[행사/세미나] [Colloquium] April 17th(Wed.) AI와 물리가 만나면?!
- 물리학과
- 조회수1549
- 2024-04-11
이번 학기 다섯 번째 콜로퀴움은 한국과학기술원 물리학과 정하웅 교수님을 모시고 콜로퀴움을 개최하오니, 학과 구성원 여러분의 많은 참여를 부탁 드립니다.
아 래
1. Title: AI와 물리가 만나면?!
2. Speaker: 정 하 웅 교수님 (한국과학기술원 물리학과)
3. Date & Time: April. 17th(Wed.) 2024. 4:30 PM
4. Place: Natural Science 1, Room No. 31214
5. Abstract: 1969년에 노벨물리학상을 수상한 머리 겔만 박사는 복잡계(Complex Systems)에 대한 연구가 미래에 가장 촉망받는 분야이며 관심을 가지고 연구해야 할 분야라고 주장한다. 겔만 박사는 현재 미국 산타페연구소에 복잡계에 대한 연구팀을 이끌고 있다. 그들의 연구 대상은 정치학, 사회학, 경제학, 생물학, 물리학, 컴퓨터공학 등등 학문의 모든 분야에 걸쳐 있다고 말할 정도로 다양하기에 전공과 상관없이 우리 모두가 관심을 가질만한 주제라고 생각된다. 게다가 얼마 전 우리 곁은 떠난 세계적인 석학, 스티븐 호킹 박사도 21세기는 복잡계의 시대가 될 것이라고 확고하게 얘기하곤 했다. 그럼 이렇듯 많은 사람들이 중요하게 말하고 있으며, 실제로 다양한 분야에서 연구가 이루어지고 있는 복잡계란 과연 무엇일까?
흔히 인용되는 복잡계의 정의도 그 적용 분야만큼이나 다양하지만 공통요소만 정리하자면, 복잡계란 다양하고 많은 수의 구성요소들이 서로간의 상호작용에 의해서 구성요소 하나하나의 특성과는 사뭇 다른 창발적인 현상을 나타내지만, 나름대로의 질서를 보여주는 시스템이라고 할 수 있다.[1]
사실 우리 주변을 둘러보면 거의 모든 것들은 다양하고 수많은 구성요소로 이루어진 복잡계이다. 예를 들어 많은 사람들이 서로의 이해관계에 의해 얽혀 있는 사회, 우리 몸속에서 여러 종류의 물질들이 여러 가지의 생화학반응을 통해 에너지를 만들어 우리를 살아 있게 만드는 생명현상, 또 수많은 컴퓨터들이 여러 가지의 통신수단을 통해 연결되어 있는 인터넷 등이 복잡계의 대표적인 예라 할 수 있다. 신경세포들이 연결되어 구성하는 뇌(Brain) 또한 예외는 아니다. 이렇듯 다양한 복잡계에 대한 연구는 새로운 밀레니엄을 맞아 여러 가지 방법을 통해 활발히 연구되고 있는데, 최근 들어 주목받는 새로운 방법론은 네트워크 과학으로, 네트워크 과학이란 복잡계의 구성요소들과 그들 간의 상호작용을 점과 선으로 단순화시켜서, 네트워크 (또는 그래프)로 바꾸어 연구하는 것이다. 특히나 일련의 연구를 통해 전혀 다른 분야에서 발견되는 네트워크들의 모양이 신기할 정도로 거의 똑같다는 것이 알려지면서, 자연스럽게 다양한 연구 대상의 공통점에 대한 관심이 늘어났고, 타학문 분야와의 접촉도 빈번해졌는데 결국, 다양한 학문 분야에 펼쳐져 있던 복잡계의 연구 대상들이 간단히 “네트워크”라는 하나의 주제로 통일되면서, 자연스럽게 학제간 연구로 발전하고 있는 것이다.
예를 들어, 우리가 살고 있는 사회를 단순화시키면 사람을 점(點)으로 그 인맥을 선(線)으로 나타낼 수 있다. 이것은 바둑판위에 교차되어있는 선과 점들 유사하다. 그러나 바둑판처럼 생긴 네트워크는 결코 세상을 올바르게 설명하지 못한다. 예를 들어 한쪽 구석에 있는 점 A에서 반대편 모서리에 있는 점 B로 간다고 생각해보자. 이 경우 바둑판의 많은 점들을 거쳐 가야 하므로 짧은 거리에 의해 연결될 수가 없다. 하지만 우리는 세상이 좁다라는 것을, 즉 평균 6단계면 세상의 많은 사람과 연결된다는 것을 알고 있다. 그렇다면 실제 네트워크는 어떻게 생겼을까? 실제 네트워크의 모양을 알아보기 위해 1999년 필자는 미국 노트르담대학교의 라즐로 바라바시(Albert-Laszlo Barabasi) 교수와 함께 다음과 같은 실험을 주도했다. 그 당시 필자는 월드와이드웹을 자동으로 돌아다니며 정보를 모으는 프로그램인 로봇(또는 크롤러, crawler)을 만들어 월드와이드웹의 연결 지도를 얻었다. 즉 각 웹페이지가 어떤 웹페이지와 어떻게 연결(하이퍼링크)되는지를 알아낸 것이다. 월드와이드웹의 지도를 통해 먼저 웹페이지가 평균적으로 19번의 링크만으로 서로 연결돼 있는 좁은 세상이라는 점을 연구팀은 알아냈다.[2] 연구를 시작하기 전 연구팀은 기존의 그래프 이론인 무작위적 네트워크 이론의 지배를 받았던 탓에 웹페이지들이 모두 비슷한 갯수의 연결선을 가진 바둑판과 비슷한 모양일 것이라고 예상했다.[3] 아마 독자들도 웹페이지들에 링크된 다른 웹페이지의 개수가 대부분 비슷할 것이라고 예상하기 쉬울 것이다. 그러나 결과는 놀랍게도 각 점들에 연결된 연결수의 분포함수인 “연결선 분포함수”가 포아송(Poisson) 분포가 아닌 멱함수(power-law)라고 불리는 새로운 분포함수를 따르는 것으로 밝혀졌다. 멱함수 분포는 평균 주위에 정점(頂點)이 없고 계속 감소하는 모양을 갖는다(P(k)~k-γ). 따라서 멱함수 분포를 따르는 네트워크에서는 연결선이 적은 점들이 대부분이지만, 동시에 연결선이 많은 점, 즉 허브들도 적지만 함께 존재한다. 이러한 연결구조는 멱함수 법칙을 따르는 척도 없는(scale-free) 네트워크라 불리우는데, 더욱 재미있는 점은 척도 없는 네트워크의 구조가 월드와이드웹뿐만 아니라, 여러 네트워크에서 공통적으로 발견된다는 것이다. 우리 몸속의 신진대사망, 할리우드 배우들의 공동출연을 통해 연결한 사회 네트워크, 그리고 실제 물리적인 인터넷 연결망도 그랬다. 결국 1959년 이후 네트워크의 구조에 관해 우리의 사고를 지배했던 무작위 네트워크이론은 막을 내리고 좁은 세상을 설명할 수 있는 새로운 척도 없는 네트워크라는 이론이 탄생한 것이다.
코넬 대학의 스트로가츠(Steven Strogatz) 교수에 따르면, 매 10년마다 알파벳 ‘C’로 시작하는 중요한 이론들이 나타났다고 한다. 1960년대에는 사이버네틱스(Cybernetics), 1970년대에는 카타스트로피 이론(Catastrophe theory), 1980년대에는 혼돈 이론(Chaos theory), 그리고 1990년대에는 복잡계 이론(Complexity Theory)이 그것이라고 했다. 물론 약간은 억지스러운 말이긴 하지만, 최근 여기저기서 나타나고 있는 복잡계에 관한 폭발적인 관심으로 미루어볼 때, 꼭 틀린 말은 아닌 듯하다. 사실 복잡계에 대한 연구는 영국의 저명한 물리학자들이 20세기를 마무리하며 꼽은 물리학의 10대 미해결 연구과제 중 하나로 선정되었으며, 또한 미국 과학재단(NSF)이 뽑은 4대 주요 연구과제 중 하나로 꼽힐 만큼 중요한 연구 분야임에 틀림없다. 경우에 따라서는 연구 분야라고 하기보다는 그 다양한 응용 및 적용 분야로 말미암아 여러 학문 분야에서의 새로운 패러다임으로서 방법론적인 측면이 더 강조되기도 하는데 그렇기에 21세기의 학문을 추구하기 위한 필수조건으로 여겨지기도 한다. 그 중에서도 지금까지 살펴본 ‘복잡계 네트워크 이론’은 복잡계를 이해하는 새로운 방법론으로 받아들여지고 있으며, 다양한 학문분야에서 특별히 주목을 받고 있다. 지금까지 공학자이건 물리학자이건 생물학자이건 그들은 연구대상을 잘게 쪼개서 분석을 하는데 모든 노력을 경주해왔다. 이러한 환원주의적 접근 방식은 19~20세기에 걸쳐 자연이나 사회를 이해하는 데 크게 기여했다. 하지만 잘게 쪼개진 부분에 관한 수많은 정보, 즉 생태계를 이루고 있는 생물들이나 경제활동에 참가하는 개개인에 관한 정보가 아무리 많다고 해도, 전체로 모일 때 생기는 특이한 현상들을 설명해주지는 못했다. 그들은 부분이 서로 복잡한 상호작용으로 연결되어 전체라는 네트워크로 이해될 수 있다는 생각을 하지 못했다. 절실히 필요한 것은 복잡한 네트워크의 구조와 작동원리를 정확히 꿰뚫어볼 수 있는 통찰력이었다. 물론 구체적인 구성요소는 각 연구대상마다 판이하게 다르지만 전체적인 큰 그림으로 본다면 네트워크라는 연결구조에 대한 이해가 먼저 있어야 할 것이다. 네트워크 과학은 각 구성성분의 세부사항 같은 가정과 추측을 최대한 줄이고, 그들의 전체적인 연결구조와 작동원리를 파악하여 제한적이나마 신뢰할 수 있는 결과를 얻어낼 것이다. 네트워크 과학은 우리가 보고자 하는 전체를 올바른 방향으로 보게 해주는 길잡이 역할을 할 것이기 때문이다. 물론 지금까지의 네트워크 과학의 발전 단계가 복잡계의 모든 난제에 대한 해답을 정확히 제공할 수준은 아니다. 그러나 네트워크 과학이 세상의 여러 가지 문제에 대한 실마리를 가지고 있는 것은 분명하다. 당장 이러한 난제들이 풀리지 않을지도 모르지만, 복잡계 네트워크 과학은 이것들을 풀어낼 탄탄한 토대를 제공할 수 있을 것이라 믿는다.[4] 따라서 더욱 관심이 필요한 분야라고 할 수 있다. 더더군다나 최근 네트워크 과학과 더불어 빅데이터에 대한 관심 또한 복잡계 연구에서 새롭게 주목을 받고있는데 이는 IT기술의 발달로 접근가능한 정보의 양이 엄청나게 늘어나면서 비롯되었다. 검색엔진으로 성공한 구글의 사례처럼 정보를 어떻게 활용하느냐에 따라 어렵고 복잡해 보이는 문제들을 쉽게 해결할 수 있는 가능성이 점차 열리고 있는 것이다. 일례로 구글 트렌드(trends.google.com)는 사람들이 어떠한 단어들을 얼마나 검색하는지를 보여주는 서비스이다. 관심있는 단어를 넣으면 2004년부터 현재까지 해당 단어가 얼마나 많은 검색이 이루어졌는지를 보여준다. 이를 활용, 대선 후보 검색어로 선거결과를 예측했던 사례와 함께, 최근 영국과 미국의 연구자들이 경제와 관련된 단어들의 검색량 증감과 주가지수의 상관관계를 조사하여 특정단어의 검색량 증감이 주가지수의 증감과 관련이 있음을 보이고 이를 통해 주가를 예측해 높은 수익률을 올릴 수 있다고 발표하였다. 예를 들면 “debt(빚)”라는 단어의 최근 3주간의 검색량과 이번 주의 검색량을 비교하여 검색량이 늘어나면 (주가가 떨어질 것으로 예상) 주식을 팔고, 줄어들면 (주가가 오를 것으로 예상) 주식을 사는 방식을 취하여 최고 326%의 수익률을 달성할 수 있다고 발표했다. 사람들의 관심이 검색어 빈도에 반영되며 이는 사람들의 정치/경제활동과도 연계가 된다는 이 연구는 빅데이터의 다양한 활용성를 잘 보여준다고 하겠다. 또한 구글 검색엔진을 이용, 사람과 사람, 사람과 사물 등 거의 모든 것들의 네트워크를 구성할 수 있는 알고리즘이 발표되기도 했는데[5] 두 사람의 이름 혹은 두 단어를 함께 구글에 검색하였을 때 나타나는 웹페이지의 숫자, 즉 구글검색량 (google hits)을 기준으로 공통적으로 등장하는 웹페이지가 많으면 두 단어의 상관관계가 높다고 보고 이를 가중치로 다양한 네트워크를 구성하는 것이다. 이를 통해 복잡계 각 구성요소들 간의 상호관계 등을 알기 쉽게 정량화 해주며, 웹데이터라는 공개적인 빅데이터로 사람과 사물, 사물과 사물 등 거의 모든 것들에 대한 네트워크를 손쉽게 구성할 수 있다는 점에서 네트워크와 빅데이터 분야의 결합이라는 새로운 패러다임으로 발전되고 있다. 특히나 최근 4차 산업혁명으로 각광받는 분야를 살펴보면 빅데이터 이외에도 사물인터넷(IoT), 인공지능, 로봇, 미래자동차, 미래에너지, 차세대바이오, 3D 프린팅 등이 있다.[6] 그런데 묘하게도 이런 주제들을 살펴보면 모두 앞서 말씀드린 빅데이터와 네트워크를 결합하는 것으로 볼 수 있다. 사물인터넷은 모든 사물들이 서로의 데이터를 통신하며 네트워크로 연결된 것을 말하며, 요즘 유행하는 인공지능은 빅데이터를 딥러닝으로 대표되는 기계학습을 통해 컴퓨터에 인공신경망을 구현하여 원하는 어려운 문제를 잘 푸는 것을 말하는데 바꾸어 말하면, 빅데이터를 인공신경망이라는 네트워크를 통해 가중치로 잘 묶어내는 작업으로 볼 수 있다는 것이다. 로봇과 미래자동차도 결국 주어진 환경데이터를 기계학습 등을 통해 잘 연결시켜서 효율적으로 운영되기를 바라는 것이며, 미래에너지 분야도 다양한 곳에서 신재생 에너지 등 여러 방법으로 만들어진 여분의 에너지를 스마트 그리드라는 네트워크를 통해 수요와 공급을 연결해주는 것으로 해석할 수 있다. 차세대 바이오 및 3D 프린팅도 필요한 개개인의 정보를 종합, 연결하여 맞춤 신약개발이나 원하는 제품을 개별 프린팅하는 산업으로 이해할 수 있다. 결국 4차 산업혁명의 거의 모든 것은 데이터와 네트워크의 연결에 방점을 두고 있다고 할 수 있다. 다시 말해 데이터의 연결에서 새로운 가치가 생긴다는 의미이다. 쉬운 사례로 2015년 저희 연구실에서 지금까지 235년간 미국의 모든 특허를 분석한 결과, 78%의 특허가 새로운 특허가 아닌 기존의 특허를 인용 또는 연결한 결합특허라는 것을 알 수 있었고, 정말 새로운 특허는 1880년대 이후 점차 줄고 있다는 점을 확인하였다. Nature Physics 지에 “혁신의 둔화(Innovation Slowdown)”로 소개되기도 하였는데 최근 특허의 경향은 새로운 혁신보다는 기존 특허의 연결에서 그 대부분의 가치를 만들어내고 있다는 점이다. 결국 마크 트웨인이 “하늘 아래 새로운 아이디어는 없다, 단지 새로운 조합만이 있을 뿐이다”라고 말했듯이 데이터를 네트워크로 연결하는 것이 4차 산업혁명의 본질이라고 생각할 수 있다. 아직은 문제점도 지적되지만 최근 다양한 활용가능성 때문에 주목을 받고 있는 비트코인 같은 가상화폐, 블록체인 기술도 결국 거래 데이터들을 공개적으로 P2P 네트워크에 분산하여 관리하는 것으로 데이터의 연결을 통해 이루어진 새로운 IT 기술로 이해할 수 있다. 이렇듯 빅데이터를 활용한 데이터과학 분야 또한 따로 떨어져있는 개별 정보들을 연결하여 총체적으로 함께 분석하는 네트워크 과학과 함께 21세기의 최대 난제인 복잡계를 풀어나갈 또 다른 방법론으로 앞으로의 활약이 더욱 기대되기에, 초연결시대인 21세기를 직접 살아가는 우리 모두가 관심을 갖고 익혀야할 새로운 과학으로 강력하게 추천하고자한다.[7,8]
참고문헌:
[1] 윤영수, 채승병 "복잡계 개론" (삼성경제연구소)
[2] R. Albert, H. Jeong, A.-L. Barabasi, "Diameter of the WWW" Nature 401 130 (1999)
[3] P. Erdos, A. Renyi, "On the evolution of random graphs" Publ. Math. Inst. Hung. Acd. Sci. 5 17 (1960)
[4] 최재천, 주일우 엮음 “지식의 통섭:학문의 경계를 넘다” (이음)
[5] S. H. Lee, P.-J. Kim, Y.-Y. Ahn, H. Jeong "Googling social interactions:Web search engine based social network construction", PLoS ONE e11233 (2010)
[6] 중앙일보 배영대의 “지성과 산책” 2016/11/30 인터뷰
[7] 정하웅,이해웅,김동섭 공저 “구글 신은 모든 것을 알고 있다” (사이언스북스)
[8] 정하웅 외 공저 “미래과학” (반니)