요즘 내 최대 관심사는 머신러닝/딥러닝이다.
최근 알파고를 만든 딥마인드에서는 알파스타를 선보였으며,
알파스타는 인공지능이 정복하기 어렵다는 스타크래프트(ver.2)에서 선수를 이겼다.
스타크래프트는 기존 알파고가 이겼던 바둑과는 다른 차원의 이야기다.
바둑은 정해진 수를 계산하고 최고의 시나리오를 선택하는 것이지만, 스타크래프트는 수를 계산할 수가 없다.
어쨋든 이처럼 인공지능은 날로 발전하고 있는데
기계가 어떻게 학습하게 되었는지 그 배경지식을 채워줄 기계는 어떻게 생각하고 학습할까라는 책을 만나게 되었다.
2016년 구글의 알파고와 이세돌 기사의 대국을 지켜보던 사람들이 느낀 감정에서 많은 부분은 공포가 차지했을 것이라 생각한다.
역설적으로 이는 어떤 의미에서는 인간의 지능이 매우 뛰어나다라는 것을 시사한다.
많은 사례와 사건을 인용하여 꼼꼼히 소개한 이책은 일반인이 이해하기 쉬운 동시에 어느 정도 수준 있는 과학적 설명도 갖추어서 적극 추천하고 싶다. - 옮긴이 김정민
컴퓨터는 때로는 인간보다 더 나은 능력을 보여주기도 한다.
인공지능과 인간의 지능이 닮아갈수록 경이로움과 동시에 불편한 감정도 생긴다.
엘론 머스크는 우리가 악마를 불러내고 있다고 했다.
어떤 초기 선구자가 인간이 절대 발명하지 않아야할 물건이라고 묘사했던 최첨단 인공지능이 품은 희망과 공포에 대해 알고 싶은 사람은 이 책을 계속 읽어야 한다. - 더글러스 헤븐 편집자
인공지능 분야는 지능을 가진 것처럼 행동하는 기계에 관한 과학이자 공학이다.
아리스토텔레스는 삼단논법이라는 공식화된 기계적 논법을 주창했는데 이 공식을 따르면 인간의 전체 지식을 모두 정리하지 않더라도 지능을 가지고 동작하는 메커니즘을 만들 수 있다.
삼단논법 - 어떤 백조는 하얗다. 모든 백조는 새다. 그러므로 어떤 새는 하얗다
튜링은 만약 어떤 기계의 반응을 인간에게 기대되는 반응과 구별할 수 없다면 그 기계가 지능을 가졌다고 판단할 수 있다고 했다.
이것을 이미테이션 게임이라고 명했다.
만약 판단자가 기계를 인간과 구별할 수 없다면, 그 기계는 지능을 가졌다고 인정된다.
튜링은 자신의 이론을 논중한 논문을 통해 오늘날 뉴런(신경세포)을 모사해 시뮬레이션하는 데 쓰이는 인공 신경망의 초기 형태를 설명했다.
뇌에서의 시냅스 같은 상호연결점을 따라 전달되는 신호는 1이나 0 중 하나다. 이 망은 오늘날의 참거짓형 신경망이라는 이름으로 불린다. (A형머신)
이 신경망은 학습능력이 없었기 때문에 튜링은 A형머신을 기반으로 학습시킬 수 있는 B형머신을 고안했다.
튜링은 사실상 컴퓨터과학의 기초를 세웠고, 성실한 연구와 연속적인 영감의 발휘를 통해 연합국이 제2차 세계대전에서 이기는 데 일조했다.
그리고 지능의 본질 및 뇌구조와 지능의 연관성을 규명하기 위한 기초가 되는 질문을 제시했다.
인생 후반기에는 생물학 연구도 시작해 형태발생에 대한 수학적 이론을 고안했다. 이것은 생물학 분야의 기초가 되었다.
대부분의 연구자들은 지능의 비밀을 푸는 열쇠는 기호추론에 있다고 생각했다.
기호추론은 생각과 내념을 단어, 구문, 문장과 같은 기호로 표현하고, 이 기호드을 논리 규칙에 따라 처리하는 수학적 접근법이다.
기호추론에 대한 환상은 실망으로 바뀌어 퍼져나갔다. 인간의 뇌는 다른 방식으로 움직이는게 분명했다.
인간에게는 컴퓨터와 비교할 수 없는 무엇인가가 존재한다고 주장했다.
처음에는 의식이나 자아의식과 같은 인간의 특성이 이런 주장의 중신 논거였지만, 이런 개념이 정확히 무엇을 의미하는지는 의견이 모아지지 않았다.
컴퓨터는 연민이나 지혜와 같은 인간의 독특한 특성은 절대 가질 수 없을 것이라고 했다.
이런 특성은 인간의 양육 과정과 경험을 통해 얻어지기 때문이다라는 것이다.
인공지능에서 정신적, 심리적 특질을 만들어내려는 노력을 포기한 그 순간부터, 성과가 나오기 시작했다.
연구자들은 사전프로그래밍된 기호규칙을 버리고 머신러닝을 택했다.
거대한 양의 데이터를 이용해 스스로 학습한다.
컴퓨터에게 충분히 많은 정보를 주기만 하면, 언어 번역, 얼굴 인식, 자율주행처럼 지능을 가져야 할 수 있는 것처럼 보였던 일들을 학습시킬 수 있다.
초기 엔지지어들은 탑다운 방식으로 프로그래밍하는 것이다.
인간이 어떻게 말을 하고, 글을 읽고, 시각적 이미지를 처리하는지에 대한 수학적 모델을 먼저 만들고 나서,
그 다음에 이런 작업들을 논리적으로 추론하는 컴퓨터 프로그램 형태로 구현하는 방식으로 지능적 행동을 만들어내려고 했다.
이후 탑다운에 대한 환상을 버리고 구체적인 과제에 집중하기 시작했다.
초기의 몇몇 성과는 상품추천 시스템에서 나왔다. 왜 고객이 그 상품을 사려고 하는지를 알기는 어려웠다.
답을 찾기 위해 문제를 완전히 이해할 필요는 없다. 많은 데이터를 가지고 결합해 유용한 상관관계를 뽑아낼 수만 있으면 된다.
데이터가 이론적 모델보다 더 강력할 수 있다는 사실이다.
소량의 통계적 학습 알고리즘과 대량의 데이터로 무장한 인공지능 기계의 새로운 세대가 등장하게 된것이다.
기계가 인간의 지능을 흉내 내도록 하기 위해서 지능의 특징을 정확하게 규명해낼 필요는 없다.
연구자들의 관심을 새로운 인공지능 기계의 엔진 연료, 즉 데이터로 집중되었다. 데이터를 어디에서 찾고, 데이터를 어떻게 최대한 활용할 것인가?
데이터 연구에서 중요한 발견 중 하나는 가치 있는 데이터를 다양한 활동을 공짜로 얻을 수 있다는 것이다.
게다가 엔지니어들과 기업가들은 추가 데이터를 끄집어내어 축적하는 다양한 방식을 발명해냈다.
사용자에게 쿠키 저장에 동의하라고 요청한다든가, 사진에 있는 친구를 대트한다든가.
상품을 평가하거나 길거리에 있는 몬스터를 잡는 내용이 주가 되는 위치기반 게이을 하게 한다는가 하는 방식 말이다.
데이터는 신시대의 석유가 되었다.
알파고의 프로그래머 중 누구도 자신들이창조한 프로그램은 물론이고 그 정도의 바둑 고수를 이길 수 있는 실력 근처에도 가지 못했다.
이들은 심지어 알파고의 전략을 이해하지도 못했다.
알파고는 뉴 멀이다. 인공지능을 개발하는 프로그래머들이 해야 하는 일의 핵심은 결국 직접 프로그래밍할 수 있을 만큼 잘 알지 못하고 이해하지 못하는 일들을 프로그램이 학습하도록 시키는 것이다.
추천의 품질은 학습에 사용된 데이터의 양과 질에 상당 부분 좌우된다.
사용자가 자동완성 기능을 더 많이 사용할수록, 소프트웨어는 사용자가 사용하는 단어와 표현을 더 많이 학습하 수 있다.
경험에 기반해 행동을 개선한다.
다시 말해, 학습의 정의에 부합한다.
이런 시스템은 아마도 수억 개 단위의 구절을, 즉 수백만 개의문서에 해당하는 입력을 받아 학습해야 할 것이다.
인간에게는 어려운 일이겠지만, 현대의 하드웨어 수준에서는 전혀 문제가 되지 않는 일이다.
책은 어려움 없이 읽어 나갈 수 있었다. 앉은 자리에서 1/3 정도는 금방 읽었다.
그동안 편파되었던 배경 지식들이 순서대로 정리 되는 기분이었다.
그리고 미쳐 몰랐던 부분들에 대해서도 알게 되어 읽으면서 점점 뿌듯해지는 책이다.