본문 바로가기

유용한 정보

알파고(딥마인드)의 학습과정


알파고의 벽돌깨기 학습과정 입니다.


명령은 단지 높은 점수를 획득하라는 명령뿐, 아무런 정보도 주지않은 상태 입니다.

딥마인드는 공이 뭔지 막대기가 뭔지, 벽돌이 뭔지 아무것도 모르는 상태에서 무작정 시작 합니다.








벽돌깨기 동영상






1. 초반 10분동안은 2점밖에 달성을 못함





2. 알파고 스스로 게임룰을 터득하기 시작하면서 주고받기가 이어짐


3. 20분이 지나자 300점이 넘는 점수를 달성.


4. 120분이 지나자 능숙하게 게임을 컨트롤 함.


4. 240분 후 벽돌위로 올라가는 길을 만들어서 점수를 올리는 방법 터득.


터널을 파는것이 고득점을 위한 효과적인 방법임을 알게되고 게임을 반복하면서 처음 명령받은 '최대 점수를 내라' 를 이루는 방법을 알아냈다.

볼 컨트롤을 터득하는 것을 넘어 효과적인 방법을 스트로 터득.


사람도 처음에 게임을 할때 시행착오를 거쳐 가장 효율적인 방법을 찾는데 기계가 사람처럼 행동한다니 무섭네요.

요즘 떠도는 말처럼 '지구환경에 유해한 요소를 찾아라' 라고 하면 인간을 찾을듯...


알파고는 지금까지의 인공지능이 단순한 연산능력 이었다면 직관적인 인공지능이라 더욱 발전된 형태의 인공지능 이라고 합니다.

이세돌과의 대결전에는 아직까지 인공지능이 바둑에서 만큼은 인간을 이기지 못할것으로 예상했지만 결과는 정 반대였죠.





급기하 이 대국은 불합리한 싸움이라는 분석들이 쏟아지기 시작했습니다.







이세돌의 4국 승리에 안도하며 이세돌 신드롬과 바둑에 대한 관심이 급증하고 있습니다.

앞으로 인공지능이 지금보다 더욱 발전할 것이고 그에 따른 일상생활의 편리함과 함께 인간을 대신하는 기계로 인해 많은 부분에서 일자리가 줄어들 것이라고 예상하고 있습니다.

이번 알파고와 이세돌의 대결이 단순한 재미로 받아들였다가 이제는 기계와 인간의 미래를 생각하게 만드네요. 







 

아래의 공감버튼을 눌러주시면 저에게는 큰 힘이 됩니다!!