게임에서 알파고를 이긴 유일한 인간 체스 선수는 누구인가요?
대한민국 프로 체스 선수 이세돌(?).
2016년 3월, 알파고는 한국 프로 체스 세계 챔피언 이세돌(?) 지우단에게 도전장을 냈다. 알파고는 미국에 있는 구글의 클라우드 컴퓨팅 서버를 사용하며, 광섬유 케이블 네트워크를 통해 한국과 연결된다.
대회 장소는 대한민국 서울 포시즌스 호텔이며, 대회 형식은 우판치로 각각 3월 9일, 10일, 13일, 15일에 개최된다. 중국 바둑 규칙은 3과 3/4개의 돌을 배치하는 것입니다. 시간은 각 측면에 2시간이며 1분 카운트다운이 3회 있습니다. DeepMind 팀은 미국 프로 체스 선수인 Michael Redmond가 영어 해설을 제공하는 YouTube를 통해 전 세계적으로 생중계됩니다. 중국의 많은 비디오 웹사이트에서도 YouTube의 생방송 신호를 사용하여 생방송에 자체 해설을 추가합니다. 대만 아마추어 바둑 6단 딥마인드 팀의 황시지에 박사가 체스판에서 알파고를 대표하고 있습니다.
콘테스트 우승자에게는 상금 100만 달러가 수여됩니다. 알파고가 이기면 상금은 유니세프 등 바둑단체와 자선단체에 기부된다. 이세돌의 출연료는 15만달러이며, 승리할 때마다 보너스 2만달러를 받게 된다.
알파고는 2016년 3월 9일, 10일, 12일 세 경기에서 승리했다. 이세돌은 13일, 알파고는 15일 최종전에서 승리했다. 따라서 경기 결과는 알파고가 이세돌을 4:1로 이겼다. 이 대회는 인터넷에서 경쟁과 인공지능에 대한 광범위한 논의를 촉발시켰습니다.
확장 정보:
알고리즘
AlphaGo는 가치 네트워크 및 체스 이동 정책 네트워크의 도움으로 몬테카를로 트리 검색(몬테카를로 트리 검색)을 사용합니다. 두 가지 유형의 심층 신경망은 평가 네트워크를 통해 다수의 선택된 포인트를 평가하고 체스 이동 네트워크를 통해 배치 포인트를 선택합니다.
AlphaGo는 처음에 인간 플레이어를 모방하여 과거 프로 체스 플레이어의 체스 게임과 일치시키려고 했습니다. 데이터베이스에는 약 3천만 개의 체스 동작이 포함되어 있습니다. 나중에 특정 수준의 숙련도에 도달하면 강화 학습을 사용하여 자신을 상대로 많은 체스 게임을 시작합니다.
바둑은 단순히 최선의 수를 찾는 것만으로는 해결될 수 없습니다. 평균 게임에는 약 150개의 수가 있고, 각 수에는 약 200개의 가능한 수가 있으므로 해결해야 할 가능성이 너무 많습니다.