이세돌과 알파고의 2차전, 바둑 관점에서 본 관전 포인트는?
긴 답변을 쓸 시간이 별로 없어서 제가 가장 깊이 느낀 점에 대해 간단히 말씀드리겠습니다:
사용된 알고리즘에는 명백한 허점이 있습니다 프로 체스 선수들이 상황을 판단합니다.
프로 체스 선수들이 상황을 판단하기 위해 사용하는 알고리즘은 대략 한 문장으로 요약할 수 있습니다. 양측의 포인트 수(사이트 크기) 차이를 추정합니다.
영토의 경계가 완전히 결정되지 않은 경우 어떻게 되나요? 간접 임원이 있는 경우에는 직접 임원에게 수여됩니다. 중고 임원이 2명인 경우 각 사람에게 수여됩니다.
그래서 두꺼운 전위 조각이 몇 개의 메쉬로 변환되는지와 같은 몇 가지 모호성이 있습니다. 이것은 느낌으로만 이루어질 수 있다.
오늘 각종 플랫폼에서 나온 설명을 보면 아마도 커제의 판단이 가장 정확할 것 같습니다. 중간 게임에서 커제는 검은색 체스판에서 15점 정도를 클릭했다. Gu Li는 한때 Xiao Li의 이점을 판단했으며 임원이 많지 않은 경우에도 여전히 훌륭한 조치라고 생각했습니다. 김명완도 거의 똑같다. McClemmon은 Gurley의 판단보다 조금 더 정확해 보이는 그의 판단을 주의 깊게 듣지 않았습니다. 128번째 수에서 Mi Yuting은 여전히 좋은 수라고 생각했습니다(이때 Ke Jie는 이미 흑이 확실히 앞서 있다고 판단했습니다). 저는 Go TV를 전혀 시청하지 않았는데, 더 추가해 주세요.
누구의 판단이 더 정확하든 관계없이 우리는 흰색 128 패에있는 모든 당사자의 판단을 간단히 살펴볼 수 있습니다. 일부 Ke Jie는 흑의 체스가 한 발 앞서 있다고 말했고, 다른 이들은 체스가 괜찮다고 말했으며, 심지어 일부는 백의 체스가 약간 우월하다고 말하기도 했습니다. 이러한 프로 체스 선수들은 실제로 같은 상황을 판단하는 데 있어서 한 점 이상 차이를 보일 수 있습니다! 이는 위 알고리즘의 모호성으로 인해 발생할 수 있는 엄청난 오류를 증명할 뿐입니다.
그럼 어디서 오류가 발생할 수 있는지 생각해 보겠습니다. 먼저, First Mover는 First Mover에게 수여됩니다. 그러나 체스판에서 '선제공격'은 상대적인 개념으로, 역수를 보는 경우도 드물지 않다. 어떤 경우에도 사람들이 열심히 싸우고 선두를 선택하는 것은 드문 일이 아닙니다. 둘째, 모호한 판단이다. 문제는 더 크다. 프로 체스 선수들이 체스 조각의 두께를 판단하는 차이는 완전히 다른 결과로 이어질 가능성이 높습니다.
알파고는 어떻게 상황판단을 하나요? AlphaGo의 전략 포트폴리오의 일부는 가치 네트워크입니다. 이 부분의 원리는 제 수준에는 명확하지 않습니다. 이해를 돕기 위해 이전 세대 AI인 Zen의 판단 방법인 다수의 무작위 샘플을 통해 '승률'을 추정하는 방법을 고려합니다. 예를 들어, 체스 게임에는 120개의 동작이 있습니다. 이때 AlphaGo는 체스 게임을 무작위로 완료한 후 무작위로 완료된 게임에서 어느 쪽이 승리할지 결정합니다. 이 과정을 여러 번 반복합니다. 예를 들어 10만 번, 흑이 3만 번 승리하고 백이 7만 번 승리하면 백의 승률은 70%로 추정됩니다.
물론 AlphaGo의 가치 네트워크는 Zen의 방법보다 훨씬 발전되어 예상 승률이 더 정확합니다.
AlphaGo는 남은 체스 게임을 완전히 무작위로 시뮬레이션하는 것이 아니라 이전 게임 기록을 참조하고 이동 선택기를 사용하여 속도를 보장하기 위해 가장 가능성이 높은 지점을 찾습니다.
효과에서 판단 위에서 보면 승률 추정 효과가 실제로 매우 좋습니다. 그리고 저는 이런 판단 방식이 꼭 필요하다고 생각합니다.
왜요? 우선 이론적으로는 특정 상황에서는 흑이 승리하거나 백이 승리해야 한다는 점을 분명히 해야 합니다. 그러나 바둑은 실제로 완전할 수 없기 때문에 우리는 확률을 추정하거나 인간 체스 선수처럼 양측 간의 차이를 추정하는 데에만 의존할 수 있습니다. 그러나 많은 경우 메쉬 크기 차이는 의미가 없습니다.
예를 들어(여기에 사진이 있을 텐데) 블랙은 메쉬 개수가 70개로 잠재력이 없다고 판단했습니다. 흰색은 메쉬 수를 40메시로 결정하고, 40메시를 수용할 수 있는 넓은 열린 공간이 있습니다. 흑이 즉시 침입해 살아남으면 40골의 잠재력이 실제 10골로만 환산될 수 있어 흑이 승리한다. 흑이 득점에 실패하면 백은 40홀로 둘러싸여 백이 승리하게 됩니다. 검정색은 또한 보수적인 얕은 제거를 선택할 수 있으며, 그러면 흰색의 40메시 잠재력은 약 25메시로 변환될 수 있습니다. 이런 상황에서 얄팍한 탈락을 선택하면 결국 격차는 줄어들겠지만 실제로 승리할 확률은 매우 낮다. 안타깝게도 이런 상황에서 프로 체스 선수들이 승리와 생존 확률을 정확하게 예측하기는 어렵지만 알파고는 가능합니다. 그러므로 환상을 가진 인간 체스 선수들은 자신들이 뒤처지지 않았고 돌파할 가능성도 없다고 느꼈고, 그래서 그들은 하얀 체스와 빈 공간을 제거하는 것을 선택했고 그 결과 화이트의 40골 잠재력은 전환되었습니다. 25골을 넣었고 Black은 보드에 5골만 더 남겨서 . 알파고는 진입 승률이 40%인 반면 얕은 탈락 승률은 25%에 불과하다고 추정해 출전을 결정했다.
최종 승패에 관계없이 진출을 선택하는 것이 분명히 더 나은 전략입니다.
즉, '두 눈 앞'만 있어 승률이 80%이고, '다섯 눈 앞'에 승률이 70%라면 전자는 그러나 인간은 후자가 더 큰 이점을 가지고 있다고 생각할 것입니다. 이것이 인간 체스 선수들의 운명일지도 모릅니다.
안타깝게도 인간이 수많은 무작위 표본을 통해 승률을 추정하는 것은 불가능합니다.