[文摘] AlphaGo 的「珍瓏棋局」:誰破解了真相?

About #AlphaGo

 

Disclaimer: I don’t know playing Go. An independent judgment of the ability of AlphaGo as well as the potential of such AI therefore escapes me. The thing is: I don’t think many people who are talking about them have a clue themselves, either. It will take time to figure about what this AI really means to us- humanity.

 

有關 AlphaGo:

AJA.JPG

*

附圖 出自奕棋討論區,aja 是DeepMind AlphaGo 的推手,台師大資工出去的黃士傑,在圍棋論壇上的回文。在有關 AlphaGo 與圍棋的一切如此謎團之際,似乎只有他透露的有限資訊適合作為追尋真相的起點。

 

 

**

AlphaGo為何厲害?中國時事評論員夏小強在大紀元〈李世石輸了,但這是場古典的勝利〉提及以下說法,認為其邏輯沈穩求勝,沒有血氣:

 

一、AlphaGo使用的是蒙特卡洛樹搜索,它會在下棋時分析每一步的風險係數,比如在未來20步的N種情況下,它立即就能判斷出如何落子的勝率最高。

 

二、AlphaGo有自己學習和進化的能力。它集合了3,000萬種職業棋手的下法,數百萬次深度學習與自我對戰,十分接近帶著直覺和第六感的人類大腦,能以57%的概率預測與其對陣人類的水平。

 

此外,研發者表示「人類在長時間的比賽中會因疲勞而犯錯,但電腦程式不會,人類可能一年只能下一千盤棋,而AlphaGo一天就能下一百萬盤」。因此,在數據提取、統計、分析、判斷、選擇等方面,人類不是它的對手。李世石會犯錯,AlphaGo不會。

 

中國圍棋國手李喆發文稱:AlphaGo的算法決定其落子的決策基於「勝率」而不是「最優」,這意味著,我們人類所謂的「失誤」對於「AI」而言很可能不是失誤。第一局所謂李世石的領先和細棋都是人類經驗帶來的錯覺,從開局戰鬥到最後結束,一直是AlphaGo優勢!

 

這一判斷也符合AlphaGo自己的勝率走勢。如果我們只用人類思考圍棋的方式來理解AlphaGo,或許我們將永遠都不知道是怎麼輸的。它的目標只有贏,不求最優。

 

AlphaGo會遇強則強,遇到李世石可能贏二目半,遇到業餘6段可能也就贏二目半。…在局面領先的情況下,AlphaGo常會走出人類棋手所認為的緩手,從而縮小了領先優勢,其實這正是AlphaGo的強大之處,它通過選擇勝率更高的退讓走法,雖然損目但提高了勝率,從而將其優勢轉化為不可動搖的勝勢。而很多人類棋手反而會在優勢局面下貪吃爭勝,從而走出過分的招法導致逆轉。

 

***

〈AlphaGo的勝利是一次古典的勝利〉原是《澎湃新聞》上張定浩文章所訂的標題,其文章理路,必須追溯日、韓、中三國,在近現代圍棋興起的順序,以及競爭邏輯的不同。AlphaGo 接近的,是過去日本的圍棋精神。

 

近現代圍棋比賽起源於日本明治維新後,在昭和時代,吳清源木谷實共同掀起「新布局」的潮流展開大業,在上世紀六七十年代到達頂峰之際,日本在「圍棋」國際化之前一直世界第一。

 

直到九十年代韓國圍棋崛起,先是「圍棋皇帝」曹薰鉉1988年在第一屆應氏杯世界圍棋錦標賽中奪冠,並由「天才少年」李昌鎬從眾多棋手中脫穎而出,稱霸世界棋壇至2004年狀態下滑為止。此間,從1995年到2005年,上述二人與「第一攻擊手」劉昌赫、「野戰司令」徐奉洙,直接統治了那10年的棋壇。

 

2005年後,中國崛起,與韓國共分天下,而日本棋手完全落敗。到2013年,中國年輕新銳備出,江維傑范廷鈺時越連贏得世界冠軍,羋昱廷陳耀燁周睿羊檀嘯等棋手大放異彩,18歲的柯潔在2015年奪得三個世界冠軍,排名竄至世界第一。雖棋壇累積成就仍是世界排位第三的李世石高,但柯潔對戰李世石戰績以8比2領先。

 

惟日本之落寞,乃因其堅守武士道的高雅古典傳統。夏小強寫道:

 

日本人始終把圍棋看為一項藝術,而認為各類比賽只是一種「秀」。在日本,哪種比賽在甚麼地方舉行,甚麼頭銜的棋手才有資格使用幽玄特別對局室,甚麼比賽棋手穿和服都有明文規定,這些繁瑣別緻的禮儀一方面透射出日本對待傳統的執著,另一方面也使他們在現代圍棋的高競爭性下漸漸落後。圍棋的競技和藝術始終是矛盾,日本棋手總是有一個信條,有些醜陋的棋,寧可輸掉也不下;而中韓圍棋,哪怕再難看的棋,只要贏就去下。

張文浩於是說道

 

所謂「爭棋無名局」,這當然是常識,但圍棋比賽最後慢慢變成一個拼體力、搏失誤、賭昏招的野蠻粗暴的競技運動,卻不能不說是和年輕一代棋手「勝者為王」的整體培養機制有關。…

 

我看 Alphago 下棋,會有一種感動,因為想起久被冷落的日本棋手。曾經的日本圍棋之所以名局佳話不斷,和棋局時間長有直接關係,一盤棋可以綿延數月,棋手可以從容地窮盡各種可能性(是不是很像Alphago所做的事),同時,各種無理棋也就基本喪失了生存可能,因為只要有足夠時間計算,無理棋一定會吃虧。如此,棋手比拚的就不是對方的失誤,而首先是自己每一步著法的最優化,棋手是在和圍棋這門技藝相搏(Alphago的自我對弈其實也可以作如是觀),而不是和對面的那個具體爭勝負者。

 

…與其說它象徵著非人的力量,不如說,它意味著向著圍棋中深藏的人類價值觀無限靠近。在中韓年輕棋手紛紛化身成一台台高能高耗的現代作戰機器的時候,Alphago卻更像是一位江戶時代的名棋手,它穿越時空來到我們中間,它帶來的勝利是屬人的、古典的勝利。//

 

夏小強更趁機為《大紀元》作注到圍棋的「神傳文化」:

 

在《梨軒曼衍》記載:「圍棋初非人間之事:始出於巴邛之橘,周穆王之墓;繼出於石室,又見於商山,乃仙家養性樂道之具。」

.

換句話講,圍棋是神傳文化的一種。圍棋盤象徵宇宙,361個點象徵無數的天體,中心天元代表宇宙的中心,棋子分黑白象徵陰陽,黑白子交替落子形成的棋勢和蘊含的無窮變化象徵了宇宙運動的規律。…在黑白子的陰陽互動中,「手談」是一種超越語言境界層次的交流,在看似小小的圍棋盤所包涵的宇宙世界中,在手談之間,弈者和棋已經融為一體,以致達到天人合一的境界。對弈者的每一手棋都是其思想境界的體現,…是一種使人精神昇華和修煉的載體,也就是中華幾千年人們孜孜以求的「道」之一種。

 

****

奇妙的是,我們可以輕易看到這些棋藝不深的評論手,為 Alphago下這麼宏大敘事美感的評注,但線上的中、韓九段圍棋高手,反而大為實際地表明了他們的困惑與無知。

 

在第一盤敗陣後,李世乭回憶,就是到了雙方都陷入困境時,或可說是下決定勝負一步棋時,「AlphaGo竟下了人類絕對不可能下的一步棋」。

 

南韓金成龍九段說,「在那種狀況下,若是職業棋手,誰都會認為鐵定完局了,AlphaGo竟下了這麼奇怪的一步棋」;整局AlphaGo「完全不像人類在下棋,可說是排除了人類職業棋手感覺的一盤棋。」

 

在〈九段高手為無法評述而道歉〉一篇報導,也記錄了棋壇高手們的類似反應:

 

…請來解說的圍棋九段高手在經過45分鐘對局之後,都無法對 AlphaGo 的下棋方式作出評論,只是一味在提出疑問。「與其說是不可思議,不如說沒理由那麼下棋好了。以專業棋手的感覺來看,這種下棋法是從沒想過的。到底這麼行棋有甚麼含意呢?」李熙星九段說。由於 AlphaGo 下棋可說毫無章法,難以預測,不少行棋方式都像是失誤,所以李熙星只有嘆息地說「到底( AlpahGo )是怎樣將這樣的棋局⋯⋯變成取勝的棋局啊。」

.

另一位九段棋手金成龍就說「 AlphaGo 恐怖之處是它行著資料上沒有的棋法,在 AlphaGo 以自我學習能力演變出來的下棋法下,我覺得人類是太軟弱了。」

.

不少在棋局中段前認為李世乭佔優的評述者,都為後來 AlphaGo 佔優而向觀眾道歉。為 韓國放送 SBS 直播作評述的宋泰坤九段表示:「各位觀眾非常抱歉,我不知道導致李九段失敗的一着在哪裡。以人類的眼光來看, AlphaGo 可說是失誤頻頻。如果以至今的理論來評述, AlphaGo 的章法是無法得出答案的。」他在賽後接受《朝鮮日報》訪問時就表示,在直播期間看著棋局,感覺就像被狐狸迷惑一樣。

.

在AlphaGo連續擊敗李世乭三場後,Go Game Guru 網站編輯 David Ormerod 五段在 〈AlphaGo shows its true strength in 3rd victory against Lee Sedol〉寫道:

 

When AlphaGo defeated Lee Sedol in the first game, the result was shocking to many, but doubts still remained about its strengths and weaknesses.

 

It seemed like Lee had underestimated his opponent and chosen an experimental opening to test the machine’s strength. That did not go well.

 

Soon afterwards, he became embroiled in a complex tactical position, and eventually lost.

On the second day, Lee’s play was much better. His game plan was clearly to play solid and patient moves, and wait for an opportunity to strike.

It was a good test of the machine’s abilities.

Even though Lee never found that opportunity, it was a high quality game and it gave hope to everyone supporting ‘team human’.

.

For many, including An Younggil 8p and myself, game three crushed that hope.

We’re now convinced that AlphaGo is simply stronger than any known human Go player.

韓聯社報導引述韓國訊息通信 (IT) 專業律師田石鎮的看法也認為,AlphaGo 遠不是前述中國評論員所美化的那種古典棋藝,而是  brute force 這種對所有可能性進行破解式演算的機械力。

AlphaGo 並非按已獲取的訊息行招,而是先看對方的招數並對其進行縝密分析後拆招,這意味著它擁有無數的「指教者」,而並非真正意義上的人工智慧。

 

 

那麼到底,是因為線上這批九段高手們,太過當局者迷、長年在醜陋的現代棋盤博奕廝殺中喪失了人性,而成了見樹不見林、看不懂 AlphaGo 古典智慧的瞎子;

 

還是他們才是在名為逼近「終極」、深不可測的非人運算面前,坦承地認清人類有限的真實明道者呢?

 

alphago-lee-sedol-game-3-game-over
Publicités

Poster un commentaire 我有話說

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s