close

人機大戰大跌眼鏡,揭秘AlphaGo真相

3月9日下午,谷歌AlphaGo在人機對戰的第一盤戰勝李世石。雖然李世石賽前曾經表示,人工智能擊敗人類長期來看將是不可避免的事,但這次他將堅決為捍衛人類尊嚴而戰。但是他還是出現瞭幾個失誤,輸給瞭AlphaGo。



2016年1月,國際頂尖期刊《自然》曾經報道瞭谷歌研究開發的名為AlphaGo的人工智能電腦,這款人工智能於去年10月以5比0完勝歐洲圍棋冠軍、職業二段樊麾。

當谷歌旗下的DeepMind公司宣佈邀請韓國著名職業九段棋手李世石五局比賽的時候。大多數人並不看好AlphaGo,包括中國古力,聶衛平和目前第一高手柯傑,很多人都預測AlphaGo會0比5輸。而第一局是李世石輸瞭。

雖然,李世石有幾個明顯失誤,但是AlphaGo所表現出來的戰鬥力遠不是1月份的水平,為何高手紛紛走眼?AlphaGo為何表現出比1月份強出若幹倍的戰鬥力呢?這得從AlphaGo是什麼說起。

一、AlphaGo牛在哪?

AlphaGo 是什麼?在今年一月的Nature上有AlphaGo的詳細介紹,AlphaGo是一套為瞭圍棋優化的設計周密的深度學習引擎,使用瞭神經網路加上

MCTS (Monte Carlo tree search),並且用上瞭巨大的谷歌雲計算資源,使用瞭GPU的通用計算能力。

AlphaGo

的特點在於充分利用現在的機器學習技術,可擴張的架構,它不僅僅是用一臺超級計算機,而是可以利用谷歌龐大的計算資源來做這個深度學習,提升學習能力。谷歌提供瞭15-20名世界頂級的計算機科學傢和機器學習專傢和全世界最龐大的谷歌後臺計算平臺,看看能把圍棋這種高難度的人類遊戲項目做到什麼高度?

圍棋是相當感性的項目,它不像象棋每個子都有價值計算,目標明確就是將死對方的王,不被對方將死。圍棋的形好壞是相當感性的東西。對優劣的判斷也不是純計算的結果。

而且,圍棋的棋盤太大,手數太多,五子棋的復雜度是10的28次冪,國際象棋是10的46次冪,而圍棋因為棋盤大,復雜度是10的172次冪。復雜度越高,對計算能力的要求就越高,所以圍棋計算機程序的水平一直無法與人類高手相比。

所以,雖然從1997年以來,計算機性能遵照摩爾定律一直在飛速增長,超級計算機每年性能都刷新紀錄,但是要挑戰圍棋這種復雜遊戲的人類高手,要到2016年才開始。

AlphaGo雖然有谷歌的龐大計算資源,雖然有GPU通用計算能力。但是它也算不瞭圍棋這種超高復雜度的遊戲,不能像簡單的棋一樣把每一步算清楚。

所以AlphaGo綜合瞭各種人工智能的成果,首先通過深度學習引擎,AlphaGo搞來人類的數千萬盤對局,學習人類高手的招數,來選擇每一步可能下的幾個點。

這個深度學習是可以不斷進化的,學習過的越多,選點的水平就越高,而在選擇瞭有限的點之後,就可以用MCTS (Monte Carlo tree

search)來算下去瞭,求出最優解。

當然,圍棋的棋盤太大,手數太多,即使是選擇有限的點,計算量也無法承受,所以AlphaGo又對棋盤分瞭區,算局部而整體。

以前結合深度學習和運算能力,配上谷歌龐大的計算資源加以訓練(深度學習是可以自己與自己下棋不斷提高的)AlphaGo的水平就超越瞭以前的圍棋AI,可以挑戰職業棋手瞭。

二、為何高手會看錯

在對局前,從李世石自己到中國高手們,對AlphaGo都是不屑一顧的,因為它們看到的是AlphaGo對樊麾的棋譜,這個棋譜的水平隻是贏瞭,並沒有高到那裡。所以高手們認為AlphaGo不堪一擊。

而事實上,AlphaGo是根據對手的每一步棋在選擇,隻要贏的概率大,AlphaGo不會像人類一樣走追求完美的棋,所以AlphaGo被低估瞭。

而AlphaGo的深度學習能力是可以不斷強化的,人類的棋譜可以輸入,機器可以不斷的自我對局來積累經驗,選擇最佳點。求最優解的計算也可以積累。所以AlphaGo的進步實際上是非常非常快的,而且會越來越快。

如同谷歌工程師所說,李世石一年最多下一千盤,而計算機可以一天一百萬盤,而且每一盤的經驗和計算都可以儲存積累。

所以3月份的AlphaGo與1月份的AlphaGo也有瞭非常大的不同。高手們看到第一盤的棋譜,紛紛認為自己走瞭眼。中國棋院的一些高手對AlphaGo的認識從職業初段的水平提升到職業五六段,而圍棋第一人柯傑的評價更高,他表示自己也隻有六成勝算。

AlphaGo以前的棋譜不能代表其極限水平,它是遇強更強的,另外AlphaGo的進步速度也遠超人類,所以AlphaGo超越人類高手也許很快就可以做到台中市化糞池清理

三、人類還有機會嗎?

其實,以圍棋的復雜程度,現在計算機雖然用上GPU通用計算,用上瞭分佈式計算,依然沒有計算清楚圍棋所有的變化。

所以,圍棋還要深度學習模擬人類選擇點,還要用棋盤分區來減輕計算量,在佈局和中盤,計算機由於時間和運算能力限制並非能拿出最優解。

因為深度學習選擇的點未必是最優的,而靠MCTS 完全計算清楚再有時間限制的情況下也很困難。

但是到瞭最後的宮子階段,計算量大大減少,AlphaGo可以完全算清楚,讓每一步都是最優解。人類最多也是與之平手。

所以AlphaGo至少在目前還不是不可戰勝,在開局和中盤,人類還是有機會領先的,在宮子階段可以與之戰成平手。實際上1月份二段水平的樊麾也贏瞭兩局快棋。

但是,由於AlphaGo強大的深度學習能力,其深度學習後選擇點的能力會越來越高,它也會越來越難戰勝。

而今後若幹年,隨著計算機能力的再擴充,AlphaGo有可能通過MCTS把圍棋每一步都計算清楚,那個時候圍棋這個運動的意義就不大瞭。

四、AlphaGo的意義

圍棋本來認為是無法算清的,至少現在的計算能力不行,而AlphaGo把人類感性的東西,通過計算機龐大的計算能力和高水平的人工智能程序來解釋,通過機器的自我學習來提升,這是很有意義的。

AlphaGo裡面的深度學習、神經網絡、MCTS,和AlphaGo的擴張能力計算能力都是通用的技術。AlphaGo今天要進入一個新的應用領域,用AlphaGo的底層技術和AlphaGo的團隊,應該可以更快更有效地開發出解決方案。

AlphaGo如果有朝一日在圍棋上擊敗頂級的人類智能,那麼這種學習能力用於其他難以精確計算而依靠人類經驗判斷的領域,也會擊敗人類。

要知道,現在傳感器實際上有遠遠優於人類的感知能力,如果計算機對非精確描述的事物學習能力也超過人類,那麼人類真的就可以被替代瞭。

無人駕駛是小菜一碟,人類能學會的,計算機都可以學會,而且學得更好,那麼人類的所有的技能與經驗就全部變成可替代的瞭,包括編程。計算機可以自我發展,完成各種功能,人類的各種勞動都可以解放瞭。

計算機具備瞭深度學習能力以後,人類的所有勞動都可以被替代。工廠是無人的,車輛是無人的,飛機是無人的,飯店服務員是機器人,名廚是一臺自動烹調的機器,人類隻復雜在機器故障或者失靈時候,做人為的幹預與檢修。而機器給人創造的財富幾乎沒有上限,隻取決於自然資源的多少。

這個世界聽上去似乎很熟悉,沒台中包通馬桶錯,天網就在不遠的將來。

作者:maomaobear | 來源:iDoNe台中市抽水肥ws專欄

台灣電動床工廠 電動床
台灣電動床工廠 電動床
AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋
AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots
一川抽水肥清理行|台中抽水肥|台中市抽水肥|台中抽水肥推薦|台中抽水肥價格|台中水肥清運
X戰警多鏡頭行車記錄器專業網|多鏡頭行車記錄器|多鏡頭行車紀錄器比較|多鏡頭行車紀錄器推薦|多鏡頭行車紀錄器影片
台中抽水肥專業網|台中抽水肥|台中市抽水肥|台中抽水肥推薦|台中抽水肥價格|台中水肥清運
台灣靜電機批發工廠|靜電機|靜電機推薦|靜電油煙處理機|靜電油煙處理機推薦
優美環保科技工程-靜電機,靜電機推薦,靜電機保養,靜電機清洗,靜電油煙處理機


arrow
arrow

    awi480aa84 發表在 痞客邦 留言(0) 人氣()