close
AlphaGo首現Bug 圍棋算法死穴在哪兒?
摘要: 圍棋因為變化委實太多,至今仍未有最優解,所以能存活到今天。AlphaGo並沒有徹底擊敗李世石,看起來圍棋的生命力仍然很頑強
(本文正在參與鈦媒體最新競拍話題【圍觀AlphaGo大戰世界圍棋冠軍:機器戰勝人到底是不是忽悠?】的競拍,如果持有不同見解,鈦妹歡迎你來參與競拍,觀點PK,不服來戰!)
再可怕的怪物也是有弱點的,AlphaGo為什麼會下臭棋讓大傢大跌眼鏡,圍棋人工智能第二代第三代的死穴是什麼?
圍棋人工智能第三代的死穴在哪兒?
韓國圍棋界曾獲得多項世界冠軍的職業九段李世石對陣谷歌計算機AlphaGo的人機大戰,三連敗之後,執白棋居然扳回一局。
大眾把此場圍棋人機大戰看得太重,看作人腦跟電腦的徹底較量,其實不然,因為比試的隻是圍棋一樣東西。圍棋人機大戰人類若輸瞭,不等於人腦就從此比不上電腦瞭。
實際上,圍棋雖然變化復雜,但理論上並非變化無窮。畢竟可以看作一道數學題目,可以用計算機來編程運算從而得到解答。假以時日,人類在下棋這一方面遲早難以與電腦匹敵。就算李世石三連敗之後能扳回兩局,那就怎麼樣呢?下圍棋這一方面人類遲早是敵不過人工智能的。
圍棋人工智能第一代算法使用的就是窮舉法,試圖把所有的下法都算出來,然後選擇必勝的下法。但是因為圍棋的變化委實太多,暫時無法辦到。
第二代算法,是抽樣評估選擇勝率最高的算法,大大減省瞭運算量,使人工智能終於能跟業餘圍棋選手較量。
谷歌AlphaGo是第三代算法,利用人工智能自我學習的能力使己身棋力突飛猛進。看上去似乎已能輾壓世界頂尖職業高手的AlphaGo,第四局居然爆冷下臭棋落敗,是出瞭什麼問題?
Alpha Go的算法是有問題的。第三代算法的問題實際上也是第二代算法的問題,因為第三代算法是基於第二代算法的抽樣評估再加以自我學習。就算Alpha Go可以自己跟自己下棋提升棋力,它之所以能這樣下棋還是基於抽樣評估。
抽樣評估是有弱點的。勝率高的下法不一定就是正確的下法,畢竟這隻是統計。有些冷門下法,也許反而能出奇制勝。
Alpha Go下臭棋時思考速度特別快恰恰說明此時的樣本少。李世石78手是奇招,會下這一手的棋手很少,AlphaGo按照程序運算的結果自以為李世石勝算不高,特別快地作出瞭反應。這是一個天大的錯誤。
跟圍棋程序下過棋的棋手都有這麼一種感覺:電腦在劣勢時應對特別混亂。不單AlphaGo,Zen也是這樣。因為電腦處於勝率低的情況已經不好思考瞭。按照樣本統計,處於勝率低的情況下當然是落敗的多,反敗為勝的樣本可不好找。勝率越低的情況,AlphaGo的思路越混亂。在極端情況下,也許找到的樣本中勝率低的一方已經投子認輸瞭,沒有後續的棋譜,AlphaGo於是不懂該怎麼辦瞭。
Alpha Go的失敗也是人類的失敗,畢竟的程序也是人類編出來的。另一方面,也是因為算法基於人類的樣本,導致瞭AlphaGo的失敗。如果有應對李世石那一招的樣本,AlphaGo也不至於如此判斷出錯。
Alpha Go之父哈薩比斯說:“AlphaGo的訓練並沒有專門針對李世石先生,而是像對普通棋手比賽前一樣,做的隻是日常的準備。AlphaGo備戰就是從網上下載很多業餘棋手的棋譜研究,沒有什麼特別之處。”隨後又說,“要針對某一個棋手備戰也很難,我們至少需要數百萬甚至上億的棋譜,才能整體提供給AlphaGo,它才能接收並進行深度學習。”
哈薩比斯的話也證實瞭圍棋人工智能第二代第三代的死穴,也就是樣本評估的問題。像李世石反敗為勝這樣的奇招,能找到的樣本實在太少。AlphaGo明顯需要有大量職業棋手的優質且非常全面的對局作為參考,這可不好辦到。
圍棋貼目難題仍待解決
第四局,台中通馬桶推薦李世石執白棋反而能獲勝,這是一件很匪夷所思的事。因為黑棋有先手優勢,勝率更高。
圍棋人機大戰引出瞭一個長期困擾圍棋界的問題,就是圍棋規則中關於貼目的規定。不玩圍棋的人可能不知道,但圍棋迷都清楚。執黑棋的棋手是先手,享有優勢,故為瞭公平起見,黑方需要向白方貼目。
1949年(昭和24年)日本棋院圍棋規則規定:黑方貼4目半。從1955年的第3期王座戰起,黑棋貼目從4目半改為5目半。但是根據統計,黑方仍然占瞭優勢。截止到2001年底,在日本棋院近5年來進行的1.5萬盤正式公開棋賽對局中,(黑貼5目半的情況下)黑棋勝率達到瞭51.86%。執黑執白的勝率之差雖然不大,但在爭奪激烈的圍棋大賽上,這樣的差距足以致命。
在國際棋賽中實力明顯占優的韓國率先在大多數棋賽中改用6目半制。中國也從2002年春天起,全部改貼3又3/4子(相當於7目半)。日本棋院對於實行瞭50年的黑棋貼5目半的制度也實行瞭改革,將部分比賽向中韓靠攏, 2003年開始全部采用黑棋貼6目半規則。
截止到2014年底,中國大陸主辦的貼3又3/4子(相當於7目半)的世界大賽共有380盤對局,其中黑勝200局,勝率為52.6%(前3屆春蘭杯相當於貼5目半,未計入)。而臺灣舉辦的應氏杯(貼8點,也相當於7目半)則是黑勝100局,白勝97局。由此可見,即便是貼7目半,黑方似乎還是略占優勢。
那麼,到底黑方要向白方貼目多少才絕對公平?目前這個數值隻是根據大量人類對局作統計得出的,並非數學上的完美無懈的解答。
也許,讓AlphaGo學金庸武俠小說中的周伯通和郭靖左右互搏,自己左手跟右手下棋,然後通過大量內戰結果統計出貼目的合理數值?No,這也不是完美的解答。
前面說過,AlphaGo之所以能自己跟自己下棋,還是基於對人類對局的抽樣評估。這跟直接對人類對局進行統計沒什麼兩樣。
完美的解答,還是要回到最初,用最原始的窮舉法,找出下圍棋的最優解。這樣,才能徹底制訂貼目的數值。隻是不知道,運算量這麼大的工程,不知道要到什麼時候才能實現?
我們倒是可以設想一下圍棋得到徹底破解之後的情景:某國際圍棋大賽在萬眾矚目下開始瞭,執黑棋的棋手才下瞭第一子,裁判當即宣佈,執白棋的棋手不用下瞭,比賽結果已定,誰勝誰負或是打成平手已經水落石出。觀眾一片歡呼。
AlphaGo玩麻將怎麼樣兼論桌遊設計的隨機性
圍棋人機大戰人類雖然輸瞭,但有些網友表示,人類的智慧還有中國麻將守著(詳見鈦媒體文章《贏瞭圍棋冠軍不算什麼,阿爾法狗敢不敢挑戰麻將?|鈦搞瞭》)。但中搜網絡創始人、北京圍棋業餘賽冠軍陳沛對采訪他的記者說:“要是麻將,人類會輸得更慘!麻將一共就那麼多張,很容易算出來的。”
然而,陳沛的話其實是錯的。假設有個傻大木,他都不太會玩麻將,但他就是運氣好到爆棚,一開局就自摸十三么,請問AlphaGo可有破解高招?
麻將這類棋牌遊戲因為隨機抽牌,是有運氣成分的。
有網友就戲言:假如打麻將時三個人聯手對付AlphaGo,AlphaGo會輸得很慘。這雖然是作弊瞭,但也道出瞭一個大問題:在多人遊戲中,局面變得異常復雜,人工智能要如何才能應對?
比如說,三個人跟Alpha Go打麻將,雖然沒人作弊,但是甲玩傢技術不行打錯瞭牌導致乙玩傢得利,這是Alpha Go所無法控制的。
說起來,AlphaGo要學習打麻將,也是得基於對大量人類對局的樣本評估。Alpha Go隻能弄明白什麼樣的打法勝率較高,然而打麻將並沒有所謂必勝的打法。
圍棋的棋子擺在棋盤上是明眼可見的。不知大傢有沒有聽說過一種“暗棋”,就是將象棋的棋子反過來蓋上再玩的。陸戰棋也有暗棋的玩法。麻將其實也跟暗棋玩法類似,牌是蓋起來玩的。蓋起來的棋牌是什麼,還得猜測。Alpha Go頂多是通過計算進行評估,蓋起來的棋牌是什麼的可能性比較大,不可能準確推理得到唯一結果。也就是說Alpha Go永遠無法進化到100%獲勝的地步。
圍棋沒有運氣成分,而麻將有著運氣成分,兩者都有自己的魅力。
廣義上,圍棋、麻將這些棋牌遊戲,其實是屬於桌遊的范疇。圍棋的英文是“Go”,AlphaGo的“Go”就從此而來。圍棋躋身BGG桌遊排行榜前100名,是中國棋牌類遊戲排名最高的。
在民間,實際上像象棋、圍棋這類沒有運氣成分的棋牌(桌遊)已漸趨沒落。現在關註圍棋人機大戰的網友,又有多少人是圍棋迷呢?
因為大眾想要的更是娛樂,像象棋、圍棋這類沒有運氣成分的,玩起來水平發揮比較穩定,高手就是高手,一般人很難贏得瞭,除非你能找到棋力剛巧跟你一個水平檔次的,不然玩起來沒意思,強的太強弱的過弱。
故此,新興桌遊的設計宗旨,都是要保證隨機性,要有運氣成分。像萬智牌、遊戲王和爐石傳說之類隨機抽牌,飛行棋、大富翁之類擲骰子,都是產生隨機數,帶來運氣成分。有瞭運氣成分,所有玩傢發揮出來的水平就不至於相差太遠,能湊到一起玩個痛快。
另一方面,沒有運氣成分的棋牌(桌遊),因為理論上一定存在最優解,最優解一旦出來後,肯定讓人興致大減。圍棋就是因為變化委實太多,至今仍未有最優解,所以能存活到今天。現在,AlphaGo並沒有徹底擊敗李世石,看起來圍棋的生命力仍然很頑強。(本文首發鈦媒體)
台中通馬桶 本文來源:鈦媒體
責任編輯:張彬彬_NT台中清化糞池推薦5025
摘要: 圍棋因為變化委實太多,至今仍未有最優解,所以能存活到今天。AlphaGo並沒有徹底擊敗李世石,看起來圍棋的生命力仍然很頑強
(本文正在參與鈦媒體最新競拍話題【圍觀AlphaGo大戰世界圍棋冠軍:機器戰勝人到底是不是忽悠?】的競拍,如果持有不同見解,鈦妹歡迎你來參與競拍,觀點PK,不服來戰!)
再可怕的怪物也是有弱點的,AlphaGo為什麼會下臭棋讓大傢大跌眼鏡,圍棋人工智能第二代第三代的死穴是什麼?
圍棋人工智能第三代的死穴在哪兒?
韓國圍棋界曾獲得多項世界冠軍的職業九段李世石對陣谷歌計算機AlphaGo的人機大戰,三連敗之後,執白棋居然扳回一局。
大眾把此場圍棋人機大戰看得太重,看作人腦跟電腦的徹底較量,其實不然,因為比試的隻是圍棋一樣東西。圍棋人機大戰人類若輸瞭,不等於人腦就從此比不上電腦瞭。
實際上,圍棋雖然變化復雜,但理論上並非變化無窮。畢竟可以看作一道數學題目,可以用計算機來編程運算從而得到解答。假以時日,人類在下棋這一方面遲早難以與電腦匹敵。就算李世石三連敗之後能扳回兩局,那就怎麼樣呢?下圍棋這一方面人類遲早是敵不過人工智能的。
圍棋人工智能第一代算法使用的就是窮舉法,試圖把所有的下法都算出來,然後選擇必勝的下法。但是因為圍棋的變化委實太多,暫時無法辦到。
第二代算法,是抽樣評估選擇勝率最高的算法,大大減省瞭運算量,使人工智能終於能跟業餘圍棋選手較量。
谷歌AlphaGo是第三代算法,利用人工智能自我學習的能力使己身棋力突飛猛進。看上去似乎已能輾壓世界頂尖職業高手的AlphaGo,第四局居然爆冷下臭棋落敗,是出瞭什麼問題?
Alpha Go的算法是有問題的。第三代算法的問題實際上也是第二代算法的問題,因為第三代算法是基於第二代算法的抽樣評估再加以自我學習。就算Alpha Go可以自己跟自己下棋提升棋力,它之所以能這樣下棋還是基於抽樣評估。
抽樣評估是有弱點的。勝率高的下法不一定就是正確的下法,畢竟這隻是統計。有些冷門下法,也許反而能出奇制勝。
Alpha Go下臭棋時思考速度特別快恰恰說明此時的樣本少。李世石78手是奇招,會下這一手的棋手很少,AlphaGo按照程序運算的結果自以為李世石勝算不高,特別快地作出瞭反應。這是一個天大的錯誤。
跟圍棋程序下過棋的棋手都有這麼一種感覺:電腦在劣勢時應對特別混亂。不單AlphaGo,Zen也是這樣。因為電腦處於勝率低的情況已經不好思考瞭。按照樣本統計,處於勝率低的情況下當然是落敗的多,反敗為勝的樣本可不好找。勝率越低的情況,AlphaGo的思路越混亂。在極端情況下,也許找到的樣本中勝率低的一方已經投子認輸瞭,沒有後續的棋譜,AlphaGo於是不懂該怎麼辦瞭。
Alpha Go的失敗也是人類的失敗,畢竟的程序也是人類編出來的。另一方面,也是因為算法基於人類的樣本,導致瞭AlphaGo的失敗。如果有應對李世石那一招的樣本,AlphaGo也不至於如此判斷出錯。
Alpha Go之父哈薩比斯說:“AlphaGo的訓練並沒有專門針對李世石先生,而是像對普通棋手比賽前一樣,做的隻是日常的準備。AlphaGo備戰就是從網上下載很多業餘棋手的棋譜研究,沒有什麼特別之處。”隨後又說,“要針對某一個棋手備戰也很難,我們至少需要數百萬甚至上億的棋譜,才能整體提供給AlphaGo,它才能接收並進行深度學習。”
哈薩比斯的話也證實瞭圍棋人工智能第二代第三代的死穴,也就是樣本評估的問題。像李世石反敗為勝這樣的奇招,能找到的樣本實在太少。AlphaGo明顯需要有大量職業棋手的優質且非常全面的對局作為參考,這可不好辦到。
圍棋貼目難題仍待解決
第四局,台中通馬桶推薦李世石執白棋反而能獲勝,這是一件很匪夷所思的事。因為黑棋有先手優勢,勝率更高。
圍棋人機大戰引出瞭一個長期困擾圍棋界的問題,就是圍棋規則中關於貼目的規定。不玩圍棋的人可能不知道,但圍棋迷都清楚。執黑棋的棋手是先手,享有優勢,故為瞭公平起見,黑方需要向白方貼目。
1949年(昭和24年)日本棋院圍棋規則規定:黑方貼4目半。從1955年的第3期王座戰起,黑棋貼目從4目半改為5目半。但是根據統計,黑方仍然占瞭優勢。截止到2001年底,在日本棋院近5年來進行的1.5萬盤正式公開棋賽對局中,(黑貼5目半的情況下)黑棋勝率達到瞭51.86%。執黑執白的勝率之差雖然不大,但在爭奪激烈的圍棋大賽上,這樣的差距足以致命。
在國際棋賽中實力明顯占優的韓國率先在大多數棋賽中改用6目半制。中國也從2002年春天起,全部改貼3又3/4子(相當於7目半)。日本棋院對於實行瞭50年的黑棋貼5目半的制度也實行瞭改革,將部分比賽向中韓靠攏, 2003年開始全部采用黑棋貼6目半規則。
截止到2014年底,中國大陸主辦的貼3又3/4子(相當於7目半)的世界大賽共有380盤對局,其中黑勝200局,勝率為52.6%(前3屆春蘭杯相當於貼5目半,未計入)。而臺灣舉辦的應氏杯(貼8點,也相當於7目半)則是黑勝100局,白勝97局。由此可見,即便是貼7目半,黑方似乎還是略占優勢。
那麼,到底黑方要向白方貼目多少才絕對公平?目前這個數值隻是根據大量人類對局作統計得出的,並非數學上的完美無懈的解答。
也許,讓AlphaGo學金庸武俠小說中的周伯通和郭靖左右互搏,自己左手跟右手下棋,然後通過大量內戰結果統計出貼目的合理數值?No,這也不是完美的解答。
前面說過,AlphaGo之所以能自己跟自己下棋,還是基於對人類對局的抽樣評估。這跟直接對人類對局進行統計沒什麼兩樣。
完美的解答,還是要回到最初,用最原始的窮舉法,找出下圍棋的最優解。這樣,才能徹底制訂貼目的數值。隻是不知道,運算量這麼大的工程,不知道要到什麼時候才能實現?
我們倒是可以設想一下圍棋得到徹底破解之後的情景:某國際圍棋大賽在萬眾矚目下開始瞭,執黑棋的棋手才下瞭第一子,裁判當即宣佈,執白棋的棋手不用下瞭,比賽結果已定,誰勝誰負或是打成平手已經水落石出。觀眾一片歡呼。
AlphaGo玩麻將怎麼樣兼論桌遊設計的隨機性
圍棋人機大戰人類雖然輸瞭,但有些網友表示,人類的智慧還有中國麻將守著(詳見鈦媒體文章《贏瞭圍棋冠軍不算什麼,阿爾法狗敢不敢挑戰麻將?|鈦搞瞭》)。但中搜網絡創始人、北京圍棋業餘賽冠軍陳沛對采訪他的記者說:“要是麻將,人類會輸得更慘!麻將一共就那麼多張,很容易算出來的。”
然而,陳沛的話其實是錯的。假設有個傻大木,他都不太會玩麻將,但他就是運氣好到爆棚,一開局就自摸十三么,請問AlphaGo可有破解高招?
麻將這類棋牌遊戲因為隨機抽牌,是有運氣成分的。
有網友就戲言:假如打麻將時三個人聯手對付AlphaGo,AlphaGo會輸得很慘。這雖然是作弊瞭,但也道出瞭一個大問題:在多人遊戲中,局面變得異常復雜,人工智能要如何才能應對?
比如說,三個人跟Alpha Go打麻將,雖然沒人作弊,但是甲玩傢技術不行打錯瞭牌導致乙玩傢得利,這是Alpha Go所無法控制的。
說起來,AlphaGo要學習打麻將,也是得基於對大量人類對局的樣本評估。Alpha Go隻能弄明白什麼樣的打法勝率較高,然而打麻將並沒有所謂必勝的打法。
圍棋的棋子擺在棋盤上是明眼可見的。不知大傢有沒有聽說過一種“暗棋”,就是將象棋的棋子反過來蓋上再玩的。陸戰棋也有暗棋的玩法。麻將其實也跟暗棋玩法類似,牌是蓋起來玩的。蓋起來的棋牌是什麼,還得猜測。Alpha Go頂多是通過計算進行評估,蓋起來的棋牌是什麼的可能性比較大,不可能準確推理得到唯一結果。也就是說Alpha Go永遠無法進化到100%獲勝的地步。
圍棋沒有運氣成分,而麻將有著運氣成分,兩者都有自己的魅力。
廣義上,圍棋、麻將這些棋牌遊戲,其實是屬於桌遊的范疇。圍棋的英文是“Go”,AlphaGo的“Go”就從此而來。圍棋躋身BGG桌遊排行榜前100名,是中國棋牌類遊戲排名最高的。
在民間,實際上像象棋、圍棋這類沒有運氣成分的棋牌(桌遊)已漸趨沒落。現在關註圍棋人機大戰的網友,又有多少人是圍棋迷呢?
因為大眾想要的更是娛樂,像象棋、圍棋這類沒有運氣成分的,玩起來水平發揮比較穩定,高手就是高手,一般人很難贏得瞭,除非你能找到棋力剛巧跟你一個水平檔次的,不然玩起來沒意思,強的太強弱的過弱。
故此,新興桌遊的設計宗旨,都是要保證隨機性,要有運氣成分。像萬智牌、遊戲王和爐石傳說之類隨機抽牌,飛行棋、大富翁之類擲骰子,都是產生隨機數,帶來運氣成分。有瞭運氣成分,所有玩傢發揮出來的水平就不至於相差太遠,能湊到一起玩個痛快。
另一方面,沒有運氣成分的棋牌(桌遊),因為理論上一定存在最優解,最優解一旦出來後,肯定讓人興致大減。圍棋就是因為變化委實太多,至今仍未有最優解,所以能存活到今天。現在,AlphaGo並沒有徹底擊敗李世石,看起來圍棋的生命力仍然很頑強。(本文首發鈦媒體)
台中通馬桶 本文來源:鈦媒體
責任編輯:張彬彬_NT台中清化糞池推薦5025
AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋
AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots
文章標籤
全站熱搜
留言列表