不管你是否准備好,人工智能正以秋風掃落葉之勢向人類發起各項挑戰。
2017年年初,人工智能“Master”用連勝60局的戰績橫掃了世界圍棋界各路頂尖高手,一周時間的最后,Alpha Go(阿爾法狗)脫下“Master”的馬甲,宣布暫時閉關。他的最后一個對手、世界冠軍古力留下兩個字:絕望。
在棋壇一騎絕塵之后,網友們依然不服輸:有本事就來跟我打麻將。而人工智能真的來了,雖然挑戰的項目不是麻將,而是和麻將有相通之處的德州扑克。
人工智能轉戰德州扑克 首次戰勝人類職業玩家
近日,加拿大和捷克幾位科學家的一篇題為《DeepStack:無限注德扑的專業級人工智能玩家》的論文中,介紹了一種能在一對一無限注(任何人在任何時候可下任何數目籌碼)德州扑克中擊敗人類玩家的新算法DeepStack。
該團隊邀請了來自17個國家的33名專業扑克選手挑戰DeepStack,進行了44852次較量。DeepStack成為了首個在一對一無限注德扑中戰勝人類玩家的人工智能,並且平均勝率達到了492mbb/g(一般人類玩家到50 mbb/g就被認為擁有較大優勢,750mbb/g 就是對手每局都棄牌的贏率)。
圍棋被攻陷后,為何是德州扑克來承載人類應戰的責任?
圍棋對弈,雙方的棋子都盡顯在一方棋盤中,也就是“完整信息游戲”。阿爾法狗的勝利,實質上就是揭開了圍棋玄而又玄的神秘面紗,証實了其計算的本質。
而德州扑克則是“非完整信息游戲”,信息不完全透明,玩家隻看得到自己手中的牌,無法得知對手的牌,並在博弈過程中包含了欺騙、推測。簡單來說,這是一個“人心不可測”的游戲。
你不僅要思考別人要做什麼,思考自己做什麼,甚至要思考別人會認為你做什麼,進而推理出自己的下一步。這些爾虞我詐的戰術更像是兵法。
在這篇論文中,多次出現一個詞:“直覺”,也就是我們常說的“牌感”。DeepStack注重培養人工智能出牌時的“直覺”。在運用深度學習,反復自我博弈之后,DeepStack學會了在每一個具體情境出現時進行推理。
這非常接近人類玩家的“牌感”,即在當前情境下對個人牌面大小的感覺,並作出相應的決策。
那麼,這次勝利能夠說明人工智能已經擁有了人類的直覺和推理能力嗎,能說人工智能已經讀懂人心了嗎?
德州扑克資深玩家:震驚但表示懷疑
人工智能在德州扑克上戰勝人類的消息一出,幾位資深德州扑克玩家在震驚之余,也表示了懷疑。
曾在一檔德州扑克的電視真人秀節目中獲得冠軍的教小瘦認為:“圍棋、國際象棋等游戲理論上是個純技術類游戲,因為機器在計算和統計上有著絕對的優勢,所以在這個領域人工智能戰勝人類是完全沒問題的。但是德州扑克短期的對局中運氣因素十分重要。除了運氣之外,人類還存在著‘詐牌’這種獨有的欺騙性的打法,而這種打法是人類才會具備的技巧,是一種情緒的反應,這一點人工智能是無法具備的。”
不過對於人工智能是否能夠真的在德州扑克上戰勝人類,教小瘦表示在超過一定手牌數的時候,人類就完全不是對手了。
“我們人類完全靠記憶記錄對手邏輯思維順序,還有打牌的模式套路,而人工智能會直接存檔,把你每一手牌的牌和過程全部記錄下來,客觀上這一點人類就比較難做到。所以在一個較長手牌數的對局中,運氣成分概率上被稀釋,人工智能對於人類對扑克理解的數據收集后,人類就完全無法對抗了。”
另一位長年混跡德州圈的“莫小胖”同樣也對人工智能所謂的“牌感”表示懷疑。他認為機器在“感”這個字上不可能達到人的境界,就算能贏也只是基於它強大的數據收集和計算能力上,在加上人會受到外界因素的干擾,會不可避免地出現失誤。
莫小胖認為,在打德州扑克的過程中需要不斷地對於場面變化進行判斷和應對,這其中摻雜了情緒、心理、氣勢等一系列主觀因素,人工智能的牌感是它對於比賽信息收集之后的一個數據化的結果。如果論文中所說的“牌感”真實存在,那麼這個人工智能確實可以說是真的在這個領域打敗人類了。
浙江大學人工智能研究所所長:DeepStack仍然是基於大數據
DeepStack戰勝人類職業玩家的消息登上各大媒體,浙江大學人工智能研究所所長、教授吳飛也第一時間下載了這篇論文。
“這次勝利肯定不是基於對對手表情心理的解讀和推理,本質上還是基於大數據的學習與訓練,是基於人類給它的一個樣本,並不能說它已經具備了推理能力。”
李開復老師也是一位德州扑克玩家。他在知乎上關於“德州扑克有哪些技巧、經驗或者原則”的回答排名第一:“很多人認為德州扑克要學好詐唬(高手慣用技巧)和讀懂對方,但就算想成為詐唬專家,也要先學好統計。”。
但就像對於戰勝國際象棋高手的超級計算機“深藍”、戰勝圍棋高手的阿爾法狗是一種飛躍一樣,戰勝德州扑克職業玩家的DeepStack也是一種飛躍。“它的研究方向肯定是對的,人工智能的目標就是人類的直覺。”
愛因斯坦曾說過,人類真正有價值的東西就是直覺。吳飛教授解釋道:“直覺能夠產生創造力,而創造力是一種跳躍式思維,牛頓能從蘋果掉下來聯想到萬有引力。”
從一件事情想到另一件事情,這是一個離散空間的思維跳躍,是人工智能在連續空間中無法推理出來的。你能用一個數學公式來証明出牛頓是如何想出萬有引力的嗎?並不能。
而吳飛教授也明確表示人工智能是無法解決這一問題的。“因為人類自己都無法提供一個知識庫和常識規則來解釋。鳥會飛,鴕鳥是鳥,但由此推理出來的‘鴕鳥會飛’卻是錯的。”
正是因為知識的不確定性,人類自己都無法窮盡推理的無窮可能,又如何能為人工智能提供一個數據庫來讓其學習呢?
所以,人工智能讀懂人心?不可能。
不管你有沒有准備好 人工智能的戰書不會停止
其實在這篇論文幾天前,美國卡內基梅隆大學已經發出預告:該校教授領導研發出的Libratus人工智能系統,將於當地時間1月11日,在賓夕法尼亞州匹茲堡的 Rivers 賭場,與四個頂級職業玩家玩12萬手的HUNL,並角逐20萬美元的獎金。
與DeepStack沒有公開對戰現場不同,卡內基梅隆大學走的是當年阿爾法狗的路線,在華麗的賭場搞一場秀,與人類頂尖玩家對戰,還有20萬美金的噱頭。
不論這次公開的“秀”是否會讓人類再次“顏面掃地”,可以肯定的是,人工智能向人類下的戰書隻會越來越多。
過去的20年間,我們見証了人類的不斷敗北,比如西洋雙陸棋、跳棋、國際象棋、Jeopardy 、Atari 電子游戲和圍棋。德州扑克之后,人工智能又會盯住什麼呢?
PC用戶掃碼,手機用戶長按二維碼加“人民創投”公眾號