谷歌的人工智能系統(tǒng)剛剛在圍棋游戲中擊敗人類大師,圍棋是一個有著2500年悠久歷史的競賽游戲,較之國際象棋,其策略和智力復雜程度呈指數(shù)級增長。
Bostrom是牛津大學哲學教授,出生于瑞典,近期暢銷書《Superintelligence: Paths, Dangers, Strategies》讓這位教授聲名鵲起,他在書中探討了人工智能的好處,也提出這樣的主張,一臺真實的智能計算機能加速人類滅亡。倒不是說他低估了谷歌圍棋機器的力量。他只是認為,這并不一定是一次巨大飛躍。Bostrom指出,多年來,系統(tǒng)背后的技術(shù)一直處于穩(wěn)定提升中,其中包括有過諸多討論的人工智能技術(shù),比如深度學習和強化學習。谷歌擊敗圍棋大師不過是更大弧線進程中的一部分。這一進程始于很久以前,也將延續(xù)至未來幾年。
Bostrom說,「過去和現(xiàn)在,最先進的人工智能都取得了很多進展,」「(谷歌)的基礎(chǔ)技術(shù)與過去幾年中的技術(shù)發(fā)展密切相連。」
但是,如果你以另一種方式看待這個事情,它正是谷歌獲勝為什么如此激動人心的原因所在——或許還也有點讓人害怕。Bosrom甚至認為,這是一個停下來的好理由,看一看這項技術(shù)已經(jīng)走了多遠并正往何處去。研究人員曾經(jīng)認為,人工智能破解圍棋至少還需要另一個十年。如今,它正前往曾被視為無法企及之處。或者,至少說,許多人——他們可自由支配巨大權(quán)力和大量金錢——決心要抵達的那些地方。
這并不僅僅是指谷歌。也指Facebook,微軟以及其他科技巨人。創(chuàng)造出最聰明人工智能的努力真的已經(jīng)演變成一場競賽,而且競爭者們都是這個地球上最有權(quán)力也最富有的巨人。在谷歌這場勝利當中,最生動的部分可能就是扎克伯格的反應(yīng)。
搭建大腦
谷歌的人工智能系統(tǒng),亦即AlphaGo,由DeepMind研發(fā),谷歌早在2014年就花4億美元收購了這家人工智能研究機構(gòu)。DeepMind專門從事深度學習和強化學習研究,這些技術(shù)能讓機器自己進行大量學習。以前,創(chuàng)始人Demis Hassabis和他的團隊已經(jīng)使用這些技術(shù)搭建了一些會玩經(jīng)典雅達利視頻游戲(比如,Pong,Breakout以及Space Invaders)的系統(tǒng)。在有些案例中,這些系統(tǒng)不僅比職業(yè)玩家還出色,它們還會以天馬行空的方式玩游戲,沒有人類玩家會或者可以這么玩。顯然,這就是促使佩奇買下這家公司的原因。
使用所謂的神經(jīng)網(wǎng)絡(luò)—— 近似大腦神經(jīng)元網(wǎng)絡(luò)的硬件和軟件網(wǎng)絡(luò)——深度學習就是顯著有效的圖片搜索工具驅(qū)動力——更不用說Facebook的面部識別服務(wù),微軟Skype的翻譯工具以及推特的色情內(nèi)容識別系統(tǒng)。如果你用數(shù)百萬游戲招數(shù)訓練深度網(wǎng)絡(luò),你就能教會它玩這款游戲。而且,當你用其他海量數(shù)據(jù)組訓練它時,就能教會神經(jīng)網(wǎng)絡(luò)完成其他任務(wù),從為谷歌搜索引擎生成結(jié)果到識別電腦病毒。
強化學習將系統(tǒng)能做的事情向前推進一步。一旦搭建起一個很善于玩游戲的神經(jīng)網(wǎng)絡(luò),你就能讓它和自己對戰(zhàn)。隨著兩個版本的神經(jīng)網(wǎng)絡(luò)彼此對陣數(shù)以千計次后,系統(tǒng)就能追查出哪些招數(shù)回報最高——也就是說,得分最高——并以這種方式學會以更高的水平玩游戲。但是,再一次,這一技術(shù)并不限于游戲。也能適用到任何類似游戲,包含策略和競爭的事情上。
AlphaGo使用了這一切。而且還遠不止此。Hassabis和他團隊添加了一個二級 「深度強化學習」,預(yù)測每一步的長效成果。而且他們采用了過去驅(qū)動圍棋游戲人工智能系統(tǒng)的傳統(tǒng)人工智能技術(shù),包括蒙特卡洛樹搜索。借鑒新舊技術(shù),他們搭建起能夠擊敗頂級職業(yè)選手的系統(tǒng)。十月,AlphaGo與三次衛(wèi)冕歐洲圍棋冠軍的選手進行了閉門對弈,比賽結(jié)果于周三早上才對外公布。比賽對弈五局,AlphaGo五局全勝。
極其復雜
這場勝利之前,許多人工智能磚家認為,它不可能打敗頂尖人類棋手——至少不會這么快。最近幾個月,F(xiàn)acebook已經(jīng)在研究自己的圍棋人工智能系統(tǒng),盡管它并沒有像許多其他研究人員那樣密切致力于圍棋項目,就像DeepMind那樣。上個禮拜,當我們問及LeCun,這位負責Facebook人工智能研究 工作的深度學習創(chuàng)建人,谷歌是否已經(jīng)秘密打敗了了象棋大師時,他說,這不太可能(it was unlikely)。他的回答是,「不(No)?;蛟S(Maybe)。不(No)。」
Facebook開源自己的人工智能硬件
問題在于圍棋特別復雜。國際象棋平均一回合有35種可能的下法,圍棋卻高達250種可能。而且每個走法之后還有另外250種走法。以此類推。這意味著,即使最大的超級計算機也不能預(yù)測出每個可能下法的結(jié)果。因為太多了。正如Hassabis說的,可能的位置比宇宙原子數(shù)量還要多。為了破解圍棋,你需要一種不光會計算的人工智能。它需要多少模仿人類, 甚至是人類直覺。你需要會學習的東西。
這就是谷歌和Facebook要解決這個難題的原因。如果他們能夠解決如此復雜的問題,那么,他們也能將研究所得作為跳板,邁向處理更實際現(xiàn)實生活問題的人工智能。Hassabis說,這些技術(shù)和機器人學是「天作之合」。它們能讓機器人更好地了解環(huán)境并對環(huán)境中不可預(yù)測的變化做出響應(yīng)。想象一臺能洗盤子的機器。但是,他也相信,這些技術(shù)能增進科學研究,提供了可以為研究人員指明下一個重大突破的人工智能助手。
而且那也略過了一些將會改變?nèi)祟惾粘I畹母又苯拥膽?yīng)用。DeepMind技術(shù)能幫助智能電話識別圖片、語音以及翻譯,不僅如此,還能理解語言。這些技術(shù)正通往這樣的機器:它能理解用普通老式英語說的話,并用這種語言回答我們。
他們是認真的
這一切解釋了為什么扎克伯格如此渴望在谷歌披露自己已經(jīng)擊敗一位圍棋大師這一消息幾小時之前,更新自己的Facebook討論圍棋。
谷歌以在學術(shù)期刊Nature上發(fā)布研究論文的方式公布了這一結(jié)果,而且Facebook員工也在官方發(fā)布之前獲得這份論文(消息發(fā)布兩天前,也和一些記者方分享了這一消息,不過締結(jié)了守秘協(xié)議)。結(jié)果,扎克伯格以及公司許多其他人就采取了某種預(yù)損失控制行動。
谷歌宣布消息的前一晚,F(xiàn)acebook人工智能研究人員發(fā)布了一嶄新的研究論文,介紹了他們自己的圍棋研究工作——就其本身水平來說,研究工作還是令人印象深刻的——扎克伯格也在自己的賬戶上宣傳了這篇論文。他說,「在過去六個月中,我們已經(jīng)搭建起一個能以0.1秒之速下棋的人工智能,同時也和之前那些花費數(shù)年搭建起來的系統(tǒng)一樣出色。」「研究人員田淵棟,就坐在距離我20英尺的座位上。我喜歡讓我們的人工智能團隊坐在我旁邊,這樣我就能從他們的研究中學習些東西?!?/p>
不必介意Facebook的圍棋人工智能不像AlphaGo走得那么遠。正如LeCun指出的,F(xiàn)acebook并沒有在圍棋問題上像DeepMind那樣投入很多資源。而且也沒有花費很多時間研究這方面。為什么公司在谷歌大日子前夕強調(diào)自己的研究工作,原因尚不清楚,但是現(xiàn)實是,F(xiàn)acebook——特別是扎克伯格——非常重視這類人工智能。然而,這種人工智能競賽并不真的僅僅是個哪家公司系統(tǒng)更會玩圍棋的問題。毋寧是哪家公司能夠吸引到頂級人工智能人才的問題。扎克伯格和LeCun都知道,他們必須向相對小規(guī)模的人工智能社區(qū)展示,在這個問題上,公司態(tài)度是認真的。
有多認真?哦,最明顯的地方就是扎克伯格測量了自己和田淵棟的距離。在Facebook,你的重要性取決于你的座位距離扎克伯格有多近。而且,扎克伯格個人也卷入了對人工智能的需求中——毫無疑問。今年元旦,扎克伯格說,2016年的個人挑戰(zhàn)就是打造一個人工智能系統(tǒng),在家庭和工作事務(wù)中,幫助自己。
威脅
谷歌和Facbook意圖搭建人工智能,它將在許多方面超越人類智能。但是,他們不是唯一的兩個玩家。微軟,推特和馬斯克以及其他許多人都在同一方向上推進著自己的研究。對于人工智能研究來說,那是件了不起的事情。而且,對于像Nick Bostrom這樣的人——以及,呃,馬斯克——來說,它也讓人感到恐懼。
正如深度學習創(chuàng)業(yè)公司Skymind的CEO兼創(chuàng)始人Chris Nicholson指出的,圍棋證實的這類人工智能幾乎能用于解決任何可被視為某種游戲的難題——策略會在其中扮演重要角色的任何事情。他說,這包括金融交易和戰(zhàn)爭。這兩個例子都需要更多的研究工作——以及更多的數(shù)據(jù)。不過,思維本身并未得到解決。Bostrom的書言之有理,人工智能會比核武器還要危險,原因不僅在于人類會濫用人工智能,還在于我們能打造出多少無法加以控制的人工智能系統(tǒng)。
類似Alpha Go.這樣的系統(tǒng)。是的,系統(tǒng)會己學習——確實會和自己對弈,自己生成數(shù)據(jù)和策略,在圍棋游戲中(我們?nèi)匀黄诖鴮Q世界最頂尖的圍棋選手之一),它能勝過幾乎所有人類。但是,盡管圍棋很復雜,但是,它也是一個有限的宇宙——并不近乎真實事情那般復雜。而且,DeepMind的研究人員已經(jīng)完全掌控系統(tǒng)。他們能夠以自己意愿改變它并關(guān)掉它。事實上,考慮將這種特殊機器視為危險,甚至是毫無意義的。
擔憂在于,隨著研究人員不斷改進該系統(tǒng),他們會在不知不覺中跨越那道門檻,有關(guān)世界末日的焦慮確實開始變得有意義。Bostrom說,他和他的Futhre of Humanity Institute其他同仁正在關(guān)注加強學習找到突破人類控制的方式。他說,「某些同樣的問題會出現(xiàn)在今后更佳成熟的系統(tǒng)中,我們今天也能在系統(tǒng)中找到類似的問題?!顾忉尩?,有許多小的暗示表明,強化學習會產(chǎn)生機器拒絕被關(guān)閉的情形。
但是,這些是非常小的暗示。Bostrom承認,如果這樣的危險真的會發(fā)生,那還很遙遠。謝謝他的努力,也感謝那些諸如馬斯克這樣有影響力的技術(shù)專家們,對于潛在危險而言,這種更為廣泛的興師動眾無異于未雨綢繆,是明智的。這些擔心說明了一件最重要的事情,像DeepMind的那些尚處發(fā)展中的技術(shù),它們非常強大。
谷歌的這次勝利說明了同一件事。但是,這場勝利僅僅是序曲。3月,AlphaGo將挑戰(zhàn)過去十年中的世界頂級圍棋選手李在石,這場比賽將更加重要。李在石比剛剛在倫敦輸?shù)舯荣惖臍W洲冠軍樊麾更有才能。樊麾世界排名633,而李在石世界排名第五。許多專家相信,AlphaGo將會贏得這場重量級較量。如果事實果真過如此,好吧,那也只是一個序曲。