?
昨日,科技圈最大的熱點(diǎn)莫過(guò)于世界圍棋冠軍李世石輸?shù)袅伺c谷歌人工智能系統(tǒng) AlphaGo 大戰(zhàn)當(dāng)中的第一場(chǎng)。
其實(shí)賽前,李開(kāi)復(fù)等多數(shù)科技大佬都紛紛預(yù)測(cè)李世石會(huì)擊敗 AlphaGo,李世石本人也是信心滿(mǎn)滿(mǎn),表示后者只是三段棋手的水平,贏下比賽并不難。圈內(nèi)一番熱議之后,支持率幾乎一邊倒,僅有少數(shù)人認(rèn)為機(jī)器會(huì)擊敗人類(lèi)。
李世石與 AlphaGo 首場(chǎng)比賽現(xiàn)場(chǎng)
然而,第一場(chǎng)比賽還是“爆了個(gè)大冷門(mén)”。在這場(chǎng)歷時(shí)三個(gè)半小時(shí)的對(duì)陣當(dāng)中,李世石在開(kāi)局占優(yōu)的大好局勢(shì)下連續(xù)失誤,最終惜敗 AlphaGo,著實(shí)讓人大跌眼鏡 ...
不過(guò),我們先別糾結(jié)李世石輸?shù)暨@場(chǎng)人機(jī)圍棋世紀(jì)大戰(zhàn)有多遺憾,換個(gè)角度看,這樣的結(jié)局實(shí)際上是科技界的一次勝利,人類(lèi)在人工智能的研究上已經(jīng)到上升到了一個(gè)新的 level。
我們來(lái)看看擊敗世界冠軍的 AlphaGo 到底強(qiáng)在哪里?
AlphaGo 的前世今生
AlphaGo 是由谷歌旗下 DeepMind 公司研發(fā)的圍棋程序,最初并不為人熟知。
到 2015 年 10 月以 5:0 完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾,AlphaGo 完成了史無(wú)前例的一次勝利,成為第一個(gè)擊敗圍棋專(zhuān)業(yè)選手的機(jī)器人,AlphaGo 瞬間名聲大噪。
除此之外,研究人員還測(cè)試了 AlphaGo 與其他圍棋人工智能機(jī)器人之間的戰(zhàn)績(jī),令人瞠目結(jié)舌的是,AlphaGo 在 495 局中僅輸了一場(chǎng),勝率高達(dá) 99.8%,說(shuō)它為圍棋界的常勝將軍也不為過(guò)。
AlphaGo 的殺手锏——深度學(xué)習(xí)
AlphaGo 如此驚艷的表現(xiàn)不禁讓人想起 IBM 研制的超級(jí)計(jì)算機(jī)——深藍(lán)(Deep Blue),深藍(lán)曾在 1997 年也曾代表機(jī)器贏下了與人類(lèi)之間的競(jìng)賽。
20 年后的今天,計(jì)算機(jī)的 CPU 以及 GPU 性能遠(yuǎn)遠(yuǎn)超過(guò)了彼時(shí)的水平,可以說(shuō) AlphaGo 與深藍(lán)相比絕對(duì)是有過(guò)之而無(wú)不及。有數(shù)據(jù)顯示,深藍(lán)的計(jì)算能力是 11.38 GFLOPS,而 AlphaGo 的計(jì)算能力是它的 2.5 萬(wàn)倍,二者差了 N 個(gè) level。
不過(guò),AlphaGo 最大的特點(diǎn)還不是計(jì)算能力的跨越,最讓人膽顫的恐怕還是其融入的深度學(xué)習(xí)能力。
“深度學(xué)習(xí)”是指多層的人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法。一層神經(jīng)網(wǎng)絡(luò)會(huì)把大量矩陣數(shù)字作為輸入,通過(guò)非線(xiàn)性激活方法取權(quán)重,再產(chǎn)生另一個(gè)數(shù)據(jù)集合作為輸出。這就像生物神經(jīng)大腦的工作機(jī)理一樣,通過(guò)合適的矩陣數(shù)量,多層組織鏈接一起,形成神經(jīng)網(wǎng)絡(luò)“大腦”進(jìn)行精準(zhǔn)復(fù)雜的處理,就像人們識(shí)別物體標(biāo)注圖片一樣。(來(lái)源于百度)
深度學(xué)習(xí)并非只用于協(xié)議上的機(jī)器人,這一概念適用于所有人工智能應(yīng)用,例如,人臉識(shí)別、語(yǔ)音識(shí)別、無(wú)人駕駛都可通過(guò)深度學(xué)習(xí)來(lái)實(shí)現(xiàn),說(shuō)其為一項(xiàng)高大上的技術(shù)應(yīng)該沒(méi)人反對(duì)吧。
AlphaGo 的深度學(xué)習(xí)功能由兩種深度神經(jīng)網(wǎng)絡(luò)完成:一個(gè)是“監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)(Policy Network)”,它的任務(wù)是觀察棋盤(pán)布局企圖找到最佳的下一步,通俗點(diǎn)講就是“落子選擇器”;另一個(gè)大腦是“價(jià)值網(wǎng)絡(luò)(Value Network)”,它的作用在于通過(guò)整體局面判斷來(lái)輔助落子選擇器。即一邊推算一邊判斷局面,不猜測(cè)下一步,只是預(yù)測(cè)每一個(gè)棋手贏棋的可能。這兩個(gè)神經(jīng)網(wǎng)絡(luò)相輔相成,缺一不可。
?
因?yàn)橛羞@兩張超強(qiáng)的神經(jīng)網(wǎng)絡(luò)大腦,AlphaGo 的思路和人類(lèi)幾乎是一致的,具體如下:
1. 基于深度模仿“腦” 來(lái)預(yù)測(cè)未來(lái)的下一步走法,直到 L 步。
2. 結(jié)合兩種方式來(lái)對(duì)未來(lái)到 L 的走勢(shì)進(jìn)行評(píng)估,就是通過(guò)上述兩個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)完成的。
3. 評(píng)估完,將評(píng)估結(jié)果作為當(dāng)前棋局下的下一步走法的估值。即給一開(kāi)始給出的下一步走法根據(jù)未來(lái)的走向進(jìn)行評(píng)估。
4. 結(jié)合下一步走法的估值和深度模仿腦進(jìn)行再一次的模擬,如果出現(xiàn)同樣的走法,則對(duì)走法的估值取平均。
5. 循環(huán) N 次上述步驟之后,選擇最多的走法作為下一步。
業(yè)界認(rèn)為,圍棋盤(pán)面的局部處理上是 AlphaGo 的強(qiáng)項(xiàng),同為專(zhuān)業(yè)九段棋手的古力也自嘆不如。如此看來(lái),面對(duì)這樣的對(duì)手,李世石今天似乎輸?shù)貌⒉浑y看。
計(jì)算機(jī)已經(jīng)超越人腦了嗎?
隨著人工智能的快速發(fā)展,以至于各種人工智能威脅論逐步被放大,這多少會(huì)讓人們產(chǎn)生恐慌。但是,就目前我們此刻還無(wú)法預(yù)測(cè)人工智能今后會(huì)發(fā)展到什么樣的地步,至少現(xiàn)它還沒(méi)有強(qiáng)大到威脅人類(lèi)生命。
其實(shí)去年就有研究指出,即使是現(xiàn)如今最先進(jìn)的超級(jí)計(jì)算機(jī),其強(qiáng)大的程度也僅僅是人類(lèi)大腦的三十分之一。當(dāng)時(shí),來(lái)自加利福尼亞大學(xué)伯克利分校 Katja Grace 博士和她的研究團(tuán)隊(duì)用 IBM 紅杉超級(jí)計(jì)算機(jī)和人腦作為對(duì)比,他們通過(guò)測(cè)試前者的持續(xù)運(yùn)算以及峰值運(yùn)算速度,最終得出的結(jié)論就是人腦比計(jì)算機(jī)要快 30 倍。
中科院院士段樹(shù)民認(rèn)為,李世石輸給 AlphaGo 還不能說(shuō)明人腦已經(jīng)被計(jì)算機(jī)超越了。他還指出,在純計(jì)算問(wèn)題上,計(jì)算機(jī)要強(qiáng)于人腦,但如果是比較復(fù)雜的功能,比如圖像認(rèn)知、情感、意識(shí)和綜合判斷,人腦是有絕對(duì)優(yōu)勢(shì)的。
最后還是啰嗦一句,李世石和 AlphaGo,不論誰(shuí)贏都是人類(lèi)的勝利!