建設(shè)和運(yùn)營(yíng)小而精的網(wǎng)站需從幾個(gè)方面入手 |
發(fā)布時(shí)間:2016-02-10 文章來(lái)源: 瀏覽次數(shù):3206 |
作者:劉鋒 計(jì)算機(jī)博士,互聯(lián)網(wǎng)進(jìn)化論作者,人工智能學(xué)家主編 ”把大象關(guān)進(jìn)冰箱要幾步“涉及的科學(xué)漏洞
在討論谷歌圍棋AI及其比賽題目之前,我們先看那個(gè)聞名的笑話“把大象關(guān)進(jìn)冰箱要幾步“,2000年中國(guó)春晚,趙本山、宋丹丹的小品《鐘點(diǎn)工》,曾經(jīng)用到了這個(gè)笑話:?jiǎn)?ldquo;把大象放進(jìn)冰箱總共分幾步?”答:“三步,第一步把冰箱門(mén)打開(kāi);第二步把大象放進(jìn)去,第三步把冰箱門(mén)帶上”。 小品中的情景只是一個(gè)笑話,從科研角度看,由于故意忽視最為樞紐的第二步,使得這個(gè)原本偉大的科學(xué)實(shí)驗(yàn),變成了笑話段子。本文提出谷歌圍棋AI及其比賽有科學(xué)欺詐表現(xiàn),根源也在這里。 谷歌圍棋AI在Nature上畢竟說(shuō)了什么 谷歌在Nature發(fā)表論文闡述了其圍棋AI程序AlphaGo的運(yùn)行原理,這個(gè)原理描述相對(duì)專(zhuān)業(yè),這里我們也力爭(zhēng)用通俗易懂的語(yǔ)言描述谷歌畢竟說(shuō)了什么,谷歌圍棋AI程序AlphaGo在下棋過(guò)程中主要通過(guò)四步完成工作,它們分別是: 第一步快速判定:用于快速的觀察圍棋的盤(pán)面,類(lèi)似于人觀察盤(pán)面獲得的第一反應(yīng) 第二步深度模仿 :AlphaGo學(xué)習(xí)近萬(wàn)盤(pán)人類(lèi)歷史高手的棋局來(lái)進(jìn)行模仿學(xué)習(xí),用得到的經(jīng)驗(yàn)進(jìn)行判定。這個(gè)深度模仿能夠根據(jù)盤(pán)面產(chǎn)生類(lèi)似人類(lèi)棋手的走法。 第三步自學(xué)成長(zhǎng):AlphaGo不斷與“自己”對(duì)戰(zhàn),下了3000萬(wàn)盤(pán)棋局,總結(jié)出經(jīng)驗(yàn)作為棋局中的評(píng)估依據(jù)。 第四步全局分析:利用第三步學(xué)習(xí)結(jié)果對(duì)整個(gè)盤(pán)面的贏面判定,實(shí)現(xiàn)從全局分析整個(gè)棋局。 判定欺詐的第一個(gè)原因,谷歌的把大象關(guān)冰箱題目 Nature論文闡述的AlphaGo基本原理,按照人工智能專(zhuān)家的評(píng)價(jià):”其基本原理并沒(méi)有新東西“,但核心價(jià)值是學(xué)習(xí)了近萬(wàn)盤(pán)人類(lèi)歷史高手的棋局,和自我對(duì)戰(zhàn)下的3000萬(wàn)盤(pán)棋局總結(jié)的經(jīng)驗(yàn)。 請(qǐng)留意,這個(gè)樞紐內(nèi)容,也就是AlphaGo到底終結(jié)出什么圍棋規(guī)律,或者其神經(jīng)網(wǎng)絡(luò)的權(quán)重值是什么,谷歌并沒(méi)有發(fā)表出來(lái)。也就是谷歌在”大象關(guān)進(jìn)冰箱要幾步“題目上,說(shuō)出了如何打開(kāi)圍棋擊敗人類(lèi)的冰箱大門(mén),和如何關(guān)上圍棋擊敗人類(lèi)的冰箱大門(mén),但唯獨(dú)在第二步 圍棋如何擊敗人類(lèi)的方法塞進(jìn)冰箱,同樣做了躲藏。 我們知道,圍棋之所以很難被人工智能攻破,擊敗人類(lèi)高手,就是其可能的組合數(shù)異常龐大。至于多么異常,2016年1月普林斯頓的研究職員給出了最新研究結(jié)果:對(duì)于一個(gè)19x19的圍棋棋盤(pán)而言,一共有361個(gè)位置,而每個(gè)位置可以單獨(dú)放置黑棋、白棋或者留空,理論上所有的可能組合是3^361種。但根據(jù)圍棋規(guī)則,不是所有位置都可正當(dāng)落子,例如在圍棋術(shù)語(yǔ)中沒(méi)有氣的位置就不能落子。那么排除掉這些不正當(dāng)?shù)钠寰趾罂偣策剩多少種呢? 普林斯頓的研究職員給出的19x19格圍棋的精確正當(dāng)棋局?jǐn)?shù):208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935 我們給它多分幾行: 2081681993819799846 9947863334486277028 6522453884530548425 6394568209274196127 3801537852564845169 8519643907259916015 6281285460898883144 2712971531931755773 6620397247064840935 不用數(shù)了,一共171位數(shù)! 這個(gè)數(shù)字比我們地球所有的沙粒數(shù)目還要多!比人類(lèi)已知宇宙的所有星球數(shù)目還要多!對(duì)比一下,谷歌學(xué)習(xí)的近萬(wàn)盤(pán)人類(lèi)棋局是5位數(shù),谷歌自行對(duì)戰(zhàn)的3000萬(wàn)盤(pán)是8位數(shù)。而圍棋所有可能的棋局盤(pán)數(shù)是171位數(shù)。假如規(guī)避還有可能的重復(fù)變化,我們把大頭去掉,那也有70位數(shù)的棋局變化。 第一也就是說(shuō)谷歌以幼兒園規(guī)模的知識(shí)量,就要獲得諾貝爾獎(jiǎng)級(jí)的知識(shí)規(guī)律,這是違反科學(xué)發(fā)展規(guī)律和常識(shí)的,第二,假如谷歌通過(guò)學(xué)習(xí)和自行對(duì)戰(zhàn)學(xué)到了超出平常的規(guī)律,或者其神經(jīng)網(wǎng)絡(luò)權(quán)重值達(dá)到新的高度狀態(tài)。但谷歌不愿意公然這個(gè)最重要最樞紐的內(nèi)容,其他研究者就無(wú)法真正了解谷歌圍棋的真實(shí)水平。在這種情況下,匆忙舉辦獲得巨大貿(mào)易利益,沒(méi)有第三方真正監(jiān)視,無(wú)法洗脫作弊嫌疑的世界冠軍比賽。受到科學(xué)欺詐指控也屬必定。 判定欺詐的第二個(gè)原因,密室實(shí)驗(yàn)與棋手放水 從科學(xué)實(shí)驗(yàn)的嚴(yán)謹(jǐn)性說(shuō),谷歌在論文中闡述的實(shí)驗(yàn)方法,表現(xiàn)不及格甚至惡劣,我們知道在物理,化學(xué),生物,計(jì)算機(jī)等領(lǐng)域,進(jìn)行實(shí)驗(yàn)時(shí),要求實(shí)驗(yàn)對(duì)象必需達(dá)到一定數(shù)目,并進(jìn)行多次獨(dú)立實(shí)驗(yàn)。才能相對(duì)確保結(jié)果的不亂性和可靠性。譬如一個(gè)受到污染的試管,不管我們重復(fù)多少次實(shí)驗(yàn),其結(jié)果也一定是不可靠的。 谷歌在這篇論文中 對(duì)其他圍棋程序選取了眾多測(cè)試對(duì)象,并進(jìn)行了495次實(shí)驗(yàn),但對(duì)人類(lèi)測(cè)試者,卻只選取了一位曾經(jīng)獲得歐洲圍棋冠軍的棋手,并簽署嚴(yán)格的保密協(xié)議,原本可以很輕易邀請(qǐng)更多選手,但卻沒(méi)有按照科學(xué)規(guī)范進(jìn)行多次實(shí)驗(yàn)。先不談谷歌和棋手之間有無(wú)利益交易,就這一點(diǎn),谷歌在Nature發(fā)表的論文從實(shí)驗(yàn)角度是分歧格的。 更重要的題目出在與谷歌對(duì)戰(zhàn)的歐洲圍棋冠軍樊麾身上,在對(duì)戰(zhàn)棋譜宣布后的二個(gè)月里,大量職業(yè)圍棋高手蘊(yùn)藉或公然指出樊麾水平施展變態(tài),或不求進(jìn)取,或就是放水。 多次擊敗李世石,當(dāng)前世界最優(yōu)秀的圍棋選手柯潔評(píng)價(jià)道:“他可能也是好久不下棋了,實(shí)力表現(xiàn)非常糟糕”。前北京市高校圍棋冠軍王爍在財(cái)新發(fā)布的文章中評(píng)價(jià)道:“這五局棋下得反而是很平庸。樊麾抵擋不足,五盤(pán)棋沒(méi)有什么激烈的戰(zhàn)斗,開(kāi)局、定式、占大場(chǎng)、小規(guī)模接觸戰(zhàn),收官,對(duì)抗度很差。” 固然歐洲圍棋冠軍樊麾多次辯解“我施展變態(tài),當(dāng)時(shí)崩潰了“,但更多棋友評(píng)價(jià)歐洲圍棋冠軍樊麾,“施展有技術(shù)變形”,“樊麾的表現(xiàn)只有業(yè)4水準(zhǔn),樞紐地方顯著放水”,“很顯著樊麾是谷歌公司的托,全是50年前的招法極其守舊,不輸才怪”,“對(duì)于谷歌,沒(méi)有什么假話是不能用1千萬(wàn)美金解決的”。 除此之外,谷歌也沒(méi)有向Facebook那樣把圍棋程序放到互聯(lián)網(wǎng)上,光明磊落的接受大眾的考驗(yàn),作為與谷歌AlphaGo原理相同facebook圍棋程序DarkForest,目前水平相稱(chēng)于業(yè)余5段,與職業(yè)選手依然有巨大的差距。 同時(shí)谷歌的論文結(jié)論也存在不可重復(fù)題目,F(xiàn)acebook圍棋項(xiàng)目負(fù)責(zé)人田淵棟在評(píng)價(jià)谷歌圍棋AI最為樞紐的快速走子策略時(shí)講到”對(duì)此AlphaGo只提供了局部特征的數(shù)量,而沒(méi)有說(shuō)明特征的詳細(xì)細(xì)節(jié)。我最近也實(shí)驗(yàn)了他們的辦法,達(dá)到了25.1%的正確率和4-5微秒的走子速度,然而全系統(tǒng)整合下來(lái)并沒(méi)有復(fù)現(xiàn)他們的水平。我感覺(jué)上24.2%并不能完全概括他們快速走子的棋力,由于只要走錯(cuò)樞紐的一步,局面判定就完全錯(cuò)誤了“。 從上述情況看,谷歌圍棋實(shí)驗(yàn)刻意違背科學(xué)規(guī)范,采用密室孤立實(shí)驗(yàn),這些題目在3月9日與韓國(guó)選手李世石的比賽中沒(méi)有消除。人們常說(shuō),互聯(lián)網(wǎng)上,你不知道你的對(duì)面坐的是人仍是條狗。同樣對(duì)于谷歌圍棋比賽,我們完全可以質(zhì)疑,與李世石對(duì)弈的畢竟是程序仍是人?如何保證李世石沒(méi)有被利益收買(mǎi)?谷歌即使不贏,實(shí)在也是勝了,魯迅的那個(gè)故事,乞丐:趙老爺今天打了我。 判定欺詐的第三個(gè)原因,過(guò)度追求市場(chǎng)影響與進(jìn)步股價(jià)
谷歌選擇歐洲圍棋冠軍和前圍棋冠軍李世石進(jìn)行世界轟動(dòng)的比賽,而且沒(méi)有嚴(yán)格的第三方監(jiān)視,排除作弊的可能,表明谷歌并不是追求科學(xué)的嚴(yán)謹(jǐn)和榮譽(yù),而是在追求品牌和影響力最大化,從而獲得巨大的經(jīng)濟(jì)利益。 事實(shí)也證實(shí)這一點(diǎn),2016年1月28日曝出了谷歌人工智能?chē)鍛?zhàn)勝歐洲冠軍的動(dòng)靜,隨后是谷歌拿出100萬(wàn)美元作為獎(jiǎng)金挑戰(zhàn)李世石。當(dāng)日谷歌股價(jià)大幅上漲,漲幅4.42%,換算成市值漲了200億美元。從宣傳效果是看,谷歌這次的“廣告”做非常巧妙。2016年2月26日彭博社報(bào)道,谷歌旗下人工智能公司DeepMind正推進(jìn)自身醫(yī)療技術(shù)發(fā)展,由于其在圍棋領(lǐng)域的影響,已經(jīng)獲得不菲的訂單。 谷歌的技術(shù)期貨路徑和消除欺詐指控的方法
西方諺語(yǔ)說(shuō)”一個(gè)動(dòng)物,假如它走起來(lái)像鴨子 叫起來(lái)像鴨子 它就是鴨子“,同樣,對(duì)于谷歌圍棋Ai及其比賽,假如它回避公然如何從3000萬(wàn)盤(pán)(8位數(shù))棋局獲得171位天文數(shù)字棋局的規(guī)律或神經(jīng)網(wǎng)絡(luò)權(quán)重值,回避不愿大范圍邀請(qǐng)棋手介入實(shí)驗(yàn),回避收買(mǎi)選手嫌疑,回避不在互聯(lián)網(wǎng)上公然對(duì)戰(zhàn)接受監(jiān)視,那么谷歌的圍棋比賽可以看作一場(chǎng)精心策劃的科學(xué)騙局或有欺詐嫌疑。 貿(mào)易中有一種做法叫產(chǎn)品期貨,消費(fèi)者購(gòu)買(mǎi)商品后,要等到半年或一年后才能拿到,那時(shí)技術(shù),原料本錢(qián)大幅下降,商家因此獲得利潤(rùn)。同樣,谷歌的圍棋程序應(yīng)該獲得一定進(jìn)展,但遠(yuǎn)沒(méi)有到達(dá)能夠挑戰(zhàn)職業(yè)選手或九段高手的地步,谷歌通過(guò)市場(chǎng)和技術(shù)手段,拔高其圍棋水平。故意回避公然監(jiān)視或公然大范圍對(duì)戰(zhàn)。等待未來(lái)水平繼承晉升后,可能會(huì)進(jìn)行公然,這種做法也可以稱(chēng)作 ”技術(shù)期貨路徑。 谷歌可以消除欺詐指控的嫌疑,不是與李世石下棋,而是: 1.完整宣布或開(kāi)源其利用3000萬(wàn)盤(pán)棋局和學(xué)習(xí)人類(lèi)棋譜總結(jié)的規(guī)律,或公然其神經(jīng)網(wǎng)絡(luò)權(quán)重值參數(shù),讓其他實(shí)驗(yàn)者可以重復(fù)谷歌的實(shí)驗(yàn)結(jié)果,還原谷歌對(duì)戰(zhàn)成績(jī)。 2.將谷歌圍棋AI程序AlphaGo放在互聯(lián)網(wǎng)上,接受百人,千人的同時(shí)對(duì)戰(zhàn)。并檢測(cè)對(duì)戰(zhàn)結(jié)果,消除作弊嫌疑。 這兩條谷歌能做出任意一條都可以看作是消除欺詐指控的強(qiáng)有力證據(jù),但在未來(lái)一年或更長(zhǎng)時(shí)間里,谷歌沒(méi)有任何動(dòng)作,那么谷歌將持續(xù)背負(fù)有科學(xué)欺詐嫌疑,利用科學(xué)炒作獲得巨大經(jīng)濟(jì)利益的指控。 |
|