自去年AlphaGo大戰(zhàn)李世石后,多家科技公司借“人機(jī)大戰(zhàn)”展示人工智能技術(shù)。最近,搜狗耗資4000萬元讓機(jī)器人“汪仔”亮相江蘇衛(wèi)視“一站到底”,與人類選手對(duì)決。自開播以來,兩期節(jié)目均以汪仔戰(zhàn)勝人類落錘,但是,搜狗機(jī)器人的表現(xiàn)從第一期開始便引發(fā)了巨大爭(zhēng)議,“賽前背題庫”、“假AI真營銷”等傳聞一度甚囂塵上。
2月6日,江蘇衛(wèi)視“一站到底”播出首場(chǎng)人機(jī)對(duì)戰(zhàn)節(jié)目,有細(xì)心網(wǎng)友發(fā)現(xiàn)汪仔答對(duì)的題目幾乎全部是在往期節(jié)目中出現(xiàn)過的老問題,而絕大多數(shù)新問題汪仔都沒有搶答正確。無獨(dú)有偶,第二期人機(jī)對(duì)戰(zhàn)同樣出現(xiàn)歷史題目比例較高的情況,有超過三分之一的問題來源于網(wǎng)絡(luò)題庫。這使得外界質(zhì)疑汪仔所謂的語義理解、知識(shí)搜索等能力存在較大水分,能夠贏得對(duì)戰(zhàn)可能是賽前背題庫的結(jié)果。
此外,號(hào)稱搭載了搜狗“立知”系統(tǒng)的汪仔機(jī)器人在節(jié)目中作出的回答與立知搜索結(jié)果也存在較大出入。以第二期節(jié)目為例,當(dāng)主持人問到“‘你無情,你冷酷,你無理取鬧’,這句臺(tái)詞最早出自哪部電視劇?”時(shí),汪仔給出的答案是“還珠格格”,而但據(jù)搜狗立知顯示,搜狗早在2014年5月30日就已經(jīng)明確給出了正確答案是“情深深雨蒙蒙”,令人匪夷所思。
從提問形式上看,“一站到底”的問題也存在刻意降低難度、迎合搜索的痕跡。兩期節(jié)目中,主持人提問時(shí)采用的均為固定的封閉式問句,如“世界上面積最大的內(nèi)陸國是哪個(gè)國家?”“土耳其海峽連接的兩片海域分別是黑海和哪片海?”“我國第一支水彩顏料是由哪家知名企業(yè)生產(chǎn)?”等,這些問題對(duì)搜索引擎來說僅需要非常簡單的語義理解和關(guān)鍵詞匹配,便能直接檢索到答案,背后并不能體現(xiàn)高級(jí)的人工智能技術(shù)。例如,通過試驗(yàn)發(fā)現(xiàn),當(dāng)問題修改為開放式問句,如“世界上面積最大的內(nèi)陸國是?”,搜狗并不能直接給出答案。
除了問答題目,號(hào)稱體現(xiàn)汪仔“語音識(shí)別”能力的對(duì)話環(huán)節(jié)也被質(zhì)疑提前串詞。從現(xiàn)場(chǎng)表現(xiàn)來看,汪仔與選手的對(duì)話非常“人性化”。例如,在沒有任何“喚醒詞”的情況下,汪仔能準(zhǔn)確判斷選手與主持人的話是對(duì)誰說,進(jìn)而選擇“說話”或者“沉默”,且從對(duì)話的識(shí)別準(zhǔn)確度、反應(yīng)速度和對(duì)話內(nèi)容看來,汪仔表現(xiàn)出了驚人的“智能”,表現(xiàn)遠(yuǎn)超行業(yè)水平。然而,正是因?yàn)?ldquo;太真了”,反而讓人懷疑,什么樣的訓(xùn)練數(shù)據(jù)能訓(xùn)練成這樣?想來只有“背臺(tái)本”能完美實(shí)現(xiàn)。
嚴(yán)格來說,所謂人工智能是由機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺等不同領(lǐng)域的技術(shù)組成的,研究使命是賦予機(jī)器可模擬人類思維、意識(shí)和信息處理的能力,進(jìn)而使機(jī)器可以完成那些過去只有人類才能完成的工作。相比之下,“一站到底”比拼的是選手的知識(shí)儲(chǔ)備和快速應(yīng)變能力,并不考察人工智能模擬人類思考這一根本屬性,搜狗所謂的語義分析、問題理解、信息抽取等其實(shí)還是傳統(tǒng)意義上的關(guān)鍵詞匹配搜索。
將信息輸入搜索框,在后臺(tái)進(jìn)行準(zhǔn)確的理解、分析、檢測(cè)和匹配,是搜索引擎近二十年來的主要研究方向。搜狗借汪仔的殼將搜索結(jié)果換了一種形式呈現(xiàn),在技術(shù)上沒有明顯的進(jìn)步和創(chuàng)新。對(duì)于這次“人機(jī)大戰(zhàn)”,搜狗其實(shí)是在搜索技術(shù)上包裝了“人工智能”的外殼,對(duì)外宣稱汪仔使用的多項(xiàng)高新技術(shù)不過是放衛(wèi)星式的超前宣傳。而且,無論是蘋果siri,還是Google Now,語音問答技術(shù)早已被科技公司摸熟、玩透,搜狗拿這項(xiàng)技術(shù)來炒冷飯,反倒顯得有幾分敝帚自珍的意思。
高端技術(shù)的研發(fā)離不開企業(yè)在人、財(cái)?shù)确矫娴木薮笸度耄压放c一線科技公司在人工智能領(lǐng)域的投入上本就存在很大差距。與谷歌、IBM、Facebook等科技巨頭相比,搜狗鼓吹的4000萬研發(fā)費(fèi)用好比是陣毛毛雨,幾乎可以忽略不計(jì),而當(dāng)這些財(cái)力雄厚的科技公司已經(jīng)吸納了一批頂級(jí)人工智能專家時(shí),搜狗拿得出手的科技明星還只有頻繁出沒于商業(yè)活動(dòng)根本無法潛心技術(shù)的CEO王小川一人。搜狗能否拿得出真正集語音識(shí)別、圖像識(shí)別、語義分析、知識(shí)搜索、語音合成等功能于一身的機(jī)器人,可想而知。
此前,搜狗就曾在烏鎮(zhèn)互聯(lián)網(wǎng)大會(huì)上自導(dǎo)自演實(shí)時(shí)機(jī)器翻譯表演,卻因現(xiàn)場(chǎng)BUG頻出被戳穿是“人工”智能。而此番“一站到底”的尷尬表現(xiàn)也似乎正逐漸坐實(shí)外界對(duì)搜狗人工智能“敗絮其中”的猜測(cè),4000萬元的研發(fā)費(fèi)用不算少,希望沒有都花在營銷上。(來源:中國資訊網(wǎng))