搜狗砸4000萬參加“一站到底” 網友:我可能看到了假的機器人
自去年AlphaGo大戰(zhàn)李世石后,多家科技公司借“人機大戰(zhàn)”展示人工智能技術。最近,搜狗耗資4000萬元讓機器人“汪仔”亮相江蘇衛(wèi)視“一站到底”,與人類選手對決。自開播以來,兩期節(jié)目均以汪仔戰(zhàn)勝人類落錘,但是,搜狗機器人的表現從第一期開始便引發(fā)了巨大爭議,“賽前背題庫”、“假AI真營銷”等傳聞一度甚囂塵上。
2月6日,江蘇衛(wèi)視“一站到底”播出首場人機對戰(zhàn)節(jié)目,有細心網友發(fā)現汪仔答對的題目幾乎全部是在往期節(jié)目中出現過的老問題,而絕大多數新問題汪仔都沒有搶答正確。無獨有偶,第二期人機對戰(zhàn)同樣出現歷史題目比例較高的情況,有超過三分之一的問題來源于網絡題庫。這使得外界質疑汪仔所謂的語義理解、知識搜索等能力存在較大水分,能夠贏得對戰(zhàn)可能是賽前背題庫的結果。
此外,號稱搭載了搜狗“立知”系統(tǒng)的汪仔機器人在節(jié)目中作出的回答與立知搜索結果也存在較大出入。以第二期節(jié)目為例,當主持人問到“‘你無情,你冷酷,你無理取鬧’,這句臺詞最早出自哪部電視劇?”時,汪仔給出的答案是“還珠格格”,而但據搜狗立知顯示,搜狗早在2014年5月30日就已經明確給出了正確答案是“情深深雨蒙蒙”,令人匪夷所思。
從提問形式上看,“一站到底”的問題也存在刻意降低難度、迎合搜索的痕跡。兩期節(jié)目中,主持人提問時采用的均為固定的封閉式問句,如“世界上面積最大的內陸國是哪個國家?”“土耳其海峽連接的兩片海域分別是黑海和哪片海?”“我國第一支水彩顏料是由哪家知名企業(yè)生產?”等,這些問題對搜索引擎來說僅需要非常簡單的語義理解和關鍵詞匹配,便能直接檢索到答案,背后并不能體現高級的人工智能技術。例如,通過試驗發(fā)現,當問題修改為開放式問句,如“世界上面積最大的內陸國是?”,搜狗并不能直接給出答案。
除了問答題目,號稱體現汪仔“語音識別”能力的對話環(huán)節(jié)也被質疑提前串詞。從現場表現來看,汪仔與選手的對話非常“人性化”。例如,在沒有任何“喚醒詞”的情況下,汪仔能準確判斷選手與主持人的話是對誰說,進而選擇“說話”或者“沉默”,且從對話的識別準確度、反應速度和對話內容看來,汪仔表現出了驚人的“智能”,表現遠超行業(yè)水平。然而,正是因為“太真了”,反而讓人懷疑,什么樣的訓練數據能訓練成這樣?想來只有“背臺本”能完美實現。
嚴格來說,所謂人工智能是由機器學習、計算機視覺等不同領域的技術組成的,研究使命是賦予機器可模擬人類思維、意識和信息處理的能力,進而使機器可以完成那些過去只有人類才能完成的工作。相比之下,“一站到底”比拼的是選手的知識儲備和快速應變能力,并不考察人工智能模擬人類思考這一根本屬性,搜狗所謂的語義分析、問題理解、信息抽取等其實還是傳統(tǒng)意義上的關鍵詞匹配搜索。
將信息輸入搜索框,在后臺進行準確的理解、分析、檢測和匹配,是搜索引擎近二十年來的主要研究方向。搜狗借汪仔的殼將搜索結果換了一種形式呈現,在技術上沒有明顯的進步和創(chuàng)新。對于這次“人機大戰(zhàn)”,搜狗其實是在搜索技術上包裝了“人工智能”的外殼,對外宣稱汪仔使用的多項高新技術不過是放衛(wèi)星式的超前宣傳。而且,無論是蘋果siri,還是Google Now,語音問答技術早已被科技公司摸熟、玩透,搜狗拿這項技術來炒冷飯,反倒顯得有幾分敝帚自珍的意思。
高端技術的研發(fā)離不開企業(yè)在人、財等方面的巨大投入,搜狗與一線科技公司在人工智能領域的投入上本就存在很大差距。與谷歌、IBM、Facebook等科技巨頭相比,搜狗鼓吹的4000萬研發(fā)費用好比是陣毛毛雨,幾乎可以忽略不計,而當這些財力雄厚的科技公司已經吸納了一批頂級人工智能專家時,搜狗拿得出手的科技明星還只有頻繁出沒于商業(yè)活動根本無法潛心技術的CEO王小川一人。搜狗能否拿得出真正集語音識別、圖像識別、語義分析、知識搜索、語音合成等功能于一身的機器人,可想而知。
此前,搜狗就曾在烏鎮(zhèn)互聯網大會上自導自演實時機器翻譯表演,卻因現場BUG頻出被戳穿是“人工”智能。而此番“一站到底”的尷尬表現也似乎正逐漸坐實外界對搜狗人工智能“敗絮其中”的猜測,4000萬元的研發(fā)費用不算少,希望沒有都花在營銷上。(來源:中國資訊網)