搜狗砸4000萬參加“一站到底” 網友：我可能看到了假的機器人

時間：2017-02-17 17:48:05 來源：

自去年AlphaGo大戰(zhàn)李世石后，多家科技公司借“人機大戰(zhàn)”展示人工智能技術。最近，搜狗耗資4000萬元讓機器人“汪仔”亮相江蘇衛(wèi)視“一站到底”，與人類選手對決。自開播以來，兩期節(jié)目均以汪仔戰(zhàn)勝人類落錘，但是，搜狗機器人的表現從第一期開始便引發(fā)了巨大爭議，“賽前背題庫”、“假AI真營銷”等傳聞一度甚囂塵上。

2月6日，江蘇衛(wèi)視“一站到底”播出首場人機對戰(zhàn)節(jié)目，有細心網友發(fā)現汪仔答對的題目幾乎全部是在往期節(jié)目中出現過的老問題，而絕大多數新問題汪仔都沒有搶答正確。無獨有偶，第二期人機對戰(zhàn)同樣出現歷史題目比例較高的情況，有超過三分之一的問題來源于網絡題庫。這使得外界質疑汪仔所謂的語義理解、知識搜索等能力存在較大水分，能夠贏得對戰(zhàn)可能是賽前背題庫的結果。

此外，號稱搭載了搜狗“立知”系統(tǒng)的汪仔機器人在節(jié)目中作出的回答與立知搜索結果也存在較大出入。以第二期節(jié)目為例，當主持人問到“‘你無情，你冷酷，你無理取鬧’，這句臺詞最早出自哪部電視劇?”時，汪仔給出的答案是“還珠格格”，而但據搜狗立知顯示，搜狗早在2014年5月30日就已經明確給出了正確答案是“情深深雨蒙蒙”，令人匪夷所思。

從提問形式上看，“一站到底”的問題也存在刻意降低難度、迎合搜索的痕跡。兩期節(jié)目中，主持人提問時采用的均為固定的封閉式問句，如“世界上面積最大的內陸國是哪個國家?”“土耳其海峽連接的兩片海域分別是黑海和哪片海?”“我國第一支水彩顏料是由哪家知名企業(yè)生產?”等，這些問題對搜索引擎來說僅需要非常簡單的語義理解和關鍵詞匹配，便能直接檢索到答案，背后并不能體現高級的人工智能技術。例如，通過試驗發(fā)現，當問題修改為開放式問句，如“世界上面積最大的內陸國是?”，搜狗并不能直接給出答案。

除了問答題目，號稱體現汪仔“語音識別”能力的對話環(huán)節(jié)也被質疑提前串詞。從現場表現來看，汪仔與選手的對話非常“人性化”。例如，在沒有任何“喚醒詞”的情況下，汪仔能準確判斷選手與主持人的話是對誰說，進而選擇“說話”或者“沉默”，且從對話的識別準確度、反應速度和對話內容看來，汪仔表現出了驚人的“智能”，表現遠超行業(yè)水平。然而，正是因為“太真了”，反而讓人懷疑，什么樣的訓練數據能訓練成這樣?想來只有“背臺本”能完美實現。

嚴格來說，所謂人工智能是由機器學習、計算機視覺等不同領域的技術組成的，研究使命是賦予機器可模擬人類思維、意識和信息處理的能力，進而使機器可以完成那些過去只有人類才能完成的工作。相比之下，“一站到底”比拼的是選手的知識儲備和快速應變能力，并不考察人工智能模擬人類思考這一根本屬性，搜狗所謂的語義分析、問題理解、信息抽取等其實還是傳統(tǒng)意義上的關鍵詞匹配搜索。

將信息輸入搜索框，在后臺進行準確的理解、分析、檢測和匹配，是搜索引擎近二十年來的主要研究方向。搜狗借汪仔的殼將搜索結果換了一種形式呈現，在技術上沒有明顯的進步和創(chuàng)新。對于這次“人機大戰(zhàn)”，搜狗其實是在搜索技術上包裝了“人工智能”的外殼，對外宣稱汪仔使用的多項高新技術不過是放衛(wèi)星式的超前宣傳。而且，無論是蘋果siri，還是Google Now，語音問答技術早已被科技公司摸熟、玩透，搜狗拿這項技術來炒冷飯，反倒顯得有幾分敝帚自珍的意思。

高端技術的研發(fā)離不開企業(yè)在人、財等方面的巨大投入，搜狗與一線科技公司在人工智能領域的投入上本就存在很大差距。與谷歌、IBM、Facebook等科技巨頭相比，搜狗鼓吹的4000萬研發(fā)費用好比是陣毛毛雨，幾乎可以忽略不計，而當這些財力雄厚的科技公司已經吸納了一批頂級人工智能專家時，搜狗拿得出手的科技明星還只有頻繁出沒于商業(yè)活動根本無法潛心技術的CEO王小川一人。搜狗能否拿得出真正集語音識別、圖像識別、語義分析、知識搜索、語音合成等功能于一身的機器人，可想而知。

此前，搜狗就曾在烏鎮(zhèn)互聯網大會上自導自演實時機器翻譯表演，卻因現場BUG頻出被戳穿是“人工”智能。而此番“一站到底”的尷尬表現也似乎正逐漸坐實外界對搜狗人工智能“敗絮其中”的猜測，4000萬元的研發(fā)費用不算少，希望沒有都花在營銷上。(來源：中國資訊網)