11月17日上午消息,第三屆世界互聯(lián)網(wǎng)大會(huì)正在烏鎮(zhèn)舉行,搜狗公司首席執(zhí)行官王小川在今日上午發(fā)表了演講。
王小川認(rèn)為,大家可以看到人工智能的重要突破是在語(yǔ)音和文字方面,但圖像、自然語(yǔ)音處理的發(fā)展是緩慢的。他提到,作為產(chǎn)品經(jīng)理,可以看到人工智能的三個(gè)方向:識(shí)別、創(chuàng)造與判斷,而其中有重要意義的是在判斷。在過(guò)去,傳統(tǒng)方式是將規(guī)則交給機(jī)器,而未來(lái)將要將目標(biāo)交給機(jī)器,讓它能深度學(xué)習(xí)。
王小川分析說(shuō)此前他特別好奇Alphago在下棋的第四局輸?shù)袅耍珕?wèn)過(guò)工程師后發(fā)現(xiàn)其實(shí)這不是程序有bug,而是深度學(xué)習(xí)的體系有瓶頸。那么以深度學(xué)習(xí)為代表的體系還有哪些是不靠譜的?
第一,語(yǔ)音識(shí)別靠譜嗎?許多技術(shù)在安靜環(huán)境下識(shí)別可以達(dá)到95%甚至到97%,但有噪音的情況下識(shí)別率就下降,“那么如果有兩個(gè)人說(shuō)話(huà)呢?無(wú)解。”王小川曾經(jīng)咨詢(xún)過(guò)學(xué)術(shù)界的人,發(fā)現(xiàn)這個(gè)人與機(jī)器在人工識(shí)別的差別在于如何解決問(wèn)題,一位博士說(shuō),但凡兩個(gè)人說(shuō)話(huà)只要有一個(gè)人有差別人就能辨別出來(lái),但機(jī)器不能。
第二,語(yǔ)義靠譜嗎?在一款產(chǎn)品的測(cè)試中,機(jī)器的表現(xiàn)非常驚艷,但是有個(gè)環(huán)節(jié)是,如果你問(wèn)是否需要停車(chē)位,回答我沒(méi)車(chē),機(jī)器是理解不來(lái)的。“今天機(jī)器在自然語(yǔ)音處理方面還遠(yuǎn)遠(yuǎn)不夠。”王小川分析說(shuō)。
第三,無(wú)人駕駛靠譜嗎?無(wú)人駕駛對(duì)于見(jiàn)過(guò)的場(chǎng)景、使用過(guò)的場(chǎng)景表現(xiàn)非常優(yōu)異,但使用的場(chǎng)景不止于五環(huán)路上,現(xiàn)階段的無(wú)人駕駛還需要輔助駕駛。
王小川總結(jié)說(shuō),深度學(xué)習(xí)是有限的,人工智能還缺乏對(duì)符號(hào)的理解,對(duì)于創(chuàng)造性事物的理解。那么人工智能是否會(huì)出現(xiàn)第三次退潮,也就是說(shuō)真正的人工智能時(shí)代還未到達(dá),王小川表示,“人工智能已經(jīng)進(jìn)入到實(shí)用階段,有更多的資本投入,人才投入,我們也期待行業(yè)不斷產(chǎn)生新的突破。”
值得一提的是,王小川在此次演講的同時(shí),還利用實(shí)時(shí)語(yǔ)音轉(zhuǎn)錄技術(shù)進(jìn)行了實(shí)時(shí)語(yǔ)言輸入轉(zhuǎn)錄,但除了中文顯示,還有實(shí)時(shí)的英語(yǔ)翻譯。也就是說(shuō),在自然語(yǔ)言的輸出、處理方面,搜狗已經(jīng)實(shí)現(xiàn)了:輸入、轉(zhuǎn)錄和翻譯。