忘忧草在线影院www日本,亚洲偷偷自拍高清,中国女人内谢69xxx,亚洲自偷自拍另类12p

>

2016-11-23|
分享到:
|2302 |文章來源:科技訊

百度首席科學家吳恩達演講實錄:語音是人機交互最自然的方式

11月22日,百度語音開放平臺三周年主題活動在北京召開,本次大會百度公開宣布開放四大語音技術——情感合成、遠場方案、喚醒二期、長語音方案,為開發者提供免費接入入口。百度首席科學家吳恩達在主題演講中表示,“語音是人類交流、人機交互最自然的方式,通過開放語音技術,百度希望可以推動語音功能產品繁榮的浪潮。

在演講中吳恩達詳細解讀了百度人工智能核心成果“百度大腦”及其核心組成部分,包括語音、圖像、自然語言處理、用戶畫像、機器學習五大重要組成部分。在百度語音開放平臺三周年之際,吳恩達還向外界公開介紹百度語音技術最新數據情況:注冊開發者數量達到14億,在線識別請求量2016年每天達到1.4億次,在線語音合成請求量則達到2億次,再次證明了語音開放平臺開放給開發者帶來的實用價值。

此外,吳恩達還對人工智能的未來充滿信心,他認為,人工智能的未來會體現在方方面面,例如陪伴機器人,個性化私教,音樂作曲,機器人醫生等。

以下是吳恩達演講實錄:

大家好,非常高興大家今天來參加我們的語音開放平臺三周年發布會。

我是“百度大腦”的項目負責人吳恩達,在百度大腦的項目中有一部分非常重要的工作,就是把最領先的技術輸出給大家使用。在百度大腦開放平臺上,我們不僅輸出人工智能技術,也有很多有關人工智能技術的培訓資料。

那么,百度大腦到底是什么呢?它最核心的幾個技術部分為:語音、圖像、自然語言處理、用戶畫像、機器學習平臺。我發現很多人使用百度的語音技術有兩大原因,第一個原因,百度有非常領先的技術為他們的用戶提供更好的體驗;第二個原因,我個人做了好幾十年有關人工智能的項目,發現通常你剛開始做一個項目的時候,只是需要語音技術,當做了幾個月以后,你發現還需要圖像技術或者自然語言處理技術等等。如果你是使用百度大腦開放平臺,你可以比較容易的選擇真正需要的技術部分把它放進來,把它融合,為你做到最好的效果。再比如說你想服務一個智能客戶,開始的時候覺得只需要語音識別、語音合成技術,但是做了幾個月以后,發現你需要最領先的自然語言處理技術。如果你是使用百度大腦開放平臺,希望你比較容易拿到這些技術放到自己的產品中。

我個人對人工智能的未來充滿信心,我希望未來我們會有陪伴機器人、個性化私教、音樂作曲、機器人醫生等等。這些年人工智能技術發展的非常快,這給我們,也給你們帶來很多新的機會,在百度是沒有辦法探索這么多非常有潛力的機會,所以我們的目標就是把我們的人工智能技術輸出給大家,希望可以支持你們在非常有潛力的項目上探索,而且支持你們在這些項目中獲得非常好的結果。

今天大會的主題就是語音技術。大家可能已經知道,在很多最重要的百度產品中,我們已經支持語音輸入,包括手機百度、百度地圖、百度輸入法。如果你還沒有試過百度輸入法,我希望你試一試,我輸入信息時就挺喜歡用百度輸入法。還有度秘,最近我們把度秘放入各類硬件中,比如小度機器人。度秘系統可以為客戶點餐,把度秘和機器人融合,也可以讓各種用戶有新的體驗。

這幾年來,我們的團隊在不斷地優化語音識別系統,在2012年開始使用DNN模型,后來有比較好的特征,之后開始用Sequence Discriminative Training,也開始使用LSTM模型,加上CTC,今年我們的團隊開發了Deep CNN模型,效果在不斷進步,這就是我們的語音識別系統。

此外,我們的語音合成模型也變得越來越好,這幾年來我們在好幾個技術方面有比較大的突破,我們的語音合成效果也變得越來越好。現在百度在中國語音合成的能力是遠遠超過其他公司的,今天下午我們的語音團隊負責人也會和大家分享更多細節。

因為我們的語音技術、自然語言處理技術、我們的人機交互技術進步的這么快,2016年MIT科技評論我們的技術是2016年十大突破性技術之一,我們覺得這些技術有很大的潛力,可以改變人機交互的效率和辦法。

未來語音技術在很多應用場景有很好的機會,為人機交互帶來巨大的改變。舉個例子,在智能家居的場景,我們希望未來你回家以后可以使用語音跟你的電視、遙控器、音箱、窗簾講話,比如說希望你未來可以向你的電燈說,“電燈請打開”,它就明白你的命令,或者對遙控器說話,它就能非常方便的滿足你的需求。其實智能家居只是一個應用場景,我覺得在很多應用場景中,語音技術都可以帶來人機交互非常大的改變,這包括手機、音箱、電視等等。希望語音能讓你做更好的智能客服中心。在汽車領域語音也是一個非常重要的人機交互的場景,我們有很多合作伙伴正在使用我們的語音技術探索這些應用場景。

最后,今天我們已經知道,尤其是在手機端,我們知道語音輸入比鍵盤打字更快、更方便、更準確。下一位進行演講的是我的好朋友,也是斯坦福大學James Landay教授,他也會為大家分享有關這方面的研究,就是使用百度的語音識別系統,如果你使用這個系統,在手機端輸入就可以更快、更方便、更自然。

語音輸入這么方便,希望未來語音輸入會變得更普及。大家想一想,如果你跟我想交流,最自然的辦法就是你跟我講一句話,或者我跟你講一句話,所以人和人交流最自然的辦法還是語音。這幾年來,語音和自然語言處理和度秘這種技術進步這么快,今天很多場景,人機交互最自然的辦法已經是語音。人機交互不只是你跟電腦或者和設備講話,你的電腦和設備也需要告訴你它的意見,所以我們的語音技術也可以讓這些設備非常自然的告訴你它的意見。

最后,因為人工智能,尤其是語音技術這幾年發展的很快。在百度大腦已經有好幾種不同的人工智能技術,其中比較成熟的,就是我們的語音技術。所以語音技術已經給我們,也給大家,也給你們,給你的公司,給開發者很多新的機會。所以,我希望我們輸出語音技術,希望它可以為大家提供非常好的服務,也希望我們可以使用我們的技術支持你們探索這些新機會,希望你們可以使用這些技術,支持你們在這些新機會中獲得非常好的成果。

謝謝大家!

文章評論

請輸入您的留言: