百度吳恩達(dá):不必?fù)?dān)心機(jī)器人會(huì)掌控世界
來(lái)源:新浪科技
1月20日,未來(lái)論壇創(chuàng)立大會(huì)在北京成功舉行。百度首席科學(xué)家吳恩達(dá)在論壇上發(fā)表了題為“人工智能與深度學(xué)習(xí)”的主題演講,并在會(huì)后接受了新浪科技的采訪。
吳恩達(dá)提到,“我們最近決定看看,以神經(jīng)網(wǎng)絡(luò)取代傳統(tǒng)語(yǔ)音識(shí)別軟件。世界走向移動(dòng)設(shè)備,想象一下我們圍繞語(yǔ)音界面重新設(shè)計(jì)移動(dòng)產(chǎn)品——語(yǔ)音將會(huì)推動(dòng)手機(jī)的革命。我想要重新設(shè)計(jì)大家的手機(jī)”,這也將改變很多家用電器、可穿戴設(shè)備等等,“這些設(shè)備有太多界面了,如果用語(yǔ)音識(shí)別和設(shè)備進(jìn)行溝通,會(huì)更加方便。”
技術(shù)發(fā)展帶來(lái)深度發(fā)展新機(jī)會(huì)
吳恩達(dá)以建造火箭為例,闡述了深度學(xué)習(xí)越來(lái)越火爆的原因。“火箭有兩個(gè)部分,第一部分是火箭發(fā)射機(jī),是很大的發(fā)動(dòng)機(jī)。第二個(gè)是燃料,如果發(fā)動(dòng)機(jī)小,燃料很多是不可能的,如果發(fā)動(dòng)機(jī)很小,燃料很少也不行,燃料燒著燒著就沒(méi)了,所以火箭必須要有一個(gè)大發(fā)動(dòng)機(jī)和很多的燃料。深度學(xué)習(xí)和這個(gè)差不多,我們現(xiàn)在神經(jīng)網(wǎng)絡(luò)就是我們發(fā)動(dòng)機(jī),它推動(dòng)著AI的發(fā)展,燃料就是我們所用的數(shù)據(jù),我們現(xiàn)在有這么多的數(shù)據(jù),社會(huì)數(shù)據(jù)化給我們提供了大量的數(shù)據(jù),這樣輸入到我們發(fā)動(dòng)機(jī)中給我們作為燃料。”
如今,隨著移動(dòng)互聯(lián)網(wǎng)的興起,大家的交流方式慢慢地從文本轉(zhuǎn)向圖像和視頻,基于此,越來(lái)越多的人開(kāi)始搜索圖像和語(yǔ)言,而通過(guò)深度學(xué)習(xí),可以幫助人們更好地了解文本和圖像、語(yǔ)音之間的互動(dòng)關(guān)系。
在吳恩達(dá)看來(lái),隨著軟件和技術(shù)的發(fā)展,帶來(lái)了新的機(jī)會(huì),使得軟件可以通過(guò)深度學(xué)習(xí)來(lái)分析數(shù)據(jù),從而使得我們擁有更多的數(shù)據(jù),使得計(jì)算機(jī)視覺(jué)可以做到之前所無(wú)法做到的事情。
目前百度基于深度學(xué)習(xí)技術(shù)的產(chǎn)品已有很多,深度學(xué)習(xí)技術(shù)幫助我們更好地理解語(yǔ)言、圖片和語(yǔ)音,使計(jì)算機(jī)更好地理解我們的溝通。并希望能通過(guò)各種方式去更好地利用這一技術(shù)。
其中一個(gè)最主要的例子是對(duì)對(duì)象的識(shí)別。你可以讓計(jì)算機(jī)去“看”一張圖片,并從中識(shí)別出對(duì)象。在許多知名的評(píng)分中,百度獲得了最好的成績(jī)。此前一些別的團(tuán)隊(duì)獲得了最好成績(jī),而我們?cè)诖嘶A(chǔ)上繼續(xù)改進(jìn)。這是通過(guò)深度學(xué)習(xí)技術(shù)來(lái)實(shí)現(xiàn)的。這需要通過(guò)建設(shè)龐大的神經(jīng)網(wǎng)絡(luò),輸入大量數(shù)據(jù),而百度的GPU技術(shù)使其成為了可能。
機(jī)器人不會(huì)掌控世界
AI快速的發(fā)展促成了一些炒作,大家忍不住會(huì)想,未來(lái)的某一天,計(jì)算機(jī)或許會(huì)成為機(jī)器人,掌控整個(gè)世界?
吳恩達(dá)很?chē)?yán)肅地表示,他們是會(huì)和我們一起創(chuàng)造一個(gè)很好的世界,并不會(huì)成為邪惡的機(jī)器人。因?yàn)椋蠹彝耆梢岳眉夹g(shù)進(jìn)行預(yù)測(cè),技術(shù)不斷的改變,神經(jīng)網(wǎng)絡(luò)是非常好的識(shí)別工具,還有預(yù)測(cè)的工具,當(dāng)你輸入數(shù)據(jù)的時(shí)候它們可以進(jìn)行預(yù)測(cè)。
如果我們能夠遠(yuǎn)離炒作,AI發(fā)展是比較健康的,AI創(chuàng)造的挑戰(zhàn)并不是機(jī)器會(huì)掌控世界,他很可能會(huì)幫助我們替代勞工,我們領(lǐng)導(dǎo)者必須要認(rèn)真考慮技術(shù),要讓人工智能技術(shù)幫助我們替代那些繁雜的勞動(dòng)。
百度語(yǔ)音識(shí)別正取得很好進(jìn)展
百度的語(yǔ)音識(shí)別技術(shù)正取得很好的進(jìn)展,計(jì)算機(jī)已經(jīng)保存了大量語(yǔ)音數(shù)據(jù),通過(guò)訓(xùn)練神經(jīng)網(wǎng)絡(luò),從而打造了非常準(zhǔn)確的語(yǔ)音識(shí)別系統(tǒng)。當(dāng)前語(yǔ)音識(shí)別技術(shù)的一大問(wèn)題在于無(wú)法在嘈雜的環(huán)境中使用,例如當(dāng)你在一個(gè)很吵的車(chē)中開(kāi)車(chē)時(shí),這樣的技術(shù)無(wú)法很好地提供服務(wù)。百度目前擁有嘈雜環(huán)境中最優(yōu)秀的語(yǔ)音識(shí)別技術(shù)。
至于如何克服語(yǔ)音識(shí)別技術(shù)研發(fā)中的困難,則需要做兩方面的工作。一方面在于規(guī)模,百度需要研究如何建設(shè)規(guī)模很大的網(wǎng)絡(luò)。因此百度擁有著很強(qiáng)大的GPU團(tuán)隊(duì),并開(kāi)發(fā)了強(qiáng)大的GPU軟件。另一方面,百度需要找到足夠多的數(shù)據(jù)來(lái)作為這一大型神經(jīng)網(wǎng)絡(luò)的輸入內(nèi)容。
在百度工作令人興奮
吳恩達(dá)已經(jīng)在百度工作將近一年的時(shí)間,也不可避免地接觸到公司以及團(tuán)隊(duì)的成員。這也是一個(gè)不可回避的問(wèn)題。
當(dāng)然,吳恩達(dá)在提到這個(gè)問(wèn)題的時(shí)候非常愉快,因?yàn)樵谒磥?lái),在百度工作令人興奮而愉快。公司非常敏捷,動(dòng)作很快,所以可以創(chuàng)造出一些東西,而且與研發(fā)團(tuán)隊(duì)的共事也讓人感到興奮。
他還以語(yǔ)音識(shí)別來(lái)舉例說(shuō)明。百度有3個(gè)實(shí)驗(yàn)室,這3個(gè)實(shí)驗(yàn)室之間經(jīng)常共同討論,相互提供專(zhuān)業(yè)指導(dǎo)。許多人會(huì)相互拜訪、相互溝通。以往當(dāng)語(yǔ)音技術(shù)宣布突破時(shí),美國(guó)的團(tuán)隊(duì)出現(xiàn)進(jìn)展,北京的團(tuán)隊(duì)就會(huì)借鑒來(lái)自英語(yǔ)環(huán)境的經(jīng)驗(yàn),并轉(zhuǎn)而在中文環(huán)境中嘗試。百度是一家統(tǒng)一的公司,大家努力作為同一個(gè)團(tuán)隊(duì)、同一家公司來(lái)行動(dòng)。
百度吳恩達(dá):圖像和音視頻搜索是人工智能新方向
日前,未來(lái)論壇創(chuàng)立大會(huì)在北京舉行。百度公司首席科學(xué)家吳恩達(dá)發(fā)表了題為《機(jī)器學(xué)習(xí)與AI人工智能》的主題演講。在他看來(lái),通過(guò)移動(dòng)互聯(lián)網(wǎng)的興起,交流方式從文本慢慢轉(zhuǎn)向圖像和視頻,因此,越來(lái)越多的人通過(guò)AI就能夠更好的了解這些文本和圖像,以及語(yǔ)言之間的互動(dòng)關(guān)系。以下是吳恩達(dá)的演講實(shí)錄:
Andrew Ng:在過(guò)去幾年中,AI 人工智能和深層次的學(xué)習(xí)不斷轉(zhuǎn)變技術(shù),而且給公司創(chuàng)建了巨大的經(jīng)濟(jì)價(jià)值,也在更大改進(jìn)人類(lèi)和技術(shù)獲得的方式。但是關(guān)于 AI 人工智能也有非常多的炒作,我今天要做的就是向大家傳達(dá)兩個(gè)信息,一個(gè),我希望能夠向大家介紹一下 AI 人工智能領(lǐng)域所發(fā)生的現(xiàn)象,我希望三十年之后,大家能夠講述什么是腳踏實(shí)地,什么是炒作。其次,如果你是組織的領(lǐng)導(dǎo)人,我希望 30 分鐘之后你能夠有戰(zhàn)略性的思維,思考一下最近的歷史和 AI 近期的未來(lái),這樣就能夠更好的領(lǐng)導(dǎo)團(tuán)隊(duì)做出更好的關(guān)于 AI 和技術(shù)的決策,因?yàn)?/span> AI 和互聯(lián)網(wǎng)正在改變著我們的生活和我們的經(jīng)濟(jì)結(jié)構(gòu)。
過(guò)去十五年間,我們現(xiàn)在都有一個(gè)關(guān)于人工智能正循環(huán)的理念,我們認(rèn)為它能夠帶來(lái)一個(gè)很好的產(chǎn)品,服務(wù)很多的用戶(hù),有著很多的用戶(hù)就能夠收集很多的數(shù)據(jù),用戶(hù)數(shù)據(jù)、服務(wù)數(shù)據(jù),有很多數(shù)據(jù)就能夠使我們使用 AI 繼續(xù)改善我們的產(chǎn)品。但是這張圖的問(wèn)題就在于,直到近期 AI 這一步其實(shí)做的都不好,傳統(tǒng)來(lái)說(shuō),即便是你加大投入,但是它的性能也不會(huì)提高。我們現(xiàn)在對(duì) AI 和深度學(xué)習(xí)的理解,只要你現(xiàn)在衡量 AI 的技術(shù)等等,他的 AI 性能會(huì)越來(lái)越高,這樣就能夠減少它的成本,提高它的性能,在大數(shù)據(jù)的時(shí)代這些深度學(xué)習(xí)的算法比傳統(tǒng) AI 算法要更好,因?yàn)樗軌蛑饾u提高 AI 的性能,因此歷史上第一次我們能夠在這個(gè)圖中完成 AI 的環(huán)節(jié),得到數(shù)據(jù),得到很好的產(chǎn)品,接觸大量的用戶(hù)。
大多數(shù)互聯(lián)網(wǎng)信息都是基于文本的,通過(guò)移動(dòng)互聯(lián)網(wǎng)的興起,我們認(rèn)為這種交流方式同文本慢慢轉(zhuǎn)向圖像和視頻,所以在百度我們看到越來(lái)越多的人搜索圖像和語(yǔ)言,我認(rèn)為通過(guò) AI 我們就能夠更好的了解這些文本和圖像,以及語(yǔ)言之間的互動(dòng)關(guān)系。我現(xiàn)在想給大家介紹一些例子,向大家解釋一下 AI 是如何使用今天的互聯(lián)網(wǎng)。
AI如何使用今天的互聯(lián)網(wǎng)
百度這樣的公司在文本上做了很多工作,我們先從圖像開(kāi)始。七年前我問(wèn)我斯坦福的學(xué)習(xí),讓他們寫(xiě)一個(gè)算法,在圖像中找到杯子。七年前當(dāng)時(shí)最好的算法,他們使用了最好的算法,這就是結(jié)果,在各個(gè)地方都找到了杯子,這是錯(cuò)誤的。對(duì)于你和我來(lái)說(shuō),作為人類(lèi)來(lái)說(shuō),很難理解計(jì)算機(jī)為什么無(wú)法識(shí)別出這個(gè)杯子,為什么計(jì)算機(jī)看不到我們能看到的東西?計(jì)算機(jī)很難做到這一點(diǎn),我們?cè)敿?xì)的看一看,我們眼中看到的是杯子,但是計(jì)算機(jī)看到的是很多的像素,所以計(jì)算機(jī)的作用是看這些數(shù)字來(lái)考驗(yàn)?zāi)氵@些數(shù)字代表的是什么,代表的是這個(gè)杯子的口,看起來(lái)這是一個(gè)計(jì)算機(jī)的問(wèn)題,六、七年前如果讓機(jī)器來(lái)解決這些問(wèn)題是非常困難的。
五年前發(fā)生了變化,興起了深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的技術(shù),我們當(dāng)時(shí)受到了人類(lèi)大腦運(yùn)作的啟發(fā),開(kāi)始創(chuàng)造軟件,模擬這些神經(jīng)元的工作方式。深度學(xué)習(xí)是什么意思?我們建立這些神經(jīng)網(wǎng)絡(luò),深度模擬我們大腦中神經(jīng)源信息傳統(tǒng)的路徑和方式。在 AI 中有很多炒作,這些炒作的原因之一,很多人說(shuō)這句話,深度學(xué)習(xí)推動(dòng)科技發(fā)展,這句簡(jiǎn)簡(jiǎn)單單的話,這句口號(hào)都對(duì) AI 進(jìn)行炒作。
在午餐的時(shí)候我跟饒毅進(jìn)行交談,他是北大的生命科學(xué)家,我們當(dāng)時(shí)都感嘆,今天我們其實(shí)都不了解人的大腦是如何工作的,所以我們的確無(wú)法來(lái)準(zhǔn)確的模擬人類(lèi)的大腦。我們深度學(xué)習(xí)的軟件雖然模擬人類(lèi)的大腦,但是他只是大腦,從特別特別淺的方面來(lái)模擬大腦運(yùn)作方式,我們真的不了解大腦是如何運(yùn)作的。我們通過(guò)不準(zhǔn)確的模擬就已經(jīng)啟發(fā)了我們新技術(shù)的發(fā)展,我們使用計(jì)算機(jī)的視覺(jué),我們給他輸入了很多關(guān)于杯子的數(shù)據(jù)。我們?cè)谶^(guò)去五年間發(fā)現(xiàn)這些算法,能夠從數(shù)據(jù)中學(xué)習(xí),學(xué)習(xí)這個(gè)杯子長(zhǎng)的是什么樣的,所以我們?nèi)〉昧撕荛L(zhǎng)久的進(jìn)步。今天計(jì)算就很容易的識(shí)別杯子了。這只是在圖像中找到杯子,這是一個(gè)很簡(jiǎn)單的任務(wù)。我們的視覺(jué)系統(tǒng)能夠做的比這多得多,我希望能夠給大家展示這些圖像,問(wèn)大家您在這些圖像中看到了什么。
如果我想問(wèn)您為這些圖寫(xiě)說(shuō)明,你左邊可能會(huì)寫(xiě)一個(gè)黃車(chē)在路上行駛,后面是樹(shù)林。右面你可以寫(xiě)是一個(gè)起居室,白色的沙發(fā),藍(lán)色的地毯,還有下午的斜陽(yáng)照進(jìn)了房間。之所以你能夠?qū)戇@些說(shuō)明,你了解這些圖像是什么意思,所以你才能夠?qū)懻f(shuō)明。你能做的是詳細(xì)的說(shuō)明這些圖像的信息,另一方面計(jì)算機(jī)只能識(shí)別杯子,這兩者之間有巨大的差異。這些說(shuō)明和字幕并不是人寫(xiě)的,過(guò)去幾年中通過(guò)軟件的發(fā)展,我們現(xiàn)在已經(jīng)有軟件對(duì)這些圖像進(jìn)行字幕的說(shuō)明,有這樣的技術(shù)對(duì)我們帶來(lái)了新的機(jī)會(huì),使我們軟件通過(guò)深度的學(xué)習(xí)分析數(shù)據(jù),使我們有更多的數(shù)據(jù),使計(jì)算機(jī)視覺(jué)做到五年前無(wú)法做到的事情,在可預(yù)見(jiàn)的未來(lái),這樣的軟件使我們能夠更好的了解醫(yī)學(xué)的圖象。計(jì)算,自覺(jué)的識(shí)別可能是很難的,未來(lái)是我們的目標(biāo)之一,百度眼鏡產(chǎn)品是我們對(duì)未來(lái)的愿景而已。
{$page$}
為什么深度學(xué)習(xí)現(xiàn)在火了?
為什么深度學(xué)習(xí)現(xiàn)在開(kāi)始火了,現(xiàn)在開(kāi)始越來(lái)越好了,我現(xiàn)在解釋一下深度學(xué)習(xí)的功能,以及他能為我們帶來(lái)什么樣的價(jià)值,解釋深度學(xué)習(xí)是怎樣運(yùn)作的,為什么越來(lái)越好?我現(xiàn)在要做一個(gè)比喻,如果你想象一下我們建造火箭,火箭有兩個(gè)部分,第一部分是火箭發(fā)射機(jī),是很大的發(fā)動(dòng)機(jī)。第二個(gè)是燃料,如果發(fā)動(dòng)機(jī)小,燃料很多是不可能的,如果發(fā)動(dòng)機(jī)很小,燃料很少也不行,燃料燒著燒著就沒(méi)了,所以火箭必須要有一個(gè)大發(fā)動(dòng)機(jī)和很多的燃料。深度學(xué)習(xí)和這個(gè)差不多,我們現(xiàn)在神經(jīng)網(wǎng)絡(luò)就是我們發(fā)動(dòng)機(jī),它推動(dòng)著 AI 的發(fā)展,燃料就是我們所用的數(shù)據(jù),我們現(xiàn)在有這么多的數(shù)據(jù),社會(huì)數(shù)據(jù)化給我們提供了大量的數(shù)據(jù),這樣輸入到我們發(fā)動(dòng)機(jī)中給我們作為燃料。在 AI 最近發(fā)展主要推動(dòng)力,因?yàn)槲覀兡軌蚪ê艽蟮木窬W(wǎng)絡(luò)。另一方面,百度這樣的公司能夠收集很多的數(shù)據(jù),為這些精神網(wǎng)絡(luò)輸入數(shù)據(jù)。我們有一個(gè)很大的技術(shù)網(wǎng)絡(luò),同時(shí)有很大的數(shù)據(jù),這樣當(dāng)然深度學(xué)習(xí)可以越來(lái)越好了。
我今天提到的一件事,我們現(xiàn)在能夠建造很大的神經(jīng)網(wǎng)絡(luò),五年前,2010 年的時(shí)候在學(xué)術(shù)界用的最大的神經(jīng)網(wǎng)絡(luò)有 1000 萬(wàn)的連接,于是模擬神經(jīng)源之間的連接。四年前,2011 年的時(shí)候我們?cè)诠雀鑶?dòng)了一個(gè)工程,建造很大的精神網(wǎng)絡(luò),使用 1000 個(gè)谷歌的服務(wù)器,我們當(dāng)時(shí)的團(tuán)隊(duì)建造神經(jīng)網(wǎng)絡(luò)差不多是原來(lái)的十倍大。后來(lái)我們發(fā)現(xiàn)我們當(dāng)時(shí)的技術(shù)其實(shí)無(wú)法更大,后來(lái)我們?cè)谄渌髮W(xué)應(yīng)用了其他的技術(shù),你只用三個(gè)服務(wù)器就實(shí)現(xiàn)了 100 億的連接,在百度我們使用 GPU 新的技術(shù),現(xiàn)在可以建造非常非常大的精神網(wǎng)絡(luò)。在 AI 和深度網(wǎng)絡(luò)中做出很多的進(jìn)步,都是因?yàn)槲覀兡軌蚪ㄔ炀薮蟮臋C(jī)器,模擬精神網(wǎng)絡(luò),吸收這么多海量的數(shù)據(jù),做出預(yù)測(cè)。
人工智能改變用戶(hù)交互的方式是語(yǔ)音
我現(xiàn)在和大家展示一個(gè)關(guān)于語(yǔ)音識(shí)別的例子,解釋一下我剛才做的發(fā)動(dòng)機(jī)核燃料的比喻。百度在語(yǔ)音識(shí)別方面投入了很多,很多人是使用語(yǔ)音的搜索,對(duì)于小孩和老年人,有時(shí)候可能打字比較困難,如果你能夠讓他們使用語(yǔ)音搜索,就能夠讓他們使用方便的信息產(chǎn)品和服務(wù)。對(duì)于我們普通人來(lái)說(shuō),使用語(yǔ)言識(shí)別和語(yǔ)言搜索也是越來(lái)越方便的,直到最近基本上所有語(yǔ)音識(shí)別都是很簡(jiǎn)單的軟件實(shí)施,一個(gè)方塊里是一個(gè)復(fù)雜的體系,我們最近決定讓我們看一看產(chǎn)生語(yǔ)音識(shí)別的軟件,把它扔掉,取而代之是神經(jīng)網(wǎng)絡(luò),所以這也就是我們的發(fā)動(dòng)機(jī),因?yàn)榘俣仍?/span> GPU 早期投入了很多,所以我們能夠建造很大的火箭發(fā)動(dòng)機(jī)。燃料是什么?在語(yǔ)音識(shí)別方面,大部分學(xué)術(shù)人士他們都利用數(shù)據(jù),有一些人他們有 300 個(gè)小時(shí),最大的是 2000 個(gè)小時(shí),最開(kāi)始我們用了幾個(gè)小時(shí)的語(yǔ)音數(shù)據(jù),后來(lái)有幾千個(gè)語(yǔ)音的數(shù)據(jù),后來(lái)建立了合成的語(yǔ)音數(shù)據(jù)。后來(lái)我們一共達(dá)到了 10 萬(wàn)個(gè)語(yǔ)音的數(shù)據(jù),按照語(yǔ)音識(shí)別的標(biāo)準(zhǔn),實(shí)際上這是無(wú)法想象的數(shù)據(jù)量。在百度我們有著非常強(qiáng)大的工具,我們可以利用火箭燃料核火箭引擎,把它們放在一起,這樣我們就有了語(yǔ)音識(shí)別更高的性能,而且也有很好開(kāi)放的 OPI 進(jìn)行發(fā)現(xiàn)。我們不到一個(gè)月之前有很好的結(jié)果,我覺(jué)得人工智能會(huì)改變用戶(hù)交互的方式就是語(yǔ)音,我們有語(yǔ)音,因?yàn)槲矣X(jué)得這里有越來(lái)越多互聯(lián)網(wǎng)的溝通走向語(yǔ)音的溝通,現(xiàn)在像百度的公司業(yè)非常多語(yǔ)音的產(chǎn)品,我們可以利用語(yǔ)音,我覺(jué)得整個(gè)互聯(lián)網(wǎng)經(jīng)濟(jì)和互聯(lián)網(wǎng)生態(tài)系統(tǒng)只是剛剛開(kāi)始而已,整個(gè)的世界現(xiàn)在都在走向移動(dòng)的設(shè)備,現(xiàn)在還沒(méi)有人設(shè)計(jì)出一個(gè)非常好的移動(dòng)設(shè)備輸入的產(chǎn)品,正因?yàn)槿绱耍覀儸F(xiàn)在花很多的時(shí)間在小的鍵盤(pán)上進(jìn)行輸字,如果說(shuō)可以讓語(yǔ)音識(shí)別運(yùn)作非常好,在一個(gè)安靜的環(huán)境下,它運(yùn)作還是非常不錯(cuò)的。
現(xiàn)在出去你在開(kāi)車(chē),你的手機(jī)是放在旁邊的座椅上,沒(méi)有人會(huì)利用語(yǔ)音的環(huán)境,因?yàn)樵卩须s環(huán)境下語(yǔ)音識(shí)別是不行的。如果我們能設(shè)計(jì)很好的,在嘈雜環(huán)境下運(yùn)作良好的語(yǔ)音技術(shù),我們當(dāng)然愿意利用語(yǔ)音技術(shù)。如果我在開(kāi)車(chē),我的手機(jī)放在旁邊座椅上,我可以跟自己的手機(jī)進(jìn)行溝通,我可以給我妻子發(fā)一個(gè)短信,我覺(jué)得如果有這樣語(yǔ)音技術(shù),這樣會(huì)改變我們整個(gè)的世界,會(huì)改變我們和移動(dòng)設(shè)備互動(dòng)的方式,我想要重新設(shè)計(jì)大家的手機(jī),圍繞著一個(gè)語(yǔ)音識(shí)別的界面進(jìn)行重新的設(shè)計(jì),除了移動(dòng)的設(shè)備之外,我覺(jué)得語(yǔ)音也在改變著物聯(lián)網(wǎng),包括很多家用電器、可穿戴設(shè)備等等。有一些人知道,現(xiàn)在在物聯(lián)網(wǎng)上,在家用電器中有太多的界面,如果我們能夠和我們的設(shè)備進(jìn)行溝通,進(jìn)行語(yǔ)音識(shí)別將會(huì)非常好。如果五年前我們說(shuō)電視的遙控器能夠使你和你的電視進(jìn)行溝通調(diào)頻道,人們覺(jué)得你瘋了。我希望可能在我的孩子和孫子輩生命期之內(nèi)有這樣新的技術(shù),也許有一天我的孫子,或者將來(lái)你孫子的孫子會(huì)告訴你,他們可以直接和電視進(jìn)行溝通,調(diào)頻。也許有一天你可以和你的微波爐溝通,微波爐會(huì)忽略你嗎,它不跟你溝通真的太粗魯,它不禮貌了。我們發(fā)現(xiàn)語(yǔ)音在改變著移動(dòng)世界,也改變著物聯(lián)網(wǎng),而且現(xiàn)在有太多互聯(lián)網(wǎng)的溝通,我們與技術(shù)的互動(dòng)太多了,我們的互動(dòng)都是圍繞著文本的,還有很多的圖像和語(yǔ)音。現(xiàn)在 AI 人工智能技術(shù)還有深入學(xué)習(xí),語(yǔ)音技術(shù)已經(jīng)成為最強(qiáng)大的技術(shù),可以幫助我們了解和識(shí)別這些數(shù)據(jù),我覺(jué)得人工智能是有著很大的潛力,能夠改變我們和技術(shù)互動(dòng)的方式,包括百度i和無(wú)人駕駛車(chē)等等,他有非常大的潛力,改變我們跟技術(shù)的互動(dòng)。基于如此,我對(duì)這樣的技術(shù)感到非常的興奮,我在這個(gè)基礎(chǔ)方面開(kāi)展很多的工作。
當(dāng)然,這方面也有很多的炒作,我覺(jué)得不幸的是,AI 快速的發(fā)展現(xiàn)在促成了一些炒作,也許人們會(huì)想,某一天計(jì)算機(jī)會(huì)成為好的機(jī)器人,會(huì)掌控整個(gè)的世界,和我們創(chuàng)造一個(gè)很好的世界,也許它們不會(huì)成為邪惡的機(jī)器人,我們現(xiàn)在手機(jī)上還有非常多的代碼,我個(gè)人看來(lái)不會(huì)出現(xiàn)炒作中出現(xiàn)的狀況。我們可以利用這些技術(shù)進(jìn)行預(yù)測(cè),技術(shù)不斷的改變,我們的生活就是圍繞著技術(shù),但是神經(jīng)網(wǎng)絡(luò)你知道是非常好的識(shí)別工具,還有預(yù)測(cè)的工具,當(dāng)你輸入數(shù)據(jù)的時(shí)候它們可以進(jìn)行預(yù)測(cè),但是我們?cè)?/span> AI 領(lǐng)域中工作的這些人,我們參加會(huì)議,我們發(fā)表論文,我們對(duì)未來(lái)的看法和其他一些有著胡思亂想的人之間有很大的區(qū)別,我們的看法不一樣。我覺(jué)得如果我們能夠遠(yuǎn)離炒作,AI 發(fā)展是比較健康的,AI 創(chuàng)造的挑戰(zhàn)并不是機(jī)器會(huì)掌控世界,他很可能會(huì)幫助我們替代勞工,我們領(lǐng)導(dǎo)者必須要認(rèn)真考慮技術(shù),要讓人工智能技術(shù)幫助我們替代那些繁雜的勞動(dòng)。