欧美,日韩中文字幕在线,男女性杂交内射妇女bbwxz,久久99久久9国产精品免费看,久久久久无码精品国产app,免费无码成人片

a&s專業(yè)的自動化&安全生態(tài)服務平臺
公眾號
安全自動化

安全自動化

安防知識網(wǎng)

安防知識網(wǎng)

手機站
手機站

手機站

大安防供需平臺
大安防供需平臺

大安防供需平臺

資訊頻道橫幅A1
首頁 > 資訊 > 正文

百度首席科學家吳恩達:語音識別將會推動物聯(lián)網(wǎng)革命

2015年IT領袖峰會討論內(nèi)容。

  3月22日消息,2015年IT領袖峰會今日在深圳正式開幕,百度首席科學家吳恩達發(fā)表題為《深度學習與人工智能》的主題演講。

百度首席科學家吳恩達

  吳恩達指出,如果能把語音識別的準確率真正做到99%,我們甚至可以把所有手機的接口做重新的設計和修改,使我們自己更加習慣于語音通話指令的發(fā)送方式,這可以推動這個領域的革新。

  吳恩達還表示,在手機之外,我們的話音識別還會推動物聯(lián)網(wǎng)的革命,從汽車界面到家用設備到可穿戴設備將會發(fā)生很多的改變。我在家里有5個遙控可以控制的東西,我想再過幾年再回過頭來看,我們會覺得這 5個遙控太少了,比如你只是遙控電視,只是遙控空調(diào),簡直不夠了,看來都是小兒科的東西。

  以下為吳恩達演講實錄:

  吳恩達:大家好!我還是每天學習一點中文,不過我現(xiàn)在普通話還是不夠好,所以如果有這個耳機,我今天還是講英語,請翻譯者幫我翻譯。

  我們看到新的人工智能技術(shù)出現(xiàn),我們把它稱為深度學習,深度學習給我們帶來了巨大的價值,給很多的IT公司也帶來很多的價值。我相信人工智能,我指的是 新的人工智能,也就是深度學習給我們帶來的影響將會越來越深遠。在座的各位很多是企業(yè)的領袖,所以未來大家可能會做出對你的組織有利的很多重要的決定,可能是公司,也可能是大學,這都是在深度學習方面的,所以我想分享一些對大家有用的東西。首先我講一下為什么現(xiàn)在人工智能的發(fā)展非常迅速,第二要怎樣進行投 資來推動人工智能的發(fā)展。我們在全球看到的人工智能發(fā)展趨勢,以及我們面臨的機會和挑戰(zhàn)。

  我希望在我的演講當中關注三個領域,我覺得這三個領域正在發(fā)生重大的創(chuàng)新,一個是圖像,第二個是語音,第三個是行為。我們先從圖像開始,很多年前我還在斯坦福大學教課的時候,我問學生一個問題,就用 當時一個人工智能的技術(shù)找到一個咖啡杯,結(jié)果非常亂,他們覺得整個廚房臺面上放的都是咖啡倍??墒沁^去幾年技術(shù)已經(jīng)取得了巨大的發(fā)展,在這些年當中,人工 智能的發(fā)展曾經(jīng)一度比較低迷或者說比較慢,而在最近幾年當中有一類新的人工智能技術(shù)出來了,我們把它稱為深度學習,也就是使計算機學習了更多人類的神經(jīng)系 統(tǒng),來更好地解決比如說圖形識別的問題。我們有時候不是很清楚人腦究竟是如何工作的,而我們要真正把深度學習做好,就必須要了解人腦在做什么,人腦當中發(fā) 生了什么,這對我們來說是非常重要的。我們使用這些計算的結(jié)果,我們可以給他們提供很多的數(shù)據(jù),比如咖啡倍圖像的數(shù)據(jù),這樣我們可以獲得更好的計算機視 覺。做更好的辨識,我們對于網(wǎng)絡神經(jīng)的研究,對于人工智能的研究進行了好多年,所以有些人問我為什么在最近幾年,比如最近五年才獲得比較快速的發(fā)展,要回 答這個問題我需要打一個比方。

  比如如何構(gòu)建火箭,火箭的形狀包括兩件事情,一個是發(fā)動機,另外一個是燃料,這兩部分是非常重要的,必 須 把這兩方面做好,我們才能有機會把這個火箭發(fā)射到太空中去。如果你的發(fā)動機太小,燃料太大不行,發(fā)動機太大燃料不夠也不行。所以火箭發(fā)動機和火箭的比例非 常好才能夠確?;鸺郎蚀_地發(fā)射到軌道當中,這給我們深度學習也帶來了一些啟示。我們在深度學習的過程當中就像發(fā)射火箭那樣研究巨大的神經(jīng)網(wǎng)絡在我們的社會 當中每天都發(fā)生著巨大的活動,而且人們的活動多數(shù)都是圍繞著他們的手機和電腦來開展的。我們?nèi)绾卫眠@種新的情況呢,或者新的環(huán)境更好地幫助我們了解巨大 的神經(jīng)網(wǎng)絡呢?

  我們的社會越來越多地進行數(shù)據(jù)化或者數(shù)字化,我剛才已經(jīng)說了人們很多生活都是圍繞著手機和電腦來開展的。我想和大家分 享一下我過去的一些經(jīng)驗,在IT世界發(fā)生什么,來構(gòu)造更好的IT行業(yè)的火箭發(fā)動機和燃料的比例配比。在很多年前,當深度學習這個概念剛剛開始的時候,更多 的 是使用CPU技術(shù),構(gòu)建小的神經(jīng)元網(wǎng)絡只有100萬或1000萬的連接。我所說的是計算機連接的數(shù)目,之后我們?nèi)〉昧艘恍┻M展。其中在2008年發(fā)生改變 的事情就是GPU技術(shù)的發(fā)展,我們看到它的連接數(shù)目也發(fā)生了巨大的增長,GPU是手機上、pad上的硬件來幫助你做計算,有些人意識到硬件對我們加速深度 學習非常重要,發(fā)揮著非常重要的作用。我們借助GPU可以構(gòu)造越來越大的神經(jīng)元網(wǎng)絡。在往后,我們看到了更多大規(guī)模的發(fā)展,像谷歌的深度學習項目,使我們 更多地了解相關的知識,我們有了更多的云,更多的CPU來推動相關的發(fā)展?,F(xiàn)在我們看到的,我也認為這是下一階段的趨勢,就是我們要從云技術(shù),或者說僅僅 利用純技術(shù)跳到HPC或者叫高性能的計算技術(shù),超性能的計算技術(shù)。我不想講過多的細節(jié),因為它會偏重于技術(shù),讓我們更多地來看今天所關注的話題,HPC和 云,這可能是兩個比較分離的社區(qū),研究云和研究HPC的人也是兩類人。隨著云技術(shù)的發(fā)展,你可以同時使用上千臺計算機,不用擔心這么多計算機會發(fā)生崩潰, 這種情況是不會發(fā)生的,現(xiàn)在已經(jīng)認證了這點。而HPC技術(shù)比較小數(shù)目,但是更貴、更高性能的硬件,而我們也認為這對于我們構(gòu)造更好比例的火箭引擎也是更佳 的一個解決方案。

  在中國,我們其實在一些領域是比較領先的,甚至領先于世界很多其他先進國家。HPC到深度學習的跳越,而其他國家也 確 實進行大量的投資,這也是需要我們注意的。使用這些火箭引擎,再做一個類比,我還想給大家舉一個這樣的例子,看我們究竟能做什么。比如說計算機系統(tǒng)對人臉 的識別,這對我們來說也是比較重要的計算機應用。比如針對安全的目的,還有保安的目的,這都是在未來會越來越多的應用。大家對這張臉都很熟,美國著名的影 星,通過人臉識別可以告訴我們是同一張臉,這當然是最佳的結(jié)果,不同的組織使用不同的技術(shù),他們得到的結(jié)果也是不一樣的,這是因為有時候這個軟件的計算也 會發(fā)生不同。

  我希望大家參考一下這個柱狀圖就可以了解相關的計算結(jié)果了,我們是這周才宣布我們能夠在這方面表現(xiàn)得比其他大多數(shù)公司都要好。謝謝大家鼓掌鼓勵!

  和其他公司相比,比如說和谷歌、臉書相比,谷歌和臉書的火箭燃料比我們多,也就是他們的數(shù)據(jù)比我們多。但是我們在發(fā)動機上的投資比他們多,我們在發(fā)動機上的投資多給我們帶來巨大的好處。我們在發(fā)動機和燃料的比例方面要做得好才能確保這是一個好的火箭,我們正是在發(fā)動機方面進行大量的投資。所以我們才在人 臉識別領域和其他領域比其他國際上領先的大公司要做得好。我們在人臉識別只有0.3幾的錯誤率,大家可以看到我們的比例多么高,我給大家演示一下我們所發(fā) 生的錯誤??匆幌逻@張臉,你覺得哪兩張臉是動一個人的臉,還是都不同的?比如說在左邊的女人的臉,和其他哪張臉是相同的,大家能告訴我嗎?我們所犯的9個 錯誤,其實就是發(fā)生在這里面,這些都是一個人,大家根本想象不到,他們都是一個人,發(fā)生錯誤可能是數(shù)據(jù)的關系,不是我們自身的關系。而下面是不同的人,大 家能看出來了。我剛才提到了識別,像咖啡杯,還有人臉的東西,除了這些電腦能夠做的事情,還有很多,它能夠理解圖片還有很多,如果我們能夠在這方面做得很 好的話,這張圖片能夠告訴我們很多東西。比如我們看左邊,如果要求你寫字幕的話會怎么寫呢?你可能會寫有一輛黃色的車在路上開著。如果要為右邊的圖片寫字 幕的話會怎么寫呢?你可能會寫起居室充滿了下午的陽光。這個還不夠充滿激情,我們還可以通過深度學習讓你了解更多的信息來寫一篇更有吸引力的字幕。

  一個計算機能不能了解你我了解的圖片信息呢,或者能不能像人腦一樣工作了解我們想了解的信息呢??赡芙Y(jié)果是非常讓大家吃驚的。現(xiàn)在我在圖片上顯示的字幕 并不是人寫的,而是機器寫的,這就是我們百度可以提供的技術(shù),也是我們起步的技術(shù)。而其他公司甚至還沒有搞清相關的概念,他們有一個籠統(tǒng)的想法要提高電腦 圖像的識別,在過去幾年,具體來說大概三年的時間內(nèi),計算機圖像的技術(shù)發(fā)展非常迅速,現(xiàn)在計算機在圖像識別上,比更多年以前要做得好得多?,F(xiàn)在很多計算機 公司甚至比很多人腦眼睛一眼看上去了解的信息還多。我們有一些想法、有一些產(chǎn)品,也有一些技術(shù),我想說的是這些技術(shù)給我們開啟了無限的可能,可以使我們來 了解一下哪些產(chǎn)品領域是大有可為的。我們可以在圖上了解一些相關的領域,比如百度還有其他的搜索引擎正在做的事情。我不知道一個非常清晰的路線圖是怎樣 的,或者哪個領域會發(fā)展得更加迅速。

  比如百度在衣服的搜索方面做很多東西。還比如對老年人的照顧方面,我們也做了一些探索,因為中國現(xiàn)在面臨人口老齡化的問題。還有在可穿戴設備方面也有一些新的舉措。我們希望在這些新領域的探索開啟更多的機會,使我們可以創(chuàng)造更大的產(chǎn)業(yè)。

  來看一下計算機的發(fā)展,我想跟大家分享一下第二個領域語音識別方面我們做的東西。在移動互聯(lián)網(wǎng)方面,大家對互聯(lián)網(wǎng)的使用,對手機的使用越來越多的結(jié)合起 來。我們過去是用鍵盤,包括手機鍵盤來敲字,這是比較浪費時間的,大家現(xiàn)在用話音來進行溝通,所以語音識別是一個非常重要的發(fā)展方向。大家可以試一下百度 上面有相關的應用,現(xiàn)在已經(jīng)做得比較好了。而大家現(xiàn)在普遍反應在手機上進行語音通信的時候,如果手機離得比較遠的話效果不是很好,要比較近的時候語音識別才做得比較好。我們在相關的IT技術(shù)方面也做一些探索,從傳統(tǒng)領域來看,這是語音識別所做的事情,基本上所有做語音識別的公司都是使用非常復雜的管道。我 們來改善它的話音系統(tǒng),突出聲音特征,有一些不同的模塊,不的的模塊組合起來識別這個人到底講了什么。

  我們百度做的是什么事情呢?我們把所有這些東西都替代掉,用先進的人工智能技術(shù)替代掉,用先進的深度學習技術(shù)來替代掉,這就是我們百度的深度語音,我們的火箭發(fā)動機。大家看到這個話音識 別的結(jié)果如下,很多公司用的是依靠大量的數(shù)據(jù),而百度忘掉那些數(shù)據(jù)吧,我們將用1萬的數(shù)據(jù)集進行人工智能處理,這就是我們的火箭燃料,我們形成了一些研究 的結(jié)果。大家可以看到,基本上結(jié)果是不可想象的。

  人們之前從來不會想到能利用這么多的數(shù)據(jù),我們使用神經(jīng)元系統(tǒng)以及數(shù)據(jù)燃料,我們發(fā)布了這樣一個結(jié)果,我們可以極大地提高語音識別的準確性。根據(jù)我們的計算結(jié)果,我們的調(diào)查結(jié)果,我們現(xiàn)在正處于這樣一個環(huán)境,如果你對著手機說話提出你的要 求,我們的接口是做得越來越好了。我們可以很好地處理背景噪音,使手機更好地識別你自己講出的話。我非常興奮,我們能夠在這方面做得越來越精確,做得越來 越好。在百度,我們已經(jīng)看到了使用話音識別的用戶越來越多了。因此在這個領域,我們還有很多要提高的。很多人是低估了95%的準確率和99%的語音識別準 確率的差別。如果我們能夠做到95%的話,也就是今天的狀況,你說話要非常清楚,要離話筒非常近,必須這樣才能識別出來。如果我們將來能做到99%的準確 率的話,這和95%簡直是天壤之別,這會徹底改變我們的玩法。如果我們能真正做到99%,我們甚至可以把所有手機的接口做重新的設計和修改,使我們自己更加習慣于語音通話指令的發(fā)送方式,這可以推動這個領域的革新。你手里的東西將不是傳統(tǒng)上的手機了。

  在手機之外,我覺得我們的話音識別還會推動物聯(lián)網(wǎng)的革命,從汽車界面到家用設備到可穿戴設備將會發(fā)生很多的改變。我在家里有5個遙控可以控制的東西,我想再過幾年再回過頭來看,我們會覺得這 5個遙控太少了,比如你只是遙控電視,只是遙控空調(diào),簡直不夠了,看來都是小兒科的東西。在幾年的時間內(nèi),或者在未來幾年,我們將能夠和電視通話,和更多 的家電通話,這將是未來面臨的發(fā)展,我們將有很多的路由器內(nèi)置到這些機器當中。

  這是對語音識別的介紹,下面再看一下最后一個部分,也就是行為這塊。

  我們看到很多技術(shù)公司現(xiàn)在都能夠獲取到一些大數(shù)據(jù)來了解人們在互聯(lián)網(wǎng)的環(huán)境當中究竟是什么樣的行為,這是技術(shù)的發(fā)展。我們可以從這些數(shù)據(jù)當中挖掘更多的 價值。正如很多人都知道的,我們百度的廣告也是在人工智能方面下了很大的工夫,我們有很多數(shù)據(jù)搜集過來是關于人的行為的,而這些深度學習可以使我們了解人 們的行為是什么樣的,他們傾向于做什么事情,他們喜歡做什么事情。因為我們的數(shù)據(jù)中心還有很多數(shù)據(jù)搜集起來,使我們了解不僅僅是人的行為,還有機器人行 為。今天的深度學習確實是一個非常強大的工具,使我們可以了解機器在做什么,來更好地管理數(shù)據(jù)中心。比如我們可以使用這方面我們了解的信息來更好地使機器 運作。我們也可以更好地了解計算機是如何工作的,我們還可以使用深度學習來提高計算機的安全性。

  這是我們百度正在做的事情,我們覺得 很 多行為數(shù)據(jù)給我們帶來的機會,包括人的行為,包括機器的行為,可能比我們今天所了解到的要廣得多。美國、中國和歐洲現(xiàn)在都越來越多使用深度學習來了解人的 行為,了解機器的行為。在IT世界當中以及IT世界之外挖掘更多的機會,這也推動了我們未來的成功。我非常興奮地了解到深度學習在上述三個領域都給我們帶 來了巨大的改變或者將會帶來巨大的改變,我剛才用了火箭的引擎和燃料來做類比,使大家更生動地了解我們所面臨的改變。

  最后我跟大家分 享 一個框架,人工智能能給我們帶來什么,人工智能的循環(huán)發(fā)展是非常迅速的,在15年前,我們有這張圖,我們有這個想法,這就是AI人工智能的良性循環(huán)。那時 候我們?nèi)绻軌驑?gòu)造優(yōu)秀的產(chǎn)品可以吸引更多的用戶,有了更多的用戶就可以獲得更加大量的數(shù)據(jù)?,F(xiàn)在這個良性循環(huán)確實已經(jīng)就位了,現(xiàn)實就是這樣。而還沒有發(fā) 生的事情,我們以前想過但還沒有發(fā)生的事情,更多的數(shù)據(jù)通過人工智能被你更好地利用,來推動更多的優(yōu)秀產(chǎn)品被生產(chǎn)出來,而這個只是在最近幾年我們才做的事 情。而我們的火箭引擎現(xiàn)在不夠大了,而我們的燃料變得越來越大了,現(xiàn)實世界是這種情況。大家搜集到的數(shù)據(jù)越來越多了,可是引擎不夠大,所以不能深度地利用 這些數(shù)據(jù)。在我們搜集更多數(shù)據(jù)的過程中,推動更多應用發(fā)生的過程中,這是我們之前那些老的算法是連想都不會想的。而深度學習之所以能給我們帶來更多的價值 就是因為我們現(xiàn)在可以從越來越多的數(shù)據(jù)當中受益,獲得越來越好的結(jié)果,開發(fā)越來越多的潛能。所以我說深度學習確實改變著我們的生活,改變著傳統(tǒng)的人工智 能,使我們最終可以把鏈接做得特別好,把發(fā)動機和燃料的鏈接做得特別好,把產(chǎn)品、大量用戶和海量數(shù)據(jù)之間的連接做得更加通暢。

  最后我 想 說的是,在這個介紹當中,我主要是關注了圖像、語音和行為。但是對于人工智能的機會來說遠不止這三個方面,我們看到在自然語言的處理方面有很多的事情可以 做,在生物技術(shù)方面人工智能也有很多東西可以做,這些創(chuàng)新都在發(fā)生的過程當中,人工智能也可以更多地被應用到機器人的開發(fā)。百度大腦大家都聽過吧,還有這 也是最近大家比較熟的中國大腦緊密聯(lián)系起來的概念。在很多年前,百度可以從應用當中吸取更多的價值,在百度專門有一個團隊,他是余凱和王晶領導的,這個團 隊主要是構(gòu)建深度學習的內(nèi)部平臺,這個平臺可以做的事情是什么呢?可以支持百度的工程師獲取CPU、GPU和深度學習的平臺資源,他們可以使用這些技術(shù)來 推動他喜歡的應用。而這些在公司當中就推動了深度學習的繁榮發(fā)展。因為我們創(chuàng)造的東西那么多,我們?nèi)斯ぶ悄芎芏鄳玫念I域,我們甚至還想象不到,還不知 道。我想面對未來,可能機會會更大,能想象到的和不能想象到的機會會更多。我們可以抓住的方面也很多,可以真正幫助我們重塑經(jīng)濟結(jié)構(gòu)。面向未來,如果想看 一下人工智能給我們帶來的潛在影響的話,我不得不想到第一次工業(yè)革命,第一次工業(yè)革命是在英國,最后蔓延到整個歐洲的。我想這次工業(yè)革命在當時也是推動了 一些新技術(shù)的發(fā)展,最初在英國,最后整個歐洲都采用了這些技術(shù),這是一百多年前,快兩百年的事情了。我也希望大家能把眼光放在未來的工業(yè)革命上面,它給我 們帶來的影響是非常深遠的。這些工業(yè)革命也可以把人們從日常重復繁重的工作當中解放出來,把人性解放出來,把人的思想解放出來,使人們不再成為思想的奴 隸。這些變革,這些工業(yè)革命將會使我們的生產(chǎn)力獲得極大的提升。

  剛才我和大家分享了很多機會,我真的是很期待未來的發(fā)展,當那么多的人力,人的思想和大腦被解放出來之后,我們能做的事情很多。我非常興奮能在百度繼續(xù)進行大量的投資,投到人工智能方面,也希望我們做的東西能給大家有所幫助,能對社會有所幫助,謝謝!
 

延伸閱讀:深圳“可穿戴“:仿制者的狂歡

微軟給物聯(lián)網(wǎng)提供開放云平臺 中國創(chuàng)造有希望?

 

參與評論
回復:
0/300
文明上網(wǎng)理性發(fā)言,評論區(qū)僅供其表達個人看法,并不表明a&s觀點。
0
關于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團旗下的專業(yè)媒體平臺,自1994年品牌成立以來,一直專注于安全&自動化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場趨勢的專業(yè)媒體傳播和品牌服務。從安全管理到產(chǎn)業(yè)數(shù)字化,a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經(jīng)驗,提供媒體、活動、展會等整合營銷服務。

免責聲明:本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的,皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方,且不允許本站使用您的字體和圖片文字等素材,請聯(lián)系我們,本站核實后將立即刪除!任何版權(quán)方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟賠償!敬請諒解!
? 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法蘭克福展覽(深圳)有限公司版權(quán)所有 粵ICP備12072668號 粵公網(wǎng)安備 44030402000264號
用戶
反饋