【人物簡介】李飛飛是斯坦福大學計算機系終身教授,斯坦福人工智能實驗室和斯坦福視覺實驗室主任。使用神經(jīng)網(wǎng)絡(luò)模型等機器學習算法,李飛飛帶領(lǐng)團隊創(chuàng)造了能夠自動生成圖說的軟件,創(chuàng)建了全球最大的圖像識別數(shù)據(jù)庫 ImageNet,每年一度的 ImageNet 競賽都牽動著整個業(yè)界的心弦。李飛飛關(guān)于神經(jīng)網(wǎng)絡(luò)和計算機視覺的研究大幅推動了人工智能發(fā)展,可能為我們帶來更直觀的圖像搜索應用,以及能夠在不熟悉的情況下做出決策的自主機器人。
人工智能 60 年一直在積累
Q:您怎么看 AI 這 60 年的發(fā)展?
李飛飛:我簡短地說一下。我把過去這 60 年的 AI 看作是“in vitro AI” ,也就是在實驗室里的 AI?,F(xiàn)在是 21 世紀的第 2 個十年,是 AI 的一個重要的歷史轉(zhuǎn)折點,因為 in vitro AI 走向了 in vivo AI——成為走進人們生活、走進社會的 AI,雖然才剛邁出了第一步。過去 60 年是非常重要的 60 年,奠定了這個領(lǐng)域的基礎(chǔ),包括理論基礎(chǔ)和理論框架、軟硬件工具,尤其是數(shù)學、算法,以及 AI 需要關(guān)注的主要問題是什么,如何去衡量這些問題。過去的這 60 年,AI 有了長足的發(fā)展,站在工業(yè)界、投資界的角度,或許 AI 好像是平地而起的一個新興產(chǎn)業(yè),但實際上這 60 年一直都在積累。
Q:不過,近幾年 AI 投資非常火熱,有什么特別的原因嗎?
李飛飛:原因我想也應該是有目共睹的。深度學習的第二次崛起是 AI 從 in vitro 走向 in vivo 的一個重要轉(zhuǎn)折點。在我看來,有三個重要的因素,它們匯聚在一起,共同構(gòu)成了這個轉(zhuǎn)折點。一個是深度學習的理論框架,也就是是神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)從 20 世紀 70 年代、80 年代、90 年代不斷在發(fā)展、優(yōu)化。當然,也有一段時間,神經(jīng)網(wǎng)絡(luò)不是最受歡迎的機器學習方式,但不管怎么說,在上個世紀末機器學習百花齊放的時候,神經(jīng)網(wǎng)絡(luò)是其中的一部分。然后走到 21 世紀初期,硬件在摩爾定律的推動下不斷推陳出新,尤其是 NVDIA 的 GPU 帶來了并行計算的騰興,像神經(jīng)網(wǎng)絡(luò)的高通量模型運行。第三個非常重要的就是大數(shù)據(jù)。大數(shù)據(jù)的崛起與互聯(lián)網(wǎng)的崛起緊密相關(guān),互聯(lián)網(wǎng)又是上個世紀 90 年代的產(chǎn)物,經(jīng)過這十幾年的積累,互聯(lián)網(wǎng)帶來了大數(shù)據(jù)的爆發(fā)。所以,在人工智能領(lǐng)域,神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù)和計算機硬件,尤其是 GPU,這三個事件的聚合帶來了 2012 年左右深度學習的大爆發(fā)。
如果一定要指出一個事件,我會說是 2012 年 ImageNet 競賽 Geoffrey Hinton 和他的學生用深度卷積神經(jīng)網(wǎng)絡(luò)在圖像識別任務上取得了長足的進步,他們當時的計算結(jié)果比其他的算法都好很多,我想這可能是大家會記住的歷史事件,但背后也很多年的積累。
Q:您是計算機視覺面的專家,在這 60 年的歷史中,AI 領(lǐng)域?qū)δ绊懽畲蟮娜擞心男?/strong>
李飛飛:我的專業(yè)處在計算機視覺和機器學習的交叉點,在機器學習方面,對我影響很大的兩個人是 Michael Jordan 和 Geoff Hinton,他們在各自的機器學習領(lǐng)域都作了巨大的貢獻。從我本科生開始到研究生,他們的論文一直引領(lǐng)著機器學習的新思路、不斷地探索???Geoff Hinton 這么多年寫的論文就可以發(fā)現(xiàn),他在神經(jīng)網(wǎng)絡(luò)這個子領(lǐng)域上做了各種探索,從最開始的反向傳播算法,到生成模型、判別模型、各種不同的推理……深度學習本身是有很長歷史的子領(lǐng)域,Geoff Hinton 一直是深度學習的領(lǐng)軍人。同樣重要的一個人物是 Michael Jordan,是 Michael Jordan 把機器學習統(tǒng)計學的概念帶進了這個領(lǐng)域,而且他的工作一直在理論和應用之間保持非常好的平衡。我做研究生的時候,他很多 topic model、梯度下降……他的學生現(xiàn)在已經(jīng)分散在各個重要的高校,在領(lǐng)軍機器學習。所以,這兩個人是在機器學習方面對我影響最大的。
在計算機視覺方面,我覺得一個重要的人物是 Jitendra Malik,他是伯克利的教授。Jitendra Malik 把計算機視覺這個領(lǐng)域從圖像處理帶進了 AI。這是一個非常重要的理念,在上世紀六七十年代,計算機視覺僅僅是圖像處理一個不成氣候的小領(lǐng)域,在像素級別怎么去做 filtering (such as low-pass, high-pass)、edge detection。但是,Jitendra 是最早一批看到了視覺本身在智能這個問題上的重要性。如果你看人,視覺是人類智能的重要的部分。所以,Jitendra 和與他同時代的一些研究者,比如 Shimon Ullman、Tomaso Poggio,一起推動了計算機視覺思維方式的改革。我 2000 年開始從事計算機視覺博士研究的時候,很幸運的成為第一批趕上這股新思想的人,剛好開始用機器學習的思路來重新思考計算機視覺里重要的感知和認知的問題。所以,Michael Jordan,Geoff Hinton 還有 Jitendra Malik,我覺得這三個人是對我影響最深的三個人。
AI 投資領(lǐng)域火熱,李飛飛給投資者的幾點建議
Q:您認為未來 5 到 10 年 AI 最有可能會實現(xiàn)哪些突破?
李飛飛:我是這樣看的,任何一個即是基礎(chǔ)科學又是應用科學的科學領(lǐng)域,提到 5 到 10 年的突破,我們得看是應用場景的突破還是基礎(chǔ)科學的突破,這兩者往往是有聯(lián)系,但不一定一樣的。在我看來,基礎(chǔ)科學的突破應該比應用場景的突破早走幾步。
Q:您覺得目前投資領(lǐng)域在 AI 方面有泡沫嗎?您對 AI 投資者有什么建議?
李飛飛:要是一年前問我這個問題,我可能只能告訴你我完全不懂投資。但是,最近看到新聞,AI 投資十分火熱,同時,硅谷的一個比較優(yōu)秀的投資團隊 A16Z 邀請我成為他們的顧問,Andreessen Horowitz 也被邀請作為他們的顧問。所以,我在最近的大半年開始學習投資了,雖然還是懂得非常少。我的感受是這樣的,我認為大家對 AI 的熱情是真實的,一方面是由一個新興的領(lǐng)域帶來的興奮,另一方面是很多有遠見的人看到了,我自己就非常相信,信息革命的后半段就是由 AI 來引領(lǐng)的。
信息革命的前半段是由 PC 和互聯(lián)網(wǎng)定義的,它帶來了數(shù)據(jù),信息革命的后半段是由智能來引領(lǐng)的。所以,從這個角度講,我是認同這種興奮和關(guān)注的。你提到“泡沫”這個詞,我認為可能在這種興奮和關(guān)注之間,有時候會有一些不冷靜。現(xiàn)在在投資界大家也說,什么公司都想把自己標榜成一家機器學習公司、一家大數(shù)據(jù)公司,但如果你仔細地看一下這個公司,它的人才、實力也許還沒有走到那一步。所以我建議投資人,用投資界的朋友說的話就是,“Due diligence”一定要做好,面對每一家公司的時候,不要只看PPT,去了解一下它們的工程師,它們的技術(shù)領(lǐng)導團隊有什么樣的AI、機器學習或大數(shù)據(jù)的背景。這個是很重要的。
Q:您十月份沒有辦法到我們世界人工智能大會的現(xiàn)場,在這里有什么想對參會的各位說的嗎?
李飛飛:謝謝大家給我這個機會。首先我預祝人工智能世界大會的成功。在這個比較重要的歷史時刻辦這么一場會,我覺得也是一個非常好的機會,讓社會各界的人聚到一起,共同討論。我自己站在人工智能的科研者的角度,非常非常高興社會現(xiàn)在這么關(guān)注人工智能,我希望大家給我們很多反饋和建議,很多新的思路。我也希望我的學生今后不管是在學術(shù)界還是研發(fā)界還是創(chuàng)業(yè)界,都能有很好的機會。
我最近一直在思考 AI 何去何從的問題。你看現(xiàn)在好像 AI 不存在何去何從的問題,已經(jīng)是大家都非常關(guān)注的一個領(lǐng)域了。但我自己還是希望科技是為人類服務的,也就是說“technology has to be benevolent”,要站在人性的角度去思考技術(shù)。我也希望創(chuàng)投界和學術(shù)界更加關(guān)心人工智能的使命,人工智能最終的使命是以人為本的,當你在想應用場景的時候,不管是醫(yī)療、教育、交通、智能城市……我希望 AI 能用在提高人類生活品質(zhì)這些最關(guān)鍵的應用場景。同時我也關(guān)注 AI 人,我希望更多的不同的人參與 AI 領(lǐng)域的發(fā)展??萍际菐е鴥r值觀的,科技工作者會把他們的價值觀帶入科技中。那這些科技者是誰,就成了非常重要的一個問題,只有一種人群來創(chuàng)造科技往往會帶著這種人群的偏見。所以,我特別推崇包含很多不同的人,來自不同的生活背景、不同的膚色、不同的性別、不同的人生理念來參與 AI 科技的發(fā)展。?