人工智能的歷史
人工智能(Artificial Intelligence,簡(jiǎn)稱AI)的歷史可以追溯到物理學(xué)家薛定諤于1944年出版的科普書《生命是什么——活細(xì)胞的物理學(xué)觀》。這本書希望從物理學(xué)和化學(xué)原則的角度來解釋生命現(xiàn)象,它開啟了分子生物學(xué)的大門,也在人工智能的早期發(fā)展中起到了重要作用。在1956年馬文•明斯基組織的達(dá)特茅斯會(huì)議里,麥卡錫首次提出了“人工智能”的概念,這被公認(rèn)為是AI誕生的標(biāo)志。在這次會(huì)議中,大家一致認(rèn)為“學(xué)習(xí)或者智能的任何其他特性的每一個(gè)方面都應(yīng)能被精確地加以描述,使得機(jī)器可以對(duì)其進(jìn)行模擬”。
自此之后,人工智能經(jīng)歷了三次熱潮,人們對(duì)人工智能的認(rèn)識(shí)也在逐步完善。第一次熱潮源于連接主義的進(jìn)展,里程碑式的成果是20世紀(jì)中期McCulloch和Pitts發(fā)現(xiàn)了神經(jīng)元“興奮”和“抑制”的工作方式以及1956年Rosenblatt提出的“感知機(jī)”模型。同時(shí),1959年Solomonoff有關(guān)文法歸納的研究和1965年Samuel將分段劃分引入對(duì)符號(hào)域的數(shù)據(jù)處理,也促進(jìn)了符號(hào)主義的發(fā)展。人工智能在連接主義、符號(hào)主義以及行為主義等領(lǐng)域的成功,讓當(dāng)時(shí)的科學(xué)家們興奮不已,并樂觀地估計(jì)10年后便有可能制造出像人一樣有智能的機(jī)器。然而,明斯基出版的《感知機(jī)》一書指出,當(dāng)時(shí)的人工智能研究甚至不能解決一些簡(jiǎn)單的二分類問題,而其它主義的進(jìn)展也遭遇了瓶頸,使得人工智能進(jìn)入了第一個(gè)寒冬。
1986年,連接主義學(xué)派找到了新的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法,即利用反向傳播技術(shù)來優(yōu)化神經(jīng)網(wǎng)絡(luò)的參數(shù),二分類問題因此得以解決。符號(hào)主義也提出了“如果—則”的專家系統(tǒng),于是,人工智能再次掀起新一輪熱潮。但好景不長(zhǎng),科學(xué)家們發(fā)現(xiàn)“如果—則”的規(guī)則容易出現(xiàn)組合爆炸問題,即無法窮盡可能的規(guī)則。而1995年提出的統(tǒng)計(jì)學(xué)習(xí)理論,既有嚴(yán)密理論又有完美算法支持,讓理論方面存在不足的連接主義再次淡出視野,人工智能也因此成為以統(tǒng)計(jì)學(xué)習(xí)和機(jī)器學(xué)習(xí)為主導(dǎo)的研究。
人工智能的現(xiàn)狀
2012年,在計(jì)算機(jī)視覺領(lǐng)域一個(gè)關(guān)于大規(guī)模圖像檢索的比賽中,深度學(xué)習(xí)研究的領(lǐng)袖級(jí)人物Geffrey Hinton帶領(lǐng)團(tuán)隊(duì)成員Alex Krizhevsky和Ilya Sutskever提出了一種新型的深層網(wǎng)絡(luò)模型AlexNet,顯著地將識(shí)別性能提高了近10個(gè)百分點(diǎn)。而這個(gè)提升之前曾被以為需要20年的時(shí)間,這讓科研人員開始重新關(guān)注神經(jīng)網(wǎng)絡(luò)尤其是深層網(wǎng)絡(luò)的研究。
通過近六年的努力,深度學(xué)習(xí)在計(jì)算機(jī)視覺、圖像處理、自然語言處理、語音識(shí)別等眾多領(lǐng)域都取得了耀眼的成績(jī)。其成功的原因主要有三個(gè):
第一,模型本身的變化。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同,深度學(xué)習(xí)對(duì)網(wǎng)絡(luò)采用了逐層做特征學(xué)習(xí)的方式,并在每一層中采用了不同的角度加以處理,使得網(wǎng)絡(luò)在學(xué)習(xí)能力或特征工程上得到了極大的加強(qiáng)。
第二,數(shù)據(jù)規(guī)模的顯著提升。在2012年前,沒有超大規(guī)模的數(shù)據(jù)可用來訓(xùn)練網(wǎng)絡(luò),這使得之前網(wǎng)絡(luò)即使能做深,也達(dá)不到傳統(tǒng)統(tǒng)計(jì)學(xué)習(xí)和機(jī)器學(xué)習(xí)的性能。而2012年后,這一問題得到了解決。一方面是采集設(shè)備的成本下降和來源變得豐富,數(shù)據(jù)的收集能力明顯增強(qiáng);另一方面是人工標(biāo)注對(duì)大量有效數(shù)據(jù)集的形成起到了幫助。據(jù)媒體報(bào)道,目前國內(nèi)至少有近千家標(biāo)注公司和工廠、共20余萬名以上的數(shù)據(jù)標(biāo)注員在從事人工標(biāo)注的工作。另外,2014年以后,通過對(duì)抗生成式網(wǎng)絡(luò)來生成偽數(shù)據(jù)的策略也大幅度減輕了大數(shù)據(jù)的需求問題。
第三,可并行計(jì)算的GPU顯卡帶來的算力提升也功不可沒。自從Geoffrey Hinton等提出的AlexNet深度網(wǎng)絡(luò)首次采用雙GPU來處理數(shù)據(jù)后,現(xiàn)有的深度學(xué)習(xí)模型都是基于多GPU計(jì)算完成的。
深度學(xué)習(xí)也帶來了產(chǎn)業(yè)界的同化。由于其模型采用了“輸入為問題、輸出為目標(biāo),中間的規(guī)律完全通過深度模型來學(xué)習(xí)”的“端到端”設(shè)計(jì)理念,各行業(yè)特有的規(guī)律都能通過收集大數(shù)據(jù)集,并通過模型學(xué)習(xí)來完成。因此,這種端到端的操作方式,加上現(xiàn)階段源碼共享的流行,讓原來領(lǐng)域差異明顯的產(chǎn)業(yè)界如電信、金融、安防等都投身到人工智能的研發(fā)與應(yīng)用中。不僅如此,在圍棋上AlphaGo、AlphaZero的所向披靡、戰(zhàn)無不勝以及對(duì)300年圍棋譜的新認(rèn)識(shí),還有波士頓機(jī)器人團(tuán)隊(duì)的碩果累累,都讓人感覺人工智能近在眼前。
從國家層面看,我國對(duì)人工智能給予了前所未有的支持力度。2017年7月,國務(wù)院發(fā)布了《新一代人工智能發(fā)展規(guī)劃》。規(guī)劃預(yù)計(jì)到2020年,我國人工智能核心產(chǎn)業(yè)規(guī)模將超過1500億元,帶動(dòng)相關(guān)產(chǎn)業(yè)規(guī)模超過1萬億元;到2030年,人工智能核心產(chǎn)業(yè)規(guī)模將超過1萬億元,帶動(dòng)相關(guān)產(chǎn)業(yè)規(guī)模超過10萬億元。而在本輪熱潮中,我們也看到了大量與人工智能相關(guān)的公司的創(chuàng)建,其中不乏有進(jìn)入中國獨(dú)角獸企業(yè)榜單的。資本對(duì)人工智能的關(guān)注也近乎狂熱,甚至行內(nèi)有些投資機(jī)構(gòu)在對(duì)人工智能相關(guān)公司進(jìn)行估值時(shí),會(huì)以在頂級(jí)人工智能領(lǐng)域會(huì)議論文發(fā)表的數(shù)量為參考,這又直接導(dǎo)致了AI相關(guān)的公司愿意花重金去吸引AI方向上有良好論文發(fā)表紀(jì)錄的優(yōu)秀人才。
那么,現(xiàn)在人工智能具體發(fā)展境況如何呢?我國又處在什么關(guān)鍵位置呢?
人工智能的憂思與展望
首先,我們得肯定,隨著國內(nèi)研究能力的提高,國內(nèi)科研機(jī)構(gòu)在頂級(jí)期刊或會(huì)議上發(fā)表論文的數(shù)量較以往已經(jīng)上了好幾個(gè)臺(tái)階,目前我國論文的發(fā)表數(shù)排全球第二便是很好的明證。然而,在原創(chuàng)性上,我國的科研創(chuàng)新還沒有占據(jù)國際主導(dǎo)地位,比如論文的引用數(shù)在國際上未排進(jìn)前十名,說明論文的影響力不夠;在人工智能必需的硬件環(huán)境上,我們?nèi)試?yán)重依賴于目前還無法國產(chǎn)化的GPU顯卡;在軟件平臺(tái)上,我們?nèi)砸蕾囉赑yTorch、Tensorflow等國外軟件;在深度學(xué)習(xí)的核心算法上,國內(nèi)提供的關(guān)鍵算法相對(duì)較少,多是在國外團(tuán)隊(duì)設(shè)計(jì)的相關(guān)算法上的小修小改。
其次,對(duì)論文的過度看重,導(dǎo)致科研院校和行業(yè)偏好選擇“短平快、易產(chǎn)出”的方向進(jìn)行研究,而對(duì)可能需要3—5年甚至更遠(yuǎn)的5—10年才能有產(chǎn)出的研究方向不甚感冒,這從論文的引用率上就能看出一斑。而資本的進(jìn)場(chǎng),又容易讓原本可能可以按時(shí)間節(jié)點(diǎn)穩(wěn)步發(fā)展的企業(yè)產(chǎn)生加速擴(kuò)張的心態(tài),這多少會(huì)影響其對(duì)原創(chuàng)性研究的追求。如果這些企業(yè)缺乏專業(yè)的管理和財(cái)務(wù)團(tuán)隊(duì),則很有可能會(huì)導(dǎo)致投資方期望過高而實(shí)際產(chǎn)出偏低的結(jié)果。如果對(duì)此不重視,說不定第三波人工智能的熱潮會(huì)因?yàn)?ldquo;AI經(jīng)濟(jì)泡沫”的破滅跌回低谷。一旦出現(xiàn)這一現(xiàn)象,很有可能會(huì)有較二波寒冬更長(zhǎng)的寒冬期。這些都是值得我們警惕的問題。事實(shí)上,當(dāng)前人工智能在產(chǎn)業(yè)界中取得明顯進(jìn)展的,主要是與預(yù)測(cè)相關(guān)的智能應(yīng)用,但從更廣義的智能角度來看,人類仍有較多同智能相關(guān)的問題尚待解決:
第一,深度學(xué)習(xí)通過擴(kuò)大模型來獲得預(yù)測(cè)能力的同時(shí),也由于模型參數(shù)過多導(dǎo)致可解釋性變差,不太容易提取出可解釋的結(jié)論或規(guī)則。第二,常識(shí)智能尚無明確的解決方案。如人走路不會(huì)識(shí)別路面的精細(xì)細(xì)節(jié)但卻可以快速行走,出門時(shí)發(fā)現(xiàn)下雨后又返回家中拿傘,這些都屬于常識(shí)智能。然而,目前對(duì)于常識(shí)智能,仍缺少可以拿來分析的有效理論和模型。第三,小樣本問題。在很多情況下,樣本的收集是困難或昂貴的,甚至人工標(biāo)注也不可行,如全基因組的測(cè)序、高性能計(jì)算芯片的參數(shù)檢測(cè)等。此時(shí),依賴需要大數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)就很難獲得好的性能。第四,硬件依賴問題。目前的深度學(xué)習(xí)嚴(yán)重依賴于GPU顯卡的并行能力,然而,并非所有環(huán)境都能提供具有高效運(yùn)算的硬件。因此,有必要設(shè)計(jì)更有效、不依賴于GPU的模型和方法。第五,情感智能的研究。盡管在情感方面存在不少的研究,但多數(shù)研究是基于情感的預(yù)測(cè)來展開的,對(duì)真實(shí)情感的模擬還遠(yuǎn)沒達(dá)到人類會(huì)難以區(qū)分的地步。結(jié)果就是,現(xiàn)有的服務(wù)機(jī)器人還難以形成真正的情感。
那么,我們有沒有可能借助其它學(xué)科的進(jìn)展來促進(jìn)人工智能的發(fā)展呢?舉例來說,腦科學(xué)對(duì)人腦的研究,盡管在分子級(jí)別以及神經(jīng)細(xì)胞群的活動(dòng)較以往已經(jīng)有了更深入的認(rèn)識(shí),但受限于探測(cè)器的時(shí)間和空間分辨率,目前對(duì)大腦的精細(xì)和全局分析仍有較大的發(fā)展空間。同時(shí),遺傳學(xué)雖然對(duì)基因編碼機(jī)制進(jìn)行了廣泛研究,可以對(duì)智能體的基因進(jìn)行全序測(cè)量,但是基因在非編碼區(qū)形成的調(diào)控機(jī)制仍不是完全明了的。此外,在未來智能社會(huì)中,假定智能體具備了真正的智能,可以作為群體融入到人類社會(huì),那么就需要有社會(huì)學(xué)關(guān)于群體行為的研究成果做參考和支撐,但是,目前還缺少可資量化的社會(huì)學(xué)行為分析方法。
總體來看,盡管其他學(xué)科對(duì)智能也有不少的研究,但并不是盡善盡美。我們需要取長(zhǎng)補(bǔ)短,并結(jié)合人工智能學(xué)科的研究,才有可能對(duì)智能研究進(jìn)行進(jìn)一步完善,避免人工智能進(jìn)入下一個(gè)寒冬。
【本文作者為復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、博導(dǎo)】
責(zé)編:李 懿 / 楊 陽