生成式人工智能技術快速發(fā)展,涵蓋了創(chuàng)意產業(yè)、醫(yī)療保健、虛擬現實、藝術和文化創(chuàng)作等多個領域,為各行各業(yè)帶來更多創(chuàng)新、效率和價值。第十四屆夏季達沃斯論壇發(fā)布《2023十大新興技術報告》,其中就包括生成式人工智能。2023年7月13日,國家網信辦等七部門發(fā)布《生成式人工智能服務管理暫行辦法》,推動生成式人工智能向著健康發(fā)展和規(guī)范應用邁進。本期特邀專家圍繞相關問題進行研討。
深度嵌入生產生活全過程
生成式人工智能走進現實,將給經濟社會發(fā)展帶來怎樣的變革?
余江(中國科學院科技戰(zhàn)略咨詢研究院研究員):當前,以ChatGPT為代表的人工智能的前沿性突破給世界帶來極大震撼,也給人們的生產生活帶來深刻變化。生成式人工智能,是指基于算法、模型、規(guī)則來生成文本、圖片、聲音、視頻、代碼等內容的新一代人工智能技術,其與傳統(tǒng)人工智能或簡單神經網絡學習最大的差異是具備自生成模式,可以實現閉環(huán)式學習體系的構建,通過從海量數據信息中自己學習要素,進而生成全新的、原創(chuàng)的專業(yè)知識內容或產品,并能持續(xù)提高自身能力,真正打破了我們熟悉的“專業(yè)知識壁壘”。生成式人工智能等突破性創(chuàng)新涌現,標志著世界進入新一輪創(chuàng)新活躍期和產業(yè)變革期。
值得注意的是,依托無處不在的數據與智能,當前除了在語言大模型方面有重大突破,人工智能領軍企業(yè)還在研究構建針對不同類型業(yè)務數據進行高效訓練的模型,包括代碼、時間序列數據、表格數據、地理空間數據和IT事件數據等各類異質性極大的數據集。生成式人工智能不僅具備傳統(tǒng)人工智能的分析、判斷、決策功能,還能實現其所不及的創(chuàng)造性屬性,加速了人工智能行業(yè)從決策式分析式向生成式躍進演化,強調學習歸納后進行演繹創(chuàng)造,生成新的知識內容,其本質是對生產力的大幅度提升和創(chuàng)造,這引起了世界各國科技界和產業(yè)界的高度重視。
具有創(chuàng)造性是生成式人工智能的核心特征。強大的對話能力和生成能力,能夠處理超長文本,允許用長形式的內容創(chuàng)建、擴展會話、文檔搜索,回答新問題、承認可能的錯誤、拒絕不適當的請求等,意味著當前人工智能顛覆了傳統(tǒng)搜索模式,具有創(chuàng)造性將信息轉化為知識的優(yōu)勢,不僅對我們熟悉的咨詢、教學、考試等方面產生深遠影響,在智能客服、游戲、虛擬人等領域也得到廣泛應用。
人工智能持續(xù)取得突破,正不斷催生新產業(yè)、新業(yè)態(tài)和新商業(yè)模式,培育經濟發(fā)展新動能。生成式人工智能在商業(yè)端的應用開始跨越企業(yè)組織邊界,深度集成到現有組織工作流程和系統(tǒng)中,對客戶服務、供應鏈和網絡安全等領域的關鍵業(yè)務流程進行重構,形成有影響力的新模式、新業(yè)務。生成式人工智能商業(yè)潛力的發(fā)揮,推動了利用與開發(fā)海量數據價值的進程,在信息生成、編輯和迭代方面,可以高效收集、整合各類數據,自動生成文本內容、圖像。據國際咨詢公司Gartner預測,到2025年,大型企業(yè)機構對外營銷信息中的合成信息比例將上升到30%;到2030年,主要影視作品中AI生成內容的比例將上升到90%。在新的人工智能基礎設施賦能下,生物制藥、制造、材料科學等領域也開始變革業(yè)務流程。
生成式人工智能從營銷、設計、建筑、內容領域向生命科學、制藥、汽車、航空航天產業(yè)廣泛滲透,正成為越來越多行業(yè)的新生產力核心元素,為更多客戶創(chuàng)造全新價值。同時也要認識到,當前算法、模型、數據和算力的進步一日千里,亟需引導人工智能良性健康發(fā)展。人工智能系統(tǒng)能力及其固有的局限性是把雙刃劍,在加強技術研發(fā)和創(chuàng)新的同時,需努力提高其安全性和可控性,有效識別潛在風險和漏洞并形成應對策略。需推進生成式人工智能發(fā)展所需的算力基礎設施、優(yōu)質數據集等建設。此外,還要營造可信的運行環(huán)境,通過提升算法透明度、水印技術等方式確保使用者知曉內容是否為人工智能生成。釋放海量數據價值和生成式人工智能的商業(yè)潛力,需要提供法規(guī)保障,讓更多用戶受益,《生成式人工智能服務管理暫行辦法》出臺,展現了國家堅持發(fā)展和安全并重、促進創(chuàng)新和依法治理相結合的包容審慎原則。
產業(yè)界高度重視生成式人工智能的突破意義,近期各類大模型發(fā)布如火如荼。擁抱更美好的智能時代,關鍵在于推動人工智能深度嵌入經濟社會生產生活全過程,依托數據與模型相互增強的雙動力,以數智化賦能、激活和推動更多新業(yè)務新場景落地,堅持共生共贏的合作開放理念,營造充滿活力的智能化創(chuàng)新生態(tài)圈,讓生成式人工智能成為創(chuàng)新發(fā)展重要驅動力。
賦能千行百業(yè)潛力巨大
作為一項新技術,生成式人工智能在我國發(fā)展和應用情況怎樣?如何充分釋放其發(fā)展?jié)摿Γ?/strong>
武虹(中國科協(xié)創(chuàng)新戰(zhàn)略研究院研究員):大模型引發(fā)的生成式人工智能熱潮,其關鍵變革性特征是通過學習現有數據并以自然語言而非編程語言實現創(chuàng)建文本、圖像、視頻、音頻和代碼等形式的新內容。生成式人工智能泛指借助AI手段由機器自動產出的多模態(tài)內容,其技術本身離不開算力、算法、數據三大要素的支撐,而作為AI技術產出的成果,可以與相關行業(yè)融合,賦能千行百業(yè)。《生成式人工智能服務管理暫行辦法》規(guī)范了生成內容的服務管理,對生成式人工智能技術從算力(平臺)、算法以及數據等維度進行了激勵與約束,提升了在應用過程中的規(guī)范化程度,以激發(fā)多方協(xié)作,推動擴大行業(yè)未來增長空間。
伴隨ChatGPT的火爆,人工智能行業(yè)格局發(fā)生巨大變化,由于市場擁擠、產品差異化不夠,國外一些基于開源工具開發(fā)的大語言模型初創(chuàng)企業(yè)發(fā)展受阻,已進入裁員階段,缺乏技術護城河和產品易復刻成為初創(chuàng)型企業(yè)可持續(xù)發(fā)展面臨的關鍵問題?;赜^國內,近半年來國產生成式人工智能大模型亦備受業(yè)界關注。今年3月16日,百度推出搭載文心大模型的文心一言,對標ChatGPT。其后,更多巨頭企業(yè)跟進發(fā)布大模型。4月8日,華為更新盤古大模型;4月10日,商湯科技推出商量SenseChat;4月11日,阿里巴巴推出通義千問,字節(jié)跳動、科大訊飛、京東、騰訊等互聯(lián)網巨頭也相繼在該領域布局??萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心5月底發(fā)布的《中國人工智能大模型地圖研究報告》顯示,當前國內10億參數規(guī)模以上的大模型已發(fā)布79個。數據顯示,我國人工智能核心產業(yè)規(guī)模達到5000億元,企業(yè)數量超過4300家,生成式人工智能大模型成為近期熱度最高的領域。從目前狀況來看,國內生成式人工智能底層算法及實現與發(fā)達國家還存在一定差距,算力存在限制,加之國外基礎模型自身也在不斷演進與發(fā)展,作為上層應用的人工智能產業(yè)或在不短的時間內處于緊密跟隨的動蕩期。
大模型作為生成式人工智能最基礎、最核心的工具,可作為底層技術,在此基礎上垂直應用于各個產業(yè)和復雜場景。國內大型科技企業(yè)研發(fā)的人工智能大模型已布局辦公、娛樂、生活、金融、醫(yī)療、教育、工業(yè)、自動駕駛、智慧城市等多個領域。例如,百度文心大模型已率先應用于百度搜索、信息流、智能駕駛、百度地圖、小度智能屏等內部重要產品,并在能源、金融、傳媒、社科等領域與國家電網、浦發(fā)銀行、泰康保險集團、上海辭書出版社等開展外部應用實踐。華為盤古大模型專注于企業(yè)市場服務,已在能源、零售、金融、工業(yè)、醫(yī)療、環(huán)境、物流等領域完成場景驗證。公開信息顯示,在醫(yī)藥領域,利用藥物分子大模型可將先導藥研發(fā)周期縮短至1個月,研發(fā)成本降低約70%;在氣象領域,可提供秒級全球氣象預報,預測速度提高了萬倍以上;在工業(yè)領域,可提升樣本篩選效率約30倍,篩選質量提高約5倍,同時降低開發(fā)成本90%,但目前尚無關于盤古大模型的外部評估信息。
基于對當前技術、應用的分析,充分釋放生成式人工智能發(fā)展?jié)摿Γ枳⒅匾韵聨追矫妗?/p>
一是加快生態(tài)培育和應用拓展。發(fā)揮我國生成式人工智能專業(yè)化、細分化、多元化應用場景優(yōu)勢,構建多源異構的應用大數據生態(tài)圈。合法合規(guī)推動開源開放,打破“數據孤島”,以高質量、多模態(tài)、場景化的數據為人工智能產業(yè)穩(wěn)定高速發(fā)展提供原動力。
二是順應新一代人工智能研發(fā)范式的變革,淡化研發(fā)與應用邊界。借鑒ChatGPT在研發(fā)組織方面的經驗,通過為用戶提供測試服務,收集交互數據加速迭代優(yōu)化模型。以新技術的多場景應用為導向,以供需聯(lián)動為路徑,促進研發(fā)和應用形成閉環(huán)。
三是加強人工智能領域高水平開放合作。充分發(fā)揮我國超大市場規(guī)模優(yōu)勢、制造業(yè)集成化優(yōu)勢,搭建多層次國際交流平臺,積極融入國際人工智能創(chuàng)新生態(tài)。倡導共建共享理念,參與人工智能全球研發(fā)應用與產業(yè)分工,維護產業(yè)鏈供應鏈穩(wěn)定、完善與發(fā)展。
四是合理引導,避免盲目跟風的同質化研發(fā),一哄而上的概念炒作等現象。充分利用我國在數據規(guī)模、應用以及產業(yè)上的優(yōu)勢,準確研判生成式人工智能的發(fā)展走勢并前瞻布局,為實施國家大數據戰(zhàn)略增添新動力。
全球范圍迎來新一輪快速成長期
從世界范圍看,生成式人工智能發(fā)展現狀和趨勢怎樣?
肖仰華(復旦大學計算機科學技術學院教授、上海市數據科學重點實驗室主任):自2022年11月ChatGPT推出以來,其強大的多輪對話能力、意圖理解能力、上下文學習能力、指令理解能力引起社會廣泛關注,引領了生成式人工智能的研究與應用熱潮。
隨著前沿技術的不斷進步,全球范圍內生成式人工智能迎來新一輪快速發(fā)展。生成式人工智能在解決復雜任務、提升專業(yè)水平、理解多模態(tài)數據、具身化操縱物理機械等方面有了顯著進展,其產業(yè)生態(tài)初具規(guī)模,已形成從基礎模型、行業(yè)模型、應用插件到數據服務的完整產業(yè)形態(tài),帶動了GPU(圖形處理器)計算顯卡、高通量網絡互聯(lián)設備、云計算平臺等算力企業(yè)進一步發(fā)展,并在圖像、語音、代碼、游戲、醫(yī)療等領域的應用場景中取得了顯著效果。國際知名AI工具導航網站theresanaiforthat已收錄面向1966個任務的7142個AI應用,其中絕大多數是近半年內新生企業(yè),主要圍繞基礎模型,結合各細分領域與場景的具體需求,打造具有競爭力的AI產品或服務??梢哉f,圍繞生成式人工智能基礎模型的產業(yè)生態(tài)正蓬勃發(fā)展。
新一輪人工智能的快速發(fā)展由少數巨頭企業(yè)直接推動形成,微軟、亞馬遜、谷歌、臉書等企業(yè)競相入局,并投入巨大資源布局生成式人工智能大模型與相應產品研發(fā)。同時,一系列以實現通用人工智能為目標的人工智能實驗室或創(chuàng)新企業(yè)匯聚了包括圖靈獎得主在內的頂尖科學家,取得一系列重大突破,加速推動通用人工智能應用落地。
生成式人工智能的發(fā)展催生了大量的產業(yè)應用,涉及教育、娛樂、商業(yè)等眾多領域。在教育領域,可以實現教學各個環(huán)節(jié)提質增效。以可汗學院的AI機器人Khanmigo為例,可為學生提供多個領域的個性化輔導和反饋,讓其自主掌握知識和技能。在娛樂領域,可以創(chuàng)作出小說、劇本、配音、歌曲、動畫等多種形式和風格的內容。Fable Studio公司的動畫生成模型SHOW-1使用ChatGPT生成腳本;位于紐約的人工智能初創(chuàng)公司Runway發(fā)布的視頻編輯器Gen-2,可根據用戶指令進行影視作品創(chuàng)作。在商業(yè)領域,可以幫助企業(yè)進行市場分析,為客戶提供智能咨詢、推薦等服務。例如,客戶關系管理軟件服務提供商Salesforce推出的AI銷售助手SalesGPT,可快速生成定制的銷售郵件,而Marketing GPT模型則將AI用于營銷工作,幫助用戶提高效率。上述應用只是不完整列表,生成式人工智能是有著深遠且廣泛影響的技術革命,其代表性技術大規(guī)?;A模型將會成為人工智能基礎設施,賦能千行百業(yè)。
全球人工智能產業(yè)進入高速發(fā)展階段,但在實際應用中仍有不少問題亟需解決。首先,大模型存在安全底線問題,很多訓練語料在未經用戶授權情況下混入個人信息,提供對外服務時存在泄露風險,需進一步加強隱私防護、版權保護、可控編輯,確保可解釋性與透明度。其次,大模型經常產生所謂的幻覺現象(如編造不存在的人物經歷),未來要在更多場景應用落地,需解決其幻覺問題,降低訓練與應用成本、實現增量學習、提升規(guī)范理解能力,增強大模型的可用性。再次,持續(xù)提升大模型的認知能力,包括角色扮演、性格塑造、記憶與遺忘、長短期記憶轉換等,從而提高其在代碼生成、數學推理、評論改寫等場景的應用效果。
值得注意的是,人工智能新技術在為經濟社會發(fā)展帶來新機遇的同時,也產生了傳播虛假信息、侵害個人信息權益等問題。兼顧發(fā)展與安全成為全球共識,各國政府積極應對生成式人工智能帶來的新挑戰(zhàn)。美國加利福尼亞州、伊利諾伊州等地出臺了生成式人工智能相關法案,歐盟、日本、韓國等國家和地區(qū)正醞釀相關法案,預期在2023年底出臺正式法案。中國發(fā)布《生成式人工智能服務管理暫行辦法》,已于今年8月15日正式施行。與此同時,社會各界也在積極呼吁加強對生成式人工智能的監(jiān)管與治理。
人工智能是新一輪科技革命和產業(yè)變革的重要驅動力量,從全球發(fā)展趨勢來看,算力仍是人工智能發(fā)展的制約性因素,特別是高端GPU芯片、高速網絡互聯(lián)設備,生成式人工智能與其他人工智能的技術集成將成為取得應用效果的關鍵。與此同時,大模型能力瓶頸日益受到關注,大模型與傳統(tǒng)AI技術的深度融合,特別是與傳統(tǒng)知識庫等技術的融合,是釋放其在嚴肅復雜決策場景應用價值的重要方式。大模型將逐步從文本、圖像、語音等數據的基礎模型,演變?yōu)樽灾沃悄荏w大腦;將驅動智能體在虛擬環(huán)境中成長、與物理環(huán)境交互,成為能夠自主適應復雜環(huán)境的智能體;將逐步從互聯(lián)網開放聊天,演變?yōu)橥苿訉嶓w經濟智能化發(fā)展的先進生產力。大模型有望成為推動數據價值變現的重要技術設施,助力數據資產化改革。