伴隨著數(shù)字經(jīng)濟的快速發(fā)展,人工智能技術持續(xù)突破,智能時代正加速到來。在人工智能浪潮席卷下,以生成式人工智能、大模型為代表的算力應用落地開花,也引發(fā)了算力需求的進一步增長。一直以來,我國東部地區(qū)特別是上海深入挖掘算力融合應用場景,各類大模型應用不斷推出,加速釋放算力資源服務潛能。面對新一輪人工智能發(fā)展熱潮,上海如何乘勢而上加速推進算力在更多場景的應用落地?如何促進算力更好融合實體經(jīng)濟?
上海市日前印發(fā)的《立足數(shù)字經(jīng)濟新賽道推動數(shù)據(jù)要素產(chǎn)業(yè)創(chuàng)新發(fā)展行動方案(2023—2025年)》明確提出,建設高效協(xié)同的算力體系,建設“E級”超算載體、人工智能公共算力平臺,因地制宜部署邊緣計算資源池,對接“東數(shù)西算”國家戰(zhàn)略,建設樞紐型算力調(diào)度平臺,到2025年,算力總規(guī)模較“十三五”時期末翻兩番。
上海迅速布局算力這一新基建,正是基于當前以大模型為代表的算力應用的落地開花。最近1年,人工智能成為全球科技產(chǎn)業(yè)的熱門焦點領域。爆款產(chǎn)品ChatGPT(自然語言處理大模型)以其強大的對話輸出功能,讓人工智能有效輔助生產(chǎn)生活,人工智能產(chǎn)業(yè)隨之向前邁進一大步,迅速成為資本青睞的“香餑餑”。
隨著全球科技巨頭紛紛入局,人工智能應用在大模型領域打開新局面。普遍觀點認為,上游算力基礎設施的持續(xù)建設、算力規(guī)模的不斷擴大、數(shù)據(jù)處理能力的迅速提升,造就了下游算力應用端ChatGPT等大模型的成功崛起,讓人工智能發(fā)展迎來“拐點”。
在這場全球參與的科創(chuàng)競技中,我國緊跟趨勢走在前沿。其中,以上海為代表的生成式人工智能(AIGC)探索將人工智能帶到新高度,國家也出臺了《生成式人工智能服務管理暫行辦法》,及時規(guī)范AIGC的開發(fā)及應用。作為算力落地場景的最大突破口,國內(nèi)AIGC的發(fā)展態(tài)勢如何?應用效果如何?面臨哪些挑戰(zhàn)?記者走訪了諸多業(yè)內(nèi)企業(yè)與專家,探尋在算力支撐下,人工智能到底怎樣“為我所用”。
大模型火爆
今年的中考、高考結(jié)束后,ChatGPT、文心一言、復旦MOSS、訊飛星火等大模型緊跟熱點,紛紛下場寫起作文。看了MOSS寫的上海中考語文作文《會心之樂》后,上海市市南中學語文高級教師陶璐說:“我覺得MOSS總體上寫得不錯,但大模型沒有自我意識,它怎么能真正理解‘會心之樂’呢?”上海復旦五浦匯實驗學校校長、語文特級教師黃玉峰更是笑言,“如果要我打分,它肯定不及格”。
盡管人們對生成式人工智能抱有不同態(tài)度,但它已經(jīng)進入我們的生產(chǎn)生活。
“大模型是指具有大量參數(shù)的機器學習模型,可以在訓練過程中處理大規(guī)模的數(shù)據(jù)集。ChatGPT就是具有超大規(guī)模參數(shù)的大模型。要實現(xiàn)大模型的訓練,必須有強有力的算力支撐。”天風全球前瞻產(chǎn)業(yè)研究院聯(lián)席院長孔蓉表示,按照國內(nèi)的發(fā)展速度,預計今年國內(nèi)大模型可以達到GPT3.5的技術水平;得益于海外開源大模型的技術,會有一批國內(nèi)企業(yè)達到這一水平。
國內(nèi)大模型的涌現(xiàn)速度,也印證了孔蓉的判斷。3月16日,百度推出搭載文心大模型的文心一言;4月8日,華為更新盤古大模型;4月10日,商湯科技推出商量SenseChat;4月11日,阿里巴巴推出通義千問;此后,360、字節(jié)跳動、科大訊飛、京東、騰訊等公司也紛紛推出了自己的大模型。科技部人工智能發(fā)展研究中心5月底發(fā)布的《中國人工智能大模型地圖研究報告》顯示,當前國內(nèi)10億參數(shù)規(guī)模以上的大模型已發(fā)布79個,“百模大戰(zhàn)”并非戲言。7月份在上海舉辦的第六屆世界人工智能大會上,國內(nèi)通用型大模型頂尖產(chǎn)品悉數(shù)到位,集中展示國內(nèi)外總計30多款大模型。
國內(nèi)大模型發(fā)展火爆,離不開國內(nèi)算力資源作為基礎。
燧原科技創(chuàng)始人、董事長兼CEO趙立東表示,在大模型的技術萌芽期,訓練一個GPT3參數(shù)規(guī)模的大模型成本極為高昂。根據(jù)谷歌的經(jīng)驗,用大模型來代替谷歌每秒32萬個查詢,將新增約360億美元推理成本。此后,發(fā)展到應用加速膨脹期,大模型應用賦能千行百業(yè),所需算力又會是一波乘數(shù)效應。
上海市集成電路行業(yè)協(xié)會會長張素心表示,“為解決算力需求問題,國產(chǎn)芯片應匯聚合力,擴大開發(fā)者群體,形成生態(tài)閉環(huán),繼而加速產(chǎn)業(yè)發(fā)展乃至國際化之路”。
東浩蘭生會展集團董事長陳小宏告訴記者,在第六屆世界人工智能大會上,圍繞大模型的訓練需求,沐曦曦思N100、瀚博SG100、昆侖芯2代AI芯片等大模型應用芯片集中亮相,夯實了國內(nèi)算力資源的底氣。可以說,隨著大模型的火爆,算力領域既感到壓力,也充滿動力。
應用突圍
無論是實現(xiàn)大模型落地應用,還是提升算力供應,都需要努力構建自主創(chuàng)新架構、滿足市場多元需求。當前無疑是一個極佳的時間窗口。
孔蓉在美國硅谷調(diào)研發(fā)現(xiàn),相比國內(nèi)企業(yè)爭相布局大模型,美國科技企業(yè)的研發(fā)已經(jīng)以AI應用為主。在美國企業(yè)中,AI應用已相當普遍,寫文章、寫郵件、數(shù)據(jù)分析、發(fā)布招聘廣告等都離不開AI。“國內(nèi)大模型井噴之后,當務之急是應用落地。畢竟大模型研發(fā)出來就是要為生活和工作服務的。”孔蓉表示。
“歷經(jīng)4年技術深耕和研發(fā)迭代,百度現(xiàn)已升級到文心大模型3.5。”百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰表示,文心大模型3.5在效果、功能、性能等方面有了明顯提升。“凡是與語言文字或程序代碼打交道的應用場景,都可能有文心一言的用武之地。”王海峰表示,不少行業(yè)如能源、金融、教育等,已經(jīng)成為文心一言的應用場景。
要把通用大模型應用到不同行業(yè)中,仍存在不少突破口。對此,垂直的行業(yè)大模型應運而生。這類行業(yè)模型、專屬模型脫胎于通用大模型,經(jīng)過有針對性的專業(yè)數(shù)據(jù)精調(diào)后,就可適用于垂直領域,為某些特定行業(yè)服務。
不久前,星環(huán)信息科技(上海)股份有限公司發(fā)布了為金融領域量身定做的大模型“無涯”。作為業(yè)界首款面向金融智能量化投研的領域大模型,它將在金融投研、量化投資和智能推理等領域有力輔助分析師、研究員和投資經(jīng)理的日常工作,對股票、債券、基金、商品等各類市場事件進行復盤、傳播和推演。同時,基于大模型的事件驅(qū)動與深度圖引擎,其可實現(xiàn)對事件語義刻畫、定價因子挖掘、時序編碼、異構關系圖卷積傳播等功能,幫助企業(yè)更好應對復雜的市場環(huán)境和業(yè)務需求。
不過,目前來看,大模型應用仍存在一些問題。星環(huán)科技創(chuàng)始人孫元浩表示,大模型有時會一本正經(jīng)“胡說八道”,原因之一在于訓練大模型至少用時半年,這導致實時新聞資訊、市場行情等快速變化的信息難以內(nèi)置到模型中,因此需要各類大模型發(fā)布商不斷更新語料與數(shù)據(jù),這是一個不小的挑戰(zhàn)。
北京中關村科金技術有限公司專注于垂直行業(yè)和細分領域的大模型應用,瞄準新一代得助對話引擎,他們推出了全新的AIGC應用——“超級員工”,如智能客服、外呼機器人、智能陪練、智能質(zhì)檢、坐席助手等。該公司副總裁張杰介紹,“超級員工”以助手的形式在金融、零售、政務等多個行業(yè)頭部企業(yè)試用,原先需要10分鐘完成的營銷文案,現(xiàn)在10秒即可完成;外呼客服話術師助手讓原來30個話術師的工作量如今由2人即可完成,且語義理解準確度從85%提升至94%。“大模型具備的超強語言理解能力,讓‘最后一公里’的銷售過程實現(xiàn)數(shù)字化轉(zhuǎn)型成為可能。這既能幫助企業(yè)通過智能對話服務實現(xiàn)降本增效,也能有效提升用戶體驗、拓展服務外延。”張杰說。
眾多通用大模型和垂直大模型同臺競技,結(jié)果必然是優(yōu)勝劣汰。張杰表示,在成本約束以及充分的市場競爭環(huán)境下,眾多大模型產(chǎn)品必然面臨“洗牌”。
面臨“洗牌”的不僅是大模型,算力領域同樣如此。“百模大戰(zhàn)”可喜亦可憂,必須直面算力“燒不燒得起”的課題。大模型訓練和推理最終要回歸商業(yè)邏輯,實現(xiàn)經(jīng)濟效益而非“不計代價”,這就涉及算力能否像水電煤一樣“普惠”。
燧原科技創(chuàng)始人兼COO張亞林表示,“隨著大模型間的競爭逐漸展開,大模型在數(shù)量上會收斂,生態(tài)也會相應濃縮和集約,這對于建立AI芯片新生態(tài)來講,是非常有利的機會”。
上海天數(shù)智芯半導體有限公司不久前宣布,天垓100加速卡的算力集群,基于北京智源人工智能研究院70億參數(shù)的Aquila語言基礎模型,使用代碼數(shù)據(jù)進行訓練,已穩(wěn)定運行19天,且模型收斂效果符合預期,測試證明天數(shù)智芯已經(jīng)具備支持百億級參數(shù)大模型訓練的能力。天垓100加速卡的算力集群率先完成百億級參數(shù)大模型訓練,邁出了自主通用GPU大模型應用的重要一步。這一成果證明天垓產(chǎn)品可以支持大模型訓練,打通了國內(nèi)大模型創(chuàng)新發(fā)展的關鍵“堵點”,對于我國大模型自主生態(tài)建設、產(chǎn)業(yè)鏈安全保障具有重要意義。
孔蓉說,“像ChatGPT這樣級別的大模型需要上萬張芯片和加速卡支持,就目前國內(nèi)一些商業(yè)化應用來看,不需要比拼最高算力,而是應比拼實際效率,因此性價比會是重要的影響決策因素”。趙立東也認為,“芯片是‘用進廢退’,越用才能越好用。在漸進式過程中培育算力生態(tài)、迭代算力產(chǎn)品,這個過程是我們必須經(jīng)歷的”。
提升競爭力
不久前印發(fā)的《上海市推進算力資源統(tǒng)一調(diào)度指導意見》提出,開展上海全市算力基礎設施及算力資源輸出能力摸排,形成算力清單。基于算力資源底數(shù),推動頭部企業(yè)接入上海市人工智能公共算力服務平臺,構建一體化算力調(diào)度服務體系和平臺基礎框架,實現(xiàn)算力資源統(tǒng)一編排。
“某種程度上,算力決定了市場競爭力。”商湯科技董事長兼CEO徐立說,在AI大模型時代,模型參數(shù)量將以指數(shù)級速率提升,數(shù)據(jù)量隨著多模態(tài)的引入將大規(guī)模增長,由此帶來算力需求劇增。
上海市經(jīng)信委副主任湯文侃表示,“十四五”期間,上海將加強全市算力資源統(tǒng)籌、調(diào)度和共享,提升算力資源利用率,加速數(shù)據(jù)要素流通,全面釋放數(shù)據(jù)價值。
上海臨港新片區(qū)6月份發(fā)布的《臨港新片區(qū)加快算力產(chǎn)業(yè)集聚發(fā)展三年行動方案》提出,到2025年,臨港新片區(qū)將形成以智算算力為主、基礎算力和超算算力協(xié)同的多元算力供給體系,總算力超過5EFLOPS(FP32),AI算力占比達到80%,算力產(chǎn)業(yè)總體規(guī)模突破100億元,集聚相關企業(yè)及機構超過100家,打造具有全國影響力的算力產(chǎn)業(yè)集聚區(qū),建設一批算力示范應用標桿場景。
一系列算力布局,是為了夯實大模型應用的底座。隨著AIGC深度應用的展開,不僅對算力、數(shù)據(jù)、算法提出了更高要求,也對安全、隱私、倫理提出更多挑戰(zhàn)。只有在確保數(shù)據(jù)安全和隱私保護、健全人工智能倫理與安全的前提下,才能讓AI技術真正釋放出應用價值。
針對算力問題,華為輪值董事長胡厚崑表示,華為已在內(nèi)蒙古烏蘭察布市建設數(shù)據(jù)中心,初期階段部署了數(shù)千卡規(guī)模的人工智能集群,在同等算力下,計算效率提升10%以上。
不久前,UCloud優(yōu)刻得AIGC算力底座正式亮相。優(yōu)刻得董事長兼CEO季昕華表示,優(yōu)刻得推出涵蓋數(shù)據(jù)中心、計算平臺、管理平臺、網(wǎng)絡服務、應用服務、生態(tài)接口的一系列產(chǎn)品和解決方案,可為用戶提供完全物理隔離的獨享機柜、服務器、網(wǎng)絡、存儲資源,結(jié)合完整的安全方案和專家服務,確保用戶的大模型平穩(wěn)運行。
“歷史的機遇、技術的變革,將數(shù)據(jù)智能推向了前所未有的高潮,也帶來了更加嚴峻的數(shù)據(jù)安全挑戰(zhàn),數(shù)據(jù)流通邁向密態(tài)化是未來趨勢。數(shù)據(jù)密態(tài)要求下,隱私計算的方法體系、平臺框架、技術標準都面臨全新變革。”螞蟻集團副總裁兼首席技術安全官韋韜呼吁更多同行參與到開源和生態(tài)建設工作中。“開源隱私計算核心產(chǎn)品一直是我們對行業(yè)的態(tài)度,未來將進一步加大隱私計算的開放力度和廣度,與行業(yè)一道構筑AI智能時代數(shù)據(jù)安全護城河。”韋韜說。
盡管挑戰(zhàn)不少,但不可否認,以大模型為核心的人工智能時代正加速到來。“未來10年,新一輪科技周期將啟動。”孔蓉認為,在AI推動下,XR、機器人、自動駕駛、影視內(nèi)容等行業(yè)將進入爆發(fā)式變革時期。
騰訊研究院、同濟大學、騰訊云共同發(fā)布的《人機共生——大模型時代的AI十大趨勢報告》明確指出,通過建設可控、可用的安全生態(tài),推動模型落地和應用,AI技術將為各行業(yè)帶來更多機遇。大模型時代帶來的創(chuàng)新和發(fā)展,將推動人工智能走向更廣闊的未來。
正如工業(yè)和信息化部副部長徐曉蘭所言,以深度學習為代表的新一代人工智能和以大模型為代表的通用人工智能不斷取得技術突破,將成為智能產(chǎn)業(yè)的根技術和智能經(jīng)濟的基礎設施。這意味著人工智能產(chǎn)業(yè)生態(tài)將醞釀一個又一個“爆點”,并等待著創(chuàng)業(yè)者去把握與挖掘。