今天,隨便拉個人出來都會說兩句AI。我們關心它的能力,看它的樂子,也擔心它的提升。沒有人會拒絕從天而降的熱度,早期投資人早已聞風而動,二級市場不愿錯過這一輪上升的機會。不論估值還是市值,反映的都是我們對技術的樂觀預期。
(相關資料圖)
在AI的世界里,人類已經樂觀了好幾次。
2016年,AlphaGo打敗李世乭,AI概念便開始走紅;2018年,波士頓動力展示了跑酷王Atlas 2的演示視頻,雖然它和AI并無關系,但也再次讓相關概念股不斷異動。每當AI有最新進展,隨之而來的都是大量概念炒作,但AI行業(yè)不僅有很高門檻,還有很高的天花板。
最近一段時期,ChatGPT概念股,又一次復現了上述情境,一些企業(yè)有意捧之炒之,2023年2月1日~4月7日,相關概念累計上漲達62.38%,而在此后ChatGPT概念股遭最狠下跌。[1]
我們常用Gartner曲線去描述一項技術的成熟度,但須知Gartner曲線原名“Hype Cycle”——是伴隨技術發(fā)展的炒作的周期。
這是再樸素不過的道理:炒作結束,應用才真正起飛。
事實上,OpenAI成功并非追隨概念熱點,其核心領導團隊是一群富有使命感的技術偏執(zhí)狂,堅定擁抱通用人工智能(AGI),并持續(xù)推動大模型相關技術。[2]
許多人都沒有想到,大模型竟然可以取得如此成效,國內企業(yè)也順勢紛紛趕工,但做大模型,談何容易。
中國信通院《人工智能白皮書(2022年)》指出,人工智能正朝更大規(guī)模、更多模態(tài)的方向發(fā)展[3]。未來的大模型,不僅需要算力驚人,更會通曉文字、圖像或視頻。
首先,高質量語料正逐漸消耗殆盡,更多信息需要從視覺上獲取,也就是向多模態(tài)發(fā)展。人類一生可以聽到約10億個單詞,GPT-3就已學習約5000億語言數據,已知最大語言模型數據消耗量在2萬億個Token(指文本中最小單位)以上,而人類文明產生高質量語料共9萬億左右,語料被用完是遲早之事。事實上,人類是視覺動物,80%信息通過眼睛獲取,且神經元處理視覺和語言連接數比例為10:1,因此讓AI也學會識圖,就能更快了解世界。
其次,大模型時代單純使用參數量的標定方式已過時,現在應該綜合考慮算法、數據和算力三要素。過去10年,最好的AI算法對于算力需求增長超過了100萬倍,也就是每兩年提高一個數量級。隨著多模態(tài)的引入,數據量將繼續(xù)指數級增長,當計算量有限情況下,需要分配更多計算資源給數據,而不是完全給參數,用公式來說,就是“大模型參數量×處理的數據量=計算量”,計算量越大,通用能力越強。
神經網絡參數量算力需求增長已超過100萬倍
國內外成型的類ChatGPT產品,其本質均由前期大模型而來,而產品本身能力則主要取決于前期大模型發(fā)展情況[4]。自從AI大模型于2017年被提出,國外就已經開始進行相關超大規(guī)模訓練,并于2021年正式進入軍備競賽階段。[5]
國內在早期擁有大模型能力的公司是少數。且國內大模型仍缺乏數據量,也做不到高層級的架構[6]。更困難的是,大模型是算力巨獸,依賴高端GPU芯片,一個大模型需數萬塊GPU,以此推算,是至少幾十億元人民幣的投入。[7]
雖然困難重重,但也有滿足做大模型一切條件的公司,這種公司需要既有算法,又有算力。
從“大煉模型”到“煉大模型”,AI產業(yè)前期投入大而后期應用難一直被行業(yè)所詬病。而如今,將語言、視覺等信息和能力融為一體的多模態(tài)大模型正悄然引發(fā)AI設計范式的轉變,即從專用人工智能走向通用人工智能(AGI)。
目前普通用戶和產業(yè)界也在追求多模態(tài)AI工具的聯合應用。一個模型被用于指揮另外一組模型、被用于生成Prompt。應用層面的創(chuàng)新層出不窮,是新一代大模型+場景的結合。
但“AI+場景”真的很貴,研發(fā)周期也極長,每個場景均有其專屬模型,如果遇到新任務,就要重新設計AI系統,采集樣本,對模型重新訓練。而AGI就像一個可以適配各行各業(yè)的萬能鑰匙,當大模型廠商把推理能力部署到千行百業(yè),就能讓更多應用享受到AI帶來福利。[8]
3月中旬以來,大模型混戰(zhàn)開打,百度、阿里巴巴、華為、360等公司分別展示了其在大模型領域的進展。而國內也一致指向新概念——模型即服務(Model-as-a-Service,MaaS),描繪一副全新的商業(yè)前景。
為了擴大市場應用,大模型應瞄準ToB業(yè)務。我們也看到,國產大模型也正一點點地撬動B端更多應用。
作為從2018年就開始研發(fā)大模型的AI公司商湯科技,就在近日展示了其日日新SenseNova大模型體系,面向行業(yè)提供涵蓋自動化數據標注、自定義大模型訓練、模型增量訓練、模型推理部署、開發(fā)效率提升等多種大模型即服務(MaaS)。
3月以來,越來越多的人機對話應用浮出水面,各家公司都對其擁有自己的思考。日日新大模型體系下的千億級參數語言大模型“商量SenseChat”作為聊天助手,可以解決復雜問題、提供定制化建議、輔助創(chuàng)作成本,同時還能在醫(yī)療領域提供導診、健康咨詢、輔助決策等對話能力,在編程領域提供代碼補全、注釋生成代碼、測試代碼生成、代碼翻譯、代碼修正、代碼重構、復雜度分析等功能。
商湯基于日日新SenseNova大模型體系,自研包括如影SenseAvatar、瓊宇SenseSpace、格物SenseThings以及文生圖大模型秒畫SenseMirage(同時也支持大量第三方豐富開源模型導入)等一系列生成式AI模型及應用,既可以生成高清圖片和視頻,也能生成各種3D內容。
多年發(fā)展中,自動駕駛很難向更高級別跨越,而它也很難像人一樣,可以靈活應對各種路況,多模態(tài)大模型或許能夠解決這種困境。利用大模型生成大量困難樣本,再用環(huán)視感知數據和多模態(tài)數據作為輸入,實現感知和決策一體化,通過環(huán)境解碼器重建3D場景,實現路徑規(guī)劃,并用自然語言解釋自動駕駛動機,就能使自動駕駛系統更安全可靠,且具有可解釋性。商湯則開發(fā)了自動駕駛的BEV(Bird Eye View)感知算法,實現量產,并在今年開發(fā)能夠實現端到端自動駕駛的UniAD,比SOTA更準確,誤差更低。
商湯的自動駕駛大模型概況
傳統AI技術下,人工標注所需時間長、成本高,需投入大量資源。而利用大模型可以實現自動標注,大大降低了成本。商湯明眸自動化數據標注平臺則提供自動數據標注服務,它擁有12個行業(yè)級大模型,涵蓋超過1000個目標類別,且能標注2D和3D。當用戶上傳圖片數據,就可以對目標進行檢測和屬性識別,并自動顯示標注。
商湯明眸SenseAnnotation概況
生物醫(yī)藥領域,人類基因組攜帶了超2萬個蛋白質的指令,但人體20種不同氨基酸通過排列組合,再經過螺旋和折疊,形成不同的復雜結構,只有約1/3蛋白質的三維結構通過實驗方法得到了解析[9]。因此解析蛋白質結構是一項非常重要的基礎工作。
蛋白質功能通常由其結構所決定,要預測其結構,算力資源是基礎。DeepMind的Alpha Fold之所以名震人工智能界與科研界,就在于其學習了X射線晶體學和冷凍電鏡的實驗數據,使其預測蛋白質結構能力超群,大大提升科研效率。商湯AI大裝置為蛋白質結構大模型提供AI推理算力,并為蛋白質相互作用模型,提供研發(fā)平臺及訓練算力,在與百英科技合作中,蛋白質結構預測大模型推理時間可由數小時減少到數分鐘,使得蛋白質結構預測性能達到工業(yè)應用的標準,抗體篩選效率提升60%。
不同于其它廠商大模型技術路徑,商湯是以視覺大模型為核心技術突破點衍生而來的多模態(tài)大模型發(fā)展路徑:2019年商湯即研發(fā)了10億參數視覺大模型,至2022年已推出320億參數視覺大模型。與此同時,商湯也提前布局自研NLP模型和多模態(tài)模型,并在2021年就應用在商湯數字人等產品中,在今年 3月,商湯還開源了30億參數的多模態(tài)大模型書生2.5。
基于AI領域的長期應用落地,商湯積累了大量的、有人反饋的、視覺類信息,形成優(yōu)質多模態(tài)語料,也使得桎梏大模型發(fā)展的數據難題迎刃而解。
此外,商湯AI大裝置SenseCore也奠定了商湯的發(fā)展基底。它目前的算力規(guī)模包含2.7萬塊GPU,可輸出5000PetaFlop的算力,支持20個千億參數超大模型同時訓練,支持最大4000卡并行單任務訓練,可持續(xù)7天以上不間斷穩(wěn)定訓練。
對于正探索多模態(tài)大模型的公司,到底如何讓大模型更有價值?商湯構建能力的思考,也許有些參考意義:一是優(yōu)化好模型本身,提高多模態(tài)數據處理能力,讓文字、圖片、視頻無縫銜接;二是提供更多高質量數據,給模型更多“好口糧”;三是與生態(tài)伙伴探索商業(yè)應用,讓大模型釋放更多生產力,如智能助手、自動駕駛、醫(yī)療診斷;四是讓大模型時刻安全可靠。
美國斯坦福大學人類中心人工智能研究所(HAI)發(fā)布的《人工智能指數報告 2023》(AI Index Report 2023)顯示,大語言模型論文發(fā)表量方面,美國要遠超其它國家。[10]
圖源:美國斯坦福大學[10],漢化丨公眾號“科研圈”[11]
在投入上,美國也遠超中國:2022年,美國在AI領域的私人投資為470億美元,約是排名第二的中國(130億美元)的3.5倍。
圖源:美國斯坦福大學[10],漢化丨公眾號“科研圈”[11]
大模型作為前期投入極大的技術,需要的并不是概念,而是在提高投入的前提下,找到更多看得見摸得著的商業(yè)化應用。當大模型被每個人觸及之時,行業(yè)便會被更多人所重視。
References:
[1] 深圳商報:ChatGPT概念暴跌,機構、游資卻在抄底!最強主線真的熄火了嗎?.2023.4.10.https://mp.weixin.qq.com/s/TkXbhHu5jODPXWPQzEj5ig
[2] 新智元:張宏江:大模型發(fā)展機會與挑戰(zhàn).2023.3.18.https://mp.weixin.qq.com/s/pjUaRD0YV2qb6MXZ-oVstQ
[3] 中國信通院:http://www.caict.ac.cn/kxyj/qwfb/bps/202204/P020220412613255124271.pdf
[4] 智能相對論:ChatGPT冷觀察:沒有大模型的土壤,開不出ChatBot的花.2023.2.16.https://mp.weixin.qq.com/s/f7HTfM0wlh5D1GFJcJVstw
[5] 祝梅.國產AI大模型,尋找未來競爭力[N].浙江日報,2023-04-12(003)
[6] 新眸:阿里大模型也來了!聊聊我的幾點看法.2023.4.9.https://mp.weixin.qq.com/s/RZ73F7Z231H5GPg6s0p3LA
[7] 許林艷.國產AI大模型“百舸爭流” 夯實算力底座正在進行時[N].證券日報,2023-04-12(A03))
[8] 張依依.大模型正在塑造人工智能產業(yè)新格局[N].中國電子報,2023-04-11(007))
[9] Callaway E. DeepMind’s AI predicts structures for a vast trove of proteins[J]. Nature, 2021, 595(7869): 635-635..https://doi.org/10.1038/d41586-021-02025-4
[10] THE AI INDEX REPORT:Measuring trends in Artificial Intelligence.https://aiindex.stanford.edu/wp-content/uploads/2023/04/HAI_AI-Index-Report_2023.pdf
[11] 科研圈:https://mp.weixin.qq.com/s/yfOQkyWoManWRUlnSAWEeA
關鍵詞:
新聞發(fā)布平臺 |科極網 |環(huán)球周刊網 |中國創(chuàng)投網 |教體產業(yè)網 |中國商界網 |萬能百科 |薄荷網 |資訊_時尚網 |連州財經網 |劇情啦 |5元服裝包郵 |中華網河南 |網購省錢平臺 |海淘返利 |太平洋裝修網 |勵普網校 |九十三度白茶網 |商標注冊 |專利申請 |啟哈號 |速挖投訴平臺 |深度財經網 |深圳熱線 |財報網 |財報網 |財報網 |咕嚕財經 |太原熱線 |電路維修 |防水補漏 |水管維修 |墻面翻修 |舊房維修 |參考經濟網 |中原網視臺 |財經產業(yè)網 |全球經濟網 |消費導報網 |外貿網 |重播網 |國際財經網 |星島中文網 |手機測評 |品牌推廣 |名律網 |項目大全 |整形資訊 |整形新聞 |美麗網 |佳人網 |稅法網 |法務網 |法律服務 |法律咨詢 |媒體采購網 |聚焦網 |參考網 |熱點網 |焦點網
亞洲資本網 版權所有
Copyright © 2011-2020 亞洲資本網 All Rights Reserved. 聯系網站:55 16 53 8 @qq.com