【環球播資訊】騰訊云率先打響「大模型應用」信號槍
撰文|吳坤諺王潘編輯|吳先之在大模型賽道話不太多的騰訊,派出騰訊云向
撰文 | 吳坤諺 王潘
(資料圖片)
編輯 | 吳先之
在大模型賽道話不太多的騰訊,派出騰訊云向行業交出了自己的一份答卷。
2023年6月19日,騰訊云舉辦行業大模型及智能應用技術峰會,公布騰訊云在B端方向的MaaS(modle-as-a-service,模型及服務)技術方案,以及多款SaaS智能應用升級、產業客戶應用落地進展。
其中最值一提的是騰訊云并未選擇認知更為廣泛的通用大模型,而是選擇了基于騰訊云AI技術底座而預訓練的行業大模型,也就是垂直領域大模型。據了解,目前騰訊云業已發布的垂類領域包含金融、政府、文旅、傳媒、教育等,企業客戶只需要以上述預訓練模型為基礎,使用行業數據訓練,即可獲得具備業務能力的專屬大模型。
換句話說,騰訊云在發布會上展示的能力不在于模型本身,而在于大模型的部署與應用。
實際上,早在今年大模型全面爆發前,推進模型的垂直領域應用便已成為玩家們的共識,高校與業界都積累了不少垂直領域中小模型。只是在缺乏相應技術基底的情況下,即使這些模型的執行效率、安全性、可解釋性都差強人意,但其訓練與部署應用的邊際成本遲遲難以降低,預留的創新空間難以支撐其商業化。
而今得益于由OpenAI發現的模型涌現能力以及以此為基礎而衍生的訓練策略,通用模型能力加速拓展,也為垂直模型快速訓練與部署打下基礎。基于這些成功經驗,騰訊云正在邁出大模型落地探索和市場教育的第一步。
行業大模型正當時
現代教育中普遍采取的人才培養模型是T字型模式。我們往往會進行長時間的通識學習,在打牢基礎并發展出一定個人思維能力后參加高等教育,深入專研某個領域。人工智能集大成者的大模型似乎也是如此,在T字形發展的往復周期中,進入了豎向周期,而信號槍則由騰訊云率先打響。
騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生于技術峰會上表示,比起通用大模型,企業更需要針對具體行業的大模型,并結合企業自身的數據進行訓練和精調,以打造出更實用的智能服務。企業對提供的專業服務要求高且容錯性低,因此使用的大模型必須具備可控、可追溯和可修正的特點,并經過反復充分的測試。
眾所周知,通用大模型話題度滿滿,但在能力上過于泛化,僅憑借通識能力難以解決業務方面的現實問題,以至于通用大模型的訓練與調優更多地是在探索大模型的產出邊界,而非落地,從而解鎖其下一個價值級別。
與之相比,行業大模型最為明顯的優勢在于其聚焦專業領域的對齊能力,即模型的輸出與使用者的目標和興趣相對應的程度。
一個典型的例子是AGI,谷歌旗下人工智能前沿部門DeepMind研究員Rohin Shah認為,不正確的微調或錯誤泛化可能會導致AGI追求一個不正確的目標,未對齊的AGI將會產生災難性的后果。換句話說,即使是通用大模型,其外部輸出與內部微調都需要與人類的普世價值觀對齊,遑論有強烈落地需求的垂直專業領域。
即使是寫代碼這樣通用大模型普遍發力的高需求高價值垂直領域,目前在通用模型中所展現的能力也難言靠譜。無數利用已開放測試的大模型進行代碼測試的程序員們對此應該有更深刻的認知。
何況行業大模型針對的是特定領域任務,不涉及更多泛化通識,因此不需要龐大的通用模型為基底來進一步訓練,也不需要在推理和內存上進行過多的堆砌,追求“大力出奇跡”。
騰訊云副總裁、騰訊云智能負責人、優圖實驗室負責人吳運聲在與我們對話時提到,雖然業內的大模型在參數規模上不斷上漲,但騰訊云更關注的是如何以最有效、最低成本的手段去解決客戶的問題。相比之下,參數量其實沒那么重要。因為參數規模越大,其價值體現與解決問題的能力需要更多算力與數據集的支撐,其訓練與推理的成本無論是對騰訊云還是對企業客戶而言都難以承擔。
技術的價值體現在于落地,而無法落地的技術只是空中樓閣,在業界春秋筆法中等待價值虛像被打破。大模型之前的元宇宙、區塊鏈等風口已然是最佳例證。
行業模型顯然是更適合的解決方案,無論是騰訊云還是企業客戶。那么,需要深究的問題便是騰訊云的解決方案,即經由行業數據訓練的行業大模型能否在行業理解中展現比同參數通用大模型更強的能力。
技術底座決定上下限
大模型時代,自然語言處理、計算機視覺、語音識別等AI需求井噴,只是這些基于大模型的應用通常需要龐大的計算資源和存儲空間,以及高效的部署和管理機制。為避免企業普遍需求下“重復造輪子”的資源浪費,模型即服務(MaaS)作為一種新興的技術服務模式應運而生。
也就是說,MaaS服務的核心能力實際上是幫助企業完成AI應用從“手工作坊”向“工廠模式”的躍升。
而騰訊云的解決方案如下全景圖所示,以“一站式行業大模型精選商店”的形式為企業客戶提供包含模型的預訓練、精調、應用開發等能力的工具鏈,幫助企業高效率、高品質、低成本地創建和部署AI應用。其中對垂直領域能力起決定作用的是部署模型的基礎架構,也就是技術底座部分。
其中的基礎設施部分分別對應AI三要素中的算力與數據兩方面,其一是智能算力支撐——高性能計算集群 HCC,這項騰訊云于4月最新發布的技術可以使算力性能較前代提升3倍,為大模型訓練提供高性能、高帶寬和低延遲的智算能力支撐,配合自研星脈高性能計算網絡,可以為HCC計算集群帶來 3.2Tbps 業界最高互聯網帶寬;其二是數據檢索支撐——向量數據庫Tencent Cloud Vector DB,經騰訊海量業務場景驗證,在提供高吞吐、低延遲、低成本、高可用、彈性擴展能力的前提下,日均處理向量檢索千億次,更是同時支持標量+向量的混合檢索。
如果說基礎設施為企業打造的專屬模型提供上限,那么行業大模型便是企業專屬模型的下限。據湯道生介紹,騰訊云打造的行業精選模型商店覆蓋金融、文旅、政務、傳媒、教育等10大行業,提供超過50個解決方案,包含了智能客服、ORC識別、政務咨詢、教育咨詢、媒介管理等場景。
以文旅場景為例,騰訊云的某位頭部文旅客戶的傳統智能客服需要人工進行對話配置且知識維護量大、耗時長,但運營人力有限、人力配置成本高,且涉及訂單等復雜業務場景,長期未能完成業務閉環。但憑借長期業務積累的in-house數據,結合騰訊云文旅行業大模型能力,通過騰訊云TI平臺精調并構建了專屬文旅客服大模型,相比傳統職能客服增加了意圖識別、長文本識別與答案生成能力,讓該文旅企業無需人工配置對話流程,即可端到端解決業務問題。
除了客戶企業的成本控制與應用優化外,騰訊云以行業大模型為基礎,輔以行業數據精調的落地路徑恰好可以盤活當下經濟生態中多個行業與企業占有的沉默行業數據,讓數據價值得以展現。
曾經,許多行業的in-house數據被視作資產的原因在于大數據之下的用戶畫像等基礎運用,其價值紅利已逐漸出盡。而今,行業數據可以被用作企業專屬模型的養料,這不僅讓數據資產重回價值高地,更為行業帶來了新的想象空間。
值得一提的是,企業敝帚自珍的大量數據在模型訓練中使用也意味著曾經對精調(Finetune)的固有印象被打破,即精調不再局限于小規模數據集,而是規模更大且兼具縱深的行業數據集。作為大模型最重要的“手藝活兒”,騰訊云的解決方案中自然也不乏數據相關的方案。
數據仍是落地關鍵
騰訊云MaaS方案的中間層TI平臺聚焦數據這一關鍵要素,涵蓋了數據的標注、訓練和應用全流程。
在數據標注方面,高質量的標注數據集相對數據規模對大模型訓練的影響更大。除了業內尚未攻破的OpenAI神話外,谷歌于5月意外泄漏的內部研究人員文章也證實了這一點。
中文互聯網中廣告等干擾信息進一步加劇了數據清洗難度,中文大模型訓練對數據服務的要求也水漲船高。在騰訊云看來,大模型訓練和優化所需的高質量數據集必須經過清洗和預處理,以消除噪聲、填補缺失值并確保數據質量。如果導入的數據質量低,那么訓練出來的模型也會有問題,即“garbage in,garbage out”。
數據的訓練和應用同樣重要。要知道,垂直領域模型的構建并非簡單地向通用模型投喂行業數據,而是牽涉多方面技術與技巧的“手藝活兒”。例如epoch(訓練樣本在神經網絡中完整傳遞一次)值設置,如果epoch設置過高,將導致模型的災難性遺忘,喪失既有能力;而epoch設置過低,模型很可能根本學不到新知識,相當于白跑一趟。
這三項服務均在騰訊云的行業大模型案例中有所體現,比較典型的是與不同行業伙伴訓練出的多場景智能客服。金融、政府、教育等不同的行業數據在標注后結合對應行業大模型精調,即可展現業務所需的模型能力。
例如知識維護量大,冷啟動知識配置耗時長,且運營方面需要持續投入的金融客服場景,某國家首批股份制商業銀行便在騰訊云的技術與平臺支持下,運用積累的行業數據構建了專屬大模型并進行私有化部署。
至于中間層的數據平臺之下的加速組件,其功能在于模型訓練與精調的增效。據了解,太極加速組件在傳統CV、NLP算法模型的基礎上,通過異步調度優化、顯存優化、計算優化等方式為模型構建增速,相比行業常用方案性能提升30%以上。
只是在模型落地中,模型的歸屬權以及數據安全問題仍難以避免。
以騰訊云所在的云計算行業為例,早在MaaS模式興起前,云端部署便是云計算產業亟待解決的行業問題。巨頭企業可以豪擲千金做私有化部署,而中小企業卻只能采取公有云托管的形式,即使如此,巨頭企業也必須面對私有部署后高昂的遷移成本。
大模型的部署、歸屬以及更基礎的數據安全在企業客戶看來,自然也是重中之重。比較典型的便是ChatGPT的API接口模式,導致不少企業遭遇數據泄露,以三星、蘋果為首多家巨頭企業內部早早便禁用了ChatGPT API能力。
因此,騰訊云在全景圖之外更可貴的服務在于針對客戶需求提供私有化部署、公有云托管、混合云部署等靈活部署方案,而算力使用、模型的知識產權歸屬等問題同樣是case by case,讓企業客戶在享有高質量數據與模型服務的同時保障了私有數據stay in-house,真正做到了“量體裁衣、普惠適用”。
結語
“對于工業革命來講,早一個月把電燈泡拿出來,在長的時間跨度上來看是不那么重要的。關鍵還是要把底層的算法、算力和數據扎扎實實做好。”
自馬化騰在2023Q1財報會議上回應騰訊在大模型賽道“失聲”起已有一個月,騰訊云加碼行業大模型“先聲奪人”,這折射了大模型賽道中,互聯網大廠在商業化落地的一次轉向。在媒體熱潮逐漸過去,通用大模型發展進入平穩期的當下,落地才是行業應該為模型需求者提供的能力。
那么,垂直與通用是否是截然相反的路徑?
在大模型領域內,答案當然是否定的。因為垂直模型與通用模型的訓練方法基本相通,即使是在代碼層面也是如此。
大模型“煉丹”的特殊性,決定大模型賽道中可以同時存在兩種路徑,典型的就是在100B參數下探索人工智能邊界以及在7B參數下進行快速落地部署和應用,兩者殊途同歸,均以落地為目的,只是目前7B走在了通用的前面。可以肯定的是,大模型賽道中“兩條腿走路”的現象將持續存在。騰訊云憑借MaaS方案,已經成為行業內首個成功邁出了右腳的玩家。
原文標題 : 騰訊云率先打響「大模型應用」信號槍