大模型來襲,證券行業或迎變革?

導語
大模型研發浪潮下,證券行業能否把握行業變革帶來的發展機遇是能否構建長期核心競爭力的關鍵。

國內首批11家大模型產品陸續通過備案,大模型發展駛入快車道,生產力工具迎來顛覆式革新🏝。證券行業天然具備數字化優勢,與大模型應用層面落地存在高度適配性🍯。然而,目前大模型在證券行業業務場景的探索處於迭代升級初期。大模型研發浪潮下,證券行業如何把握行業變革帶來的發展機遇是能否構建長期核心競爭力的關鍵。因此,本文嘗試探究大模型的發展變革及其應用落地模式,探尋金融行業與大模型融合的應用場景,並以證券行業為錨點⛹️♂️,暢想“券商 + 大模型”發展遠景圖、業務落地可行性以及可能面臨的挑戰💁🏼♀️,為券商把握大模型革新機遇提供借鑒與參考。
大模型發展顛覆式變革
大模型(LLM) 是 大 規 模 語 言 模 型(Large Language Model)的簡稱,是“大數據 + 大算力 + 強算法”的產物🛌🏼。大模型是能夠借助大數據和神經網絡來模擬人類思維和創造力的人工智能算法和利用海量參數的深度學習模型,通過“預訓練—有監督微調—反饋強化學習”來理解、生成和預測新內容☄️。
國內外大模型發展變革
與早期人工智能模型相比💁🏻♀️,現有階段的大模型在參數規模⛹🏿♂️、算法結構🧑🏻🔬、商業模式以及應用場景等方面均特色顯著💫🟫,逐步從識別、篩選等感知能力🤹🏻,向理解、分析、決策等認知能力轉變,推動學習泛化能力🧝🏼📈、認知互動能力完成了質的飛躍,生成式人工智能(Artificial Intelligence Generated Content,AIGC)使LLM 成為人類生產力工具革新的驅動力。
首先🕴,參數規模倍數級增長,多模態預訓練模型占據主流。作為一種深度學習算法,大模型的快速發展伴隨著參數規模的激增👩🏿🍼,先後經歷單語言預訓練模型、多語言預訓練模型🦸🏻、多模態預訓練模型三個階段。在“參數為王”時代,高頻訓練量超越閾值之後可以帶來模型精準度的質變,各大商家開始尋求模型參數設置量級的豐富化。例如,騰訊“混元”大模型達到了千億級參數💬🔋,阿裏“通義千問”大模型則官宣已達到10萬億參數。
其 次,Transformer 架 構 提 出, 自 然 語 言 處 理(Natural Language Processing,NLP) 開 啟 新 範 式。Transformer是一種基於 Attention 機製的序列模型,與傳統的循環神經網 絡(Recurrent Neural Network,RNN) 和 卷 積 神 經 網 絡(Convolutional Neural Networks,CNN)等深度學習模型不同的是,在引入註意力機製和並行計算思想之後,其 Transformer能夠實現“知識識別—內容生成”的系統服務,有效解決長序列數據記憶處理難題。這也是研發者開啟對擴充大模型參數量的追逐的主要原因🐸。目前大模型參數設置的白熱化之爭或只適合於邊際效應遞增的發展初期,參數設置飽和後,運算效率和性能提升或將達到峰值🏄🏽♂️,因此重點是如何契合並落地至具體應用場景。
大模型應用層面落地模式分析
綜觀全球大模型應用層面的競爭格局🚹,美國憑借算法模型集成研發和產品化的領先優勢🙋♂️,整體呈現頭部巨頭通用模型領先🔀、中小廠商聚焦垂類場景特色的發展格局。國內大模型的發展相對較晚🐤,互聯網巨頭以其在AI領域的長久積累具備先發優勢💅,隨著高校研究院🌴、人工智能企業等組織/主體積極進入大模型的“藍海”領域🦷,國內大模型應用將日趨成熟。
應用場景是大模型發展的核心驅動力和價值釋放地。通用模型和行業模型的商業應用現處於研發迭代的早期階段🧔🏻♀️,未來大模型的變現模式主要有 To B(To Business)和 To C(To Consumer)兩個渠道。通用模型運算過程中只涉及少量微調,適合完成多場景任務、泛化普適性功能。行業模型前期需要運用行業知識進行大批量訓練,更加註重專業適用性🌓,以契合不同行業的特色需求。
To B 端變現模式:一是做公有雲⚰️🧚🏻♀️,通過大模型調用實現👨🏽🚀,以token方式收費🏋🏼♂️,是典型的API(Application Programming Interface)模式🏜;二是專註私有雲部署,通過定製化服務收費🚴🏽;三是做大模型平臺👂🏿,提供算力、評測等系列服務,由於服務覆蓋面更廣,百度、商湯🛜、阿裏等大型企業涉獵可能性更大。To C端落地變現模式:一是提供具備生產力工具的AIGC 產品🦸🏻♀️,隨後通過產品外部訂閱收費;二是提升產品使用體驗💘,重視模型與市場現有產品的交互契合度,後續基於用戶流量向商家端進行收費變現。
國內金融行業大模型應用初探
金融行業屬於信息密集型行業,具有天然數字化的優勢🧑🏽,大模型在認識互動🙎🏻、文本生成🚴🏿♀️、交易決策、計算推理等性能方面的跨越式提升⛓,具備與金融行業多個應用場景的高度適配性🐡。[1]
AI 大模型與金融不是技術的簡單糅合,而是針對不同業務場景的業務流創新(見圖1)。當前既有在銀行🧚🏻、保險、證券等金融行業的應用,又有聚焦具體業務板塊✫,探索更垂直化🎓、頗具使用深度的服務💤:①大模型 + 行業領域Bloomberg GPT是首個全方位提供金融信息和財經資訊的垂直和通用混合範式的大模型,能夠賦能多種金融應用場景;恒生電子專為金融行業打造的大模型Light GPT, 具備金融專業問答、邏輯推理、超長文本處理、多模態交互等能力,能夠為投顧、客服、投研、運營等金融業務場景提供底層AI能力支持🚌。②大模型+細分業務:摩根士丹利將GPT-4接入財富管理業務🔤,打造涵蓋市場投資策略、財經資訊、研究報告等內容的財富管理智庫,投資顧問人員可以通過與聊天機器人深度互動,實現高效便捷的信息統計分析。

大模型與證券行業深度融合
大模型在金融業務場景的應用層面落地多集中在智能問答等1.0時代⛽️,隨著金融行業“數據 + 人才 + 技術”與AIGC等大模型應用的深度融合,該融合有望成為金融行業轉型升級的新引擎。證券行業憑借業務的高靈活性💎、強機動性和多創新性,或可搶先實現AI大模型 + 券商落地,為智能分析👩🎓、量化交易、智能投顧和合規風控等業務註入新活力👨🏼⚕️。
從現實展望未來👩🏽🔬:應用場景革新的機遇
根據大模型發展特點🙂、券商各業務板塊展業需求和二者深度融合可行性🅾️,筆者試圖將券商與大模型的融合劃分為三個時代🙅♀️。
秉承“能落地🎹、可應用”的核心準則,關註應用場景革新,筆者認為當前“券商 + 大模型”正處於1.0—2.0時代的過渡期。
1.0時代👨🏿🦱:簡單場景化輔以弱交互屬性,賦能C端的初步探索🏌️♀️🕴🏼。
該階段聚焦的業務場景相對簡單,大模型主要以認知、理解能力為主,交互屬性相對較多,能夠滿足券商在服務C端客戶的初步探索的需求🙏🏼🤹🏼。受限於人工智能發展,券商與科技的結合仍然是以實現專業知識智能問答和金融插件工具內部接入為主,如打造“數智員工”💅🏿、智能開戶以提升對於C端客戶的服務效率。同時✭🧑🏿💼,通過外部金融插件的接入𓀑🛷,能夠快速實現券商內部數據資料篩選、圖表製作等需求🦸🏻♂️🥺。
2.0時代:模型標準化與服務差異化共存,打造To B服務範本。
隨著垂類大模型發展趨於標準化,券商將會更加關註服務模式的差異化,客戶賦能也從C端逐步覆蓋機構端💂🏿♂️,開始重視打造具備AI特色的To B業務功能。例如,恒生電子打造的智能投研平臺WarrenQ,以及各機構接入GPT完善量化投資交易工具👮♀️。在2.0時代,投研、投行、投顧、交易等各業務模塊的專研大模型競相推出⛹🏻♂️,市場將會開始關註“傻瓜交易”🙎🏽♀️、網格指令的普惠性和公平性,而券商自有 App 將不再局限於機製式的問答和操作,而是能夠實現更加智能的交互對話,通過分析海量的市場數據和用戶行為,為用戶提供更加精準的投資建議,實現風險管理和合規監控的智能化🧝。
3.0時代:個性化與普適化,打通一站式全流程系統
券商大模型的終極形態應該是全面化✈️、個性化和普惠化的場景體現,是通用大模型與垂類大模型協同發展的產物,能夠在一個平臺實現前中後業務的有效聯通,為客戶提供一站式平臺化服務。在這種情況下,券商與大模型的融合度達到100%,“數據 + 算力 + 算法”的部署趨於成熟🚥,數據合規🏃♀️➡️、黑盒邊界等問題將得到有效解決。券商內部數據系統被打通,各系統間調用通暢🏌🏿♂️😇,既能針對單一客戶的信息輸入輸出訓練提供個性化服務,又能確保業務流趨於普惠化,大模型全方位滲透加碼以提升客戶服務體驗🧕🏽。
業務落地可行性:賦能買方投顧業務大有可為,重資源業務更新迭代優先級低
若從業務落地可行性來看,垂類大模型可以在證券行業自動化客戶服務😥🚣🏻♂️、研究🧾、量化交易🎅🏽、智能風控、融資融券和投行等應用場景相繼落地。筆者根據大模型 + 業務全面落地可能性和落地所需時間,將各個業務劃分在四個象限🧾。具體分析如下👨🏻🦲:
短期內在證券行業中最容易、最便捷👰♀️、相對成本最低的落地項目是研究業務。券商接入模型的API接口,即可輔助研究報告的底層數據收集🤽♂️、基本邏輯的梳理和金融建模的代碼等🥀,減輕研究員冗余的基礎性、重復性工作壓力,讓研究員有更多觀點思考產出,提升對數據和事件點評報告的產出速度🧏🏻。
短期可試用、難全面推廣的是交易業務。機器學習和深度學習模型兼顧穩健性、透明性以及模型時序預測能力和擬合度,可在交易指令創建、記憶🧕、轉化🧑🏽🎨、修正等方面進行結合。盤前資訊收集整理🤵🏻♂️、觀點輸出🎚;盤中實時因子計算🙎🏼、模型預測★、投資組合管理、動態調倉;盤後總結歸納🛀🏿、業績歸因。動態優化量化交易策略,通過大規模多樣化的市場數據訓練,預測股票價格和市場趨勢,實現策略的動態實時修正👮♀️。例如,針對B端量化客戶,通過大模型API端口接入,券商根據交易策略對標的股票池進行篩選,快速響應客戶需求並創新。大模型可以在純量化策略上深度應用👨🏿✈️,但對於主觀量化這種本身需要介入決策者主觀意識的交易策略而言,大模型的應用僅能局限在篩選🎭、回撤、歸因等事務性工作上,終究無法賦予主觀意識。
長期來看🦵🏿,大模型與券商買方業務結合更具適配性,尤其是在買方投顧等財富管理領域大有可為👨🦰🏘。買方投顧業務發展是金融行業的發展“藍海”🏵,其重點在打造投資🍖、顧問以及平臺三大方面。筆者認為財富管理的終極生態是買方投顧。現在券商與大模型的合作也多集中於財富管理領域,應用場景落實在前文提到的智能投研內容生成、個性化理財需求的困惑解答🚵🏽、投資服務深度陪伴以及特定任務的智能化處理方面。監管多次提及獨立投資顧問機構發展👓,暢想未來,若以美國投顧發展為鑒,在買方投顧驅動下🈵,獨立註冊投資顧問(Registered Investment Advisors,RIA)的發展空間極為廣闊。隨著財富管理領域的投資咨詢、賬戶管理、資金運營等業務被專業化機構細分後賦予牌照💇🏽,大語言模型等技術可以和買方投顧機構深度融合,實現商業盈利模式的革新🚾,從依靠產品到依靠服務🌻,再到依靠SaaS訂閱🌹、運營分成👍、流量收費。
TAMP(Turnkey Asset Management Platform)模式是買方投顧🛷,既是獨立投顧深化發展的必經之路,也是大模型在財富管理領域發力的主要錨點。TAMP平臺能夠提供投資決策與系統運營等全流程服務👨❤️👨,具體包括共同基金🛋、ETF(Exchange Traded Fund)、特定賬戶在內的投資解決方案🛀🏼,同時提供會計對賬、業績披露🔽、稅務優化🚴🏼♂️、信息報告等後臺運營服務。AIGC等大模型產品的應用,能夠跨模態生成個性化內容✋🏿,通過大數據串聯“投資 + 研究 + 電商”三大模塊🦹🏻,以技術為支撐、信用為保障,通過多輪互動🫅🏽,融入多模態知識理解🐲,加快TAMP 模式快速落地🤶🏻,大模型的發展終將成為TAMP模式構建的重要組成部分🐶。目前該部分發展仍處於行業空白👨🏽💼,發展空間廣闊,未來各券商如能推出更加智能化、個性化和高效化的 LLM來服務TAMP模式和投顧業務,可以幫助券商降本增效👨🍳,並從當下傳統業務的困境中脫穎而出🍝,在競爭激烈的買方業務市場中占據一定份額🧘🏼♂️。
筆者認為,大模型和券商業務並不能實現全面融合(見圖2)。就當前場景應用市場而言,大模型雖然可以賦能投行等強資源依賴性業務,但全面融合落地可能性較小,或只能在中臺承做方面有所作為🥛。例如,建立數據倉庫,優化入池、篩選、簿記等流程化工作及持續期管理等。考慮到投行、資管等業務的承攬和承銷環節更加看重從業人員的客戶資源和攬客能力,現有大模型應用的底層邏輯依舊是工具化屬性,多是賦能長流程🐑、復雜化🔘、重復式工作,將人員從簡單的工作中釋放出來⇢,主觀意識輸出和人情世故處理的大模型終不能勝任。

應用層挑戰🤳:關註技術要求、數據合規和監管變革
文心👩🏼🦳、星火、通義等國內大模型ToC端應用多停留在對話、智能搜索🕳、“數智人”等初級階段,支持AIGC領域文案創作、文本生成🏋🏻、知識問答等能力①👱🏻♂️;To B端雖有部分開源模型推出,也逐步融入多模態知識理解,但單個模型的普適性和應用性仍需拓寬,在技術🖖、數據🧖🏽♀️、監管三大方面仍存在發展“桎梏”🚡。
第一,技術要求👩🏻:完善基礎設施建設🏆,確保信息的及時性♑️、準確性、專業性🛀🏿。
大模型對證券公司的基礎設施建設提出較大挑戰。金融領域知識具有強專業性🤵🏼♂️,證券公司需要重構知識的輸入端模型𓀀,識別客戶文字信息的有效字段,確保客戶的需求意圖,模型設立後也需要大量預訓練反饋,底層算力需求投入成本較高🧚🏼♀️,正式全面投入使用的過程也較為繁雜。而且從輸出端來看💂🏻♀️,金融領域的知識輸出需要滿足高效性、及時性、精確性要求,對於大模型預訓練信息需要及時更新,提升對於數據選擇、處理📛、改造的工程化能力🤏🏽,防止出現訓練語料滯後的問題。
應用場景和技術發展“一體兩翼”👨🏽🎤,兩者呈現相互催化、迭代進步的相生關系👩🏻🍼。大模型與證券業的深度融合,需要黏性強、量極大、頻次高的應用場景加以匹配。如果僅將大模型應用於投研決策🙆🏼♀️、智能客服👬🏼、風險管理♙、智庫建設、業務審核等場景👊🏿,“大而全”的通用模型或許有些大材小用🏆🧸,“小而美”的垂類模型更適配👩🏽。在2.0時代,證券行業通過“大模型 + 券商”構建貼合業務的全指標體系,針對大場景、客戶畫像進行標簽化管理,細分垂直模型的應用和交互🦹🏽♂️,才能逐步走向3.0時代的全流程融合⛪️,但該階段對底層架構的構建和應用場景的打通要求都較高。對於中小券商而言👩🦼➡️,技術成本帶來的壓力將會降低機構整體參與度🦸🏼♀️,能否平衡大模型接入帶來的成本和效益,是能否引發行業深度革新的關鍵。
第二👩🏻🌾,數據安全:分設對內對外接口💆♀️,關註數據合規與歸屬權管理。
隨著大模型競品層出不窮🫳,各類產品問答中針對訓練數據集諱莫如深👧🏽,數據安全和使用權被擺上高位🕧,數據是產品差異化的重中之重🤵🏼♂️。
對外部客戶服務的大模型產品,除了宏觀數據公布、上市公司數據披露、交易所數據公開等公共的數據庫🧎♀️➡️,證券公司如何搭建大模型產品訓練數據付費模式成為競爭的關鍵點。試想機構資源豐富的券商是否推出了“知情人士透露數據庫”“一手行業調研數據庫”“聰明散戶交易數據庫”,還有已在運行的“市場認可度較高的分析師報告”“投顧策略組合優選”“金融產品的投研評價”等模式的迭代升級,證券行業財富管理業務的競爭必然朝著付費模式化、數據資源化、金融科技化的方向前進👮🏽♂️🧑🦽➡️。
對內部賦能的大模型產品,需要考慮涉及跨部門數據調配🤷🏿♀️、信息隔離墻設置、涉密信息外部端口阻攔等方面配置🛌🏿,目的是提升券商各部門“文案辦公”的效率和準確性🧛🏽♂️,輔助檢查和監督,使從業人員更加專註於服務質量,簡化服務流程🦸🏼,節省服務時間,允許證券公司把更多的精力和資源投入到拓客業務、人員和GPT融合程度培養上,進而實現降本增效和盈利增長的目的。
第三,監管發力:放和管兩手抓✌🏻🧘🏻♂️,重視三大流程監管。
2023年8月15日,《生成式人工智能服務管理暫行辦法》正式實施,鼓勵生成式人工智能技術在各行業🌮🙆♂️、各領域的創新應用,生成積極健康🏋🏽、向上向善的優質內容,探索構建應用場景生態體系。中國作為首個針對生成式人工智能產品應用出臺管理辦法的國家,保持了對創新業務一貫的監管態度,即鼓勵的🈷️、開明的、支持的,但強合規且審慎管理的,即降低事前準入,強化事中事後監管🥝。現階段,中國垂類大模型應用落地較少,監管部門尚需明確細化對引入海外大模型的合規性管理,尤其是對垂類行業模型的監管,由於涉及數據合規問題,因此不僅涉及中華人民共和國工業和信息化部等頂層算力監管部門,還需要地方層、行業主管部門介入🩰。由此,大模型的廣泛落地,一定需要先補足大模型各衍生分支的監管框架👳♂️,對標準製定🧑🦳、數據安全與治理雙管齊下👈🏼。
證券行業作為金融領域較為可能廣泛使用大模型的拓路者🩸,監管不僅需要把握“放”和“管”的結合與平衡👷🏽,還要精準劃定“管”的程度與邊界,秉承“全程管、適度放”的原則,將“業務 + 過程 + 人員”三大流程的監管相結合💋,持續進行反饋改進🧛🏿♀️,促進行業良性競爭。
(1)業務監管:鼓勵投資者參與證券業務的全流程管理🧖🏼♂️,針對數據治理等建立投資者申訴維權機製🏋️♀️;
(2)過程監管:實時監測大模型對投資者的反饋結果,定時發布大模型發展應用狀況;
(3)人員監管:規範立法監督行業人員不會利用大模型進行違規操作✈️;
(4)反饋改進:通過課題😋、圓桌會議、協會討論等形式吸收改進不足之處🫵🏼,強化事中事後監管的積極作用🦛。
展望🤦♀️👨🏽⚖️:以開放心態參與,積極迎接變革
大模型研發潮流湧進,證券行業註定迎來大變革,尤其是證券行業發展差異化逐步消弭🚶🏻➡️,業務同質化越發嚴重,券商立足金融垂類大模型發展已是大勢所趨🦈。無論是內部研發🥮,還是從第三方采購,都需要避免盲目冒進,註重大模型與業務場景的適配性,細分專業領域並不需要超大規模的模型,不恰當的網絡架構設計反而會造成對計算資源的極大浪費。此外,需要更加關註數據敏感性,明確公有雲和私有雲的部署劃分,強化合規評估與風險管理。監管介入🤷🏻♂️,重點關註大模型產品引入後對數據安全、黑盒性質🏄🏼♀️、監管邊界發展的影響,審慎運用金融科技滲透各業務領域,實現證券行業高質量發展。未來大模型是成為C端用戶的服務流量入口,還是成為 B 端機構客戶的底層技術支撐,仍需時間加以檢驗👮🏿♂️。
註釋👷🏽:
[1] 李振. 應用才是硬道理🏌🏻,下半年發布證券行業智能助手[N]. 21世紀經濟報道,2023-07-31(018).
[2] 趙大偉.AIGC能力本質與應用場景[J].企業管理,2023(09):42-45.
*本文僅代表作者個人觀點,僅供讀者參考🥖,並不作為投資、會計、法律或稅務等領域建議。編輯:葛雯瑄。