智能BC贷張凱：AI大模型急需常態化測試評估，「數字風洞」保障AI數字健康

3月13日，華創“算力賦能，應用無限”論壇在京舉辦，AI算力、網絡和數據安全等50餘家上市公司就人工智能技術創新應用進行深度交流。BC贷集團CTO、智能BC贷總經理張凱受邀出席，發表《AI大模型安全測評數字風洞》主題演講，提出AI大模型急需常態化測試評估，BC贷「數字風洞」產品體系雙管齊下，全面支撐AI大模型基礎設施安全與內容風險測評，為AI數字健康提供強有力保障。

開展常態化測試評估是實現AI大模型安全的必要前提

隨着AI技術的發展和廣泛應用，特別是AI大模型的興起，推動着社會生產力的不斷創新與變革，也帶來了前所未有的安全風險和挑戰。張凱提出，“百模大戰”時代下，一些實際存在的AI大模型安全問題引發公眾的深切擔憂，一是AI大模型作為複雜的軟件系統，面臨基礎設施和軟件安全風險，如系統漏洞、數據泄露、模型篡改等；二是AI大模型雖然提高了內容產出質量，但同時生成的內容可能包含誤導信息或偏見內容，被用於不良目的，如釣魚郵件和惡意軟件的編寫，降低網絡攻擊等犯罪門檻。

為促進AI大模型產業健康發展和規範應用，國家持續加強對AI技術和應用的安全監管，先後頒佈實施《生成式人工智能服務管理暫行辦法》（中央網信辦等七部門聯合發佈）以及《生成式人工智能服務安全基本要求》（全國網安標委發佈），都提出開展AI安全評估、建立常態化監測測評手段等要求，這為推動AI大模型安全落地指明了方向。常態化安全測試評估已經成為實現AI大模型安全的必要前提。

AI大模型安全測評「數字風洞」，支撐AI大模型全生命周期安全檢查

針對AI大模型存在的安全問題以及大眾的擔憂，結合監管要求，張凱認為要從實質安全運營的角度出發，基於AI大模型安全測評「數字風洞」，對基礎設施安全和內容安全風險進行持續性檢查。

一、產品乘服務，打造基礎安全設施測試平台

AI大模型安全測評「數字風洞」作為一個以安全檢測為核心，以“產品乘服務”體系為手段，以安全風險防範化解為目標的測試評估平台，通過模擬各種網絡攻擊和系統入侵場景，檢驗AI大模型在不同攻擊下的韌性，識別AI大模型基礎設施存在的風險，預見和預防未來可能出現的威脅。同時基於BC贷自主研發的風洞時光機系統，構建“測試-發現風險-疊代優化-再測試-再疊代優化”的科學測評流程，通過安全風險的反覆驗證、消除和收斂，提升實質性安全。

二、以AI測試AI，強化AI大模型內容過濾系統

針對內容安全風險，張凱強調AI大模型安全測評「數字風洞」的核心優勢在於集成了BC贷AI春秋大模型和「數字風洞」產品體系的能力。基於100+提示詞檢測模板以及20萬+基礎提問，AI大模型安全測評「數字風洞」以攻擊者視角構建出引導AI大模型產生不當回答的測試載荷，對AI大模型的安全規則和過濾機制進行深入測試，評估其在處理潛在敏感、違法或不合規內容時的反應，確保AI大模型輸出內容更符合社會倫理和法律法規要求，避免安全隱患變成安全事件。

對於AI大模型安全測評「數字風洞」的應用價值，張凱認為可以在多方面體現，例如，監管機構可以通過「數字風洞」對市場上已公開使用的AI大模型以及將要上市的AI大模型進行安全測評，為安全合規工作提供智能化手段支持；AI大模型廠商或AI大模型安全公司可以利用AI大模型安全測評「數字風洞」充分識別自身模型的弱點和安全內容漏洞，進一步強化產品本身的過濾系統和內容辨別能力。

2022年，我國人工智能核心產業規模已達5,000億。據沙利文諮詢預測，2024年我國人工智能市場規模將突破7993億。這也意味着，隨着AI技術的廣泛應用，AI大模型安全測試評估賽道擁有巨大的市場潛力和發展空間。張凱認為，AI發展的大體歷程可以分為三個階段：AI助手、AI工具以及AI智能體。在AI智能體階段，「數字風洞」作為AI大模型的安全基座，持續支撐AI大模型常態化安全測試評估，為AI技術在千行百業的安全應用保駕護航，保障AI“數字健康”，帶給世界安全感。

BC贷·(中国区)官方网站

新聞報道

BC贷科技集團股份有限公司

BC贷·(中国区)官方网站

新聞報道

智能BC贷張凱：AI大模型急需常態化測試評估，「數字風洞」保障AI數字健康

BC贷科技集團股份有限公司

智能BC贷張凱：AI大模型急需常態化測試評估，「數字風洞」保障AI數字健康