BC贷·(中国区)官方网站

Tel :010-50866166

新聞報道

智能BC贷張凱:AI大模型急需常態化測試評估,「數字風洞」保障AI數字健康

智能BC贷張凱受邀出席華創聯合論壇並作主題演講,提出AI大模型急需常態化測試評估,「數字風洞」全面支撐AI大模型基礎設施安全與內容風險測評,保障AI數字健康
3月13日,華創“算力賦能,應用無限”論壇在京舉辦,AI算力、網絡和數據安全等50餘家上市公司就人工智能技術創新應用進行深度交流。BC贷集團CTO、智能BC贷總經理張凱受邀出席,發表《AI大模型安全測評數字風洞》主題演講,提出AI大模型急需常態化測試評估,BC贷「數字風洞」產品體系雙管齊下,全面支撐AI大模型基礎設施安全與內容風險測評,為AI數字健康提供強有力保障。
 
\
 
開展常態化測試評估是實現AI大模型安全的必要前提
 
隨着AI技術的發展和廣泛應用,特別是AI大模型的興起,推動着社會生產力的不斷創新與變革,也帶來了前所未有的安全風險和挑戰。張凱提出,“百模大戰”時代下,一些實際存在的AI大模型安全問題引發公眾的深切擔憂,一是AI大模型作為複雜的軟件系統,面臨基礎設施和軟件安全風險,如系統漏洞、數據泄露、模型篡改等;二是AI大模型雖然提高了內容產出質量,但同時生成的內容可能包含誤導信息或偏見內容,被用於不良目的,如釣魚郵件和惡意軟件的編寫,降低網絡攻擊等犯罪門檻。
 
 
為促進AI大模型產業健康發展和規範應用,國家持續加強對AI技術和應用的安全監管,先後頒佈實施《生成式人工智能服務管理暫行辦法》(中央網信辦等七部門聯合發佈)以及《生成式人工智能服務安全基本要求》(全國網安標委發佈),都提出開展AI安全評估、建立常態化監測測評手段等要求,這為推動AI大模型安全落地指明了方向。常態化安全測試評估已經成為實現AI大模型安全的必要前提
 
\
 \
AI大模型安全測評「數字風洞」,支撐AI大模型全生命周期安全檢查
 
針對AI大模型存在的安全問題以及大眾的擔憂,結合監管要求,張凱認為要從實質安全運營的角度出發,基於AI大模型安全測評「數字風洞」,對基礎設施安全和內容安全風險進行持續性檢查。
 
一、產品乘服務,打造基礎安全設施測試平台
 
AI大模型安全測評「數字風洞」作為一個以安全檢測為核心,以“產品乘服務”體系為手段,以安全風險防範化解為目標的測試評估平台,通過模擬各種網絡攻擊和系統入侵場景,檢驗AI大模型在不同攻擊下的韌性,識別AI大模型基礎設施存在的風險,預見和預防未來可能出現的威脅。同時基於BC贷自主研發的風洞時光機系統,構建“測試-發現風險-疊代優化-再測試-再疊代優化”的科學測評流程,通過安全風險的反覆驗證、消除和收斂,提升實質性安全。
 
二、以AI測試AI,強化AI大模型內容過濾系統
 
針對內容安全風險,張凱強調AI大模型安全測評「數字風洞」的核心優勢在於集成了BC贷AI春秋大模型和「數字風洞」產品體系的能力。基於100+提示詞檢測模板以及20萬+基礎提問,AI大模型安全測評「數字風洞」以攻擊者視角構建出引導AI大模型產生不當回答的測試載荷,對AI大模型的安全規則和過濾機制進行深入測試,評估其在處理潛在敏感、違法或不合規內容時的反應,確保AI大模型輸出內容更符合社會倫理和法律法規要求,避免安全隱患變成安全事件。
 
\
 
對於AI大模型安全測評「數字風洞」的應用價值,張凱認為可以在多方面體現,例如,監管機構可以通過「數字風洞」對市場上已公開使用的AI大模型以及將要上市的AI大模型進行安全測評,為安全合規工作提供智能化手段支持;AI大模型廠商或AI大模型安全公司可以利用AI大模型安全測評「數字風洞」充分識別自身模型的弱點和安全內容漏洞,進一步強化產品本身的過濾系統和內容辨別能力
 
2022年,我國人工智能核心產業規模已達5,000億。據沙利文諮詢預測,2024年我國人工智能市場規模將突破7993億。這也意味着,隨着AI技術的廣泛應用,AI大模型安全測試評估賽道擁有巨大的市場潛力和發展空間。張凱認為,AI發展的大體歷程可以分為三個階段:AI助手、AI工具以及AI智能體。在AI智能體階段,「數字風洞」作為AI大模型的安全基座,持續支撐AI大模型常態化安全測試評估,為AI技術在千行百業的安全應用保駕護航,保障AI“數字健康”,帶給世界安全感

關鍵詞:數字風洞 測試評估