螞蟻集團發布AI安全檢測平臺“蟻鑒2.0” 可實現用生成式能力檢測生成式模型

2023-07-07 22:50:52來源：上海證券報·中國證券網

上證報中國證券網訊（記者宋薇萍）7月7日，2023世界人工智能大會（WAIC）“聚焦·大模型時代AIGC新浪潮—可信AI”論壇舉行，螞蟻集團聯合清華大學發布AI安全檢測平臺“蟻鑒2.0”。蟻鑒2.0可實現用生成式AI能力檢測生成式AI模型，可識別數據安全、內容安全、科技倫理三大類的數百種風險，覆蓋表格、文本、圖像等多種數據和任務類型，是業內首個實現產業級應用的全數據類型AI安全檢測平臺。據了解，該產品還入選了本屆大會的“鎮館之寶”。

(相關資料圖)

（圖：螞蟻集團聯合清華大學共同發布AI安全檢測平臺“蟻鑒2.0”）

AIGC安全成為當前人工智能研究發展的重要議題。中國科學院院士何積豐發表《可信人工智能展望》主題演講。他認為，不能再將人工智能視為簡單的技術工作，而是成為整個組織的變革引擎。可信人工智能要致力于保障數據安全可信、系統行為可追責、算法模型可解釋、網絡環境可信、法律倫理可信等問題。

在該論壇上，螞蟻集團同時宣布，“蟻鑒2.0”全面開放，面向全球開發者免費提供AIGC安全性、AI可解釋性、AI魯棒性三項檢測工具，可服務于數字金融、教育、文化、醫療、電商等領域的大規模復雜業務場景。

據了解，“蟻鑒2.0”的兩項硬核能力，一是實現了用生成式能力檢測生成式模型。檢測標準覆蓋內容安全、數據安全、倫理安全三大類，可對大模型生成式內容完成包含個人隱私、意識形態、違法犯罪、偏見與歧視等數百個維度的風險對抗檢測，并會生成檢測報告，幫助大模型更加有針對性地持續優化。

螞蟻集團大安全事業群技術部總裁李俊奎表示：“生成式大模型是一種‘深黑盒’技術，‘蟻鑒2.0’通過智能博弈對抗技術，模擬黑產以及自動化生成海量測試集，可實現‘生成式機器人’對‘AIGC生成式模型’的誘導式檢測計算，很像一個24小時不眠不休的‘安全黑客’在找茬大模型，從而找到大模型存在的弱點和安全問題所在。這種AI對AI的評測，也是教學相長。好比生成式考官考核生成式運動員，在對抗中雙方能力互相提升，進一步提高整個行業的AI安全水位。”

另一項硬核能力是，“蟻鑒2.0”融入了可解釋性檢測工具。綜合AI技術和專家先驗知識，通過可視化、邏輯推理、因果推斷等技術，從完整性、準確性、穩定性等7個維度及20余項評估指標，對AI系統的解釋質量量化分析，幫助用戶更清晰驗證與優化可解釋方案。

據了解，“蟻鑒2.0”集成了螞蟻近10年可信AI實踐、1000余項可信AI專利，支持零編碼測評。開發者通過API接口，將AI模型接入蟻鑒，就可以一鍵識別和挖掘模型漏洞。

螞蟻集團認為，人工智能的深度應用，不僅對數據、算法、算力提出了更高要求，也對安全、隱私、倫理提出更多挑戰。在確保數據安全和隱私保護、健全人工智能倫理與安全的前提下，才能讓AI技術真正地釋放應用價值。

此次論壇上，中國信通院、上海人工智能實驗室、武漢大學、螞蟻集團等多家單位共同發起的《AIGC可信倡議》。該倡議得到數十家單位參與，圍繞人工智能可能引發的經濟、安全、隱私和數據治理等問題，提出構建AIGC可信發展的全球治理合作框架，采用安全可信的數據資源、技術框架、計算方法和軟件平臺等全面提升AIGC可信工程化能力，最大限度確保生成式AI安全、透明、可釋。

（圖：在2023 WAIC可信AI論壇上，“產學研用”界共同發起AIGC可信倡議）

論壇現場還發布了由中國信通院、清華大學、螞蟻集團聯合編纂的《可信AI技術和應用進展白皮書（2023）》。該報告基于統一的可信AI認知維度，梳理總結可信AI發展現狀，提練了面向新階段大模型和AIGC引發的新需求，形成以技術為保障的可信AI評估體系和工具，探索新一代可信人工智能發展。

公開資料顯示，螞蟻從2015年開啟可信AI的實踐和探索，是螞蟻集團在人工智能領域的重點布局之一。通過可信AI技術的突破，螞蟻集團建設了一套世界領先的智能風控解決方案；蟻鑒AI安全檢測平臺先后獲得2022年上海金融科技中心建設三周年優秀成果、信通院可信人工智能實踐標桿案例等認可。

螞蟻集團發布AI安全檢測平臺“蟻鑒2.0” 可實現用生成式能力檢測生成式模型

相關閱讀

精彩推薦

閱讀排行

推薦閱讀