首頁 > 風控 > 正文

螞蟻集團發布AI安全檢測平臺“蟻鑒2.0” 可實現用生成式能力檢測生成式模型

2023-07-07 22:50:52來源:上海證券報·中國證券網  

上證報中國證券網訊(記者 宋薇萍)7月7日,2023世界人工智能大會(WAIC)“聚焦·大模型時代AIGC新浪潮—可信AI”論壇舉行,螞蟻集團聯合清華大學發布AI安全檢測平臺“蟻鑒2.0”。蟻鑒2.0可實現用生成式AI能力檢測生成式AI模型,可識別數據安全、內容安全、科技倫理三大類的數百種風險,覆蓋表格、文本、圖像等多種數據和任務類型,是業內首個實現產業級應用的全數據類型AI安全檢測平臺。據了解,該產品還入選了本屆大會的“鎮館之寶”。


(相關資料圖)

(圖:螞蟻集團聯合清華大學共同發布AI安全檢測平臺“蟻鑒2.0”)

AIGC安全成為當前人工智能研究發展的重要議題。中國科學院院士何積豐發表《可信人工智能展望》主題演講。他認為,不能再將人工智能視為簡單的技術工作,而是成為整個組織的變革引擎。可信人工智能要致力于保障數據安全可信、系統行為可追責、算法模型可解釋、網絡環境可信、法律倫理可信等問題。

在該論壇上,螞蟻集團同時宣布,“蟻鑒2.0”全面開放,面向全球開發者免費提供AIGC安全性、AI可解釋性、AI魯棒性三項檢測工具,可服務于數字金融、教育、文化、醫療、電商等領域的大規模復雜業務場景。

據了解,“蟻鑒2.0”的兩項硬核能力,一是實現了用生成式能力檢測生成式模型。檢測標準覆蓋內容安全、數據安全、倫理安全三大類,可對大模型生成式內容完成包含個人隱私、意識形態、違法犯罪、偏見與歧視等數百個維度的風險對抗檢測,并會生成檢測報告,幫助大模型更加有針對性地持續優化。

螞蟻集團大安全事業群技術部總裁李俊奎表示:“生成式大模型是一種‘深黑盒’技術,‘蟻鑒2.0’通過智能博弈對抗技術,模擬黑產以及自動化生成海量測試集,可實現‘生成式機器人’對‘AIGC生成式模型’的誘導式檢測計算,很像一個24小時不眠不休的‘安全黑客’在找茬大模型,從而找到大模型存在的弱點和安全問題所在。這種AI對AI的評測,也是教學相長。好比生成式考官考核生成式運動員,在對抗中雙方能力互相提升,進一步提高整個行業的AI安全水位。”

另一項硬核能力是,“蟻鑒2.0”融入了可解釋性檢測工具。綜合AI技術和專家先驗知識,通過可視化、邏輯推理、因果推斷等技術,從完整性、準確性、穩定性等7個維度及20余項評估指標,對AI系統的解釋質量量化分析,幫助用戶更清晰驗證與優化可解釋方案。

據了解,“蟻鑒2.0”集成了螞蟻近10年可信AI實踐、1000余項可信AI專利,支持零編碼測評。開發者通過API接口,將AI模型接入蟻鑒,就可以一鍵識別和挖掘模型漏洞。

螞蟻集團認為,人工智能的深度應用,不僅對數據、算法、算力提出了更高要求,也對安全、隱私、倫理提出更多挑戰。在確保數據安全和隱私保護、健全人工智能倫理與安全的前提下,才能讓AI技術真正地釋放應用價值。

此次論壇上,中國信通院、上海人工智能實驗室、武漢大學、螞蟻集團等多家單位共同發起的《AIGC可信倡議》。該倡議得到數十家單位參與,圍繞人工智能可能引發的經濟、安全、隱私和數據治理等問題,提出構建AIGC可信發展的全球治理合作框架,采用安全可信的數據資源、技術框架、計算方法和軟件平臺等全面提升AIGC可信工程化能力,最大限度確保生成式AI安全、透明、可釋。

(圖:在2023 WAIC可信AI論壇上,“產學研用”界共同發起AIGC可信倡議)

論壇現場還發布了由中國信通院、清華大學、螞蟻集團聯合編纂的《可信AI技術和應用進展白皮書(2023)》。該報告基于統一的可信AI認知維度,梳理總結可信AI發展現狀,提練了面向新階段大模型和AIGC引發的新需求,形成以技術為保障的可信AI評估體系和工具,探索新一代可信人工智能發展。

公開資料顯示,螞蟻從2015年開啟可信AI的實踐和探索,是螞蟻集團在人工智能領域的重點布局之一。通過可信AI技術的突破,螞蟻集團建設了一套世界領先的智能風控解決方案;蟻鑒AI安全檢測平臺先后獲得2022年上海金融科技中心建設三周年優秀成果、信通院可信人工智能實踐標桿案例等認可。

關鍵詞:

責任編輯:hnmd003

相關閱讀

推薦閱讀