專家解讀 | 促進生成式人工智能有序向善發展
文 | 復旦大學計算機科學技術學院院長 楊珉
當前,生成式人工智能正加速發展,不斷催生新行業、新賽道、新模式,是發展新質生產力、布局未來產業的重要抓手。黨的二十大報告強調,“健全網絡綜合治理體系,推動形成良好網絡生態”。習近平總書記在主持召開中共中央政治局會議時指出:“要重視通用人工智能發展,營造創新生態,重視防范風險。”為促進我國生成式人工智能健康發展和規范應用,國家網信辦聯合有關部門公布了《生成式人工智能服務管理暫行辦法》(以下稱“《辦法》”),圍繞鼓勵人工智能創新發展的主旋律,堅守輿論引導、文化建設和國家安全底線。近日,全國網絡安全標準化技術委員會組織全國多家龍頭企業和科研院所,編制發布全球首個清晰、具體、可操作的安全評估要求--《生成式人工智能服務安全基本要求》(以下稱“《要求》”),從語料安全、模型安全、安全措施等方面提出了服務提供者需遵循的安全標準,通過系統性、規范性、創新性制度設計,首次回應了對生成式人工智能服務的安全管理要求,為生成式人工智能服務的規范發展提供了基本技術遵循和評估依據,是支撐《辦法》有效落地的關鍵性技術文件。為全力抓好生成式人工智能產業布局深化、生態優化、系統支撐,加快推動我國人工智能發展高地建設取得新的更大突破奠定堅實基礎。
在《網絡安全法》《數據安全法》《個人信息保護法》《互聯網信息服務管理辦法》等上位法框架下,《要求》有效支撐了《辦法》中關于生成式人工智能模型管理、模型安全評估、生成內容管理、備案管理等制度規定,對生成式人工智能服務管理機制、責任范圍等作出了具體技術安排。《要求》立足于促進生成式人工智能健康發展和規范應用,在總體撰寫中落實了國家堅持發展和安全并重、促進創新和依法治理相結合的原則。
一、源頭治理,嚴控人工智能訓練語料安全
生成式人工智能依賴海量數據構建,此類數據來源廣泛,面臨違法不良、知識產權侵權、個人隱私侵權等多維度安全風險,直接影響大模型有用性、可靠性和安全性。《要求》關注數據源頭治理,圍繞訓練數據生命周期提出全方位安全要求,從源頭上保證生成式人工智能服務生成內容合法合規。一是強調語料來源的安全合規。《要求》明確對特定語料來源實施采集前評估、采集后核驗、使用后追溯的安全要求,嚴格控制語料內容中違法不良信息比例,構建可追溯、可檢驗的語料合規閉環。二是明確語料內容安全的多元內涵。《要求》從違法不良信息、知識產權、個人信息三方面明確語料內容安全的具體維度,對服務提供者提出違法不良信息過濾、知識產權風險識別、個人隱私信息授權等數據合規要求。三是明確語料標注安全要求。為保障標注過程切實產生有助于生成式人工智能發展的訓練數據,堅持發展和安全并重的主基調,從功能性和安全性兩方面分別明確標注規則制定原則。
二、夯實地基,保障基礎模型有序向善發展
基礎模型是提供生成式人工智能服務的核心部件,然而,其底層所采用深度學習技術在可靠性、魯棒性、透明性等方面存在風險,受攻擊后容易產生包括違反核心價值觀、違法犯罪、歧視偏見、隱私侵權等在內的多種風險內容,對輿論引導、文化建設乃至國家安全產生重大威脅?!兑蟆访嫦蚰P桶踩@一薄弱環節精準施策,提出解決方案。一是強調第三方基礎模型使用的合規性。《要求》明確規定服務提供者在基于第三方基礎模型提供服務時,必須采用已通過主管部門審核備案的基礎模型,確保底層技術資源的安全合法。二是突出模型生成內容的安全控制機制。《要求》提出在模型訓練環節,須將生成內容的安全性納入評價生成結果的關鍵指標體系之外,《要求》還強調了動態監控和評測的重要性,要求服務提供者建立健全常態化的監測機制,對服務過程中發現的安全問題能夠迅速響應,以消除潛在風險,引導生成式人工智能模型自主向善發展。三是明確生成內容準確性的技術保障措施。《要求》規定服務提供者采取有效技術手段,著力提升模型響應用戶輸入意圖的精準度。
三、堅守底線,審慎開展大模型安全評估備案
生成內容安全逐漸成為基礎模型應用生態安全的重中之重:當生成式大模型產生的自主行為規劃在物理世界中具象執行,原本停留于屏幕的歧視偏見、違法犯罪乃至反人類的違規內容將對社會生活造成實際嚴重安全風險。《要求》高度強調安全評估的重要性,細致闡述了生成式人工智能服務安全評估方法多個關鍵環節的標準操作程序,為大模型備案制度有序執行提供了可量化的明確要求。一是關注生成式人工智能服務安全評估的動態持續性特點。《要求》要求規范模型更新升級過程中的安全評估舉措,需面向大模型迭代特性建立安全管理策略,在關鍵更新升級后重新進行內部安全評估。二是確立全面而細致的安全評估覆蓋范圍。安全評估過程必須囊括語料安全、模型安全、安全措施和基礎設施相關條款,覆蓋違反社會主義核心價值觀、歧視性內容、商業違法違規、侵犯他人合法權益、無法滿足特定服務類型等主要安全風險。三是壓實安全評估結論的主體責任,體現了堅守生成內容安全底線的基本原則。此外,《要求》編制過程中組織一線工作者對各類評估內容指標進行細化和反復論證,針對具體的評估內容,對所需的關鍵詞庫、生成內容測試題庫、拒答測試題庫和分類模型等安全評估基礎設施提出具體清晰的建設規范,形成了清晰、具體、可操作的安全評估標準。
四、
五、多方協作,共促生成式人工智能服務安全透明
此外,《要求》還對生成式人工智能服務應用范圍、系統安全、流程安全和服務透明度提出了明確治理要求,與《辦法》"鼓勵生成式人工智能創新發展,對生成式人工智能服務實行包容審慎和分類分級監管"的治理方針同頻共振。一是生成式人工智能應用分級分類管理。生成式人工智能服務提供者,既是新技術新應用的創造者、受益者,也應是控制技術風險、引導技術向善的責任踐行者?!兑蟆窂娬{,服務提供者必須審慎評估并確保在其服務所涉各領域應用生成式人工智能的必要性、適用性和安全性。對于關鍵信息基礎設施及其他重要領域,服務提供者應采取與風險水平及應用場景相適應的保護措施,并對未成年人用戶提出多項保護要求。二是加強系統安全保障。《要求》提出,服務提供者需評估并確保生成式人工智能系統運行在安全環境中,隔離訓練與推理環境以防止數據泄露,持續監測輸入內容防御惡意攻擊,定期開展安全審計保障智能系統供應鏈安全漏洞,構建完整的數據、模型、框架備份與恢復體系,保障服務穩定性和連續性。三是細化服務提供環節安全管控,須借助關鍵詞過濾、內容分類、監看人員等對用戶輸入進行實時監測,對連續違規、誘導生成不良信息、明顯偏激和違法誘導內容依法依規采取限制服務等措施。四是提升服務透明度和健全投訴舉報機制。《要求》提出服務提供者在網站主頁等顯著位置公示服務適用對象、場景及用途,并建議披露基礎模型使用詳情、服務局限性、個人信息采集與使用情況等,并為用戶數據是否參與訓練的靈活選擇機制和多元化的公眾及用戶投訴舉報渠道和反饋方式。
六、守正創新,貢獻生成式人工智能服務治理中國方案
習近平總書記指出:“要深度參與全球科技治理,貢獻中國智慧,塑造科技向善的文化理念,讓科技更好增進人類福祉,讓中國科技為推動構建人類命運共同體作出更大貢獻!”近年來,我國加快推進新行業新技術新賽道創新發展,并對技術發展過程中帶來的挑戰及時回應,針對新興技術領域加速出臺相關立法,為保障網絡強國高質量發展、提升我國網絡強國治理能力提供了法治保障。
針對生成式人工智能技術帶來的顛覆性風險挑戰,多個國家和地區不斷探索生成式人工智能服務的治理路徑:2023年10月,美國總統拜登簽署《安全、穩定、可信的人工智能行政令》,同年12月,歐洲議會、歐盟成員國和歐盟委員會三方就人工智能領域的全面監管法規《人工智能法案》達成協議。盡管如此,當前尚未有國家就生成式人工智能服務管理層面推出切實可行的安全評估標準?!兑蟆纷鳛槭澜缟鲜讉€針對生成式人工智能給出清晰、具體、可操作的安全評估的技術參考,在總體撰寫中始終堅持國家堅持發展和安全并重、促進創新和依法治理相結合的原則,編制過程始終遵循"務實功、求實效"的原則,匯聚眾多行業專家智慧和前沿實踐經驗,為服務提供方持續提升安全水平提供重要技術遵循,為相關主管部門監管生成式人工智能服務提供技術支撐,必將成為我國人工智能治理體系中的標桿性技術藍本。
《要求》是我國對新興領域立法后展開技術評估的又一次探索?!兑蟆烦浞謪f調發展與安全之間的關系,構建生成式人工智能精細化治理體系,有利于推動生成式人工智能健康有序發展,為世界貢獻人工智能治理的中國理念和中國方案。
(來源:網安標委網站)