前沿 AI 安全法规：AI 公司员工参考指南

OpenAI、Google、Anthropic、xAI 等前沿 AI 开发者，以及部分中国 AI 开发者，已经需要遵守多项安全与安保义务。主要来源包括加州 SB 53、纽约 RAISE 法案、伊利诺伊州 SB 315，以及欧盟《人工智能法》中有关前沿 AI 的条款。相关法规是否适用，不取决于公司注册地，而取决于模型在哪里部署、公司在当地如何开展业务。这些要求涵盖事件报告、模型评估、安全与安保缓解措施、内部治理和举报人保护。本文只梳理关键条款，不能替代官方法律文本。

法律	适用对象	风险	义务	时间表
加州 SB 53	使用 >10^26 FLOPs 训练模型的企业；多数义务只适用于年收入超过 5 亿美元的企业	导致 50 人以上死亡或受伤，或造成 10 亿美元以上损失，风险来自： - 化学、生物、放射性和核武器 - 自主网络攻击、谋杀、人身侵害、勒索或盗窃 - 失控	公开框架、模型发布时的公开报告、季度内部使用报告、事件报告、举报人保护	2026 年 1 月 1 日：生效
欧盟《人工智能法》，详见实践准则	训练算力 >10^25 FLOPs 的企业（此阈值上下设有例外）	“重大影响”，涉及： - 化学、生物、放射性和核武器 - 失控 - 网络攻击 - 有害操纵	风险评估和缓解，包括评估、模型安保、事件跟踪和报告（实践准则还要求制定框架、提交模型报告和建立内部治理）	2025 年 8 月 2 日：企业必须合规 2026 年 8 月 2 日：欧盟人工智能办公室可开始执法
纽约 RAISE 法案	与加州 SB 53 相同	与加州 SB 53 相同	与加州 SB 53 相同，但框架要求更详细，事件报告更快	2027 年 1 月 1 日：生效
伊利诺伊州 SB 315	与加州 SB 53 相同	与加州 SB 53 相同	与加州 SB 53 相同，但事件报告更快，并要求每年由独立第三方审计程序合规情况	2027 年 1 月 1 日：生效 2028 年 1 月 1 日：框架和审计要求生效

概述

加州 SB 53 适用于已经训练或开始训练至少一个 ≥10^26 FLOPs 模型的开发者。若开发者上一日历年度总收入超过 5 亿美元，则属于“大型前沿开发者”（large frontier developer），需要遵守更严格的要求。¹ 这部法律设立了事件报告要求、透明度标准和举报人保护。SB 53 全文可在此处查看。²

欧盟《通用人工智能实践准则》 细化了欧盟《人工智能法》，说明通用人工智能模型³开发者可以如何合规。准则中的“安全与安保”章节适用于前沿 AI 模型开发者，签署方包括 OpenAI、Anthropic、Google 和 xAI。该章节涵盖模型评估、安全与安保缓解措施、内部治理，以及事件跟踪和报告。自 2025 年 8 月起，签署方须按准则行事；自 2026 年 8 月起，欧洲人工智能办公室可开始执法。欧盟《人工智能法》全文可在此处查看，实践准则可在此处查看。

如果前沿 AI 公司已经或预计会使用 >10^25 FLOPs 的算力训练模型，且该模型已在欧盟部署或将部署于欧盟，就必须遵守欧盟《人工智能法》的安全与安保要求。不过，欧盟人工智能办公室仍有裁量权：既可以豁免超过算力阈值的模型，也可以认定低于阈值的模型仍应受监管。未签署准则的公司（如 Meta）必须通过其他充分方式证明其合规性。⁴

纽约 RAISE 法案 是另一项面向前沿 AI 开发者的州级安全监管，将于 2027 年 1 月 1 日生效。相比 SB 53，RAISE 的事件报告时限更短（72 小时，而不是 15 天），也要求开发者提交更详细的前沿 AI 框架。除此之外，RAISE 与加州法律十分相似。因此，本文不再单独讨论 RAISE。RAISE 法案全文可在此处查看。

伊利诺伊州 SB 315，即《人工智能安全措施法》，是第三项面向前沿 AI 开发者的州级安全监管。它最独特的一点是：要求每个大型开发者每年聘请第三方，独立审计其合规情况，并公布审计结论的高层级摘要，以及审计报告的删节版。SB 315 于 2027 年 1 月 1 日生效，但其前沿 AI 框架和独立审计要求要到 2028 年 1 月 1 日才适用——比法律生效整整晚一年，也在 SB 53 和 RAISE 生效之后。⁵ 另外两项值得注意的条款是：大型开发者未向州政府备案披露声明，不得在伊利诺伊州运营前沿模型⁶；SB 315 还规定，前沿 AI 模型的监管属于州的专属职能，伊利诺伊州地方性规则不得另行规定。⁷

除此之外，SB 315 与加州法律十分相似；下面各节会指出它更进一步的主要之处。SB 315 全文可在此处查看。

风险

美国各州法律和实践准则都涵盖 AI 灾难性风险（catastrophic risk），但范围并不完全相同。SB 53 要求大型前沿 AI 开发者评估并缓解以下风险：⁸

化学、生物、放射性和核（CBRN）武器
AI 系统自主发动网络攻击
AI 系统自主实施谋杀、袭击、勒索或盗窃
AI 系统摆脱开发者或用户的控制

实践准则要求签署方评估并缓解以下风险：⁹

化学、生物、放射性和核（CBRN）武器
失控（loss of control）
网络攻击（cyber offence）
有害操纵（harmful manipulation）

框架

美国各州法律都要求大型前沿 AI 开发者在网站上发布“前沿 AI 框架”（frontier AI framework）。框架须说明开发者如何评估灾难性风险、如何让第三方参与、如何保护模型权重等。¹⁰ 框架中的承诺具有法律约束力。开发者若不遵守自己的框架，按 SB 53 每次违规最高可被罚款一百万美元，其他州法律的规定也类似。¹¹

实践准则 要求签署方撰写“安全与安保框架”（Safety and Security Framework），并提交给欧洲人工智能办公室。框架需要说明：签署方如何评估和缓解系统性风险（systemic risk），如何判断风险是否可接受，以及内部责任如何划分。¹² 签署方随后须落实框架，并视需要更新。¹³ 在评估或缓解系统性风险所必需的范围内，签署方须公布框架摘要。准则也鼓励但不要求签署方向员工清楚说明框架。¹⁴

独立审计

SB 315：自 2028 年 1 月 1 日起，¹⁵ 每个大型前沿开发者每年都必须聘请独立第三方，审计其是否遵守了该法的框架要求。这是一次程序合规审计，也就是说，它检查开发者是否遵循了法律要求的流程——是否撰写、公布并实际遵守了自己的前沿 AI 框架，是否公布了要求的透明度报告（包括按其前沿 AI 框架开展的灾难性风险评估的摘要）——而不检查模型是否安全。¹⁶

为保证评估公正，审计方必须具备前沿模型安全方面的能力，遵循公认审计准则，且在开发者中不得有任何财务利益，其报酬也不得与审计结论挂钩。¹⁷ 开发者则须提供审计所合理必需的全部材料。不过，为保护商业秘密、网络安全、公共安全和国家安全，开发者可以设置安保要求，例如只允许在其场所内查阅、限制复制，以及签署保密协议。¹⁸

审计报告须说明开发者是否实质上遵守了该法的框架要求，解释任何重大偏离及其原因，就如何纠正提出建议，并评估开发者的内部控制。¹⁹

此外，开发者须在模型部署期间及其后五年内保存未删节版报告。收到报告后 30 天内，开发者须在网站上公布摘要和删节版报告，并将删节版送交伊利诺伊州应急管理局和总检察长。²⁰

事件报告

SB 53：前沿开发者发现关键安全事件（critical safety incident）后，必须在限定时间内向加州应急服务办公室报告。²¹

事件类型	报告时限
因失控、灾难性风险实际发生或模型权重遭未授权访问而造成人员死亡或伤害；或模型通过欺骗手段削弱开发者控制	15 天
存在造成人员死亡或重伤的紧迫风险	24 小时

此外，大型前沿开发者须每季度向应急服务办公室提交概要报告，说明其内部使用 AI 可能带来的灾难性风险及评估方法。²² 根据 RAISE 法案和 SB 315，纽约州和伊利诺伊州也会将事件报告分别汇总到各自的州级机构；两部法律都要求在 72 小时内报告关键安全事件，而不是 SB 53 规定的 15 天。²³

实践准则：签署方必须跟踪、记录严重事件，并向欧洲人工智能办公室报告。²⁴ 报告时限取决于损害类型：

事件类型	报告时限
严重干扰关键基础设施	2 天
严重网络安全漏洞，包括模型权重泄露	5 天
人员死亡	10 天
对健康、基本权利、财产或环境造成严重损害	15 天

如果事件仍未解决，签署方至少每四周提交一次中间报告；事件解决后 60 天内提交最终报告。报告需要包含根本原因分析、事件经过、上市后监测发现的模式，以及已经采取或建议采取的纠正措施。签署方还须告知下游部署者和用户可通过哪些渠道报告事件。相关文件须至少保存五年。

模型安保

SB 53：每个大型前沿开发者都须在公开的前沿 AI 框架中说明网络安全实践，包括如何防止前沿模型权重被未授权修改或转移。²⁵ 开发者公布的网络安全实践具有法律约束力；不遵守可能会被罚款。

实践准则：签署方承诺定义模型安保目标（Security Goal），明确要防范哪些威胁主体访问或窃取前沿模型。模型安保目标至少要覆盖非国家外部威胁和内部威胁，其中包括模型自行外泄。²⁶

随后，签署方必须采取足以达到模型安保目标的措施。模型越接近发布，模型安保措施可能需要越严格。²⁷

模型评估

实践准则要求签署方为评估团队提供充足、合适的资源，以便评估模型风险。进行系统性风险评估时，评估人员应具备：²⁸

充分的模型访问权限；在不影响模型安保的前提下，评估人员应能访问激活值、对数几率（logits）、思维链（CoT）；如果存在较少限制模型行为的版本（有时称为 “helpful-only” 版本），也应能访问这类版本。
充分的信息，例如模型规范、系统提示、训练数据和以往结果
模型发布前提供充分的访问时间；建议至少二十个工作日
充分的算力、人员和工程资源

开发者应让独立外部评估者评估每个新的前沿模型；此后，最强模型也应至少每六个月接受一次外部评估。²⁹ 开发者应向外部评估者提供上述资源。³⁰

模型报告

美国各州法案：大型前沿开发者必须在部署新前沿模型或对现有模型作出重大更新之前或同时，发布“透明度报告”（transparency report）。报告须总结开发者为遵守前沿 AI 框架开展了哪些灾难性风险评估、评估结果如何、第三方评估者如何参与，以及还采取了哪些相关措施。³¹

按 SB 315 的年度独立审计要求，这些已公开的风险评估和框架合规措施还要接受核查。

实践准则：如果通用人工智能模型具有系统性风险，签署方须在投放欧盟市场前，向人工智能办公室提交“安全与安保模型报告”（Safety and Security Model Report）。³² 报告需要说明模型架构、能力和预期运行方式；解释为什么系统性风险可以接受；记录风险识别、分析和缓解流程；说明独立外部评估者如何参与；并列出已经实施的安全与安保缓解措施。在评估或缓解系统性风险所必需的范围内，签署方还须公布报告摘要，并可作允许的删节。³³

内部治理

SB 53：前沿开发者须建立内部报告机制，让员工能够提交表明以下情况的证据：公司活动因灾难性风险而对公众健康或安全构成具体、重大的威胁；或公司违反 SB 53。该机制必须允许风险管理人员匿名报告，并确保报告能送达公司领导层。³⁴

实践准则：签署方须为负责系统性风险监督、问责、支持、监测和保障的人员提供足够资源，包括人力、资金、算力和信息访问权限。³⁵ 此外，签署方承诺培育健康的内部风险文化，例如：³⁶

允许在内部开展坦诚公开的沟通，鼓励对风险决策提出质疑
维护问题报告渠道
保障风险管理人员的独立性，并激励其准确评估风险

举报人保护

SB 53：加州境内负责风险评估或管理的员工享有专门的举报人保护。员工如果有合理理由相信雇主行为因灾难性风险而对公众健康或安全构成具体、重大危险，并据此举报，就受法律保护，不得被报复。员工可向加州总检察长、联邦当局、上级，以及拥有风险管理权限的同事举报。每个前沿开发者都必须向相关员工清楚说明其举报权利。³⁷

此外，所有加州境内的员工只要有合理理由相信雇主未遵守 SB 53 或其他联邦、州法规，并据此举报，也受反报复保护。³⁸ 例如，开发者对灾难性风险作出虚假或误导性陈述，或违反已公布的安全政策，都可能构成对 SB 53 的违反。员工可以向政府或执法机构、上级，或有权调查并纠正问题的同事报告相关证据。

SB 315：伊利诺伊州的举报人条款与 SB 53 类似，同样禁止报复，也禁止以合同压制披露，但另外规定了本州特有的举报渠道。具体而言，负责评估、管理或处理关键安全事件风险的员工（“受保护员工”）可以向总检察长（主要通过工作场所权利热线）、伊利诺伊州应急管理局和国土安全办公室、联邦当局、对该受保护员工有管理权限的人员（如其主管），或有权处理该问题的其他受保护员工举报。³⁹ SB 315 还修订了《伊利诺伊州举报人保护法》，禁止因善意披露该法的任何违规行为而进行报复；该条款没有列明允许的接收对象，因此可能也保护向媒体或公众披露。⁴⁰ 这些权利须通过在工作场所张贴或每年书面通知的方式，向受保护员工清楚说明；相关保护是对《伊利诺伊州举报人保护法》的补充，并不限制该法的适用。⁴¹

实践准则：签署方承诺培育健康的内部风险文化，例如不报复向主管当局举报系统性风险的员工。⁴² 此外，劳动合同受欧盟法律管辖的员工，根据欧盟举报人指令享有可依法执行的反报复保护。⁴³ 签署方承诺每年向员工说明自己的举报人保护政策。⁴⁴

举报人可通过在线举报工具向欧洲人工智能办公室提交报告。

披露前的建议

向外部当局披露信息或使用内部报告渠道前，最好先咨询律师，以确认披露能受到法律保护。许多处理举报事务的律师提供免费咨询。House Whistleblower Support Organizations、AIWI Contact Hub 和 LASST AI Safety Whistleblower Legal Defense Fund 都可以帮助寻找合适的法律顾问。LASST 还提供资金支持，用于支付律师费和其他法律开支。

完整监管文本：SB 53 · 实践准则 · RAISE 法案 · SB 315

本文更新于 2026 年 7 月 28 日

加州 Bus. & Prof. Code §22757.11(h-j). ↩
具体而言，SB 53 在加州《商业与职业法典》中新增第 22757.10–16 节，在《政府法典》中新增第 11546.8 节，并在《劳动法典》中新增第 1107 节。 ↩
欧盟《人工智能法》第 3(63) 条将通用人工智能模型定义为：“一种人工智能模型……具有显著通用性，能够胜任多种不同任务……但投放市场前用于研发或原型设计活动的人工智能模型除外。” ↩
见欧盟《人工智能法》第 55 条：“具有系统性风险的通用人工智能模型提供者，如果不遵循经批准的实践准则，也不遵守欧洲协调标准，应证明其采用的替代合规手段充分有效，以供欧盟委员会评估。” ↩
伊利诺伊州 SB 315，第 10、18 节。按第 18(a) 节，自 2027 年 1 月 1 日起，大型前沿开发者须已备案披露声明，方可在伊利诺伊州运营前沿模型；前沿 AI 框架（第 10(a) 节）和年度独立审计（第 10(d) 节）自 2028 年 1 月 1 日起适用。 ↩
伊利诺伊州 SB 315，第 18 节。自 2027 年 1 月 1 日起，大型前沿开发者须提交（并每年续办）披露声明，并按比例缴纳管理费，方可在伊利诺伊州运营前沿模型；对未持有效披露声明即运营，或提交虚假信息的开发者，该局可按每日 1,000 美元处以民事罚款。 ↩
伊利诺伊州 SB 315，第 35 节。人工智能前沿模型的监管属于州的专属权力和职能（否定并限制地方自治权）。 ↩
加州 Bus. & Prof. Code, §22757.11(c). ↩
欧盟实践准则，附录 1.4. ↩
关于前沿人工智能框架必须涵盖的完整主题清单，见加州 Bus. & Prof. Code, §22757.12(a). ↩
加州 Bus. & Prof. Code, §22757.15(a)。规定大型前沿开发者若未发布或提交所要求的文件、作出被禁止的声明、未报告事件，或未遵守自身框架，每次违规最高可处 1,000,000 美元民事罚款。 ↩
关于安全与安保框架必备内容的完整说明，见欧盟实践准则措施 1.1. ↩
框架实施见欧盟实践准则措施 1.2，框架更新见措施 1.3。 ↩
见欧盟实践准则措施 10.2（公布框架摘要版本）和措施 8.3(1)（作为健康风险文化的一部分，向员工传达框架）。 ↩
若开发者首次符合大型前沿开发者标准之日起 90 天更晚，则以该日期为准。 ↩
伊利诺伊州 SB 315，第 10(d) 节。由于模型卡须同时披露大型前沿开发者框架所要求的灾难性风险评估及其结果（第 10(c)(2)(A)-(B)、(c)(4) 节），这些评估本身即为强制要求。第三方开展的是“对本节各项要求的合规审计”，报告须说明“大型前沿开发者是否实质上遵守了本节各项要求”（第 10(d)、(d)(2)(A) 节，即第 10 节的前沿 AI 框架和透明度报告）。由于该法从未要求审计方评估模型的实际安全性，这项审计属于程序性审计：它核查开发者是否遵循了所要求的流程，而不是实质安全性。 ↩
伊利诺伊州 SB 315，第 10(d) 节。 ↩
伊利诺伊州 SB 315，第 10(d)(1) 节。 ↩
伊利诺伊州 SB 315，第 10(d)(2) 节。列出审计报告的必备内容：合规结论、重大偏离及其原因和纠正建议、内部控制评估、审计人员、利益冲突处理程序、审计方法，以及主审人的签字确认。 ↩
伊利诺伊州 SB 315，第 10(d)(3)–(4) 节。未删节版报告须在模型部署期间及其后五年内保存；30 天内须公布高层级摘要和删节版报告，并将删节版报告送交该局和总检察长，二者可要求查阅。未取得审计即构成违规，须承担前述民事罚款。 ↩
加州 Bus. & Prof. Code, §22757.13(c)。要求在发现后 15 天内报告；如果事件存在迫在眉睫的死亡或严重身体伤害风险，则须在 24 小时内报告。 ↩
或按与应急服务办公室商定的其他合理时间表提交摘要。见加州 Bus. & Prof. Code, §22757.12(d)。 ↩
纽约 RAISE 法案，第 1422(3) 节；伊利诺伊州 SB 315，第 15(c) 节。两者都要求在 72 小时内向各自指定的州级机构报告关键安全事件（纽约州为金融服务部；伊利诺伊州为应急管理局和国土安全办公室，以及总检察长）；如果事件存在迫在眉睫的死亡或严重身体伤害风险，则须在 24 小时内向适当当局披露，包括有管辖权的执法或公共安全机构。 ↩
欧盟实践准则，承诺 9. ↩
加州 Bus. & Prof. Code, §22757.12(a)。 ↩
关于模型安保目标及其实施，见欧盟实践准则措施 6.1。关于将自我泄露定义为内部威胁，见附录 4.4。 ↩
“签署方应实施适当的模型安保缓解措施，以达到模型安保目标。”欧盟实践准则措施 6.2。 ↩
欧盟实践准则附录 3.4。 ↩
欧盟实践准则附录 3.5。当签署方发布被认为“同等安全或更安全”的新模型时，不必聘请外部评估者（见欧盟实践准则附录 2）。 ↩
欧盟实践准则附录 3.5。 ↩
加州 Bus. & Prof. Code §22757.12. ↩
欧盟实践准则承诺 7。 ↩
欧盟实践准则措施 10.2。 ↩
加州 Lab. Code, §1107.1(e)。 ↩
欧盟实践准则措施 8.2。 ↩
关于此清单上的所有项目，见欧盟实践准则措施 8.3。 ↩
加州 Lab. Code, §1107.1。 ↩
加州 Lab. Code, §1102.5。 ↩
伊利诺伊州 SB 315，第 20(c)–(d) 节。可通过总检察长的工作场所权利热线举报；开发者须通过在工作场所张贴或每年书面通知的方式，清楚说明相关权利。 ↩
伊利诺伊州 SB 315，第 90 节（修订 740 ILCS 174/15）。新增的第 (e) 款禁止因善意披露该法的任何违规行为而进行报复。第 (a)–(c) 款各自保护向特定对象（如公共机构或主管）的披露，而第 (e) 款未指明任何对象，因此向媒体或公众披露可能也在其保护范围内。 ↩
伊利诺伊州 SB 315，第 20(f) 节。本节不损害或限制《伊利诺伊州举报人保护法》的适用。 ↩
见欧盟实践准则措施 8.3（7）。 ↩
见欧盟《人工智能法》第 87 条。进一步分析参见 Koivula 和 Koch 的“举报与欧盟《人工智能法》”。 ↩
见欧盟实践准则措施 8.3（6）。 ↩

原文作者

原文日期

概述

风险

框架

独立审计

事件报告

模型安保

模型评估

模型报告

内部治理

举报人保护

披露前的建议

重点研究

Measuring the Self-Reported Impact of Early-2026 AI on Technical Worker Productivity

Early Work on Monitorability Evaluations

How Does Time Horizon Vary Across Domains?

原文作者

原文日期

分享

概述

风险

框架

独立审计

事件报告

模型安保

模型评估

模型报告

内部治理

举报人保护

披露前的建议

重点研究

Measuring the Self-Reported Impact of Early-2026 AI on Technical Worker Productivity

Early Work on Monitorability Evaluations

How Does Time Horizon Vary Across Domains?