OpenAI 发布了 gpt-oss-safeguard(研究预览),开放权重安全推理模型有两种尺寸:120B 和 20B TL;DR 一种以推理为先的安全工具:该模型在推理时接受开发者提供的政策,并使用思维链对内容进行分类并解释其决策。 - 自带政策:在运行时应用任何书面政策;无需为每次规则更改重新训练分类器。 - 可解释标签:模型返回的思维链推理可以让您检查,以了解为什么它以某种方式标记内容。 - 最佳使用案例:新兴或不断演变的危害、高度细致的领域,以及标记示例较少的情况。 - 权衡:比传统分类器需要更高的计算和延迟;在复杂风险方面,可能被针对许多标记示例训练的特定任务分类器超越。 许可证与下载: - Apache 2.0(宽松许可)。 - 模型可从 Hugging Face 下载。