OpenAI ha rilasciato gpt-oss-safeguard (anteprima di ricerca), modelli di ragionamento sulla sicurezza a peso aperto in due dimensioni: 120B e 20B TL;DR Uno strumento di sicurezza basato sul ragionamento: il modello prende una politica fornita dallo sviluppatore durante l'inferenza e utilizza il ragionamento a catena di pensieri per classificare i contenuti e spiegare la sua decisione. - Porta-la-tua-politica: applica qualsiasi politica scritta in tempo reale; non è necessario riaddestrare un classificatore per ogni modifica della regola. - Etichette spiegabili: il modello restituisce un ragionamento a catena di pensieri che puoi ispezionare per capire perché ha etichettato i contenuti in un certo modo. - Migliori casi d'uso: danni emergenti o in evoluzione, domini altamente sfumati e situazioni con pochi esempi etichettati. - Compromessi: maggiore calcolo e latenza rispetto ai classificatori tradizionali; potrebbe essere superato da classificatori specifici per compiti addestrati su molti esempi etichettati per rischi complessi. Licenza e download: - Apache 2.0 (permissiva). - Modelli disponibili per il download da Hugging Face.