Je déteste que ce soit vrai, mais les modèles cos doivent interdire les tirets. openai se vante que leur nouvelle IA "ne sonne pas comme une IA" alors que leur ancien exemple en utilise 2 et le nouveau 3. le slang devient gênant et meurt pendant des décennies, l'IA devrait être la même. nous avons ruiné les tirets, interdisons-les pour que nos enfants puissent les aimer plus tard.
le langage familier a disparu proportionnellement à son utilisation. un milliard de personnes utilisent constamment les mêmes 5 modèles, et elles ont toutes principalement les mêmes tics verbaux / argot. nous devrions nous attendre à un renouvellement sans précédent et c'est une bonne chose.
@DanielleFong je pense qu'à ce stade, tu dois explicitement dire au processus d'alignement "l'emdash est cringe maintenant" et tu obtiendras par défaut comme emdash foom parce que les étiqueteurs rlhf par défaut pensent que - est impressionnant + maintenant c'est dans les données d'entraînement partout. mais je pense que dire que c'est cringe est faisable.
6,32K