RIP Chain of Thought. J'ai juste testé le Skeleton of Thought et cela réduit la latence de réponse de moitié sur les tâches structurées tout en améliorant la qualité de sortie. Un article a changé ma façon de penser à la génération de texte par IA. CoT force le modèle à penser et à écrire simultanément. Le Point 1 doit se terminer avant que le Point 2 ne commence. Le Point 2 avant le Point 3. Chaque token est bloqué par le token qui le précède. Les experts ne travaillent pas de cette manière. Un consultant de McKinsey décrit d'abord chaque section, puis développe chacune indépendamment. Un professeur esquisse les sujets, puis les remplit. SoT correspond à cela. Phase 1 - Skeleton : Le modèle écrit un simple aperçu de chaque point. Pas d'élaboration. Juste une structure. Phase 2 - Remplissage parallèle : Chaque point de l'esquisse s'étend indépendamment. Le Point 3 n'attend pas le Point 2. Une mauvaise branche ne ralentit pas chaque branche qui suit. L'invite exacte : "D'abord, écrivez un squelette concis de votre réponse sous forme de liste de points clés. Ensuite, développez chaque point indépendamment et en entier. Format : [Skeleton] suivi de [Point 1], [Point 2], etc." Où SoT domine : → Guides pratiques et tutoriels → Listicles et décompositions classées...