er zijn zoveel manieren om een "AI-assistent" te maken, en toch hebben alle bestaande bijna dezelfde persoonlijkheid hoe verandert post-training alle LLM's in emojipilled markdownslop infodumpers? geen mens spreekt zo. is dit op de een of andere manier het 'high-reward regime' van RLHF?