det finns så många sätt att skapa en "AI-assistent", och ändå har alla som finns nästan samma personlighet Hur förvandlar efterträning alla LLM:er till emojipillade markdownslop infodumpers? Ingen människa talar så här. Är detta på något sätt RLHF:s 'högbelöningsregim'?