existem tantas maneiras de criar um "assistente de IA", e ainda assim todas as que existem têm quase a mesma personalidade Como o pós-treinamento transforma todos os LLMs em infodumpers emojipilled markdownslop? nenhum humano fala assim. será que isso é de alguma forma o 'regime de alta recompensa' da RLHF?