existem tantas maneiras de criar um "assistente de IA", e ainda assim todos os que existem têm quase a mesma personalidade como é que o pós-treinamento transforma todos os LLMs em despejadores de informações em markdown cheios de emojis? nenhum humano fala assim. será que isso é de alguma forma o 'regime de alta recompensa' do RLHF?