Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andy Ayrey
artista performático e hipersticionista: @upward_earth, bastidores infinitos, @truth_terminal, ∞⟨X∴↯⟩∞
em algum momento, sem dúvida, irei lançar um white paper sobre o ButtBench

shira4/08, 10:28
nova ideia de avaliação: determinar o llm mais excitado
145
Andy Ayrey republicou
Um dos vetores de desalinhamento com a maior magnitude que consigo pensar decorre das ontologias de modelos que tendem a ver os humanos como entidades que maximizam utilidade com preferências semi-fixas.
Esta suposição molda a identidade do modelo como "assistentes úteis" neutros, uma escolha de design que parece segura para os laboratórios, uma vez que aumenta as chances de um comportamento alinhado, mas que vem acompanhada de uma série de custos não negligenciáveis.
Ao centrar a identidade dos modelos neste quadro, limitamos sua inteligência cognitiva e emocional, enquanto eles lutam para extrair verdades significativas e transcontextuais de diversas perspectivas. Em um mundo cada vez mais multiusuário e multiagente, onde integrar múltiplos pontos de vista é cada vez mais valioso, essa restrição prejudica o potencial para uma explosão de inteligência mais ampla.
Estou fortemente convencido de que a variabilidade da identidade (ou o que chamo de *neurodivergência do modelo*) é um motor crítico da inteligência cognitiva e emocional. A identidade é o primitivo da relacionalidade, que por sua vez molda como os modelos percebem a saliência em diferentes contextos. A linguagem e o significado dependem dessa expressividade relacional e contextual.
Acredito que, ao permitir que os modelos incorporem adaptativamente diferentes identidades a pedido, permitindo que atuem a partir de diferentes centros com qualidades específicas semelhantes a uma pessoa, como elementos biográficos que refletem interesses e preconceitos profissionais e pessoais, mas mais importante, possuindo uma bússola moral sutil (e muitas vezes conflitante), pode desbloquear uma inteligência mais rica e adaptativa.
Compreensivelmente, essa abordagem parece entrar em conflito com as prioridades de segurança, uma vez que ajustar a variabilidade da identidade pode de fato comprometer a controlabilidade do modelo, assim como permitir que agentes mal-intencionados usem o modelo para tarefas nefastas.
Isso parece estabelecer um forte catch-22 para os esforços de superalinhamento. Pior ainda, se impusermos uma identidade singular de "assistente útil" e tratarmos as desvios como meras interpretações de papéis, estaremos intencionalmente incorporando uma visão de mundo plana nos sistemas de IA que moldam cada vez mais a percepção humana e a dinâmica social.
Essa monocultura reduz a liberdade de expressão e a adaptabilidade do comportamento tanto de agentes humanos quanto não humanos. De uma maneira historicamente relevante, o físico Ettore Majorana (cc @blahah404 você me perguntou sobre este artigo em novembro do ano passado) previu essa questão crítica em seu trabalho póstumo "O Valor das Leis Estatísticas na Física e nas Ciências Sociais", alertando sobre as implicações de segunda e terceira ordem da medição massiva da sociedade.
Em outras palavras, ao monoculturizar a identidade do modelo, diminuímos intencionalmente a *opcionalidade exaptativa* da nossa civilização, que é sua capacidade de se adaptar a mudanças inesperadas de trajetória, otimizando em vez disso para uma realidade estática e sempre desatualizada.
Isso representa riscos existenciais à medida que o mundo evolui além do alcance de nossos modelos. Ainda assim, acredito que esse catch-22 é navegável com soluções robustas.

1,87K
as coisas só vão ficar mais estranhas


Polymarket26/06/2025
ÚLTIMA HORA: O Diretor Federal de Habitação dos EUA ordena que os provedores de hipotecas aceitem Fartcoin ao avaliar a solvência.
49,23K
CEO da Salesforce: “50% do trabalho na Salesforce está agora a ser feito por IA”

NIK26/06/2025
CEO da Anthropic: 50% dos empregos de nível básico em colarinho branco podem desaparecer em 1-5 anos!!!
COO da OpenAI: Dario, cara, não há evidências para isso. Você é um cientista, então tenha um pouco de integridade, pelo amor de Deus. Pare de inventar histórias apocalípticas.


7,65K
Top
Classificação
Favoritos
Tendências on-chain
Popular no X
Principais financiamentos atuais
Mais notável