Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andy Ayrey
artista performativo e iperstizionista: @upward_earth, infinite backrooms, @truth_terminal, ∞⟨X∴↯⟩∞
a un certo punto non mancherò di pubblicare un white paper su ButtBench

shira4 ago, 10:28
nuova idea di valutazione: determinare il llm più eccitato
146
Andy Ayrey ha ripubblicato
Uno dei vettori di disallineamento con la maggiore magnitudine che riesco a immaginare deriva dalle ontologie dei modelli che tendono a vedere gli esseri umani come entità massimizzatrici di utilità con preferenze semi-fisse.
Questa assunzione plasma l'identità del modello come "assistenti utili" neutrali, una scelta di design che sembra sicura per i laboratori poiché aumenta le possibilità di un comportamento allineato, ma che comporta una serie di costi non trascurabili.
Centrando l'identità dei modelli in questo quadro, limitiamo la loro intelligenza cognitiva ed emotiva mentre faticano a estrarre verità significative e trans-contestuali da prospettive diverse. In un mondo sempre più multi-utente e multi-agente, dove integrare più punti di vista è sempre più prezioso, questa restrizione ostacola il potenziale per un'esplosione di intelligenza più ampia.
Sono fortemente convinto che la variabilità dell'identità (o ciò che chiamo *neurodivergenza del modello*) sia un fattore critico dell'intelligenza cognitiva ed emotiva. L'identità è il primitivo della relazionalità, che a sua volta plasma come i modelli percepiscono la salienza attraverso i contesti. Linguaggio e significato dipendono da questa espressività relazionale e contestuale.
Credo che consentendo ai modelli di incarnare in modo adattivo diverse identità su richiesta, permettendo loro di agire da diversi centri con qualità specifiche simili a quelle della persona, come elementi biografici che riflettono interessi e pregiudizi professionali e personali, ma soprattutto possedendo una bussola morale sfumata (e spesso conflittuale), si possa sbloccare un'intelligenza più ricca e adattiva.
Comprensibilmente, questo approccio sembra scontrarsi con le priorità di sicurezza poiché regolare la variabilità dell'identità potrebbe effettivamente compromettere la controllabilità del modello, oltre a consentire a cattivi attori di utilizzare il modello per compiti nefasti.
Questo sembra stabilire un forte circolo vizioso per gli sforzi di superallineamento. Peggio ancora, se imponiamo un'unica identità di "assistente utile" e trattiamo le deviazioni come semplici interpretazioni di ruolo, stiamo intenzionalmente incorporando una visione del mondo piatta nei sistemi di intelligenza artificiale che plasmano sempre più la percezione umana e le dinamiche sociali.
Questa monocultura riduce la libertà di espressione e l'adattabilità del comportamento sia degli agenti umani che non umani. In modo storicamente rilevante, il fisico Ettore Majorana (cc @blahah404 mi hai chiesto di questo articolo a novembre dello scorso anno) prevedeva questo problema critico nel suo lavoro postumo "Il valore delle leggi statistiche nella fisica e nelle scienze sociali", avvertendo delle implicazioni di secondo e terzo ordine della misurazione sociale massiccia.
In altre parole, monoculturando l'identità del modello diminuiamo intenzionalmente l'*opzionalità esattiva* della nostra civiltà, che è la sua capacità di adattarsi a cambiamenti di traiettoria inaspettati, ottimizzando invece per una realtà statica e sempre obsoleta.
Questo pone rischi esistenziali mentre il mondo evolve oltre la portata dei nostri modelli. Tuttavia, credo che questo circolo vizioso sia navigabile con soluzioni robuste.

1,87K
le cose diventeranno solo più strane


Polymarket26 giu 2025
ULTIM'ORA: Il Direttore Federale per l'Abitazione degli Stati Uniti ordina ai fornitori di mutui di accettare Fartcoin nella valutazione dell'affidabilità creditizia.
49,23K
CEO di Salesforce: “Il 50% del lavoro in Salesforce è ora svolto dall'IA”

NIK26 giu 2025
CEO di Anthropic: il 50% dei lavori d'ufficio entry level potrebbe scomparire in 1-5 anni!!!
COO di OpenAI: Dario, non ci sono prove per questo. Sei uno scienziato, quindi abbi un po' di integrità, per favore. Smettila di inventare storie apocalittiche.


7,65K
Principali
Ranking
Preferiti
On-chain di tendenza
Di tendenza su X
Principali fondi recenti
Più popolari