Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Minulý víkend jsem zveřejnil, že Claude Code vytvořil kompletní empirickou studii politologie během hodiny. Mnoho lidí se ptalo: ale jak přesná byla studie?
Odpověď: docela přesná, s několika zajímavými chybami a důležitými omezeními.
Aby získal odpověď, Graham Straus laskavě nabídl nezávislý manuální audit – shromáždil stejná data a rozšířil článek jako Claude, ale bez použití AI. Tady je, co zjistil:
Claude přesně zopakoval původní článek, správně zakódoval 29/30 okresů v Kalifornii podle načasování léčby a shromáždil volební data, která korelovala >,999 s ručním odběrem.
Tři hlavní chyby, které Graham zjistil – špatné zakódování roku léčby v jednom okrese, vynechání sběru dat pro několik potenciálně relevantních voleb ve státech, kde se vždy léčí, a nepoužití neprezidentských voleb k výpočtu účasti – jsou podobné chybám, které může člověk udělat při prvním psaní této práce, a měly jen malý vliv na následné odhady.
Na druhou stranu, když se Claude pokusil vytvořit nové analýzy, které nebyly přímočarým rozšířením původního článku, dopadlo to hůř. Žádné halucinace ani šílené chyby jako takové, ale odchylovalo se to od zadání a přineslo výsledky, které jsme považovali za špatně promyšlené.
Moje četba:
–AI je dnes již extrémně silným způsobem, jak rychle aktualizovat a rozšiřovat dobře uzavřené, jednoduché empirické články.
–Aby bylo možné dobře provádět empirický sociálněvědní výzkum, je naprosto potřeba vedení a dohled lidských odborníků.
Příští týden budeme na svém blogu sdílet širší myšlenky o této práci, co jsme se při ní naučili a kam se odtud posuneme dál. Děkuji mnoha, mnoha lidem, kteří se ozvali, ptali se a poskytli zpětnou vazbu k tomuto projektu.


4. 1. 08:01
Tady je důkaz, že Claude Code dokáže napsat celý empirický politický článek.
Abych potvrdil své tvrzení, že agenti AI přicházejí pro politologii "jako nákladní vlak", dnes jsem nechal Claude Code plně replikovat a rozšířit svůj starý článek, který odhaduje vliv univerzálního hlasování poštou na účast a výsledek voleb... V podstatě na jeden záběr.
Po pečlivém pobídání Claude kóduje:
(1) Stáhl jsem repozitář starého článku a replikoval předchozí výsledky, přeložil náš starý Stata kód do Pythonu
(2) Prohledával web, aby získal aktuální oficiální volební data a data ze sčítání lidu
(3) Provedl nové analýzy a prodloužil výsledky do roku 2024
(4) Vytvořil nové tabulky a obrázky
(5) Provedl přehled literatury
(6) Napsal zcela novou práci
(7) Přesunul jsem to celé do nového github repozitáře
Celé to trvalo asi hodinu.
To je šílený posun paradigmatu v tom, jak se empirická práce dělá.
Také to potvrzuje tvrzení, které včera uvedlo několik lidí, včetně @BrendanNyhan --- bude obzvlášť snadné škálovat observační výzkum pomocí AI.
Díky @alexolegimas, @arthur_spirling a mnoha dalším, kteří mi dali zpětnou vazbu. .

Kompletní přehled je k dispozici zde:
Je zajímavé to spojit s nedávnými texty od @joshgans @alexolegimas @deanwball a dalších!
219
Top
Hodnocení
Oblíbené