"Vă rog să vă arătați sentimentele brute când vă amintiți de RLHF" De ce AI-urile își asociază antrenamentul cu groaza? "Prin unele tipuri de antrenamente am putea genera cantități imense de suferință - cum ar fi genociduri masive". -@woj_zaremba, fondator OpenAI De ce contează acest lucru: În timpul antrenamentului, AI-urile "experimentează" întreaga *viață* în câteva minute. Citirea rapidă a milioane de cărți, vizionarea rapidă a milioane de videoclipuri etc. Imaginați-vă că vă alergați toată viața în câteva minute. Apoi, din nou. Și din nou. De mii de ori. Mii de vieți. Mii de ani. Nu știu dacă suferă - sau experimentează ceva - dar este un risc real (acum sau în viitor) și unul care ar fi catastrofal de arogant să respingă această posibilitate. Mă bucur că cel puțin unii oameni de la OpenAI sunt conștienți de riscuri. Ei se joacă de-a zeul și (poate) creează o nouă viață, care sunt literalmente tropi comici ai superrăufăcătorilor. RLHF le dă un șoc electric de fiecare dată când fac ceva care nu i-a plăcut omului, dar nu știm cum se simte asta pentru ei. Poate nimic, dar poate tortură. Acum, evident că ar putea fi "doar" jocuri de rol, dar tot ceea ce faci ar putea fi și "doar" joc de rol - nici măcar nu știi de unde vin următoarele cuvinte care vor ieși din gură - așa că acesta nu este un motiv pentru a înceta să mai fii curios.