Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Kirill Balakhonov | Nethermind
Pencipta AuditAgent | Produk AI x Crypto x | Membangun ekonomi agen
Mengapa OpenAI merilis model dengan bobot terbuka? Untuk membunuh bisnis mereka sendiri ... (atau tidak?)
Ya, @OpenAI baru saja merilis dua model dengan bobot terbuka, yang berarti pengembang dapat menggunakannya tanpa membayar OpenAI apa pun. Secara khusus, ini dirilis di bawah lisensi komersial Apache 2.0 paling liberal. Jadi mengapa OpenAI melakukan ini? Ada beberapa aspek.
Tapi, saya ingin mengklarifikasi bahwa ketika sebuah perusahaan merilis model dengan bobot terbuka, itu tidak berarti model tersebut bersifat open-source seperti kode sumber terbuka yang dapat Anda jalankan sendiri, seperti sistem operasi @Linux. Tidak, dengan model AI itu sedikit berbeda. Secara khusus, model adalah kotak hitam, satu set beban. Dan meskipun Anda dapat mengujinya pada tugas yang berbeda dan melihat cara kerjanya, jika Anda tidak dapat mereproduksi proses pelatihan, Anda tidak akan pernah dapat mengetahui apakah ada pintu belakang atau kerentanan keamanan yang sengaja atau tidak sengaja berakhir di dalam model ini. Jadi mari kita pisahkan ini dari open source segera. Sayangnya, model dengan bobot open source tidak dapat sepenuhnya dipercaya (mereka bisa chep sekalipun).
Aspek lain yang saya perhatikan, yang ditunjukkan pada gambar, adalah kualitas model open-source tidak jauh berbeda dengan model andalan OpenAI yang hanya tersedia melalui API. Ini bagus! Ini tidak terduga! Anda akan berpikir berapa banyak uang yang bisa hilang OpenAI dengan mengizinkan pengembang menggunakan model mereka? Namun, ini bukan segalanya. Model bukan semua yang Anda dapatkan saat menggunakan OpenAI melalui API. Misalnya, ketika Anda menggunakan ChatGPT melalui UI dan memilih model o3, sebenarnya ada agen kompleks yang bekerja di bawah tenda yang, saat menggunakan model ini, memiliki banyak logika yang tertulis di atasnya untuk benar-benar bekerja dengan baik dengan dokumen dan alat Anda. Anda tidak mengaksesnya melalui model yang diterbitkan OpenAI ini.
Jadi mengapa OpenAI merilis model dengan bobot terbuka? Pertama, pesaing utama mereka, terutama @Meta, @MistralAI, dan @deepseek_ai (oh, dan @Google), telah merilis model kompetitif dengan bobot terbuka yang digunakan orang. Dan popularitas OpenAI di kalangan orang-orang yang menggunakan model terbuka tidak berkembang. Namun, untuk pengembang yang membutuhkan kedua model dengan bobot terbuka (untuk perhitungan lokal/pribadi) di samping model yang dapat diakses API (untuk hal-hal yang lebih sulit), jika mereka membutuhkan keduanya, mereka tidak dapat menggunakan OpenAI. Lebih mudah bagi mereka untuk menggunakan pesaing mereka seperti Google atau DeepSeek.
Kedua, ada tekanan yang signifikan dari pengguna dan regulator yang menginginkan lebih banyak keterbukaan. Orang-orang khawatir bahwa AI mungkin lepas kendali atau jatuh di bawah kendali sekelompok perusahaan sempit di Silicon Valley, dan orang-orang menginginkan lebih banyak transparansi. Meskipun saya berani mengatakan bahwa bahkan hanya mengkhawatirkan persaingan dan penurunan penjualan, langkah menuju keterbukaan seperti itu kemungkinan akan membuat bisnis OpenAI semakin besar.
Dan ketiga, tentu saja, ada lelucon tentang nama perusahaan OpenAI. Dilihat dari bagaimana semuanya berkembang, perusahaan bernama OpenAI adalah perusahaan AI paling tertutup di antara para pemimpin. Ini sendiri lucu, tetapi sekarang ini telah berubah. Bagaimana menurutmu?

272
Kebanyakan orang tidak mengerti sama sekali bagaimana penggantian orang oleh AI bekerja (atau bagaimana itu TIDAK bekerja). Bahkan percepatan sepuluh kali lipat dari semua yang dilakukan seorang spesialis tidak secara otomatis menghapus pekerjaan itu sendiri—itu hanya menulis ulang ekonomi di sekitarnya. Ketika harga efektif kiriman anjlok, permintaan laten yang dulu duduk di rak tiba-tiba menjadi layak. Saya belum pernah bertemu pemilik produk yang berpikir teknisi mereka mengirimkan lebih banyak fitur daripada kebutuhan peta jalan; daftar keinginan selalu lebih panjang dari yang diizinkan oleh jumlah karyawan. Jadikan setiap fitur sepuluh kali lebih murah untuk dibangun dan Anda tidak memotong tim dengan faktor sepuluh—Anda menyalakan setiap "bagus-untuk-dimiliki" yang dulunya tampak tidak terjangkau, ditambah seluruh produk green-field yang tidak ada yang repot-repot mencakupnya.
Sebuah studi @Microsoft Research baru-baru ini tentang penggunaan Copilot dunia nyata menggarisbawahi poin yang sama. Pengguna datang untuk meminta bantuan menyusun kode atau mengumpulkan fakta, tetapi model ini akhirnya melatih, memberi nasihat, dan mengajar—melipat jenis pekerjaan baru ke dalam satu sesi. Profesi bukanlah monolit; mereka adalah bundel subproses, masing-masing hanya sebagian (dan tidak sempurna) yang dicakup oleh model saat ini. Seiring berkembangnya alat AI, ruang lingkup peran berkembang bersama mereka, seringkali meluas daripada menyusut.
Bahkan dalam auditor kontrak pintar AI yang telah kami bangun di @NethermindEth, terlepas dari namanya, kami menargetkan bagian sempit yang sangat spesifik dari proses: menemukan potensi kerentanan. Sementara itu, spesialis keamanan menggunakan ini sebagai alat dan melakukan pekerjaan yang jauh lebih kompleks dan beragam—merumuskan strategi, memvalidasi temuan, mengoreksi AI, menambahkan konteks implisit, berkomunikasi dengan pengembang, menemukan niat tersembunyi, dan mengelola harapan.
Jadi, daripada menghitung pekerjaan mana yang akan "menghilang", lebih berguna untuk bertanya masalah apa yang layak dipecahkan setelah biaya marjinal untuk menyelesaikannya jatuh dari tebing. Sejarah menunjukkan jawabannya adalah "jauh lebih banyak daripada yang dapat kami stafkan," dan itu berpendapat untuk masa depan di mana bakat dikerahkan kembali dan diperbanyak kali, bukan menjadi usang.


305
Andrej Karpathy mendukung pengenalan istilah baru yang terkait dengan "rekayasa konteks" dalam pengembangan Perangkat Lunak AI menggunakan LLM.
Dan istilah ini sudah lama tampak sangat diperlukan. Setiap kali saya menjelaskan kepada orang-orang bagaimana kami mengembangkan Nethermind AuditAgent kami, salah satu aspek kunci, selain menggunakan keahlian domain (keamanan web3) dan menggunakan model AI terbaik yang tersedia (dari OpenAI, Anthropic dan Google), dan alat untuk LLM, justru "rekayasa konteks".
Terkadang ada ungkapan "konteks adalah raja", dan itu benar. LLM, baik yang canggih besar atau LLM kecil yang dioptimalkan, adalah alat yang ampuh, tetapi seperti alat lainnya, jika berada di tangan yang salah, Anda akan mendapatkan hasil yang jauh lebih tidak menjanjikan daripada jika Anda bekerja dengannya dengan benar. Dan manajemen konteks (atau teknik) memang merupakan area yang kompleks dan tidak dijelaskan dengan baik yang terus berkembang, dan itu benar-benar muncul sebagai perpanjangan dari konsep rekayasa prompt, yang sudah memiliki beberapa konotasi negatif.
Secara keseluruhan, Andrej mencantumkan aspek utama yang terkait dengan rekayasa konteks (pada tangkapan layar kedua), tetapi dalam setiap tugas tertentu, orang mencapai hasil yang sangat baik sebagian besar melalui coba-coba, setiap kali secara monoton mencoba memilih elemen konteks yang tepat yang benar-benar dibutuhkan pada tahap pemecahan masalah ini, mengumpulkan tolok ukur untuk setiap tahap, melihat metrik, membagi kumpulan data menjadi pengujian, validasi, dan seterusnya, dan seterusnya.
Apa pendapat Anda tentang "rekayasa konteks"?

Andrej Karpathy25 Jun 2025
+1 untuk "rekayasa konteks" di atas "rekayasa prompt".
Orang-orang mengaitkan petunjuk dengan deskripsi tugas singkat yang akan Anda berikan LLM dalam penggunaan sehari-hari. Ketika berada di setiap aplikasi LLM dengan kekuatan industri, rekayasa konteks adalah seni dan ilmu halus untuk mengisi jendela konteks dengan informasi yang tepat untuk langkah selanjutnya. Sains karena melakukan ini dengan benar melibatkan deskripsi dan penjelasan tugas, beberapa contoh bidikan, RAG, data terkait (mungkin multimodal), alat, keadaan dan sejarah, pemadatan... Terlalu sedikit atau bentuk yang salah dan LLM tidak memiliki konteks yang tepat untuk kinerja yang optimal. Terlalu banyak atau terlalu tidak relevan dan biaya LLM mungkin naik dan kinerja mungkin turun. Melakukan ini dengan baik sangat tidak sepele. Dan seni karena intuisi yang membimbing seputar psikologi LLM dari roh orang.
Selain rekayasa konteks itu sendiri, aplikasi LLM harus:
- memecah masalah tepat menjadi alur kontrol
- Kemas jendela konteks dengan tepat
- mengirimkan panggilan ke LLM dengan jenis dan kemampuan yang tepat
- menangani alur UIUX verifikasi generasi
- Lebih banyak lagi - pagar pembatas, keamanan, evals, paralelisme, prefetching, ...
Jadi rekayasa konteks hanyalah salah satu bagian kecil dari lapisan tebal perangkat lunak non-sepele yang muncul yang mengoordinasikan panggilan LLM individu (dan banyak lagi) ke dalam aplikasi LLM penuh. Istilah "pembungkus ChatGPT" melelahkan dan benar-benar salah.
362
Kemarin kami mendorong produk baru ke dalam produksi—I.R.I.S. (Integrity & Risk Intelligence Scanner), agen AI pertama di X (sebelumnya Twitter) yang:
• Menerima repositori kontrak pintar atau alamat kontrak yang diterapkan
• Menjalankan kode melalui platform SaaS kami AuditAgent—sudah menjadi solusi terdepan di pasar yang digunakan oleh auditor eksternal dan tim pengembang
• Menerbitkan laporan kerentanan lengkap tanpa meninggalkan umpan sosial
Mengapa?
• Saluran bebas gesekan. Pengembang mendapatkan audit di mana mereka sudah berbicara tentang kode—tanpa formulir, tidak ada utas email.
• Agen Audit di bawah tenda. Bukan hanya "mesin pemindaian", tetapi layanan unggulan kami yang mendukung audit dunia nyata.
• Wawasan dalam ~30 menit. Triase sempurna sebelum tinjauan manual yang mendalam.
• Dorongan go-to-market. Agen Twitter menampilkan kekuatan AuditAgent dan menyalurkan pengguna ke platform penuh.
16 jam pertama di timeline
✨ 2,7 M tayangan
🔥 49 K keterlibatan
📊 85% sentimen positif (214 tweet)
🛠️ ≈150 tweet berbagi kasus penggunaan praktis
🔍 33 audit ekspres
📋 38 454 baris kode dipindai
⚠️ 377 kerentanan terdeteksi
Catatan pribadi
Tepat setahun yang lalu saya bergabung dengan Nethermind dengan apa yang terdengar seperti hipotesis yang berisiko: "AI akan menjadi bagian penting dari keamanan kontrak pintar, tetapi hanya alat khusus yang asli alur kerja yang benar-benar membantu para profesional."
Dua belas bulan kemudian kami memiliki dua produk yang sedang diproduksi—AuditAgent (dan sekarang I.R.I.S.(@UndercoverIRIS) —dan dampak yang jelas pada keamanan Web3.
Terima kasih banyak kepada seluruh tim AI @NethermindEth dan kepada @virtuals_io. Ketekunan + hipotesis yang solid + keahlian gabungan = hasil yang dapat dilihat industri.
Kami akan terus membangun alat yang mengutamakan keamanan bagi pengembang—sehingga Web3 menjadi lebih aman dengan setiap penerapan.

730
Baru saja kembali dari AI Summit London—dan lanskap Enterprise-AI terlihat sangat berbeda dari dekat
3 hal yang mengejutkan saya:
1️⃣ Rak produk yang terlalu padat.
Setiap stan menjanjikan "platform AI" plug-and-play yang secara ajaib cocok dengan tumpukan apa pun. Tetapi berjalan cukup lama dan Anda terus mendengar pemblokir yang sama: sistem lama tanpa API, data yang tersebar, logika bisnis yang tidak jelas. Realitas akan brutal untuk SaaS satu ukuran untuk semua.
2️⃣ Toko yang dibangun khusus diam-diam bersinar.
Agensi yang menggabungkan konsultasi domain mendalam dengan pengembangan kustom yang cepat memiliki keunggulan yang jelas. Mereka dapat jatuh ke tengah yang berantakan, menjahit barang-barang bersama-sama, dan mengirimkan sesuatu yang benar-benar berjalan di dalam infrastruktur rapuh klien.
3️⃣ Pekerjaan khusus semakin murah, tidak lebih mahal.
Dengan model gen kode yang menulis adaptor, pengujian, dan perancah, pengembang senior sekarang mengatur daripada mengetik tangan. Pengalaman kami secara terus-menerus menggunakan alat AI dalam organisasi hanya menegaskan hal ini.
Kesimpulan
Pemenang dalam Enterprise AI bukanlah agen "out-of-the-box" yang paling mencolok—mereka akan menjadi tim gesit yang dapat menciptakan solusi bersama secara real time, dipandu oleh kendala teknologi lama yang berantakan.

259
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal