Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Claude Opus 4.5: ulasan lengkap
Ini adalah rilis model terbaik dalam waktu yang lama dalam hal pemrograman. Itu mengejutkan saya betapa bagusnya itu. Saya belum melihat peningkatan sebesar ini sejak rilis asli gpt-4-0314
Peningkatan utama adalah mereka akhirnya memikirkannya bagaimana 'berpikir' dengan benar.
Ia tidak lagi membuat kesalahan logika yang mengerikan dalam pemikirannya.
Masalah seperti "Oke, saya akan menjalankan tes sekarang. <Tes gagal> Bagus! Tes lulus." bukan lagi sesuatu.
Ini menggeneralisasi pada dasarnya SEMUA logika ketika harus memikirkan kode - sangat jarang, jika pernah, membuat kesalahan.
Tonggak besar berikutnya: Itu tidak lagi menulis kode slop! Ini sangat besar. Dengan Codex, Anda bisa membuatnya menulis kode yang berfungsi. Tapi ia menulis kode yang mengerikan - fungsi yang tidak berguna, abstraksi yang buruk, dll. Ini menyebalkan, karena bekerja dalam jangka pendek, tetapi jangka panjang model akan berjalan sendiri ke sudut di mana ia tidak dapat lagi bekerja dengan kode yang ditulisnya sendiri.
Tidak demikian halnya dengan Opus. Tidak hanya menulis kode yang elegan, tetapi juga tahu cara memfaktorkan ulang kode slop menjadi kode non-slop. Ini sangat memahami basis kode dan dapat menemukan solusi elegan yang bukan hanya pemfaktoran ulang 'mekanis'.
Ini sangat otonom dan mandiri. Ini akan, dengan sendirinya, ketika mengalami masalah, membuat contoh minimal yang dapat direproduksi, mencoba membelah dua dari mana kesalahan berasal, lalu memperbaikinya tanpa terjebak di lubang kelinci. Bahkan jika kesalahannya ada di beberapa bagian kode yang tidak terkait -- kode yang bahkan tidak ditulis sendiri!!
Itu juga MELAKUKAN PERSIS APA YANG ANDA KATAKAN, TANPA MENGAMBIL JALAN PINTAS! Ini sangat besar!! Menggunakan Codex pada dasarnya adalah permainan memukul tahi lalat di mana ia memahami apa yang Anda inginkan untuk dilakukan, tetapi terlalu sulit sehingga meretas hadiahnya menjadi solusi omong kosong yang tidak Anda inginkan.
Opus benar-benar mengatasi masalah dan menyelesaikannya dengan benar meskipun sulit.
Pemahaman konteks yang panjang cukup sempurna. Dipasangkan dengan mekanisme pemadatan yang tersedia di Claude Code secara default, pada dasarnya Anda dapat melakukan percakapan yang sangat panjang di mana ia memahami segala sesuatu di dalamnya, tanpa degradasi.
Dalam hal desain, penelitian, menghasilkan ide-ide baru. Ini lebih baik, tetapi tidak cukup tingkat ahli-manusia. Itu dapat mengusulkan solusi yang saya anggap desain yang baik, tetapi belum bisa 'berpikir dengan portal'. Namun, peningkatan yang baik dari apa yang kami miliki sebelumnya, yang pada dasarnya tidak ada.
Semua hal di atas telah saya kumpulkan dari pengujiannya selama beberapa hari terakhir di mana tugasnya adalah menulis penerjemah untuk bahasa yang kami rancang dengan cepat. Ini adalah desain yang sangat khusus, mirip dengan Self dan Smalltalk, kecuali kami membangun bahasa di dalam bahasa itu sendiri. Ini mengarah pada skenario yang sangat sulit di mana Anda mencoba mendefinisikan bagaimana fungsi bekerja - di dalam bahasa - ketika Anda belum memiliki fungsi! Dan itu masih melakukan pekerjaan yang luar biasa. Terkadang, saya bahkan tidak sepenuhnya mengerti apa yang saya minta untuk dilakukan, tetapi Opus melakukannya, dan itu melakukan pekerjaan dengan baik.
TL; DR: Ini adalah Soneta 3.5 tahun 2025. Cobalah. Lakukan sekarang
Teratas
Peringkat
Favorit

