Saya telah menghabiskan sore hari untuk menguji produk otomatisasi konsumen baru ChatGPT - Agent. Di mana itu bekerja, dan di mana itu gagal? Dan bagaimana perbandingannya dengan Operator (dan produk yang lebih baru seperti Komet Perplexity)? Ulasan 👇 saya
Itu juga sering "berlebihan" tugas-tugas sederhana - tetapi tidak dapat menyelesaikan yang lebih kompleks. Misalnya Agen membutuhkan waktu satu menit penuh untuk menemukan tanggal / waktu 1:1 baru-baru ini, dan tidak dapat menjadwalkan yang baru (di bawah ini adalah kecepatan ⬇️ 4x) Comet menemukan info yang sama dan mengirim undangan baru dalam <10 detik.
Batas privasi dan keamanan ChatGPT juga menghalangi. Agen setuju untuk membuat poster ulang tahun untuk @illscience, menarik tanggal dari kalender saya dan fotonya dari Internet. Tetapi hasil akhirnya (memakan waktu 13 menit) menyunting nama dan gambarnya karena "alasan privasi" 🤦 ♀️
Apa yang benar-benar dikuasai Agen? Memulai tugas penelitian atau komputasi yang tidak sensitif terhadap waktu. Misalnya Agen membuat model DCF NVIDIA (dalam format Excel yang dapat diunduh!) dalam 25 menit. Pemformatannya tidak persis seperti yang akan saya lakukan, tetapi ini adalah langkah maju yang besar.
266,8K