Anthropic merilis versi upgrade dari model kecerdasan buatan (AI) Claude 3.5 Sonnet pada hari Senin. Dijuluki Claude 3.7 Sonnet, ini tersedia untuk semua pengguna Claude. Perusahaan AI menggambarkan 3.7 Sonnet sebagai model paling cerdas yang mampu melakukan penalaran tingkat lanjut. Fokus utama dari model bahasa besar (LLM) baru adalah pengkodean, dan untuk mendukung kemampuan, perusahaan juga memperkenalkan Claude Code, alat pengkodean agen pertama Anthropic yang dapat menangani berbagai macam tugas pengkodean backend.
Anthropic Merilis Model AI Baru dan Agen AI Pertamanya
Dalam sebuah posting ruang redaksi, perusahaan mengumumkan perilisan model Sonnet Claude 3.7. Ini adalah model AI hibrida pertama oleh perusahaan dan dapat berfungsi baik sebagai model bahasa standar maupun model penalaran. Model penalaran biasanya menggunakan fungsi komputasi waktu pengujian untuk meningkatkan waktu yang dihabiskan pada kueri. Selama waktu ini, ia menebak output, mencari solusi alternatif, dan memverifikasi informasi.
Dengan Claude 3.7 Sonnet, pengguna dapat menggunakan model AI yang sama untuk mendapatkan fungsi standar dan penalaran. Menjelaskan alasan di balik memilih model hibrida, Anthropic mengatakan, “Kami percaya penalaran harus menjadi kemampuan terintegrasi dari model perbatasan daripada model yang terpisah sepenuhnya.”
Anggota staf Gadgets 360 dapat mengakses model AI di tingkat gratis, dan tanggapannya tampaknya lebih canggih dibandingkan dengan model Sonnet yang lebih lama. Namun, peningkatannya marjinal, yang biasanya terjadi pada sebagian besar model AI berulang.
Pengguna sekarang dapat mengakses Mode Berpikir baru di menu pemilih model Claude, dan memilih antara Normal dan Extended. Sementara mode Normal akan menghasilkan respons yang hampir instan, mode Extended akan memicu respons berbasis penalaran. Khususnya, mode Extended saat ini hanya tersedia untuk pelanggan Pro.
Anthropic mengatakan pengembang yang mengakses model melalui antarmuka pemrograman aplikasi (API) akan dapat mengontrol waktu model berpikir sebelum menghasilkan output. Ini dapat dikendalikan dengan menentukan nilai token tertentu untuk Claude. Jumlah ini bisa mencapai 1,28,000 token, yang merupakan langit-langit atas untuk model ini. Perusahaan AI menyoroti bahwa kontrol terperinci ini akan memungkinkan pengembang membangun produk yang lebih fokus.
Datang ke kinerja, Sonnet Claude 3.7 mencetak 62.3 persen dalam tolok ukur yang diverifikasi bangku SWE, mengungguli 3.5 Sonnet dan o1 OpenAI, sesuai pengujian internal perusahaan. Ini juga mengungguli o1 dalam tolok ukur bangku TAU untuk penggunaan alat agen.
Selain itu, perusahaan AI juga memperkenalkan Claude Code, alat pengkodean agen pertamanya dalam pratinjau penelitian terbatas. Ini dapat melakukan berbagai tugas pengkodean termasuk mencari dan membaca kode, mengedit file, menulis dan menjalankan pengujian, menerapkan dan mendorong kode ke GitHub, dan menggunakan alat baris perintah.
Dalam pengujian internal Anthropic, alat agen mampu menyelesaikan tugas-tugas kompleks yang lebih dari 45 menit bekerja manual dalam satu upaya. Individu yang tertarik dapat mengakses pratinjau di sini. Perusahaan AI menyoroti bahwa alat tersebut digunakan secara luas secara internal.