Home Teknologi Peneliti Alibaba Meluncurkan Model AI Marco-o1 Sebagai Pesaing Lain yang Berfokus pada...

Peneliti Alibaba Meluncurkan Model AI Marco-o1 Sebagai Pesaing Lain yang Berfokus pada Penalaran untuk o1 OpenAI

35
0

Alibaba baru-baru ini memperkenalkan model kecerdasan buatan (AI) yang berfokus pada penalaran yang dijuluki Marco-o1. Modelnya mirip dengan model bahasa besar QwQ-32B, yang juga dioptimalkan untuk tugas-tugas yang membutuhkan kemampuan penalaran tingkat lanjut, namun, satu perbedaan penting adalah bahwa Marco-o1 adalah model yang lebih kecil dan disuling dari model Qwen2-7B-Instruksi. Raksasa teknologi China mengklaim bahwa beberapa latihan penyempurnaan telah digunakan untuk membuat model baru berfokus pada penalaran. Selain itu, para peneliti menyoroti bahwa itu dioptimalkan untuk tugas pemecahan masalah dunia nyata yang kompleks.

Alibaba Marco-o1 AI Model

Model AI baru dirinci dalam makalah penelitian yang diterbitkan di arXiv, jurnal pra-cetak online. Khususnya, makalah yang diterbitkan dalam jurnal online tidak ditinjau oleh rekan sejawat. Selain itu, Alibaba juga telah menghosting model AI di Hugging Face dan telah mengizinkan pengunduhan dan menggunakannya untuk kasus penggunaan pribadi dan komersial di bawah lisensi Apache 2.0.

Namun, ini tidak sepenuhnya bersumber terbuka karena hanya kumpulan data parsial yang telah tersedia. Dengan demikian, pengguna tidak akan dapat mereplikasi model atau memecahnya untuk menganalisis arsitektur atau komponen.

Datang ke Marco-o1, itu disesuaikan dari model fondasi Qwen2-7B-Instruksi. Dalam makalah tersebut, para peneliti menyoroti bahwa model AI didukung oleh penyetelan rantai pemikiran (CoT), Monte Carlo Tree Search (MCTS), mekanisme refleksi, dan strategi penalaran lainnya.

Akibatnya, Marco-o1 Alibaba dapat memecahkan pertanyaan terbuka dan menemukan pertanyaan untuk tanggapan “di mana standar yang jelas tidak ada dan imbalan sulit untuk diukur.” Namun, harus dipahami bahwa kemampuan penalaran tingkat lanjut tidak berasal dari kemajuan perangkat keras atau arsitektur apa pun.

Sebagai gantinya, semua model penalaran saat ini menggunakan teknik yang disebut komputasi waktu pengujian yang memungkinkan model AI menghabiskan lebih banyak waktu pemrosesan pada satu kueri. Hal ini memungkinkan mereka untuk menguji teori yang berbeda untuk menemukan solusi dan memeriksa fakta sendiri. Akibatnya, model-model ini diarahkan untuk memberikan respons yang lebih akurat dan menyelesaikan tugas-tugas yang kompleks. Salah satu area penting di mana Marco-o1 unggul, menurut para peneliti, adalah memahami nuansa sehari-hari dan menerjemahkan ekspresi bahasa gaul.

Salah satu keterbatasan model AI, menurut para peneliti, mengklaim bahwa sementara Marco-o1 menunjukkan karakteristik penalaran, “kinerjanya masih kurang dari model penalaran yang sepenuhnya direalisasikan”.

Sumber