Mistral, perusahaan kecerdasan buatan (AI) yang berbasis di Paris, merilis model AI Mistral Small 3 pada hari Kamis. Perusahaan, yang dikenal dengan model bahasa besar (LLM) open-source-nya, juga telah membuat model AI terbaru tersedia di Hugging Face serta beberapa platform lainnya. Mistral mengklaim bahwa model terbaru dibuat dengan mempertimbangkan kecepatan pemrosesan, efisiensi, dan kinerja, dan dapat mengungguli model dua kali lipat ukurannya. Pengujian internal perusahaan AI menemukan model tersebut menawarkan kinerja yang lebih baik daripada GPT-4o mini OpenAI.
Model AI Mistral Small 3 Dirilis
Dalam sebuah posting ruang redaksi, perusahaan AI Prancis merinci model AI baru. Mistral Small 3 adalah model yang dioptimalkan latensi dengan 24 miliar parameter. LLM dirilis dengan pos pemeriksaan yang telah dilatih sebelumnya dan yang disetel instruksi untuk memenuhi berbagai tugas. Model AI tersedia di bawah lisensi Apache 2.0 untuk penggunaan akademik dan komersial. Mistral menyoroti bahwa mereka menjauh dari model Lisensi Penelitian Mistral (MRL) yang hanya mengizinkan penggunaan akademis dan terkait penelitian.
Perusahaan menyatakan bahwa model AI tidak dilatih dengan proses reinforcement learning (RL) atau menyertakan data sintetis (data yang dihasilkan dari model AI lain atau sumber digital) dalam kumpulan data pelatihan.
Berdasarkan pengujian internal, perusahaan AI mengklaim bahwa Mistral Small 3 mengungguli GPT-4o mini dalam hal latensi. Ini juga berkinerja lebih baik daripada OpenAI LLM pada tolok ukur utama Massive Multitask Language Understanding (MMLU) Pro dan Graduate-Level Google-Proof Q&A (GPQA). Pengembang juga mengungkapkan bahwa model tersebut kompetitif dengan model Llama 3.3 70B, meskipun tiga kali lebih kecil.
Menurut perusahaan, model ini dapat digunakan untuk kasus penggunaan di mana efisiensi atau kecepatan penting bagi pengembang. Beberapa kasus penggunaan yang disarankan termasuk skenario di mana bantuan percakapan respons cepat sangat penting, skenario di mana panggilan fungsi latensi rendah penting, atau skenario di mana pengembang ingin membuat chatbot yang ahli materi pelajaran dengan menyempurnakan LLM.
Model AI juga dapat digunakan untuk organisasi yang lebih memilih inferensi lokal untuk melindungi data sensitif atau kepemilikan. Khususnya, Mistral Small 3 dapat dijalankan secara pribadi pada satu GPU Nvidia RTX 4090. Pengembang dapat mengakses model dari daftar Hugging Face-nya.
Untuk berita dan ulasan teknologi terbaru, ikuti Gadgets 360 di X, Facebook, WhatsApp, Utas dan Google Berita. Untuk video terbaru tentang gadget dan teknologi, berlangganan saluran YouTube kami. Jika Anda ingin tahu segalanya tentang influencer top, ikuti Who’sThat360 internal kami di Instagram dan YouTube.

Skuter Listrik Ola S1 Gen 3 Dengan ABS Ganda, Teknologi Penggerak Rantai Diluncurkan di India: Yang Perlu Anda Ketahui