Baidu merilis seri model kecerdasan buatan (AI) Ernie 4.5 dalam sumber terbuka pada hari Senin. Raksasa teknologi China itu sebelumnya mengatakan bahwa mereka akan membuat model bahasa besar (LLM) miliknya tersedia untuk komunitas terbuka pada 31 Juli. Sekarang telah merilis 10 varian seri yang berbeda, dengan masing-masing model dibangun di atas arsitektur Mixture-of-Experts (MoE). Di samping model, perusahaan juga telah merilis toolkit pengembangan multi-perangkat keras untuk Ernie 4.5 dalam open source.
Baidu Merilis 10 Varian Model AI Ernie 4.5 dalam Open Source
Dalam sebuah posting di X (sebelumnya dikenal sebagai Twitter), raksasa teknologi China mengumumkan rilis 10 model AI Ernie 4.5 open-source. Empat di antaranya adalah model berbahasa penglihatan multimodal, delapan adalah model MoE, dan dua adalah model berpikir atau penalaran. Selain itu, daftar tersebut juga mencakup lima model pasca-pelatih, sementara yang lain telah dilatih sebelumnya. Model-model ini sekarang dapat diunduh dari daftar Hugging Face perusahaan atau dari daftar GitHub-nya.
Dalam sebuah posting blog, Baidu mengatakan bahwa model MoE menampilkan total 47 miliar parameter, dengan tiga miliar di antaranya aktif pada satu waktu. Model terbesar di antara 10 varian menampilkan 424 miliar parameter. Semuanya dilatih menggunakan kerangka kerja pembelajaran mendalam PaddlePaddle.
Berdasarkan pengujian internal, perusahaan mengklaim model Ernie-4.5-300B-A47B-Base melampaui DeepSeek-V3-671B-A37B-Base pada 22 dari 28 tolok ukur. Demikian pula, ia mengklaim bahwa Ernie-4.5-21B-A3B-Base mengungguli Qwen3-30B-A3B-Base pada beberapa tolok ukur matematika dan penalaran meskipun memiliki parameter 30 persen lebih sedikit.
Baidu juga mengungkapkan metode pelatihannya di halaman model. Perusahaan menggunakan struktur MoE yang heterogen dalam proses pra-pelatihan dan menskalakan model menggunakan teknik seperti paralelisme ahli intra-node, penjadwalan pipa yang hemat memori, pelatihan presisi campuran FP8, dan metode komputasi ulang yang halus.
Selain model, Baidu juga telah menyediakan ErnieKit untuk komunitas terbuka. Ini adalah toolkit pengembangan untuk model seri Ernie 4.5. Dengan ini, pengembang dapat melakukan pra-pelatihan, penyempurnaan yang diawasi (SFT), Adaptasi Peringkat Rendah (LoRA), dan teknik penyesuaian lainnya. Khususnya, semua model tersedia di bawah lisensi Apache 2.0 permisif, yang memungkinkan penggunaan akademik dan komersial.