Home Teknologi DeepSeek Merilis Model AI Pembuatan Gambar Janus Pro 7B, Dikatakan Mengungguli DALL-E...

DeepSeek Merilis Model AI Pembuatan Gambar Janus Pro 7B, Dikatakan Mengungguli DALL-E 3 OpenAI

21
0

DeepSeek, sebuah perusahaan kecerdasan buatan (AI) China, merilis model pembuatan gambar sumber terbuka pada hari Senin. Perusahaan telah menghasilkan desas-desus di ruang AI baru-baru ini dengan merilis beberapa model fondasi perbatasan sumber terbuka sepenuhnya, termasuk DeepSeek-R1 yang berfokus pada penalaran. Model baru, yang dijuluki Janus Pro 7B, datang beberapa hari setelah model R1 dan perusahaan mengklaim mengungguli DALL-E 3 OpenAI dalam beberapa tolok ukur. Mirip dengan rilis sebelumnya, model AI baru juga tersedia dengan lisensi permisif untuk penggunaan akademik dan komersial.

DeepSeek Janus Pro 7B AI Model

Model AI baru telah dirinci dalam daftar Hugging Face. Model ini adalah penerus model Janus dan Janus Pro 1B, dan perusahaan telah melakukan peningkatan yang signifikan pada fungsinya. Menggambarkannya sebagai kerangka kerja autoregresif yang menyatukan pemahaman dan generasi multimodal, DeepSeek menyatakan bahwa beberapa perubahan dilakukan pada arsitektur serta encoder untuk meningkatkan kemampuan model.

Dengan fokus pada efisiensi, DeepSeek Janus Pro 7B sekarang memisahkan pengkodean visual ke dalam jalur terpisah sambil menggunakan arsitektur transformator terpadu untuk pemrosesan. Untuk pemahaman multimodal, ia menggunakan encoder visi SigLIP-L, sedangkan untuk pembuatan, ia menggunakan tokeniser dengan tingkat downsample 16.

Berdasarkan pengujian internal yang dibagikan oleh perusahaan, Janus Pro 7B mencetak skor 80 persen pada GenEval dan 84,2 pada tolok ukur DPG-Bench. Baik model DALL-E 3 dan Stable Diffusion memiliki skor lebih rendah pada tes ini. Namun, pengujian independen dalam beberapa hari mendatang akan mengungkapkan gambaran yang lebih baik tentang kemampuan Janus Pro 7B.

Saat ini, tersedia untuk diunduh dari halaman daftar GitHub serta di Hugging Face. Ini tersedia dengan lisensi MIT. Demo model AI dapat ditemukan di sini. DeepSeek belum mengumumkan antarmuka pemrograman aplikasi (API) apa pun untuk model sejauh ini.

Perplexity Menambahkan Dukungan untuk DeepSeek-R1

Aravind Srinivas, CEO Perplexity, mengumumkan pada hari Senin bahwa platform AI sekarang akan mendukung DeepSeek-R1 bersama model AI o1 OpenAI. Menyebutnya sebagai “model penalaran paling kuat di dunia,” dia mengatakan model tersebut akan tersedia untuk semua pengguna.

Saat ini, ada batasan jumlah output yang dapat dihasilkan menggunakan model tersebut, tetapi perusahaan berencana untuk meningkatkannya. Khususnya, perusahaan menyoroti bahwa model tersebut dihosting di AS, untuk mengurangi kekhawatiran mengenai data yang dikirim ke server China.

Secara terpisah, CEO OpenAI Sam Altman akhirnya mengomentari kebangkitan model AI DeepSeek yang tiba-tiba. Dia menyebut model R1 “mengesankan”, terutama untuk apa yang “mampu diberikan perusahaan dengan harganya.” Khususnya, harga API o1 ditetapkan jauh lebih tinggi daripada R1.

“Kami jelas akan memberikan model yang jauh lebih baik dan juga sah menyegarkan untuk memiliki pesaing baru! Kami akan menarik beberapa rilis,” tambah Altman.

Pada hari Senin, saham Nvidia turun sekitar 13 persen, menghapus sekitar $ 465 miliar (sekitar Rs. 40 lakh crore) dari kapitalisasi pasar perusahaan. Ini adalah penurunan satu hari terbesar bagi raksasa teknologi sejak go public pada tahun 1999.

Pakar pasar berspekulasi bahwa penurunan itu bisa jadi karena investor khawatir dengan klaim para peneliti DeepSeek. Para peneliti, dalam sebuah makalah, mengatakan bahwa mereka dapat membangun R1 tanpa GPU mahal dan dengan biaya di bawah $ 6 juta (sekitar Rs. 51 crore).

Sumber