Home Teknologi Model Pembuatan Video AI MuseStreamer Baidu Menghadapi Veo 3 Google Dengan Dukungan...

Model Pembuatan Video AI MuseStreamer Baidu Menghadapi Veo 3 Google Dengan Dukungan Audio Asli: Laporan

2
0

Baidu dilaporkan merilis model pembuatan video kecerdasan buatan (AI) baru pada hari Rabu. Sesuai laporan, model AI MuseStreamer juga dapat mengintegrasikan audio Cina dalam video yang dihasilkan, menjadikannya model kedua setelah Veo 3 Google. Raksasa teknologi mengklaimnya sebagai model AI pertama di dunia dengan dukungan generasi audio asli Cina. Bersamaan dengan pengenalan model bahasa besar (LLM), perusahaan dilaporkan juga meluncurkan platform pembuatan konten video baru yang dijuluki HuiXiang. Khususnya, baik MuseStreamer maupun HuiXiang saat ini tidak tersedia di luar China.

MuseStreamer Baidu Dilaporkan Dapat Menghasilkan Audio Tiongkok

Dunia model pembuatan video AI telah berkembang secara signifikan dalam dua tahun terakhir. Kami telah beralih dari model yang berjuang untuk menghasilkan orang dengan jumlah jari tetap ke LLM yang sekarang dapat secara akurat menggambarkan fisika dan gerakan realistis. Namun, salah satu area yang tidak dimasuki oleh sebagian besar pemain AI adalah video yang juga mendukung audio secara asli.

Di Google I/O 2025, raksasa teknologi itu menjadi perusahaan pertama yang menawarkan kemampuan ini dengan Veo 3, yang segera menjadi pembicaraan di kota, meninggalkan saingan terbesarnya, Sora dari OpenAI. Raksasa teknologi yang berbasis di Mountain View baru-baru ini memperluas Veo 3 di semua 154 negara di mana aplikasi Gemini tersedia, menyoroti dorongan agresif perusahaan untuk alat ini.

Namun, menurut laporan Tech in Asia (melalui AI Base), raksasa teknologi China Baidu juga telah memasuki perlombaan dengan model AI MuseStream-nya. Dikatakan menghasilkan video dengan audio Cina, dan satu-satunya model dengan kemampuan untuk melakukannya. Khususnya, Veo 3 hanya dapat menghasilkan audio dalam bahasa Inggris.

MuseStreamer dilaporkan tidak hanya dapat menghasilkan dialog yang disinkronkan dengan video, tetapi juga dapat menambahkan efek suara dan kebisingan sekitar dalam video. Baidu dikatakan telah mengklaim bahwa model tersebut mencapai skor 89,38 persen pada benchmark VBench I2V, peringkat teratas. Raksasa teknologi ini mempromosikan LLM sebagai alat pembuatan konten bagi konsumen.

Di samping model AI, Baidu dilaporkan juga telah meluncurkan platform konten video baru yang dijuluki HuiXiang. HuiXiang dikatakan berfungsi sebagai front-end untuk model AI, di mana pengguna dapat berbagi petunjuk dan menghasilkan video. Platform saat ini mendukung generasi video berdurasi 10 detik pada resolusi 1080p, kata laporan itu. Sebagai perbandingan, Veo 3 hanya dapat menghasilkan video berdurasi delapan detik. Tidak ada kejelasan tentang rasio aspek default video, dan apakah pengguna dapat menghasilkan video dalam rasio aspek yang berbeda.

Sumber