Google akhirnya meluncurkan model pembuatan gambar dan video kecerdasan buatan (AI) terbarunya pada hari Rabu. Kedua model AI ini diluncurkan di Google I/O sebagai kemajuan terbaru raksasa teknologi dalam AI generatif. Sekarang, lebih dari enam bulan kemudian, perusahaan yang berbasis di Mountain View telah memperkenalkannya di Vertex AI untuk klien perusahaannya. Khususnya, meskipun Imagen 3 tidak tersedia sebagai platform mandiri sejauh ini, itu digunakan di beberapa platform dan alat seperti Google Docs, Gemini, dan alat eksperimental yang disebut GenChess.
Google Imagen 3, Model AI Veo
Dalam sebuah posting blog, raksasa teknologi mengumumkan pengenalan dua model AI baru di Vertex AI. Platform Vertex AI Google adalah platform pembelajaran mesin terkelola (ML) di Google Cloud yang memungkinkan pengembang dan perusahaan untuk membangun, menerapkan, dan mengelola model AI. Ini mirip dengan Amazon Bedrock dan Microsoft Azure dan menawarkan alat dan solusi terintegrasi untuk alur kerja AI.
Raksasa teknologi itu menyatakan bahwa model pembuatan video Veo sekarang tersedia di Vertex AI dalam pratinjau pribadi dan bisnis dapat menghasilkan video menggunakan perintah teks atau gambar. Di sisi lain, Imagen 3 akan tersedia mulai minggu depan. Dibutuhkan perintah teks dan perusahaan dapat menggunakannya untuk menghasilkan gambar yang mencerminkan gaya dan logo merek mereka.
Datang ke kemampuan Veo, Google mengatakan dapat menghasilkan video berkualitas tinggi berdasarkan perintah teks atau gambar. Video yang dihasilkan dapat dalam berbagai gaya sinematik dan visual. Dikembangkan oleh DeepMind, model AI dikatakan memiliki kepatuhan cepat yang tinggi dan dapat menghasilkan rekaman objek dan orang yang konsisten dan bahkan menangkap gerakan secara realistis.
Imagen 3, yang akan tersedia di Vertex AI mulai minggu depan, dapat menghasilkan gambar fotorealistik dalam berbagai gaya. Menyebutnya “model pembuatan gambar kami yang paling mumpuni”, Google menyatakan bahwa model pembuatan gambar dapat memahami perintah bahasa alami dan pengguna tidak perlu menjelaskan elemen teknis untuk mendapatkan hasil yang diinginkan.
Model AI Imagen 3 juga akan tersedia dengan alat pengeditan untuk pengecatan dan pengecatan. Perusahaan juga dapat menanamkan warna, gaya, logo, dan elemen merek mereka dalam gambar yang dihasilkan.
Untuk privasi dan keamanan, raksasa teknologi telah menambahkan beberapa alat. SynthID, teknologi watermarking yang dikembangkan oleh DeepMind, akan disematkan ke dalam setiap gambar dan bingkai video yang dihasilkan model AI ini untuk memerangi contoh deepfake dan misinformasi. Google juga menyatakan bahwa model AI tidak akan dilatih pada data pelanggan dan alat tersebut akan beroperasi mengikuti tata kelola data dan kontrol privasi Google Cloud.