Home Teknologi Google DeepMind Luncurkan Model AI Genie 2, Dapat Menghasilkan Dunia 3D yang...

Google DeepMind Luncurkan Model AI Genie 2, Dapat Menghasilkan Dunia 3D yang Dapat Dimainkan untuk Melatih Agen AI

30
0

Google DeepMind meluncurkan penerus model kecerdasan buatan (AI) Genie, yang dapat menghasilkan dunia game 2D tanpa akhir, pada hari Rabu. Dijuluki Genie 2, model AI baru ini mampu menghasilkan lingkungan 3D yang unik yang dapat dikendalikan dan dapat dimainkan berdasarkan satu prompt gambar. Menyebut Genie 2 sebagai “model dunia” AI, perusahaan menyatakan bahwa ia dapat menghasilkan lingkungan hingga satu menit dengan objek yang konsisten. Perusahaan mengatakan dunia yang dihasilkan ini dapat dimainkan oleh manusia atau dapat digunakan untuk melatih agen AI.

Google DeepMind Meluncurkan Model AI Genie 2

Dalam sebuah posting blog, perusahaan merinci model AI baru dan kemampuannya. Sementara pendahulunya hanya dapat menghasilkan dunia game untuk game platformer 2D, model AI Genie 2 dapat menghasilkan dunia 3D lengkap dengan model konsisten yang dapat berinteraksi. Ini berarti manusia atau agen AI dapat berjalan, berlari, berenang, memanjat, dan melakukan lebih banyak tindakan di lingkungan ini.

Kemampuan generatif Genie 2 memungkinkannya menghasilkan rute, bangunan, dan objek yang tidak dapat dilihat dalam gambar input. Elemen-elemen ini dirancang dan dirender oleh model dari awal. Selain itu, model fondasi juga mampu menjaga konsistensi di lingkungan ini. Ini berarti bahkan ketika seorang pemain menjauh dari satu area dan kembali, lingkungannya tetap sama.

Selain itu, Genie 2 mampu menghasilkan perspektif yang berbeda seperti pandangan orang pertama, pandangan isometrik, atau pandangan orang ketiga. Selanjutnya, pengguna juga dapat berinteraksi dengan objek di dunia yang dihasilkan dan dapat melakukan tindakan seperti membuka pintu, meledakkan balon, atau menaiki tangga. Model ini juga dapat diminta untuk menghasilkan efek terkait fisika seperti riak air, asap, gravitasi, pencahayaan terarah, pantulan, dan banyak lagi.

Datang ke detail teknis, DeepMind menjelaskan bahwa Genie 2 adalah model difusi laten autoregresif dan telah dilatih pada kumpulan data video yang besar. Arsitektur transformator juga menyertakan autoencoder yang memungkinkan pembuatan bingkai demi bingkai dari dunia ini.

Khususnya, DeepMind juga merilis model AI yang dijuluki Scalable Instructable Multiworld Agent atau SIMA awal tahun ini, yang pada dasarnya mampu melakukan fungsi AI agen di dunia 3D. Perusahaan mengatakan Genie 2 mampu menyediakan lingkungan unik untuk agen AI serupa dan melatih mereka untuk berbagai skenario kehidupan nyata.

Karena model dunia dapat menghasilkan lingkungan yang unik, Google mengatakan ini akan menghilangkan risiko kontaminasi data dan akan memungkinkan pengembang untuk menilai kemampuan agen AI dengan benar.

Sumber