Google meluncurkan fitur peningkatan kecerdasan buatan (AI) baru yang disebut ‘Expressive Captions’ pada hari Kamis. Fitur ini sedang diluncurkan ke fitur Live Captions di Android. Dengan ini, pengguna akan dapat melihat teks langsung video yang diputar di seluruh perangkat dalam format baru untuk menyampaikan konteks di balik suara dengan lebih baik. Fitur AI akan menyampaikan kegembiraan, teriakan, dan kenyaringan dengan teks yang ditampilkan dalam huruf besar semua. Saat ini, Expressive Captions tersedia dalam bahasa Inggris di perangkat Android 14 dan Android 15 di AS.
Fitur ‘Teks Ekspresif’ Google Mengandalkan AI
Raksasa pencarian membagikan rincian fitur AI baru yang ditambahkan ke Live Captions Android, dan mengatakan bahwa meskipun teks pertama kali dipopulerkan pada 1970-an sebagai alat aksesibilitas untuk komunitas tunarungu dan gangguan pendengaran, presentasi mereka tidak berubah dalam 50 tahun terakhir.
Banyak orang saat ini menggunakan teks saat streaming konten online di ruang publik yang bising, untuk lebih memahami apa yang dikatakan, atau saat mengonsumsi konten dalam bahasa asing. Memperhatikan popularitas teks di kalangan pengguna Android, Google mengatakan sekarang menggunakan AI untuk berinovasi informasi yang disampaikan teks.
Dengan Teks Ekspresif, subtitle langsung akan dapat mengomunikasikan hal-hal seperti nada, volume, isyarat lingkungan, serta suara manusia. “Hal-hal kecil ini membuat perbedaan besar dalam menyampaikan apa yang melampaui kata-kata, terutama untuk konten langsung dan sosial yang tidak memiliki teks yang dimuat sebelumnya atau berkualitas tinggi,” kata Google.
Salah satu cara Teks Ekspresif akan berinovasi dalam teks adalah dengan menampilkan semua huruf kapital untuk menunjukkan intensitas ucapan, baik itu kegembiraan, kenyaringan, atau kemarahan. Keterangan ini juga akan mengidentifikasi suara seperti menghela nafas, mendengus, dan terengah-engah, membantu pengguna lebih memahami nuansa ucapan. Selanjutnya, ini juga akan menangkap suara sekitar yang dimainkan di latar depan dan latar belakang, seperti tepuk tangan dan sorak-sorai.
Google mengatakan bahwa Expressive Captions adalah bagian dari Live Captions, dan fitur tersebut dibangun ke dalam sistem operasi dan akan tersedia di seluruh perangkat Android, tidak peduli aplikasi atau antarmuka mana yang digunakan pengguna. Hasilnya, pengguna dapat menemukan teks AI real-time saat menonton streaming langsung, postingan media sosial, dan kenangan di Google Foto, serta video yang dibagikan di platform perpesanan.
Khususnya, pemrosesan AI untuk Teks Ekspresif dilakukan di perangkat, yang berarti pengguna akan melihatnya bahkan saat perangkat tidak terhubung ke Internet atau dalam mode pesawat.