Setelah kebaruan kecerdasan buatan generatif (AI) hilang, banyak yang mengajukan pertanyaan penting — Ya itu keren, tetapi bagaimana hal itu bisa berdampak di dunia nyata? Itu adalah pertanyaan yang valid. Sementara chatbot AI dapat dilihat sebagai toko serba ada untuk mencari informasi dengan cepat, melakukan percakapan dadakan, membuatnya menulis esai, menghasilkan gambar atau video, peran mereka sebagian besar terbatas pada sistem di mana pengguna manusia harus terus-menerus memerintahkannya untuk mendapatkan output dan mengawasi hasilnya.
Bahkan jika kemampuannya tidak dapat diabaikan, dan itu membuat dampak yang signifikan dalam meningkatkan produktivitas pekerja di bidang tertentu, itu tidak memiliki satu elemen penting yang menghentikannya menjadi asisten setia yang dapat menangani dan benar-benar mengotomatiskan tugas-tugas — pengambilan keputusan. AI generatif saat ini dapat membantu dengan aspek-aspek tertentu dari pekerjaan seseorang, tetapi tidak dapat menjalankan tugas.
Misalnya, Anda dapat memintanya untuk menulis email kepada klien yang memberi tahu mereka tentang penundaan yang tidak terduga, tetapi tidak dapat mengirim pesan itu atau menangani balasan marah yang mereka kirim. Demikian pula, Anda dapat menggunakan Gemini atau ChatGPT untuk meminta “smartphone terbaik untuk merekam video”, dan dapat merekomendasikan iPhone 16 Pro Max atau Samsung Galaxy S24 Ultra terbaru. Tetapi itu tidak akan dapat menjelajahi web untuk menemukan penawaran terbaik dan melakukan pembelian.
Menyadari kesenjangan ini, perusahaan teknologi yang mengerjakan model bahasa besar (LLM) mulai menggunakan kata agen AI. Para peneliti percaya agen AI dapat mengambil sistem AI berbasis pengetahuan dan mengubahnya menjadi sistem pengambilan tindakan yang dapat melakukan tugas end-to-end tanpa campur tangan manusia.
Istilah ini menjadi terkenal selama paruh kedua tahun 2024, dan saat ini, istilah ini diperlakukan sebagai obat mujarab untuk semua masalah yang berhubungan dengan pekerjaan. Dan meskipun ada beberapa kebenaran untuk itu, apakah itu benar-benar teknologi transformatif dari potensi itu? Jawabannya mungkin agak rumit, tetapi kami akan melakukan yang terbaik untuk memecahnya dan menyoroti semua aspek berbeda yang harus Anda ketahui. Mari kita selami ke dalamnya.
Apa itu Agen AI?
Karena teknologi ini masih dalam tahap awal, tidak ada definisi terpadu tentang apa sebenarnya yang merupakan agen AI. IBM mendefinisikannya sebagai sistem “yang mampu melakukan tugas secara mandiri atas nama pengguna” dengan merancang alur kerja dan menggunakan alat. Demikian pula, Google, yang mengumumkan agen AI pertamanya yang dijuluki Project Mariner tahun lalu, menyebutnya sebagai sistem yang bertindak seperti asisten manusia dan membantu mereka menyelesaikan tugas.
Definisi yang lebih komprehensif diberikan oleh Amazon, yang menggambarkannya sebagai “program perangkat lunak yang dapat berinteraksi dengan lingkungannya, mengumpulkan data, dan menggunakan data untuk melakukan tugas yang ditentukan sendiri untuk memenuhi tujuan yang telah ditentukan. Manusia menetapkan tujuan, tetapi agen AI secara independen memilih tindakan terbaik yang perlu dilakukan untuk mencapai tujuan tersebut.”
Sederhananya, agen AI dapat dipahami sebagai sistem AI yang dapat mengambil tindakan alih-alih hanya memberi tahu pengguna tentang tindakan tersebut.
Memecah Agen AI
Agen AI tipikal akan memiliki model bahasa besar (LLM) sebagai otaknya. Tetapi itu juga akan mencakup elemen lain yang memungkinkannya menggunakan kecerdasan itu dalam tindakan. Paling umum, bagian tambahan ini adalah sensor, bagian mekanis, encoder, atau integrasi yang berbeda ke dalam perangkat lunak lain.
Sensor memungkinkan agen AI untuk mengumpulkan data di berbagai format. Ini bisa berupa sinyal visual, suara, suhu, atau elektronik. Bagian mekanis biasanya digunakan untuk AI atau robot yang diwujudkan yang perlu melakukan tindakan dunia nyata seperti mengangkat objek atau berpindah dari satu tempat ke tempat lain. Encoder digunakan untuk mengubah berbagai jenis sinyal menjadi informasi yang dapat diproses oleh LLM. Terakhir, integrasi perangkat lunak memungkinkan kemampuan untuk menjalankan tugas.
Penting juga untuk menyoroti perbedaan penting lainnya antara model AI dan agen AI pada saat ini. Model AI berisi database pra-pelatihan yang menjadi dasar pengetahuan mereka. Apa pun yang bukan bagian dari database tidak akan menghasilkan output. Contoh yang baik dari ini adalah versi awal ChatGPT yang tidak terhubung ke Internet dan memiliki batas waktu pengetahuan. Jika diminta untuk menjawab pertanyaan tentang urusan terkini, itu tidak akan bisa menjawabnya.
Sebaliknya, agen AI, ketika terintegrasi dengan sistem yang relevan, dapat secara mandiri mengumpulkan data baru untuk memecahkan masalah yang tidak mungkin dilakukan berdasarkan database yang ada. Misalnya, Project Mariner Google dapat berinteraksi dengan browser untuk menemukan penawaran terbaik pada jam tangan pintar.
Aspek lain dari agen AI adalah kemampuan untuk menangani tugas-tugas yang kompleks. Agen AI mampu memajukanpenalaran dan dengan demikian dapat memecah tugas yang kompleks menjadi beberapa tugas yang lebih mudah dan kemudian menyelesaikannya satu demi satu. Pemahaman kontekstual tentang masalah dan kemampuan untuk mengetahui cara memecahnya adalah fungsi mendasar dari agen AI.
Contoh yang baik dari ini adalah alat Deep Research Gemini yang baru-baru ini ditambahkan. Pengguna dapat memintanya untuk menjelaskan topik teknis atau khusus. AI kemudian akan membuat rencana penelitian multi-langkah, memecah topik menjadi bagian-bagian yang lebih kecil, menemukan makalah dan artikel penelitian yang relevan tentang topik tersebut, melaksanakan rencana, melakukan penelitian, dan menganalisis data yang dikumpulkan untuk membuat laporan terperinci.
Aplikasi Agen AI
Perusahaan AI telah menggembar-gemborkan agen AI sebagai alat yang dapat digunakan di seluruh industri dan dalam skenario yang berbeda. Ini dapat digunakan sebagai asisten suara untuk perangkat yang dapat melakukan tugas khusus perangkat (seperti mengambil gambar atau memutar musik). Itu dapat ditambahkan ke aplikasi atau perangkat lunak dan melakukan tugas di dalamnya (membeli produk melalui agen berbasis browser). Ini juga dapat ditambahkan ke sistem perusahaan dan dapat mendeteksi penipuan atau menemukan cara untuk mengoptimalkan proses yang berbeda.
Selain itu, agen AI juga dikatakan melakukan tugas transformatif di industri tertentu. Dalam perawatan kesehatan, dapat digunakan untuk diagnosis, rekomendasi pengobatan, dan penemuan obat. Di sektor otomotif, dapat digunakan untuk membuat mobil self-driving. Agen AI juga dikatakan dapat mengemudikan drone di daerah bencana untuk mengumpulkan dan menganalisis data dan menawarkan wawasan yang dapat ditindaklanjuti untuk operasi penyelamatan.
Ini juga memiliki aplikasi di industri manufaktur melalui robot bertenaga AI, di industri game sebagai pengembang game atau sebagai karakter non-bermain (NPC) di dalam game, dan di sektor pendidikan untuk membuat rencana studi yang dipersonalisasi dan untuk menilai kertas ujian dengan cara seperti manusia.
Namun, penting untuk dicatat bahwa sementara perusahaan teknologi memasarkan agen AI sebagai penangkap semua jenis otomatisasi cerdas end-to-end, teknologi saat ini membatasi kasus penggunaannya pada peran berbasis tugas yang sebagian besar spesifik alih-alih alat tujuan umum.
Agen AI pada tahun 2025
Dengan demikian, penting untuk mendasarkan harapan kita dan memahami apa yang dapat kita harapkan secara realistis dari agen AI di tahun ini. Kecil kemungkinan agen AI akan memasuki dunia kerja di salah satu sektor penting seperti manufaktur, mobil, perawatan kesehatan, atau pendidikan.
Namun, tahun ini harus menandai masuknya agen AI dalam elektronik konsumen, aplikasi seluler dan desktop, serta situs web dan platform. Project Mariner Google, misalnya, dapat diintegrasikan dengan Google Chrome dan membantu pengguna dalam melakukan pembelian dan menemukan file dari web pada akhir tahun ini.
OpenAI juga dikabarkan akan meluncurkan agen AI-nya tahun ini yang dapat lebih meningkatkan kemampuan ChatGPT dan memungkinkannya melakukan tindakan tertentu pada perangkat pengguna dan Internet. Alat Penggunaan Komputer Anthropic juga diharapkan dapat membuat rilis global dan membantu pengguna dalam tugas sehari-hari mereka di perangkat.
Akhirnya, kita juga akan melihat pergeseran di mana agen AI dapat meniru penekanan tombol, gerakan mouse, dan klik, dan melakukan lebih banyak hal di perangkat. Misalnya, pada akhir tahun, lebih banyak alat agen seperti agen pengkodean Devin dapat menulis kode end-to-end, mengujinya, menemukan dan memperbaiki gangguan, dan menerapkannya tanpa campur tangan manusia. Tapi, akan sangat optimis untuk memasukkan ini dalam rencana perjalanan 2025.
Di sisi perusahaan, agen AI dapat mengambil peran yang lebih besar dalam menyelesaikan beberapa tugas organisasi seperti memantau data dalam jumlah besar, menyiapkan laporan analitis, dan menawarkan rekomendasi dan koreksi arah. Ini juga dapat digunakan dalam beberapa peran keamanan siber. Khususnya, Meta telah menyatakan bahwa mereka sudah menggunakan AI untuk memastikan pedoman diikuti. YouTube juga menggunakan AI untuk memantau pelanggaran hak cipta.
Namun, kami tidak mengharapkan agen AI untuk memasuki salah satu fungsi kerja penting tahun ini karena teknologi ini sebagian besar belum teruji dan keandalannya akan dipertanyakan. Bisnis, khususnya perusahaan publik atau yang didukung oleh investor besar, umumnya menghindari risiko dan tidak mungkin menyediakan akses ke data sensitif.
Masalah Dengan Agen AI
Dengan AI menjadi tren saat ini di ruang teknologi dan potensi untuk mengganggu sejumlah besar industri, dapat dimengerti mengapa ada begitu banyak kegembiraan tentang agen AI. Namun, di luar kacamata berwarna mawar ada beberapa masalah dengan agen AI yang perlu ditangani sebelum teknologi dapat menyaksikan adopsi skala besar. Di sisi lain, jika tidak dikendalikan, teknologi tersebut dapat menimbulkan beberapa risiko.
Salah satu masalah utama dengan agen AI adalah bias dan diskriminasi yang berasal dari data pelatihan mereka dan dapat menyebabkan hasil diskriminatif. Ini juga menyoroti masalah transparansi lain dalam agen AI. Dengan algoritme dan arsitektur yang kompleks, sebagian besar agen AI adalah sistem yang rumit dan buram di mana sulit untuk memahami bagaimana dan mengapa mereka membuat keputusan tertentu.
Ada masalah keamanan dan privasi juga. Dari perspektif keamanan, agen AI dapat rentan terhadap serangan permusuhan, di mana aktor jahat memanipulasi data input untuk menipu sistem. Selain itu, karena agen AI perlu dihubungkan dengan beberapa sistem dan mengumpulkan data dalam jumlah besar untuk melakukan tugas, mereka juga menimbulkan risiko privasi.
Dengan begitu banyak tantangan, perusahaan AI akan memiliki pekerjaan berat di depan untuk meyakinkan perusahaan dan individu tentang sisi positif teknologi sambil meyakinkan mereka tentang sisi negatifnya. Terlepas dari itu, tidak dapat dipungkiri bahwa agen AI akan menjadi bagian besar dari pengumuman AI pada tahun 2025.