Akhir minggu lalu, Ilmuwan riset Google Fei Xia duduk di tengah dapur terbuka yang terang dan mengetik perintah ke laptop computer yang terhubung ke robotic beroda satu tangan yang menyerupai lampu lantai besar. “Aku lapar,” tulisnya. Robotic segera meluncur ke meja terdekat, dengan hati-hati mengambil sekantong keripik multigrain dengan penjepit plastik besar, dan berputar ke arah Xia untuk menawarkan makanan ringan.
Hal yang paling mengesankan tentang demonstrasi itu, yang diadakan di lab robotika Google di Mountain View, California, adalah tidak ada pembuat kode manusia yang memprogram robotic untuk memahami apa yang harus dilakukan sebagai tanggapan atas perintah Xia. Perangkat lunak kontrolnya telah mempelajari cara menerjemahkan frasa yang diucapkan menjadi urutan tindakan fisik menggunakan jutaan halaman teks yang diambil dari net.
Itu berarti seseorang tidak harus menggunakan kata-kata khusus yang disetujui sebelumnya untuk mengeluarkan perintah, seperti yang diperlukan dengan asisten digital seperti Alexa atau Siri. Beri tahu robotic “Saya kering”, dan robotic itu akan mencoba mencarikan Anda sesuatu untuk diminum; katakan “Ups, saya baru saja menumpahkan minuman saya,” dan itu harus kembali dengan spons.
“Untuk menghadapi keragaman dunia nyata, robotic harus mampu beradaptasi dan belajar dari pengalaman mereka,” kata Karol Hausman, peneliti senior di Google, selama demo, yang juga menyertakan robotic yang membawa spons untuk membersihkan tumpahan. Untuk berinteraksi dengan manusia, mesin harus belajar memahami bagaimana kata-kata dapat disatukan dalam banyak cara untuk menghasilkan makna yang berbeda. “Terserah robotic untuk memahami semua seluk-beluk kecil dan seluk-beluk bahasa,” kata Hausman.
Demo Google adalah langkah menuju tujuan lama untuk menciptakan robotic yang mampu berinteraksi dengan manusia di lingkungan yang kompleks. Dalam beberapa tahun terakhir, para peneliti telah menemukan bahwa memasukkan sejumlah besar teks yang diambil dari buku atau net ke dalam mannequin pembelajaran mesin yang besar dapat menghasilkan program dengan keterampilan bahasa yang mengesankan, termasuk pembuat teks OpenAI GPT-3. Dengan mencerna banyak bentuk tulisan on-line, perangkat lunak dapat memperoleh kemampuan untuk meringkas atau menjawab pertanyaan tentang teks, menghasilkan artikel yang koheren tentang subjek tertentu, atau bahkan mengadakan percakapan yang meyakinkan.
Google dan perusahaan Teknologi Besar lainnya memanfaatkan secara luas mannequin bahasa besar ini untuk pencarian dan periklanan. Sejumlah perusahaan menawarkan teknologi melalui cloud API, dan layanan baru bermunculan dengan menerapkan kemampuan bahasa AI untuk tugas-tugas seperti membuat kode atau menulis salinan iklan. Insinyur Google Blake Lemoine baru-baru ini dipecat setelah secara terbuka memperingatkan bahwa chatbot yang didukung oleh teknologi tersebut, yang disebut LaMDA, mungkin hidup. Seorang wakil presiden Google yang tetap bekerja di perusahaan itu menulis Itu Ekonom bahwa mengobrol dengan bot terasa seperti “berbicara dengan sesuatu yang cerdas”.
Terlepas dari langkah-langkah tersebut, program AI masih cenderung menjadi bingung atau memuntahkan omong kosong. Mannequin bahasa yang dilatih dengan teks net juga kurang memahami kebenaran dan sering mereproduksi bias atau bahasa kebencian yang ditemukan dalam information pelatihan mereka, menunjukkan bahwa rekayasa yang cermat mungkin diperlukan untuk memandu robotic secara andal tanpa mengamuk.
Robotic yang didemonstrasikan oleh Hausman ditenagai oleh mannequin bahasa paling kuat yang telah diumumkan Google sejauh ini, yang dikenal sebagai PaLM. Itu mampu melakukan banyak trik, termasuk menjelaskan, dalam bahasa alami, bagaimana sampai pada kesimpulan tertentu saat menjawab pertanyaan. Pendekatan yang sama digunakan untuk menghasilkan urutan langkah-langkah yang akan dijalankan robotic untuk melakukan tugas tertentu.
New Replace : [randomize]