Gambar Lee Unkrich, salah satu animator Pixar yang paling terkenal, sebagai siswa kelas tujuh. Dia menatap gambar lokomotif kereta api di layar komputer pertama sekolahnya. Wow, Menurutnya. Namun, beberapa keajaiban hilang ketika Lee mengetahui bahwa gambar itu tidak muncul hanya dengan meminta “gambar kereta api”. Sebaliknya, itu harus dikodekan dan diterjemahkan dengan susah payah — oleh manusia pekerja keras.
Sekarang bayangkan Lee 43 tahun kemudian, tersandung pada DALL-E, kecerdasan buatan yang menghasilkan karya seni orisinal berdasarkan petunjuk yang disediakan manusia yang secara harfiah dapat sesederhana “gambar kereta api”. Saat dia mengetik kata-kata untuk membuat gambar demi gambar, itu Wow kembali. Hanya saja kali ini tidak hilang. “Rasanya seperti keajaiban,” dia kata. “Ketika hasilnya muncul, napas saya terengah-engah dan air mata menggenang di mata saya. Ajaib sekali.”
Mesin kami telah melewati ambang batas. Sepanjang hidup kami, kami telah diyakinkan bahwa komputer tidak mampu menjadi benar-benar kreatif. Namun, tiba-tiba, jutaan orang sekarang menggunakan generasi baru AI untuk menghasilkan gambar yang menakjubkan dan belum pernah dilihat sebelumnya. Sebagian besar pengguna ini bukan, seperti Lee Unkrich, seniman profesional, dan itulah intinya: Mereka tidak harus seperti itu. Tidak semua orang bisa menulis, mengarahkan, dan mengedit seperti pemenang Oscar Cerita Mainan 3 atau Kelapatapi semua orang Bisa luncurkan generator gambar AI dan ketik ide. Apa yang muncul di layar sangat mencengangkan dalam realisme dan kedalaman detailnya. Jadi tanggapan common: Wow. Di empat layanan saja—Midjourney, Secure Diffusion, Artbreeder, dan DALL-E—manusia yang bekerja dengan AI sekarang membuat lebih dari 20 juta gambar setiap hari. Dengan kuas di tangan, kecerdasan buatan telah menjadi mesin yang luar biasa.
Karena AI yang menghasilkan kejutan ini telah mempelajari seni mereka dari miliaran gambar yang dibuat oleh manusia, hasilnya berkisar seperti apa yang kita harapkan dari gambar itu. Tetapi karena mereka adalah AI alien, yang pada dasarnya misterius bahkan bagi penciptanya, mereka merestrukturisasi gambar baru dengan cara yang tidak terpikirkan oleh manusia, mengisi element yang kebanyakan dari kita tidak memiliki seni untuk dibayangkan, apalagi keterampilan untuk dieksekusi. Mereka juga dapat diinstruksikan untuk menghasilkan lebih banyak variasi dari sesuatu yang kita sukai, dengan gaya apa pun yang kita inginkan—dalam hitungan detik. Ini, pada akhirnya, adalah keunggulan mereka yang paling kuat: Mereka dapat membuat hal-hal baru yang dapat dihubungkan dan dipahami tetapi, pada saat yang sama, sama sekali tidak terduga.
Begitu tidak terduganya gambar-gambar baru yang dihasilkan AI ini, sehingga—dalam kekaguman yang hening segera mengikuti Wow—pemikiran lain muncul pada hampir semua orang yang pernah bertemu mereka: Seni buatan manusia sekarang harus berakhir. Siapa yang dapat bersaing dengan kecepatan, murahnya, skala, dan, ya, kreativitas liar dari mesin ini? Apakah seni adalah satu lagi pengejaran manusia yang harus kita serahkan pada robotic? Dan pertanyaan jelas berikutnya: Jika komputer bisa menjadi kreatif, apa lagi yang bisa mereka lakukan yang kami diberitahu bahwa mereka tidak bisa?
Saya telah menghabiskan enam bulan terakhir menggunakan AI untuk membuat ribuan gambar yang mencolok, sering kehilangan tidur malam dalam pencarian tanpa akhir untuk menemukan hanya satu lagi keindahan tersembunyi dalam kode. Dan setelah mewawancarai pencipta, pengguna yang mahir, dan pengadopsi awal lainnya dari generator ini, saya dapat membuat prediksi yang sangat jelas: AI generatif akan mengubah cara kita merancang hampir semua hal. Oh, dan tidak ada satu pun seniman manusia yang akan kehilangan pekerjaan karena teknologi baru ini.
Tidak berlebihan untuk memanggil gambar yang dihasilkan dengan bantuan AI cocreations. Rahasia serius dari kekuatan baru ini adalah bahwa penerapan terbaiknya bukan merupakan hasil dari mengetik dalam satu immediate tetapi dari percakapan yang sangat panjang antara manusia dan mesin. Kemajuan untuk setiap gambar berasal dari banyak, banyak iterasi, bolak-balik, jalan memutar, dan berjam-jam, terkadang berhari-hari, kerja sama tim—semuanya berkat kemajuan pembelajaran mesin selama bertahun-tahun.
Generator gambar AI lahir dari perkawinan dua teknologi terpisah. Salah satunya adalah garis sejarah jaring saraf pembelajaran mendalam yang dapat menghasilkan gambar realistis yang koheren, dan yang lainnya adalah mannequin bahasa alami yang dapat berfungsi sebagai antarmuka ke mesin gambar. Keduanya digabungkan menjadi generator gambar berbasis bahasa. Para peneliti mengorek web untuk semua gambar yang memiliki teks yang berdekatan, seperti keterangan, dan menggunakan miliaran contoh ini untuk menghubungkan bentuk visible dengan kata, dan kata dengan bentuk. Dengan kombinasi baru ini, pengguna manusia dapat memasukkan rangkaian kata—permintaan—yang mendeskripsikan gambar yang mereka cari, dan perintah tersebut akan menghasilkan gambar berdasarkan kata-kata tersebut.
New Replace : [randomize]