Bayangkan pembuat pizza bekerja dengan bola adonan. Dia mungkin menggunakan spatula untuk mengangkat adonan ke atas talenan lalu menggunakan penggilas adonan untuk meratakannya menjadi lingkaran. Mudah, bukan? Tidak jika pembuat pizza ini adalah robot.
Untuk robot, bekerja dengan benda yang dapat berubah bentuk seperti adonan itu rumit karena bentuk adonan bisa berubah dalam banyak hal, yang sulit direpresentasikan dengan persamaan. Plus, membuat bentuk baru dari adonan itu membutuhkan beberapa langkah dan penggunaan alat yang berbeda. Sangat sulit bagi robot untuk mempelajari tugas manipulasi dengan urutan langkah yang panjang — di mana ada banyak pilihan yang mungkin — karena pembelajaran sering terjadi melalui coba-coba.
Para peneliti di MIT , Carnegie Mellon University, dan University of California di San Diego, telah menemukan cara yang lebih baik. Mereka menciptakan kerangka kerja untuk sistem manipulasi robot yang menggunakan proses pembelajaran dua tahap, yang memungkinkan robot melakukan tugas manipulasi adonan yang rumit dalam jangka waktu yang lama. Algoritma "guru" menyelesaikan setiap langkah yang harus diambil robot untuk menyelesaikan tugas. Kemudian, ia melatih model pembelajaran mesin "siswa" yang mempelajari ide-ide abstrak tentang kapan dan bagaimana menjalankan setiap keterampilan yang dibutuhkan selama tugas, seperti menggunakan rolling pin. Dengan pengetahuan ini, sistem beralasan tentang bagaimana menjalankan keterampilan untuk menyelesaikan seluruh tugas.
Para peneliti menunjukkan bahwa metode ini, yang mereka sebut DiffSkill, dapat melakukan tugas manipulasi kompleks dalam simulasi, seperti memotong dan menyebarkan adonan, atau mengumpulkan potongan-potongan adonan dari sekitar talenan, sambil mengungguli metode pembelajaran mesin lainnya.
Di luar pembuatan pizza, metode ini dapat diterapkan dalam pengaturan lain di mana robot perlu memanipulasi objek yang dapat berubah bentuk, seperti robot pengasuh yang memberi makan, memandikan, atau mendandani seseorang yang lanjut usia atau dengan gangguan motorik.
“Metode ini lebih dekat dengan bagaimana kita sebagai manusia merencanakan tindakan kita. Ketika seorang manusia melakukan tugas jangka panjang, kita tidak menuliskan semua detailnya. Kami memiliki perencana tingkat yang lebih tinggi yang secara kasar memberi tahu kami apa tahapannya dan beberapa tujuan perantara yang perlu kami capai di sepanjang jalan, dan kemudian kami menjalankannya, ”kata Yunzhu Li, seorang mahasiswa pascasarjana di Ilmu Komputer dan Kecerdasan Buatan. Laboratory (CSAIL), dan penulis makalah yang menyajikan DiffSkill.
Rekan penulis Li termasuk penulis utama Xingyu Lin, seorang mahasiswa pascasarjana di Carnegie Mellon University (CMU); Zhiao Huang, seorang mahasiswa pascasarjana di University of California di San Diego; Joshua B. Tenenbaum, Profesor Pengembangan Karir Ilmu Kognitif dan Komputasi Paul E. Newton di Departemen Ilmu Otak dan Kognitif di MIT dan anggota CSAIL; David Held, asisten profesor di CMU; dan penulis senior Chuang Gan, seorang ilmuwan peneliti di MIT-IBM Watson AI Lab. Penelitian ini akan dipresentasikan pada Konferensi Internasional tentang Representasi Pembelajaran.
"Guru" dalam kerangka kerja DiffSkill adalah algoritme pengoptimalan lintasan yang dapat menyelesaikan tugas cakrawala pendek, di mana status awal objek dan lokasi target berdekatan. Pengoptimal lintasan bekerja dalam simulator yang memodelkan fisika dunia nyata (dikenal sebagai simulator fisika yang dapat dibedakan, yang menempatkan "Diff" dalam "DiffSkill"). Algoritme "guru" menggunakan informasi dalam simulator untuk mempelajari bagaimana adonan harus bergerak pada setiap tahap, satu per satu, dan kemudian menampilkan lintasan tersebut.
Kemudian jaringan saraf "siswa" belajar meniru tindakan guru. Sebagai input, ia menggunakan dua gambar kamera, satu menunjukkan adonan dalam keadaan saat ini dan yang lain menunjukkan adonan di akhir tugas. Jaringan saraf menghasilkan rencana tingkat tinggi untuk menentukan bagaimana menghubungkan keterampilan yang berbeda untuk mencapai tujuan. Ini kemudian menghasilkan lintasan cakrawala pendek yang spesifik untuk setiap keterampilan dan mengirimkan perintah langsung ke alat.
Para peneliti menggunakan teknik ini untuk bereksperimen dengan tiga tugas manipulasi adonan yang berbeda. Dalam satu tugas, robot menggunakan spatula untuk mengangkat adonan ke talenan kemudian menggunakan rolling pin untuk meratakannya. Di bagian lain, robot menggunakan gripper untuk mengumpulkan adonan dari seluruh meja, meletakkannya di atas spatula, dan memindahkannya ke talenan. Pada tugas ketiga, robot memotong tumpukan adonan menjadi dua menggunakan pisau dan kemudian menggunakan gripper untuk mengangkut setiap bagian ke lokasi yang berbeda.
Sebuah luka di atas sisanya
DiffSkill mampu mengungguli teknik populer yang mengandalkan pembelajaran penguatan, di mana robot mempelajari tugas melalui coba-coba. Faktanya, DiffSkill adalah satu-satunya metode yang berhasil menyelesaikan ketiga tugas manipulasi adonan. Menariknya, para peneliti menemukan bahwa jaringan saraf “siswa” bahkan mampu mengungguli algoritma “guru”, kata Lin.
“Kerangka kerja kami menyediakan cara baru bagi robot untuk memperoleh keterampilan baru. Keterampilan ini kemudian dapat dirangkai untuk menyelesaikan tugas yang lebih kompleks yang berada di luar kemampuan sistem robot sebelumnya, ”kata Lin.
Karena metode mereka berfokus pada pengendalian alat (spatula, pisau, penggulung, dll.), metode ini dapat diterapkan pada robot yang berbeda, tetapi hanya jika mereka menggunakan alat khusus yang ditentukan oleh para peneliti. Kedepannya, mereka berencana untuk mengintegrasikan bentuk alat ke dalam penalaran jaringan “mahasiswa” sehingga dapat diterapkan pada peralatan lain.
Para peneliti bermaksud untuk meningkatkan kinerja DiffSkill dengan menggunakan data 3D sebagai input, bukan gambar yang sulit dipindahkan dari simulasi ke dunia nyata. Mereka juga ingin membuat proses perencanaan jaringan saraf lebih efisien dan mengumpulkan data pelatihan yang lebih beragam untuk meningkatkan kemampuan DiffSkill untuk menggeneralisasi ke situasi baru. Dalam jangka panjang, mereka berharap dapat menerapkan DiffSkill ke tugas yang lebih beragam, termasuk manipulasi kain.
Komentar
Posting Komentar