Baca berita dengan sedikit iklan, klik di sini

arsip

Arek Malang, Kecerdasan Mesin, dan Pemrograman Bahasa

Derry Wijaya mendalami natural language processing (NLP) alias cabang kecerdasan buatan (AI) yang mengaitkan bahasa alami manusia dengan komputer.

23 April 2022 | 00.00 WIB

Image of Tempo
Perbesar

Baca berita dengan sedikit iklan, klik di sini

Poin penting

  • Derry Wijaya berfokus pada penelitian terkait bahasa dalam sistem kecerdasan buatan (AI)

  • Mendokumentasikan bahasa-bahasa dari seluruh belahan bumi untuk terdokumentasi di mesin penerjemah

  • Derry menyukai teknologi sejak kecil

“DERRY held the ASEAN scholarship when she joined the College in January 1998. Derry has a sharp and analytical mind and is able to think in a logical and systematic manner. Thus, Derry is quick to grasp concepts and is adept in applying them. In addition, being IT savvy, Derry has developed an outstanding computing program which was extremely useful.”

Baca berita dengan sedikit iklan, klik di sini

Surat rekomendasi guru tentang muridnya itu terasa meyakinkan. Susunan kalimat dalam lima paragrafnya runut, diawali dengan profil si murid, kepribadiannya, sampai menyoal hobi yang spesifik seperti hortikultura. Namun jangan terkecoh. Surat ini rupanya dibikin dengan bantuan komputer yang sudah dibekali program bahasa. Si pembuatnya adalah Derry Tanti Wijaya saat ia masih bersekolah di Temasek Junior College, Singapura, 1999 silam. Derry membuat program khusus itu untuk gurunya, Loo Lai Leng.

Menurut Derry, gurunya yang mengampu mata pelajaran fisika tak lihai di bidang kepenulisan, apalagi dalam bahasa Inggris. Padahal sang guru mesti membuat surat rekomendasi untuk murid-muridnya. Sepercik ide pun terpikirkan oleh Derry. Ia berinisiatif membikin bahasa pemrograman yang memuat pola bahasa, karakter personal, ekstrakurikuler, juga kelebihan seseorang. Variasi itu di-input Derry ke program bahasa yang bisa dipakai gurunya untuk membuat surat rekomendasi yang utuh.

Dengan begitu, si guru tinggal memasukkan poin penilaian di program untuk dijahitkan secara otomatis menjadi kalimat utuh. “Beberapa kalimat, seperti ‘she writes and speaks in a fluent and clear manner’ atau ‘quick to grasp concept’, saya yang menaruhnya di program,” ujar Derry saat mengobrol dengan Tempo via Zoom, Selasa pagi, 19 April lalu. Untuk kenang-kenangan, surat rekomendasi Loo Lai Leng masih disimpan Derry sampai sekarang. “Beberapa bagian sepertinya ditambahkan lagi oleh dia. Guru saya itu memang lucu,” ucapnya, lalu tertawa.

Baca berita dengan sedikit iklan, klik di sini

Derry Wijaya, 18 April 2022. Dok. Pribadi

Program bahasa untuk surat rekomendasi adalah salah satu karya yang dibuat Derry sejak belia. Perempuan kelahiran Malang, 23 Desember 1979, itu menekuni komputer dan bahasa hingga kini menjadi asisten profesor di Departemen Ilmu Komputer Boston University, Amerika Serikat. Sebelum bergabung ke kampusnya sekarang, Derry lulus program doktoral Carniege Mellon University dan melakukan riset pascadoktoralnya di University of Pennsylvania.

Di Boston University, Derry mengajar di kelas saban Selasa dan Kamis serta disibukkan juga oleh jabatannya sebagai Co-Direktur AI & Education Initiative Computer Science (CAS) Boston University, inisiatif penelitian lintas disiplin yang berfokus pada kecerdasan mesin.

Perhatian Derry pada bahasa dan kecerdasan buatan (AI) telah meletup sejak ia menghabiskan masa kecilnya di Malang, Jawa Timur. Salah satu pemantiknya adalah kesukaan orang tuanya membeli gawai terbaru. Bapak dan ibu Derry yang bekerja sebagai dosen akuntansi dan sastra Indonesia di Universitas Negeri Malang memberinya komputer saat remaja. Namun ketika itu Derry lebih sering memakainya untuk nge-game. “Saya tertarik ke komputer karena rasa penasaran dan hobi, sebelum akhirnya tahu bahwa ada sekolah khusus untuk mempelajari itu,” tuturnya.

Kesenangan pada komputer membuat Derry memilih ekstrakurikuler itu saat menempuh sekolah menengah atas. Di situ Derry kian tertarik pada pemrograman komputer karena dianggapnya dapat memproses sesuatu yang sesuai dengan ekspektasi manusia. Di sisi lain, cita-citanya sebagai dokter menguap karena ternyata ia merasa “ngeri” pada pelajaran biologi. Walhasil, saat kuliah, Derry memilih jurusan Teknik Informatika di National University, Singapura. Ia juga meneruskan pendidikan masternya di sana. Baru pada 2010, Derry hijrah ke Amerika Serikat untuk mendalami ilmu bahasa alami dan pemrograman komputer di Carniege Mellon University.

Kini Derry konsisten menelaah mesin penerjemah otomatis seperti Google Translate. Penelitiannya yang berfokus pada cara membuat sistem terjemahan ini juga merangkum lebih banyak bahasa di dunia. Derry menyebutkan, dari sekitar 7.000 bahasa di semesta, yang sudah terdata di Google Translate belum lebih dari 200 bahasa. Ia mencontohkan bahasa daerah dengan jumlah penutur besar di Indonesia, seperti Minang, Madura, dan Manado, belum mengikuti jejak bahasa Jawa dan Sunda yang terekam lebih dulu di Google Translate.

Salah satu penyebabnya adalah minimnya entri data dan sumber tulisan di Internet yang memakai bahasa yang belum terjamah mesin penerjemah. “Jumlah data yang bisa dipakai untuk melatih sistem masih sedikit. Jadi pekerjaan rumahnya adalah bagaimana bahasa yang tidak banyak ‘training data’ dan minim sumber dayanya ini bisa terbaca oleh mesin penerjemah,” kata Derry.

Ada idealisme yang terpancang di hati Derry dalam mendalami ilmu ini. Ia menyebutnya dengan istilah “demokratisasi pengetahuan”. Menurut dia, penggunaan sistem terjemahan penting agar ilmu pengetahuan yang tersedia di dunia ini bisa diakses dan dimanfaatkan oleh semua orang. Derry mencontohkan bagaimana selama ini pengetahuan yang tersedia di mesin pencari didominasi bahasa Inggris. Akibatnya, saat kita berusaha mencari informasi di Internet dengan bahasa (selain Inggris) yang dipahami, mesin pencari kerap tak memberikan jawaban yang dibutuhkan.

Derry Wijaya , dalam ajang Open AI Research event di Boston University, Desember 2018. Dok. Boston University

Begitu juga, misalnya, aplikasi Siri yang dibenamkan dalam semua perangkat iOS-nya Apple. Walau dalam Siri pengguna bisa menerapkan penggunaan bahasa Melayu alih-alih Inggris, hal itu tak serta-merta memudahkan kita untuk mengorek informasi. Derry menjajalnya sendiri di tengah wawancara. “Coba ya, saya tanya, ‘Siri, siapa yang menikah dengan (mantan Presiden Amerika Serikat) Barack Obama?’” Siri ternyata tak bisa menjawabnya. Jawaban Siri baru betul jika ditanya dalam bahasa Inggris.

Derry mengaku kini sedang meneliti sejumlah bahasa, termasuk dari Benua Afrika, seperti bahasa Somali, Swahili, Yoruba, dan Hausa. Datanya ia himpun dari komunitas NaturaL Language Processig (NLP) di Afrika. Di luar Afrika, Derry juga mempelajari bahasa lain, seperti Kazakstan, juga sejumlah bahasa India termasuk Gujarati.

Adapun dari Tanah Air, Derry sedang mendalami bahasa alay yang selama ini kerap dipakai untuk pergaulan sehari-hari. Menurut Derry, bahasa gaul harus mendapat perhatian khusus karena populer sekali dan sering digunakan. Salah satu kata yang kini trendi dipakai adalah “jujurly”, yang berarti “jujur saja”. Diksi itu sudah terbaca di Google Translate, dengan pemaknaan yang pas. “Bahasa Indonesia itu sangat dinamis. Jadi sistem komputer harus beradaptasi dengan itu, untuk menghindari eror,” ucapnya. “Kita harus ingat, kepintaran mesin itu sejauh seperti yang kita ajarkan.”

•••

FOKUS penelitian Derry di bidang pemrograman bahasa tak hanya itu. Pemenang Best Data Researcher 2021 dari Data Science Indonesia Award ini juga pernah mendapat sejumlah dana hibah, baik lewat penelitian AI tentang linguistik dan pengetahuan visual lewat Visual Genome, mesin terjemahan, dukungan untuk sarjana perempuan, maupun evolusi bias rasial dari waktu ke waktu lewat analisis framing ke media massa.

Pada 2018, bersama koleganya di Boston University, ia mendapat dana hibah US$ 1 juta dari US National Science Foundation untuk menganalisis komunikasi publik. Dana itu dimanfaatkan untuk menggarap proyek bahasa yang produknya kini bisa ditengok via situs Openframing.org. Derry menjelaskan, dalam proyek Open Framing ia berkolaborasi dengan peneliti komunikasi dan jurnalisme untuk meneliti sudut pandang media massa dalam pemberitaan atau news framing. Misalnya, dalam isu virus corona yang diliput oleh jurnalis dari berbagai media, ada yang lebih berfokus pada sudut pandang ekonomi, politik, juga kesehatan.

Nah, yang juga diteliti lebih lanjut adalah kasus kekerasan berbasis senjata api (gun violence) di Amerika Serikat yang disebutkan Derry terjadi hampir tiap hari di Amerika. Salah satu yang mencuat dan menjadi perhatian dunia adalah kasus penembakan massal di sebuah sekolah di Parkland, Florida, Amerika Serikat, yang menewaskan 17 orang. Sang pelaku, Nikolaus Cruz, adalah bekas siswa yang dikeluarkan dari sekolah itu.

Catatan kasus kekerasan berbasis senjata api itu direkam di situs Gunviolencearchive.org. Walau sudah menelan banyak nyawa dan menjadi isu panas di Negeri Abang Sam, sampai sekarang belum ada regulasi yang mengatur kepemilikan senjata api. “Kami ingin tahu, kenapa sih seperti ini kondisinya? Bagaimana sudut pandang jurnalis dalam kasus ini, kok sampai sekarang belum ada kesepakatan di level kebijakan untuk mencegah berulangnya kasus?” kata Derry.

Dari penelitian ini diketahui bahwa sepanjang 2016-2018 jurnalis lebih sering mengambil sudut pandang politik saat menuliskan kekerasan berbasis senjata api. Padahal, di sisi lain, perspektif regulasi dan kesehatan mental tak kalah penting dibahas dalam pemberitaan. Dari pembacaan data pula diketahui keberpihakan media kepada partai politik di Amerika; Demokrat ataukah Republik. Setelah menelaah kasus kekerasan dengan senjata api, Derry menyebutkan penelitian berikutnya adalah bingkai media soal perubahan iklim.

Derry menjelaskan, situs Openframing.org tak hanya memberi gambaran contoh riset berbasis data. Situs ini pun menyuguhkan alat untuk menganalisis cara media membingkai berita lewat multibahasa dengan memanfaatkan teknologi AI. “Sistem ini terbuka untuk dipakai banyak orang karena didanai dengan hibah. Bahkan kami juga mengajarkan tahap pemakaiannya disertai data dan contoh. Untuk mengarsipkan artikelnya sendiri kami memakai platform Crimson Hexagon,” ujarnya.

Derry Wijaya (kedua dari kanan) di antara para ilmuwan Boston University. Twitter.com/bucompsci

Data yang dihasilkan Open Framing dapat dimanfaatkan untuk materi pengambil kebijakan. Pemerintah, misalnya, tak hanya mendapat informasi ihwal sudut pandang media, tapi juga “temperatur” di masyarakat dalam suatu fenomena. Walaupun begitu, memang tetap ada tantangan, seperti keterbatasan data, dalam hal ini perihal akses dalam bahasa Melayu atau non-Inggris lain.

Tantangan lain, ujar Derry, adalah kendala fasilitas. Derry membandingkan ketersediaan server di Amerika dengan minimnya fasilitas di negara lain. “Jadi ini tantangan untuk sejumlah negara, karena AI di negara tertentu bisa maju karena ada dukungan besar dari pemerintahnya,” ujar Derry. Ia mengaku respek pada semangat belajar AI yang tinggi dari orang Indonesia. “Masalahnya, apakah pelatihannya sudah cukup? Apakah fasilitas di kampus sudah memadai? Kebanyakan yang saya temui, orang-orang di Indonesia belajar AI secara otodidaktik.”

Penyuka drama Korea ini berharap di masa mendatang orang di berbagai belahan dunia bisa mengakses ilmu yang sama, dari sumber yang sama, dengan memakai bahasa masing-masing. “Kita harus membuat pengetahuan apa pun bisa diakses secara bebas oleh siapa saja,” kata Derry Wijaya.

Image of Tempo
Image of Tempo
Berlangganan Tempo+ untuk membaca cerita lengkapnyaSudah Berlangganan? Masuk di sini
  • Akses edisi mingguan dari Tahun 1971
  • Akses penuh seluruh artikel Tempo+
  • Baca dengan lebih sedikit gangguan iklan
  • Fitur baca cepat di edisi Mingguan
  • Anda Mendukung Independensi Jurnalisme Tempo
Lihat Benefit Lainnya
Image of Tempo

Baca berita dengan sedikit iklan, klik di sini

Image of Tempo
Logo Tempo
Unduh aplikasi Tempo
download tempo from appstoredownload tempo from playstore
Ikuti Media Sosial Kami
© 2024 Tempo - Hak Cipta Dilindungi Hukum
Beranda Harian Mingguan Tempo Plus