bytedaily - Dilansir dari techcrunch.com, fitur AI Overview terbaru dari Google kembali menuai kritik karena menampilkan kesalahan ejaan yang mendasar, bahkan pada kata-kata sederhana seperti 'Google' itu sendiri. Laporan menunjukkan bahwa AI Google salah menghitung jumlah huruf 'p' dalam kata 'Google', menyebutkan hanya ada dua. Lebih lanjut, AI tersebut juga memberikan definisi keliru dan salah mengeja kata-kata seperti 'jurnalisme' menjadi 'j-o-u-r-n-a-d-i-s-m' serta mengeja nama belakang Presiden AS sebagai 't-r-p-u-m'.
Kesalahan ini muncul di tengah upaya Google untuk menjadikan kecerdasan buatan generatif sebagai inti dari produk mesin pencarinya yang telah berusia 29 tahun. Sebelumnya, fitur AI Overview sempat menampilkan informasi yang salah, seperti mengutip postingan satir dan menyarankan orang untuk memakan batu atau menaruh lem di atas pizza.
Google mengakui adanya tantangan dalam menghitung huruf dalam kata-kata. "Menghitung di dalam kata-kata telah menjadi tantangan yang diketahui untuk LLM, dan kami sedang berupaya memperbaiki masalah spesifik ini," ujar Google dalam pernyataan tertulis kepada TechCrunch.
Kesalahan ejaan mendasar ini menyoroti keterbatasan model bahasa besar (LLM) yang menjadi tulang punggung chatbot dan generator teks. Para ahli menjelaskan bahwa LLM tidak dirancang untuk memahami ejaan seperti manusia. Sebaliknya, model-model ini, yang sering kali didasarkan pada arsitektur transformer, memecah teks menjadi 'token'. Token ini bisa berupa kata utuh, suku kata, atau bahkan huruf, tergantung pada modelnya.
Matthew Guzdial, seorang peneliti AI dan asisten profesor di University of Alberta, menjelaskan kepada TechCrunch bahwa LLM tidak benar-benar 'membaca' teks. "Apa yang terjadi ketika Anda memasukkan sebuah prompt adalah itu diterjemahkan menjadi sebuah encoding," katanya. "Ketika melihat kata 'the,' ia memiliki satu encoding untuk makna 'the,' tetapi ia tidak mengetahui tentang 'T,' 'H,' 'E.'"
Arsitektur berbasis token ini dianggap membatasi kemampuan LLM, dan para peneliti tidak terlalu optimis mengenai solusi untuk masalah ejaan. Mereka berpendapat bahwa mendefinisikan apa sebenarnya 'kata' bagi model bahasa adalah pertanyaan yang sulit dijawab, bahkan jika para ahli manusia sepakat mengenai definisinya.
Sumber asli: Artikel ini disadur dari publikasi techcrunch.com.