bytedaily - Dilansir dari techcrunch.com, startup chip XCENA berhasil menggalang dana sebesar $135 juta dalam putaran pendanaan Seri B. Pendanaan ini menempatkan valuasi perusahaan pada angka $570 juta, dengan total yang telah dihimpun menjadi $185 juta. XCENA berfokus pada penyelesaian masalah efisiensi dalam infrastruktur kecerdasan buatan (AI), dengan argumen bahwa hambatan terbesar AI saat ini bukanlah pada daya komputasi, melainkan pada memori.
Setiap interaksi dengan model AI seperti ChatGPT melibatkan proses yang kompleks. Permintaan pengguna memicu perpindahan data dari memori, diproses oleh CPU, kemudian dikirim ke GPU untuk komputasi berat, dan kembali lagi. Proses ini berulang untuk setiap kata yang dihasilkan AI, menciptakan inefisiensi yang signifikan karena melibatkan chip yang mahal dan boros daya.
XCENA, yang memiliki kantor di Korea Selatan dan Amerika Serikat, merancang chip inovatif yang menempatkan kapabilitas komputasi lebih dekat dengan DRAM (Dynamic Random-Access Memory), jenis memori cepat yang digunakan untuk menyimpan data yang sedang aktif diproses. Dengan demikian, operasi data rutin dapat ditangani di dekat memori, mengurangi kebutuhan perjalanan data bolak-balik yang mahal antara CPU, GPU, dan memori.
Jika solusi ini berhasil diterapkan dalam skala besar, dampaknya terhadap biaya infrastruktur AI bisa sangat besar. CEO XCENA, Jin Kim, yang merupakan salah satu pendiri startup pada tahun 2022 bersama CTO Dohun Kim dan CPO Harry Juhyun Kim, menyatakan bahwa sementara CPU dan GPU terus berkembang, memori belum mengalami kemajuan signifikan. "XCENA ingin mengubah itu," ujar Kim. Ia menambahkan bahwa kenaikan harga memori baru-baru ini menunjukkan pergeseran menuju arsitektur yang berpusat pada memori dalam infrastruktur AI.
XCENA meyakini bahwa inferensi AI bukan hanya masalah komputasi, tetapi juga masalah penskalaan memori. Chip produk mereka, MX1, terhubung ke CPU melalui CXL (Compute Express Link), yang berfungsi sebagai jalur khusus antara prosesor dan memori. Chip ini memproses data sebelum keluar dari modul memori, membawa komputasi ke data. XCENA mengklaim bahwa tugas yang sebelumnya membutuhkan 10 server kini berpotensi dijalankan hanya dengan satu server.
Kim menjelaskan bahwa sementara GPU unggul dalam perkalian matriks untuk pelatihan model AI, banyak tugas orkestrasi data di sekitarnya, termasuk pra-pemrosesan dan manajemen cache, masih dijalankan oleh CPU. Chip XCENA menangani tugas-tugas ini langsung di dalam modul memori.
Permintaan solusi memori telah melonjak sejak paruh kedua tahun lalu, dan XCENA melihat ini sebagai momentum yang menguntungkan. Perusahaan ini sedang dalam tahap awal pembicaraan dengan beberapa vendor memori global. Pelanggan ideal XCENA adalah perusahaan hyperscale yang menghabiskan puluhan miliar dolar per tahun untuk infrastruktur AI, di mana peningkatan efisiensi memori sekecil apa pun dapat menghasilkan penghematan ratusan juta dolar.
Saat ini, MX1 masih dalam tahap prototipe. Produksi massal chip dijadwalkan akan dimulai di lini produksi Samsung pada akhir tahun 2026.
Sumber asli: Artikel ini disadur dari publikasi techcrunch.com.