bytedaily
Selasa, 19 Mei 2026 - 05:42 WIB

OpenAI Luncurkan Fitur Kecerdasan Suara Baru di API

Redaksi 08 Mei 2026 10 views
OpenAI Luncurkan Fitur Kecerdasan Suara Baru di API
Ilustrasi visual (Sumber: techcrunch.com)

bytedaily - Dilansir dari techcrunch.com, OpenAI pada Kamis (waktu setempat) mengumumkan peluncuran serangkaian fitur kecerdasan suara baru yang terintegrasi dalam API mereka. Fitur-fitur ini dirancang untuk membantu pengembang menciptakan aplikasi yang mampu berbicara, mentranskripsi, dan menerjemahkan percakapan dengan pengguna secara real-time.

Model suara baru yang diperkenalkan adalah GPT-Realtime-2, yang diklaim mampu menghasilkan simulasi vokal realistis untuk berinteraksi dengan pengguna. Berbeda dari pendahulunya, GPT-Realtime-2 dibangun dengan kemampuan penalaran setara GPT-5, yang dikembangkan untuk menangani permintaan pengguna yang lebih kompleks.

Selain itu, OpenAI juga meluncurkan GPT-Realtime-Translate, sebuah fitur yang menyediakan layanan terjemahan secara langsung dengan kemampuan mengikuti alur percakapan pengguna. Fitur ini mendukung lebih dari 70 bahasa input (bahasa yang dapat dipahami) dan 13 bahasa output (bahasa yang disampaikan kepada lawan bicara).

Kemampuan transkripsi baru, GPT-Realtime-Whisper, juga diperkenalkan. Fitur ini memungkinkan pengguna untuk mengubah ucapan menjadi teks secara langsung saat interaksi berlangsung.

Dalam pernyataannya, OpenAI menyebutkan bahwa model-model baru ini memungkinkan audio real-time beralih dari sekadar respons sederhana menjadi antarmuka suara yang mampu melakukan berbagai tugas, seperti mendengarkan, bernalar, menerjemahkan, mentranskripsi, dan mengambil tindakan seiring berjalannya percakapan.

Pembaruan ini dinilai akan sangat bermanfaat bagi perusahaan yang ingin memperluas kapabilitas layanan pelanggan. OpenAI juga mencatat bahwa fitur-fitur baru ini dapat mendukung berbagai bidang lain, termasuk pendidikan, media, acara, dan platform kreator.

Menyadari potensi penyalahgunaan, OpenAI menyatakan telah membangun sistem pengamanan (guardrails) untuk mencegah fitur-fitur baru ini disalahgunakan untuk pembuatan spam, penipuan, atau bentuk penyalahgunaan daring lainnya. Sistem ini dilengkapi dengan pemicu tertentu yang dapat menghentikan percakapan jika terdeteksi melanggar pedoman konten berbahaya.

Seluruh model suara baru ini tersedia dalam Realtime API OpenAI. GPT-Realtime-Translate dan GPT-Realtime-Whisper dikenakan biaya per menit, sementara GPT-Realtime-2 dikenakan biaya berdasarkan konsumsi token.


Sumber asli: Artikel ini disadur dari publikasi techcrunch.com.