bytedaily - Aplikasi dikte berbasis kecerdasan buatan (AI) telah mengalami peningkatan pesat dalam akurasi dan kecepatan, berkat kemajuan dalam model bahasa besar (LLM) dan teknologi ucapan-ke-teks. Kini, aplikasi tersebut tidak hanya mampu menerjemahkan ucapan dengan lebih tepat, tetapi juga mempertahankan konteks untuk format teks yang benar, serta dilengkapi fitur otomatis untuk menghapus kata-kata pengisi, memperbaiki kesalahan, dan menangani tanda baca, sehingga mengurangi kebutuhan penyuntingan.
Berdasarkan pengujian, beberapa aplikasi dikte AI menonjol dalam hal kegunaan dan fitur. Wispr Flow, misalnya, menawarkan kemampuan untuk menambahkan kata dan instruksi kustom, dengan aplikasi native untuk macOS, Windows, dan iOS, serta versi Android yang sedang dikembangkan. Aplikasi ini memungkinkan pengguna memilih gaya transkripsi formal, kasual, atau sangat kasual, sesuai dengan konteks tulisan seperti pesan pribadi, pekerjaan, atau email. Wispr Flow menyediakan kuota transkripsi gratis hingga 2.000 kata per minggu di desktop dan 1.000 kata per bulan di iOS, dengan paket berlangganan mulai dari $15 per bulan untuk transkripsi tanpa batas.
Willow dipasarkan sebagai penghemat waktu bagi mereka yang tidak menyukai mengetik. Selain fitur pengeditan dan pemformatan otomatis, Willow memanfaatkan LLM untuk menghasilkan teks lengkap dari beberapa kata yang didiktekan. Pendekatan yang lebih mengutamakan privasi diterapkan dengan menyimpan semua transkrip secara lokal di perangkat pengguna dan memungkinkan pengguna untuk menolak pelatihan model. Pengguna juga dapat menambahkan kosakata kustom untuk adaptasi terminologi industri atau dialek lokal. Willow menawarkan 2.000 kata per bulan secara gratis di aplikasi desktopnya, dengan paket langganan individu mulai dari $15 per bulan yang mencakup transkripsi tanpa batas dan kemampuan mengingat gaya penulisan pengguna.
Bagi pengguna yang memprioritaskan privasi, Monologue memungkinkan pengunduhan model AI langsung ke perangkat untuk transkripsi, menjaga data tetap offline. Aplikasi ini juga dapat menyesuaikan nada sesuai dengan aplikasi yang digunakan. Monologue menyediakan 1.000 kata per bulan secara gratis, dengan opsi berlangganan $10 per bulan atau $100 per tahun. Perusahaan ini juga memberikan perangkat pintasan fisik bernama Monokey kepada pengguna aktifnya.
Sementara itu, Superwhisper tidak hanya berfungsi sebagai aplikasi dikte, tetapi juga dapat mentranskripsikan file audio atau video. Pengguna dapat memilih dan mengunduh model AI, termasuk model buatan Nvidia, dengan berbagai tingkat kecepatan dan akurasi. Aplikasi ini memungkinkan penulisan prompt kustom untuk mengarahkan hasil transkripsi dan menampilkan transkrip yang diproses maupun yang belum diproses langsung dari keyboard sistem. Fitur dasar suara-ke-teks gratis, dengan 15 menit uji coba fitur Pro seperti terjemahan dan transkripsi. Tingkat berbayar memungkinkan penggunaan kunci API AI sendiri dan koneksi model cloud serta lokal tanpa batas.
Sumber asli: Artikel ini disadur dari publikasi techcrunch.com.