Produk

Mengapa dokter Indonesia membutuhkan AI scribe yang memahami bahasa mereka

Gabriel Antony Xaviour|18 Mar 2026|5 menit baca

Masuklah ke klinik mana pun di Jakarta, Surabaya, atau Bandung dan dengarkan. Dokter bertanya kepada pasien apa keluhannya dalam Bahasa Indonesia. Pasien menggambarkan nyeri dada menggunakan campuran kata Bahasa Indonesia dan istilah medis Inggris yang mereka temukan di Google. Dokter merespons dengan diagnosis diselingi nama obat dalam bahasa Inggris, instruksi dosis dalam Bahasa Indonesia, dan jadwal kontrol yang berpindah antara kedua bahasa dalam satu kalimat. Inilah cara praktik kedokteran Indonesia sebenarnya terdengar. Dan tidak satu pun produk medical scribe global yang mampu menanganinya.

Masalah campur kode yang tidak pernah dibicarakan

Ketika dokter Indonesia berbicara dengan pasien, mereka tidak memilih satu bahasa dan bertahan dengannya. Mereka melakukan code-mixing — menjalin Bahasa Indonesia, Jawa, atau Sunda dengan terminologi medis Inggris dalam satu tarikan napas. Seorang dokter jantung di Jakarta mungkin berkata: "Bapak ada mild hypertension, jadi kita mulai Amlodipine 5mg ya, diminum setiap pagi sesudah makan." Itu struktur Bahasa Indonesia, diagnosis Inggris, nama obat Inggris, dan instruksi Bahasa Indonesia — semua dalam satu kalimat. OpenAI Whisper dan Google Speech-to-Text memperlakukan ini sebagai aliran satu bahasa. Mereka memilih satu model bahasa dan memaksa seluruh ucapan melewatinya. Hasilnya adalah terminologi medis yang kacau, informasi dosis yang hilang, dan catatan klinis yang tidak akan dipercaya dokter mana pun.

Mengapa speech-to-text Barat gagal untuk konsultasi Indonesia

Ketidakcocokan aksen: Model yang dilatih dengan bahasa Inggris Amerika dan Inggris secara konsisten salah mengenali pengucapan nama obat oleh dokter Indonesia. Metformin menjadi "met for men." Atorvastatin menjadi derau yang tidak bisa dikenali.
Tidak ada dukungan code-switching: Deteksi bahasa Whisper memilih satu bahasa per segmen. Ketika dokter beralih dari Bahasa Indonesia ke Inggris untuk nama obat dan kembali ke Bahasa Indonesia untuk instruksi, model tersebut menghilangkan bahasa Inggris atau menghilangkan Bahasa Indonesianya.
Kesenjangan kosakata medis: Model STT generik tidak memiliki pelatihan tentang nama merek farmasi Indonesia (Sanmol, Bodrex, Promag), terminologi penyakit regional, atau cara spesifik dokter Indonesia menyingkat istilah klinis.
Transkripsi tanpa konteks: Tanpa memahami bahwa percakapan bersifat medis, model-model ini tidak dapat membedakan antara "gula" (makanan) dan "gula" (diabetes, seperti yang biasa disebut pasien di seluruh Indonesia).

Apa yang dipecahkan oleh pendekatan Deepgram

Deepgram membangun mesin speech-to-text yang dirancang untuk menangani ucapan multibahasa dengan presisi tinggi. Tidak seperti dukungan multibahasa yang ditempel belakangan, Deepgram memperlakukan campur kode sebagai tipe input kelas satu. Mesinnya dilatih pada data ucapan nyata dari berbagai domain di mana terminologi teknis Inggris muncul di dalam kerangka bahasa lokal. Ketika kami membangun Larinova di atas Deepgram, kami menambahkan lapisan kosakata medis. Ini berarti mesin STT tahu bahwa ketika dokter berbahasa Indonesia mengucapkan kata yang terdengar seperti Inggris, itu kemungkinan besar nama obat, diagnosis, atau prosedur — dan harus ditranskripsikan dengan presisi klinis, bukan dipaksa melalui model fonetik Bahasa Indonesia.

Kami menjalankan konsultasi yang sama melalui tiga mesin

Selama pengujian awal, kami merekam konsultasi 6 menit antara seorang dokter jantung di Menteng dan pasien berusia 54 tahun dengan dugaan hipertensi. Percakapan tersebut kira-kira 60% Bahasa Indonesia, 40% Inggris, dengan nama obat dan tanda vital dalam bahasa Inggris. Kami menjalankan audio yang sama melalui OpenAI Whisper, Google Cloud Speech-to-Text, dan Deepgram. Whisper mentranskripsikan "Amlodipine" sebagai "am lo di pine" dan melewatkan dosis sepenuhnya. Google STT menangkap segmen Inggris dengan cukup baik tetapi menghilangkan sebagian besar jaringan konektif Bahasa Indonesia antara istilah klinis, menghasilkan transkrip yang terlihat seperti daftar kata kunci. Deepgram menghasilkan transkrip yang koheren dan mudah dibaca di mana struktur kalimat Bahasa Indonesia terjaga dan istilah medis Inggris teridentifikasi dan dieja dengan benar. Perbedaannya tidak halus. Satu output dapat digunakan untuk pembuatan catatan SOAP. Dua lainnya tidak.

Kesenjangan ini bukan tentang persentase akurasi pada benchmark. Ini tentang apakah dokter melihat transkrip dan berkata "ya, itu yang saya katakan" atau membuangnya dan menulis catatan dengan tangan.

Apa artinya ini bagi dokter di lapangan

Rata-rata dokter Indonesia melihat 30-50 pasien per hari. Banyak yang melihat lebih. Dokumentasi memakan waktu 15-20 menit per pasien jika dilakukan secara manual. Itu berjam-jam menulis setelah klinik tutup — atau lebih buruk, catatan yang tidak pernah ditulis sama sekali. Ketika transkripsi berfungsi dalam bahasa yang benar-benar digunakan dokter, dokumentasi berhenti menjadi hambatan. Anda berbicara dengan pasien persis seperti biasa. Larinova mendengarkan, memahami ucapan campur kode, mengekstrak informasi klinis, dan menghasilkan catatan SOAP terstruktur. Tidak perlu perubahan perilaku. Tidak perlu bicara pelan-pelan. Tidak perlu beralih ke bahasa Inggris demi AI.

Tip

Larinova saat ini mendukung konsultasi campur kode Bahasa Indonesia+Inggris. Dukungan untuk Jawa+Inggris dan Sunda+Inggris akan diluncurkan dalam dua kuartal ke depan.

Mengapa dokter Indonesia membutuhkan AI scribe yang memahami bahasa mereka

Masalah campur kode yang tidak pernah dibicarakan

Mengapa speech-to-text Barat gagal untuk konsultasi Indonesia

Apa yang dipecahkan oleh pendekatan Deepgram

Kami menjalankan konsultasi yang sama melalui tiga mesin

Apa artinya ini bagi dokter di lapangan

More from Larinova

Why Indian doctors need an AI scribe that speaks their language

SOAP notes in 30 seconds: how Larinova generates clinical documentation