AI untuk KYC dan Pemrosesan Dokumen: Cara Fintech Asia Tenggara Membangun Sistem Onboarding di 2026
Bagaimana fintech di SEA menggunakan AI untuk KYC, OCR, dan verifikasi dokumen tahun 2026, mulai dari pembacaan KTP Indonesia hingga CCCD Vietnam.
AI untuk KYC dan Pemrosesan Dokumen: Cara Fintech Asia Tenggara Membangun Sistem Onboarding di 2026
Sebuah aplikasi pinjaman di Manila yang saya tinjau bulan lalu kehilangan 38% penggunanya tepat di langkah verifikasi PhilSys ID (KTP Filipina). Masalahnya sepele tapi fatal: warga Filipina memotret kartu mereka di bawah lampu dapur yang remang-remang, ditolak oleh sistem OCR generik, lalu mereka langsung menutup aplikasi. Tim tersebut telah menghabiskan 80.000 USD untuk vendor KYC 'global' namun mendapatkan tingkat penolakan yang secara perlahan mematikan pertumbuhan mereka.
Inilah masalah utama onboarding fintech di Asia Tenggara (SEA) tahun 2026. Regulator di Indonesia, Filipina, dan Vietnam telah memperketat aturan KYC di saat yang sama ketika ekspektasi pengguna menurun (kebanyakan pengguna akan membatalkan proses jika butuh waktu lebih dari tiga menit). Cara tim menangani kedua tantangan ini adalah dengan menggabungkan AI pemrosesan dokumen, verifikasi biometrik, dan model bahasa kecil untuk bantuan pelanggan. Berikut adalah apa yang sebenarnya digunakan oleh sebagian besar tim di wilayah ini.
Langkah OCR yang Diam-diam Mematikan Funnel Onboarding Anda
Titik awal bagi fintech SEA mana pun adalah membaca kartu identitas nasional. Di Indonesia itu adalah KTP, di Filipina itu PhilSys ID atau UMID, di Vietnam itu CCCD, dan di Thailand adalah kartu identitas nasional Thai. API OCR generik sering kali kesulitan menangani dokumen-dokumen ini. Font KTP, permukaan kartu yang timbul (embossed) di bawah pencahayaan buruk, dan tanda diakritik Vietnam akan membuat solusi Barat gagal lebih sering daripada yang diperkirakan.
Di sinilah pemain regional menang. GLAIR di Indonesia telah membangun produknya secara khusus untuk membaca KTP, NPWP, KK, STNK, dan BPKB. Pencocokan wajah dan pengecekan keaslian (active liveness) mereka dioptimalkan untuk warna kulit dan kondisi pencahayaan orang Indonesia. Mereka bahkan menawarkan pemasangan di server lokal (on-premise) bagi bank yang harus menjaga data tetap di dalam negeri sesuai Undang-Undang Perlindungan Data Pribadi (UU PDP). Perusahaan multifinance dan bank digital di Jakarta cenderung memilih GLAIR atau Privy dibanding alternatif Barat yang umum.
Untuk Vietnam, paket eKYC dari FPT.AI mencakup pembacaan CCCD dan pencocokan dengan data Kementerian Keamanan Publik. Bank-bank Vietnam yang beroperasi di bawah panduan SBV menggunakan integrasi semacam ini karena terhubung langsung ke basis data pemerintah.
Harga untuk paket KYC tingkat korporat ini biasanya disesuaikan. Perkirakan biaya antara 0,10 hingga 0,30 USD per verifikasi (sekitar Rp1.600 - Rp4.800). Bagi fintech dengan 50.000 pengguna yang melakukan dua verifikasi per pengguna per tahun, biayanya sekitar 10.000 hingga 30.000 USD setahun. Tidak murah, tapi jauh lebih murah dibanding kerugian akibat penipuan chargeback.
Mengapa Fintech di Bandung Mulai Berhenti Membayar Tarif OpenAI
Setelah pengguna terdaftar, penggunaan AI berikutnya adalah bantuan di dalam aplikasi dan penilaian risiko. Tim yang perlu menangani chat Bahasa Indonesia, Thai, atau Vietnam secara akurat kini semakin banyak yang melewati OpenAI dan menggunakan alternatif regional.
SEA-LION, keluarga LLM sumber terbuka dari AI Singapore, dibangun kembali pada 2025 dengan dukungan multimodal dan jendela konteks 256K. Model ini menangani Bahasa Indonesia, Thai, Vietnam, Tagalog, Burma, Khmer, dan Lao secara asli. Karena bobot modelnya terbuka, fintech di Vietnam dan Indonesia dapat melakukan self-host dan menjaga data pelanggan tetap di infrastruktur lokal. Hal ini sangat penting bagi regulator yang semakin menuntut kedaulatan data lokal.
Typhoon dari SCB 10X adalah padanannya untuk bahasa Thai. Model ini telah dilatih secara intensif pada teks hukum และ keuangan Thailand. Bank-bank Thailand yang menjalankan chatbot internal cenderung melakukan fine-tuning pada Typhoon daripada menerjemahkan model yang diutamakan untuk bahasa Inggris.
Bagi tim yang belum siap melakukan self-host, langkah praktisnya adalah memanggil Claude atau GPT untuk alur bahasa Inggris saja, dan memasukkan SEA-LION atau Typhoon untuk jalur bahasa lokal. Perbedaan biayanya nyata: menjalankan SEA-LION sendiri pada satu kartu grafis A100 memakan biaya sekitar 1.500 hingga 2.500 USD per bulan, jauh di bawah pengeluaran API per-token pada skala bisnis yang lumayan besar.
Biaya Tersembunyi yang Jarang Masuk dalam Anggaran
Satu hal lain yang jarang dibicarakan sampai tim benar-benar masuk ke tahap produksi: evaluasi AI. Jika chatbot akan menangani percakapan pelanggan Indonesia, seseorang harus memberi label pada ribuan contoh untuk mengujinya.
Datasaur, yang didirikan oleh insinyur keturunan Indonesia-Amerika, sangat fokus pada bahasa-bahasa SEA yang minim sumber data (low-resource). Tim menggunakannya untuk melabeli dataset di Bahasa Indonesia, menyalin audio Vietnam, dan menjalankan evaluasi LLM pada output bahasa Thai. Dibandingkan dengan Scale AI atau Labelbox, Datasaur menyediakan alur kerja bahasa SEA secara langsung. Harganya mulai sekitar 417 USD/bulan (sekitar Rp6,7 juta) untuk paket Starter.
Realitas Biaya Operasional per Tahun
Sebuah fintech Indonesia dengan 50.000 pengguna di tahun 2026 mungkin menghabiskan biaya sekitar:
- Vendor KYC (GLAIR atau serupa): 20.000 USD per tahun
- Inferensi LLM (campuran SEA-LION self-hosted plus Claude untuk tugas premium): 30.000 USD per tahun
- Pelabelan dan evaluasi (Datasaur paket Starter hingga Growth): 5.000 hingga 24.000 USD per tahun
- Waktu engineer untuk integrasi dan pemeliharaan: 1 backend engineer dengan gaji 30.000 hingga 45.000 USD per tahun (di Bandung atau HCMC)
Itu berarti total sekitar 100.000 USD per tahun (sekitar Rp1,6 miliar) untuk sistem AI lengkap yang menangani pendaftaran, dukungan, dan pemeriksaan kualitas. Bagi fintech dengan pendapatan tahunan 2 juta USD, itu adalah 5% dari pendapatan. Angka yang tinggi namun masuk akal jika berhasil memangkas kerugian penipuan.
Dua Hal yang Sering Membuat Founder Boros
Ada dua area di mana fintech SEA cenderung membuang terlalu banyak uang. Pertama: menggunakan platform visi komputer korporat global untuk OCR dokumen sederhana — GLAIR atau Privy akan lebih murah daripada Microsoft Form Recognizer untuk dokumen Indonesia. Kedua: melakukan pelabelan pada platform seperti Mechanical Turk untuk data Bahasa Indonesia yang kualitasnya tidak dapat diandalkan; lebih baik bayar Datasaur atau gunakan agensi lokal di Surabaya.
Pola yang berhasil di 2026 adalah: gunakan vendor KYC regional untuk dokumen, LLM SEA terbuka untuk chat bahasa lokal, LLM global untuk bahasa Inggris dan penalaran kompleks, serta satu alat pelabelan yang bisa Anda gunakan untuk keduanya. Kebanyakan tim yang mencoba membangun semuanya di atas OpenAI akhirnya kembali ke pola ini ketika biaya melonjak melewati 50.000 USD sebulan.
Bagi pendiri startup SEA yang membangun apa pun yang bersentuhan dengan identitas atau uang, sistem ini mulai menjadi standar utama.