Pembacaan Dokumen
Pembacaan Dokumen
URL: /ingest/baca
Tujuan
Setelah seluruh dokumen wajib terkumpul lengkap (lihat halaman Pengumpulan Dokumen), AI menjalankan proses pembacaan — mengubah berkas mentah menjadi teks dan struktur yang dapat dimasukkan ke basis data AI untuk evaluasi tahap berikutnya.
Cara Kerja
- AI membaca tiap dokumen menggunakan teknik parsing — mengenali bab, subbab, paragraf, tabel, dan elemen struktural lain di dalam dokumen.
- Hasil pembacaan dikonversi ke format Markdown (
.md) yang sudah terstruktur, kemudian disimpan di media penyimpanan instansi pembina/penyelenggara. Hasil inilah yang nantinya menjadi sumber bukti pada saat evaluasi. - Setiap dokumen mendapat skor parsing yang menunjukkan seberapa sempurna AI dapat membacanya.
Halaman ini bersifat pasif — proses berjalan sendiri di belakang layar, halaman hanya menampilkan progres dan hasilnya.
Skor Parsing per Dokumen
Tabel di halaman ini menampilkan tiap dokumen dengan skor parsing-nya. Beberapa faktor yang memengaruhi skor:
| Faktor | Pengaruh terhadap Skor |
|---|---|
| Dokumen PDF dengan lapisan teks (bukan gambar) | Skor tinggi |
| Dokumen merupakan hasil scan gambar | Skor buruk — AI tidak dapat membaca isi |
| Struktur bab/subbab terdeteksi rapi | Skor tinggi |
| Banyak halaman tanpa teks, atau tabel rusak | Skor turun |
| Format & ukuran sesuai ketentuan piloting (PDF, ≤ 2.5 MB) | Skor stabil |
Ketentuan format mengikuti pedoman pada halaman Daftar Dokumen Wajib: berkas wajib PDF (bukan hasil scan gambar) dengan ukuran maksimal 2,5 MB per file.
Rekomendasi
Setiap dokumen yang mendapat skor parsing buruk akan dilengkapi rekomendasi tindakan. Yang paling sering muncul:
- Kumpulkan ulang dokumen dalam format PDF dengan lapisan teks (bukan hasil scan).
- Pisahkan dokumen yang melebihi batas ukuran menjadi beberapa berkas.
- Periksa apakah PDF terkunci atau terenkripsi.
Setelah berkas pengganti tersedia di sumber data, proses pembacaan akan otomatis diulang — operator tidak perlu memicu apa pun dari halaman ini.
Skor Total & Status Kelayakan Lanjut
Selain skor per dokumen, halaman ini menampilkan skor total parsing untuk keseluruhan dokumen instansi. Skor total inilah yang menjadi penentu apakah proses dapat berlanjut:
- Skor mencukupi → proses dapat lanjut ke tahap Penyimpanan, kemudian evaluasi.
- Skor kurang → instansi diminta memperbaiki dokumen yang bermasalah terlebih dulu.
Status ini diperbarui secara berkala selama proses pembacaan berlangsung.
Bila Dokumen Belum Lengkap
Apabila kelengkapan dokumen di halaman Pengumpulan Dokumen belum terpenuhi, proses pembacaan menunggu sampai data lengkap. Halaman ini akan menampilkan pesan singkat beserta tautan kembali ke halaman pengumpulan.