Penyambungan Sumber Data

Penyambungan Sumber Data

URL: /ingest/sambung

Tujuan

Menghubungkan SAKIPAI ke sumber data dokumen milik instansi peserta, sehingga sistem dapat membaca berkas SAKIP langsung dari tempat penyimpanan instansi tanpa perlu diunggah satu per satu.


Gambaran Besar Pipeline Penyambungan

Sistem AI SAKIPAI hanya membaca dokumen dari satu gateway tunggal, yaitu kambing.gov3.id — platform federated storage yang dikelola tim penyelenggara. Seluruh sumber dokumen instansi peserta diorkestrasi melalui gateway ini, sehingga sistem AI tidak perlu berurusan langsung dengan beragam sistem penyimpanan instansi.

kambing.gov3.id mampu memasang external storage dari berbagai sumber lewat protokol standar:

Protokol Sifat Sambungan Cocok untuk
WebDAV Permanen Instansi dengan Owncloud / Nextcloud
SFTP Permanen Instansi dengan server Linux
S3-compatible Permanen Instansi dengan object storage (MinIO, Wasabi, AWS S3, dll.)
Google Drive One-way copy, ada masa expire Instansi tanpa salah satu di atas (jalur darurat, tidak dianjurkan)

Setelah external storage terpasang, kambing.gov3.id berperan sebagai jembatan dua arah antara jaringan federated storage instansi peserta dan pipeline AI — sesuai kebutuhan proses evaluasi SAKIP.

Sambungan Permanen vs Sementara

  • WebDAV, SFTP, dan S3-compatible menghasilkan sambungan permanen. Folder instansi tetap tersinkron sepanjang siklus evaluasi; pembaruan dokumen otomatis terdeteksi pada scan berkala.
  • Google Drive berbeda — sambungannya bersifat one-way copy dengan masa expire. Token OAuth Google perlu di-maintain berkala. Selain itu terdapat isu kedaulatan data karena dokumen melewati layanan cloud pihak ketiga. Jalur ini tidak dianjurkan kecuali tidak ada opsi lain.

Dua Cara Memuat Dokumen Setelah Folder Tersambung

Bila folder external storage instansi sudah tersambung ke kambing.gov3.id, terdapat dua cara untuk memasukkan dokumen SAKIP ke dalamnya:

  • Upload langsung ke folder yang sudah tersambung — cara konvensional. Instansi menaruh berkas PDF/DOCX/dst di folder tersambung lewat Owncloud/Nextcloud, klien SFTP, atau Google Drive. Sistem otomatis mendeteksi pada scan berkala.
  • Memberikan daftar tautan di berkas link.md — alternatif yang lebih ringan bila dokumen sudah tersedia online di portal resmi instansi (mis. bappeda.{instansi}.go.id, jdih.{instansi}.go.id, ppid.{instansi}.go.id, atau cloud publik). Instansi cukup menulis satu berkas teks berisi daftar URL dokumen; sistem akan mengunduh dan menyimpannya ke folder tersambung.

Detail cara menulis berkas link.md: lihat Daftar Tautan via link.md.

Kedua cara bisa dipakai bersamaan di folder yang sama. Tidak konflik. Dokumen hasil upload langsung dan dokumen hasil unduh dari link.md masuk pipeline yang sama (kumpul → baca → simpan → telusur).

Bagi Instansi Tanpa Storage Sendiri

Bila instansi tidak memiliki Owncloud/Nextcloud, server Linux, maupun object storage — namun bersedia melakukan share folder Google Drive ke akun khusus penyelenggara — tim penyelenggara dapat memfasilitasi akun sementara di kambing.gov3.id semata-mata untuk loading awal dokumen SAKIP.

Setelah dokumen masuk, scan terjadwal dijalankan dengan interval sekitar sebulan sekali — jauh lebih jarang dibanding WebDAV/SFTP yang scan ~1 jam, karena copy dan monitoring perubahan via API Google Drive bersifat berat secara komputasi. Akun sementara ini tidak permanen: masa berlakunya hanya selama siklus evaluasi.


Tiga Cara Penyambungan untuk Instansi Peserta

Dari keempat protokol yang didukung gateway, SAKIPAI menyiapkan tiga jalur dengan panduan lengkap untuk instansi peserta:

1. Federated Storage (WebDAV)

Untuk instansi yang sudah memiliki platform berbasis DAV seperti Owncloud atau Nextcloud.

  • Koneksi dipertahankan secara berkelanjutan.
  • Pembaruan dokumen di sumber langsung terlihat oleh sistem.
  • Mode yang paling ideal — dokumen tetap berada di lingkungan instansi.

Detail & cara share folder ke federated storage

2. SFTP

Untuk instansi yang memiliki server Linux dengan akses SSH.

  • Koneksi dipertahankan, sistem mengambil dokumen sesuai jadwal.
  • Cocok bila dokumen disimpan di file server internal instansi.

Detail & cara setup SFTP di server Linux

3. Temporary Cloud Storage (Tempat penyimpanan berkas sementara. Contoh: Google Drive)

Untuk instansi yang belum memiliki server sendiri.

Catatan penting. Koneksi ke Temporary Cloud Storage hanya dilakukan satu kali untuk menyalin dokumen ke server instansi pembina/penyelenggara. Setelah dokumen tercopy, koneksi tidak dipertahankan.

Oleh karena itu, instansi wajib memastikan memiliki sumber data lokal yang permanen. Mengandalkan cloud storage pihak ketiga seperti Google Drive berisiko tinggi: koneksi sering terputus, masa berlaku akses terbatas, dan protokol penyambungan dapat berubah sewaktu-waktu. Selain menimbulkan masalah teknis, hal ini juga berdampak pada kedaulatan data karena dokumen penting tidak sepenuhnya berada dalam kendali instansi.

Detail & cara share folder Google Drive


Setelah Sumber Tersambung

Halaman ini akan menampilkan tabel dokumen yang ditemukan di sumber data — terbatas pada berkas dengan ekstensi:

Berkas dengan ekstensi lain tidak akan diproses oleh pipeline.


Syarat Kelengkapan Data

Daftar dokumen yang wajib tersedia di sumber data dapat dibaca di halaman Daftar Dokumen Wajib. Selama dokumen wajib belum lengkap, evaluasi belum dapat berjalan sampai tahap akhir.


Setelah Penyambungan

Begitu sumber data tersambung dan dokumen terdeteksi, proses di belakang layar berjalan otomatis — pengambilan, pembacaan, lalu pengindeksan. Status setiap dokumen dapat dipantau di halaman Pengumpulan.