Pendahuluan
Berdasarkan informasi dari beberapa media seperti metrotvnews.com, detik.com, disebutkan bahwa fungsi utama SIREKAP adalah untuk membantuk proses rekapitulasi hasil penghitungan suara yang dilakukan KPU dari tingkat kabupaten/kota hingga nasional. Juga disebutkan bahwa SIREKAP menggunakan teknologi Optical Character Recognition (OCR) dan Optical Mark Recognition (OMR) untuk mendeteksi karakter dan hasil penghitungan dari form C1 plano yang disubmit ke dalam SIREKAP. Sejatinya, SIREKAP merupakan alat bantu penghitungan dengan tujuan untuk menghindari kesalahan manusia dalam memasukkan data. Tapi jagat Netizen Indonesia saat ini ramai menyampaikan permasalahan hasil perhitungan suara SIREKAP akibat keselahan dalam mendeteksi angka suara dari form C1 plano yang di upload. Kok bisa ya??
Cara Kerja OCR dan OMR
Teknologi OCR dan OMR sebenarnya telah lama dikembangkan. Teknologi OCR dan OMR ini juga sudah banyak digunakan untuk mengenali teks pada kuitansi, teks pada gambar dan yang terakhir cukup populer adalah digunakan pada aplikasi E-Tilang. Kedua teknologi ini memiliki cara kerja yang kurang lebih mirip hanya target pengenalan nya yang berbeda. Penjelasannya mungkin bisa dimulai dari cara kerja OCR terlebih dahulu. Berdasarkan artikel dari aws.amazon.com, OCR adalah proses yang mengubah sebuah gambar dari teks menjadi format teks yang bisa dibaca oleh mesin. Gambar 1 menunjukkan ilustrasi dari cara kerja OCR.
OCR bekerja dengan beberapa tahapan, yaitu:
- Image Acquisition, tahapan ini merupakan tahapan dimana gambar yang berisi teks dijadikan input ke dalam algoritma OCR. Algoritma OCR akan menganalisa perbedaan cahaya atau warna yang kontras antara warna tulisan dengan warna latarnya. Sehingga biasanya algoritma OCR bisa bekerja dengan sangat baik untuk tulisan berwarna hitam dan latarnya berwana putih atau sebaliknya. Tapi tidak menutup kemungkinan untuk mendeteksi warna tulisan dan latar yang lain, tetapi perlu diperhatikan tingkat kontras warnanya.
- Preprocessing, pada tahapan ini, gambar yang memiliki teks di olah untuk mendeteksi dan menghilangkan error yang mungkin ada. Tahapan ini bertujuan untuk menyiapkan gambar akan memenuhi kebutuhan algoritma OCR. Proses persiapan gambar yang dilakukan misalnya dengan memperbaiki orientasi atau meluruskan gambar yang miring, mendeteksi tepi teks pada gambar dan menghilangkan gangguan pada tepi teks tersebut, dan lain-lain. Teknik yang digunakan pada tahapan ini dapat berbeda antara satu solusi OCR dengan solusi yang lain.
- Text Recognition, setelah gambar selesai disiapkan pada tahapan preprocessing, tahap selanjutnya adalah proses pengenalan teks. Ada dua tipe metode yang utama dalam proses pengenalan teks, yaitu tipe pemetaan pola dan ekstraksi fitur. Pada prinsipnya kedua metode ini akan membandingkan hasil preprocessing dengan data yang tersimpan di dalam database atau biasa disebut dataset. Bedanya, pemetaan pola akan membandingkan teks yang berhasil diisolasi dari sebuah gambar atau biasa disebut glyph lalu membandingkan glyph tersebut dengan pola yang tersimpan di dataset. Metode ini bekerja dengan baik kalau pada dataset, telah menyimpan pola dengan jenis huruf dan ukuran pola yang sama. Pemetaan pola biasanya digunakan untuk mendeteksi teks yang menggunakan huruf yang sudah umum atau huruf yang dicetak menggunakan printer, bukan tulisan tangan manusia. Sementara metode ekstraksi fitur akan menganalisa glyph untuk mengambil data-data yang lebih detail seperti panjang garis, lengkungan, sudut, arah garis atau persilangan garis. Data fitur ini kemudian dibandingkan data fitur yang ada pada dataset menggunakan metode best match atau nearest neighbor. Metode ekstraksi fitur yang paling sering digunakan pada deteksi tulisan manusia.
- Postprocessing, ini merupakan tahap akhir di mana komputer akan menghasilkan data digital dari teks yang berhasil dikenali. Pada postprocessing, teks yang berhasil dikenali akan ditampilkan lagi dalam file (biasanya menggunakan format PDF) atau datanya disimpan ke dalam database kembali. Ini tergantung kebutuhan dari penggunaan teknologi OCR ini.
Penjelasan lebih detail terkait cara kerja OCR dapat dilihat pada artikel di link ini. Untuk OMR, tahapannya sama dengan OCR. Hanya di tahapan text recognition, yang dikenali adalah mark atau tanda yang terdapat di dalam gambar. Biasanya digunakan untuk mendeteksi tanda pada kertas yang jawabannya dibulat atau diberi tanda tertentu.
Implementasi SIREKAP pada Pemilu 2024
Dari penjelasan cara kerja OCR dan OMR, pengembangan aplikasi SIREKAP telah dibarengi dengan mengubah format kertas form C1 Plano. Hal ini dapat dilihat pada modifikasi format C1 plano yang digunakan pada pemilu 2024 seperti pada Gambar 2.
Dari Gambar 2, terlihat bahwa form C1 Plano di Pemilu 2024 ini sudah dimodifikasi agar memudahkan proses pengenalan oleh teknologi OCR dan OMR. Pada bagian A, pada form C1 Plano sebelum Pemilu 2024, hanya berupa kotak biasa sehingga isinya bisa diberikan sembarang tulisan tergantung dari petugas yang menuliskan angka. Sementara pada form C1 Plano Pemilu 2024, bagian A ini sudah dimodifikasi dengan menambah pola angka yang diberi garis titik-titik. Hal ini agar petugas yang menuliskan angka sudah mengikuti pola angka tertentu yang sudah dikenali oleh teknologi OCR. Sementara bagian B pada form C1 Plano sebelum Pemilu 2024 hanya kosong. Sedangkan pada form C1 plano Pemilu 2024, bagian B sudah diisi dengan format bulat yang akan dihitamkan sesuai dengan angka pada bagian A. Hal ini digunakan untuk proses pengenalan menggunakan teknologi OMR.
Kemungkinan Masalah pada SIREKAP
Dilihat dari cara kerja teknologi dan perubahan pada form C1 plano, sebenarnya KPU sudah berusaha membuat aplikasi SIREKAP ini dapat digunakan dengan baik dan petugas di lapangan tidak lagi harus memasukkan angka perhitungan suara secara manual. Namun usaha ini belum berarti aplikasi SIREKAP sudah bebas dari masalah. Ada beberapa masalah yang mungkin timbul dari sisi teknis, diantaranya adalah
- Petugas menuliskan angka di luar dari pola yang sudah dirancang. Pada pemilu sebelumnya, pada bagian A, untuk menandakan kotak kosong akan diberi tanda silang. Sementara pada pemilu 2024 ini, untuk menandakan kotak kosong dengan membuat pola angka 0. Nah perbedaan tulisan ini bisa saja menimbulkan kesalahan pengenalan oleh teknologi OCR.
- Bulatan pada bagian B kurang terisi penuh atau bulatannya lewat dari garis. Hal ini menyebabkan gangguan pengenalan dari teknologi OMR.
Belum lagi masalah non teknis misalnya cahaya saat memfoto form C1 plano atau ukuran foto form C1 plano yang diupload ke SIREKAP.
Kesimpulan
Sehingga, memang masih ada kemungkinan SIREKAP mengalami kesalahan dalam pengenalan angka dari Form C1 Plano. Kemungkinan-kemungkinan masalah seperti di atas, rupanya belum diantisipasi dengan baik oleh KPU di dalam pengembangan SIREKAP. Hal ini dapat terlihat dari masalah-masalah yang timbul di mana ada deteksi angka yang lebih besar dari angka yang ada di form C1 plano. Atau kegagalan SIREKAP dalam mendeteksi simbol X. Belum lagi kesalahan SIREKAP saat mendeteksi angka yang hanya dua digit dan box di digit awal dikosongkan. Hal-hal seperti ini dapat ditemukan bila telah dilakukan software testing atau Quality Control (QC) secara komprehensif sebelum digunakan. Hal ini menjadi pengalaman berharga mengenai pentingnya QC yang komprehensif dan menyuluruh saat membuat sebuah aplikasi. Hal ini untuk mendeteksi potensi kesalahan yang mungkin timbul dari sisi pengguna sehingga potensi kesalahan dapat diminimalisir atau diantisipasi dengan baik.