Ini tool dan tips yang paling sering aku pakai untuk mengambil teks /tulisan dari file pdf atau file gambar, pakai tools nya online jadi cukup berbekal koneksi internet kita bisa dapat teks dalam file word atau excell, simple banget mudah dan cepat.
Sebelumnya pengantar sedikit tentang teknologi di belakang tools yang ajaib ini adalah sistem OCR kependekan dari optical character recognition. Secara pengertiannya menurut WIKI adalah
"alat mekanis atau elektronik yang digunakan untuk menerjemahkan tulisan tangan ataupun naskah ketikan (biasanya dipindai menggunakan pemindai) menjadi teks yang dapat disunting dengan suatu aplikasi komputer"
OCR ada perhitungannya, nama lainnya ada algoritmanya, yang mau mendalami bisa tanya saja sama Eyang G. Singkatnya katanya situs Ini, metode OCR paling tidak ada 3 alur untuk mendapat text dalam file word, a.l. :
- Mendeteksi baris untuk tiap deretan teks;
- Mengekstrak komponen tiap-tiap huruf;
- Mengekstrak properti dari tiap karakter untuk menentukan huruf.