Optical Character Recognition (OCR) adalah teknologi untuk mengubah image suatu dokumen hasil scan menjadi dokumen teks yang dapat diedit dengan aplikasi pengolah kata.
Sistem pemrosesan data yang ideal merupakan sistem di mana data diterima dari sumber dan diolah secepat mungkin. Dalam hal ini, mesin mengenali simbol dan angka, langsung dalam format yang lama, seperti yang digunakan manusia dalam aktivitas bisnis dan sosial sehari-hari.
Saat ini pola yang dapat dikenali komputer tidak cocok dibaca manusia. Demikian juga, data yang berasal dari manusia biasanya tidak diimpor langsung ke komputer. Meski demikian, penanganan data dilambangkan dengan proses konversi dari format manusia ke format komputer.
Tujuan utamanya adalah memungkinkan komputer langsung membaca dokumen sumber. Masalah konversi pola di dokumen input ke signal elektronik, yang cocok untuk diolah komputer merupakan salah satu pengenalan pola.
Pada saat ini terdapat dua sistem otomatis yang dirancang untuk dapat mengenali karakter cetakan, yakni: OCR (Optlcal Character Recognition) dan MICR (Magnetic Ink Character Recognition).
Pada awalnya, karakter dicetak dalam format typeface konvensional, atau bar code. Biasanya bertinta hitam dengan latar belakang putih. Kemudian karakter di-scan dengan mengukur pantulan optis. Dalam sistem MICR, karakter dicetak dalam format yang mempunyai stylesheet sempurna, dengan tinta yang difragmentasi dengan partikel bermagnet. Saat dokumen MICR dibaca, tinta ditarik sebelum karakter berada pada head baca. Signal output yang dihasilkan, diatur oleh partikel bermagnet yang melewati head untuk memindai segala karakter proporsional terhadap proyeksi vertikal suatu karakter.
Kemampuan mesin mengenali karakter yang dicetak dalam format yang mudah dikenali manusia, mempunyai keuntungan besar dalam mengurangi tugas pengumpulan data. Jadi, dapat mempercepat aliran data di sistem. Biaya persiapan data dapat ditekan dan lebih akurat dibanding metode yang lebih konvensional.
Sistem pengenalan karakter dikembangkan di berbagai organisasi dan menghasilkan berbagai macam sumber typeface. Dengan adanya penyempurnaan teknik pengenalan karakter, standarisasi telah ditetapkan, namun masih terlihat perbedaan sumber yang digunakan.
Di bidang MICR, cenderung sedikit bervariasi, dan hanya ada dua sumber, yakni E13B dan CMC7. Keduanya diterima sebagai standar intemasional.
Di bidang sistem OCR, banyak terdapat variasi, meski organisasi standar internasional telah mengajukan dua standar sumber yang bernama OCR’A’ dan OCR’B’.
Dalam beberapa hal, MICR kurang fleksibel dibanding OCR. Sistem MICR menghendaki bahwa karakter harus dicetak dalam format yang mempunyai stylesheet sempurna, dan sangat akurat. Akan tetapi, sistem pengenalan ini terletak pada partikel bermagnet yang membentuk setiap karakter. Meskipun demikian, sulit dikritik, sistem OCR memiliki sejumlah kelebihan ketika menangani dokumen yang rusak dan terlipat atau dokumen yang telah kotor atau ditindih karakter.
Sistem OCR tidak terpengaruh oleh format dengan stylesheet tertentu. Bahkan stylesheet yang kurang sempurna dapat dikenali. OCR juga dapat mengenali karakter yang dibuat oleh mesin tik manual dan dapat dikonversi ke dalam karakter yang terdapat dalam komputer. Aspek ini memungkinkan kemudahan dan fleksibilitas dalam menentukan proses pengumpulan data. Di kedua sistem, karakter yang dibaca, harus dicetak di area dokumen yang ditentukan dengan standar registrasi pencetakan yang cukup tinggi.
MICR telah digunakan dalam cek perbankan di seluruh dunia. MICR sorter/reader digunakan untuk menyortir cek secara otomatis, untuk membagi cek ke nasabah di berbagai cabang, dan cek sebelumnya dicetak dengan kode cabang. Nomor cek dan nomor rekening nasabah juga dicetak sebelumnya. Nantinya jumlah transaksi dapat ditambahkan dengan MICR encoder. Perincian cek otomatis dapat dibaca pada memori komputer untuk meng-update rekening pelanggan.
OCR telah digunakan sebagai turn around document dalam akuntansi sewa-beli dan aplikasi serupa. Setiap pelanggan diberi buku voucher yang dicetak beserta jumlah pembayaran dalam kontrak sewa.
Sebagai langkah pengenalan terhadap sistem OCR, marilah kita lakukan langkah-langkah pemindaian (scanning) berikut ini.
1. Aktifkan aplikasi FreeOCR.net melalui menu Start dan All Program sehingga muncul tampilan awal seperti ini.
2. Terdapat beberapa menu dan toolbar yang digunakan, yaitu :
File, digunakan jika kita akan melakukan :
.
.
Open ( membuka) file yang pernah di-scan atau gambar berupa teks.
Scan atau memindai suatu gambar teks.
Select Scanner, bila ada beberapa mesin secanner yang terhubung dengan komputer kita.
Save teks digunakan apabila kita akan menyimpan teks dalam file berektensi txt.
Exit untuk keluar dari software.
Start OCR Process, digunakan ketika kita telah mendapatkan gambar (image) berupa teks untuk merubahnya menjadi teks yang dapat disunting (editing).
.
Pilihlah menu Settings, untuk melakukan setting bahasa.
3. Setelah diset, kini kita siap melakukan pemindaian (scanning) dengan menggunakan OCR.
4. Simpanlah atau letakkanlah teks yang akan kita scan dalam lensa Scanner. .
5. Pilihlah menu File lalu klik perintah Scan atau klik langsung toolbar Scan
dan tunggulah bebarapa saat ketika aplikasi melakukan Scanning Page kemudian klik toolbar OCR maka aplikasi melakukan Recognition Page, sehingga akhirnya muncul tampilan Text Editor.
6. Pada Text Editor inilah kita dapat mengolah, menyunting, dan memperbaiki teks sesuai dengan aslinya sebelum kita menyalin dan memindahkannya ke dalam aplikasi Iain (misalnya ke dalam Microsoft Word).
7. Untuk memindahkan hasil scan pada kolom Text Editor ke Microsoft Word, kita dapat menyorot teks atau paragraf yang kita perlukan dan mengkopinya (CtrI+C) dan membuka halaman dokumen Word lalu mem-pastenya (CtrI+V).Mensseting Scanner dengan mode OCR
Langkah –langkah mensetting scanner dengan program OCCR:
1 Klik start >program >scansoft omnipage pro 11 .0>omi page pro 11.0
2 Tempatkan dokumen yang akan di scan dengan posisi dokumen menghadap ke lensa dan diposisikan sudut kanan atas permukaan mesin scanner,pastikan scanner dalam kondisi ON
3 Klik process->proses settin
4 Hilangkan tanda cek(v):Automatically Proofreed in OCR
5 Klik OK
Cara menampilkan program OCR
1. Dengan program simple OCR
Klik start-> program -> simple OCR
SELAIN MENGGUNAKAN SOFTWARE ocr BAGI PENGGUNA Office 2002 (XP) ke atas dapat menggunakan aplikasi Microsoft Office Document Scanning.Untuk memulai menggunakannya pada OS Windows XP adalah klik Start ->All Programs-> Microsoft Office Tools->lalu pilih Microsoft Office Document Scanning.
2. Dengan program omnipage
- Hidupkan scanner
- Klik Start>Programs>ScanSoft Omnipage Pro 11.0>Omnipage Pro 11.0
- Tempelkan dokumen yang akan di-scan dengan posisi dokumen menghadap ke lensa dan diposisikan sudut kanan atas permukaan mesin scanner ,pastikan bahwa mesin scanner dalam kondisi ‘on’
- Klik Start
Tidak ada komentar:
Posting Komentar