Anonim

Salah satu hal yang sering membuat saya frustrasi adalah ketidakmampuan untuk menyalin teks dengan mudah dari gambar dan file PDF tertentu (misalnya yang mungkin dibuat dari dokumen yang dipindai). Untungnya, solusi perangkat lunak dari waktu ke waktu telah dikembangkan untuk mengatasi masalah ini, memungkinkan penghematan waktu yang signifikan yang seharusnya dihabiskan untuk menyalin dan mengetik ulang teks secara manual. Pada tip hari ini, saya akan berbicara tentang alat perangkat lunak gratis yang disebut Capture2Text yang menggunakan algoritma Optical Character Recognition (OCR) yang akan memungkinkan Anda untuk menangkap teks dari file gambar dan PDF.

Instalasi dan Pengaturan

Untuk memulai, buka halaman SourceForge proyek dan unduh versi terbaru dari Capture2Text. Perangkat lunak ini hadir sebagai arsip zip dan pada saat itu tidak termasuk penginstal khusus. Setelah diunduh, unzip arsip dan luncurkan file Capture2Text.exe. Ini akan meluncurkan perangkat lunak dan meletakkan ikon di baki sistem:

Pertama, yang ingin Anda lakukan adalah mengatur preferensi perangkat lunak, khususnya tombol pintas (atau pintasan) mana yang digunakan untuk memulai dan menghentikan penangkapan:

Dalam kasus saya, saya telah memilih untuk menggunakan tombol "Windows + q" untuk mulai menangkap dan "Enter" untuk menghentikannya. Anda dapat menyesuaikan opsi ini dengan yang paling cocok untuk Anda. Ingatlah bahwa kunci "Windows +" sudah sering digunakan untuk menangkap layar (misalnya oleh program seperti Microsoft One Note).

Pada tab selanjutnya, opsi OCR dapat dikonfigurasi termasuk bahasa input (saat ini tujuh bahasa didukung) dan apakah akan menggunakan pra-pemrosesan OCR untuk meningkatkan akurasi (sangat disarankan). Terakhir, pada tab Output, di antara opsi lain seseorang dapat memilih apakah hanya menyimpan teks yang diambil ke clipboard atau apakah akan meluncurkan jendela sembulan yang terpisah.

Menggunakan Perangkat Lunak

Setelah perangkat lunak diinstal dan dikonfigurasi, Anda dapat mulai menggunakannya melalui kombinasi tombol pintas mulai. Menggunakan mouse Anda, pilih area pada gambar yang menyertakan teks yang ingin Anda ambil. Untuk berhenti menangkap, tekan saja tombol panas yang Anda pilih untuk menghentikan penangkapan. Teks kemudian akan disalin ke clipboard, jendela sembulan keluaran, atau keduanya. Contohnya bisa dilihat di bawah ini.

Dari pengujian cepat saya terhadap alat dengan gambar, saya menemukan akurasinya layak. Jelas, ada batasan untuk alat seperti ini dan OCR secara umum. Misalnya, teks yang banyak dimodifikasi (sangat kursif, miring, atau modern) mungkin tidak berfungsi dengan baik, dan kadang-kadang tidak sama sekali. Juga, dalam beberapa kasus itu akan membantu untuk menyesuaikan dimensi kotak pengambilan sedikit atau bermain dengan zoom pada gambar itu sendiri untuk mendapatkan hasil yang lebih akurat.

Saat mengambil teks dari dokumen PDF yang dipindai, keakuratannya ok, dengan beberapa modifikasi akhir umumnya masih perlu pada hasil yang diambil (tergantung pada kualitas pemindaian awal). Juga, saya perhatikan bahwa perangkat lunak mungkin memerlukan waktu beberapa detik lebih lama untuk diproses, terutama ketika diminta untuk mengkonversi teks dalam jumlah besar.

Itu semua dikatakan, secara keseluruhan saya pikir alat melakukan pekerjaan dengan baik, terutama karena itu tersedia secara gratis - Saya mendorong Anda untuk mencobanya.

Tambahan 11/16/2015:

Sebagai pilihan lain, bagi mereka yang memiliki akun Google, dimungkinkan juga untuk menggunakan kemampuan OCR Google dengan mengunggah file ke Google Drive Anda (detail lebih lanjut dapat ditemukan di sini). Selain itu, ada juga plugin OCR yang tersedia untuk pengguna Google Chrome yang disebut Copyfish yang mungkin ingin Anda periksa juga.

Cara mengambil teks dari gambar dengan perangkat lunak ocr