Anonim

Salah satu perkara yang sering kecewa saya ialah ketidakupayaan untuk menyalin teks dengan mudah dari imej dan fail PDF tertentu (contohnya yang mungkin dibuat dari dokumen yang diimbas). Syukurlah, dari masa ke masa penyelesaian perisian telah dibangunkan untuk menangani isu ini, membolehkan penjimatan masa yang ketara yang akan dibelanjakan secara manual menyalin dan menaip semula teks. Pada hujung hari ini, saya akan bercakap mengenai alat perisian percuma yang dipanggil Capture2Text yang menggunakan algoritma Pengiktirafan Karakter Optik (OCR) yang akan membolehkan anda menangkap teks dari fail imej dan fail PDF.

Pemasangan dan Persediaan

Untuk memulakan, pergi ke halaman SourceForge projek dan muat turun versi terbaru Capture2Text. Perisian ini datang sebagai arkib zip dan pada masa itu tidak termasuk pemasang khusus. Setelah dimuat turun, unzip arkib dan lancarkan fail Capture2Text.exe. Ini akan melancarkan perisian dan meletakkan ikon ke bawah dalam dulang sistem:

Mula-mula, apa yang anda ingin lakukan ialah persediaan keutamaan perisian, terutamanya yang kekunci panas (atau pintasan) untuk digunakan untuk memulakan dan menghentikan tangkapan:

Dalam kes saya, saya telah memilih untuk menggunakan kekunci "Windows + q" untuk mula menangkap dan "Enter" untuk menghentikannya. Anda boleh menyesuaikan pilihan ini untuk yang paling sesuai untuk anda. Perlu diingat bahawa kekunci "Windows + s" sering digunakan untuk menangkap skrin sudah (misalnya dengan program seperti Microsoft One Note).

Pada tab seterusnya, pilihan OCR boleh dikonfigurasikan termasuk bahasa input (kini tujuh bahasa disokong) dan sama ada menggunakan pra-pemprosesan OCR untuk meningkatkan ketepatan (sangat disyorkan). Akhirnya, pada tab Output, antara pilihan lain, seseorang boleh memilih sama ada hanya menyimpan teks yang ditangkap pada papan klip atau sama ada untuk melancarkan tetingkap pop timbul berasingan.

Menggunakan Perisian

Sebaik sahaja perisian dipasang dan dikonfigurasikan, anda boleh mula menggunakannya menerusi kombinasi tangkapan kunci panas anda. Dengan menggunakan tetikus anda, pilih kawasan tersebut pada imej yang menyertakan teks yang ingin ditangkap. Untuk menghentikan tangkapan, tekan kekunci panas yang telah anda pilih untuk menghentikan tangkapan. Teks kemudian akan disalin sama ada ke papan klip, tetingkap pop timbul output, atau kedua-duanya. Satu contoh boleh dilihat di bawah.

Dari pengujian cepat saya alat dengan imej, saya telah menemukan ketepatannya untuk menjadi baik. Jelas sekali, terdapat batasan untuk alat seperti ini dan OCR pada umumnya. Sebagai contoh, teks yang banyak diubah suai (sangat kursif, berurat, atau moden) mungkin tidak berfungsi dengan baik, dan kadang-kadang tidak sama sekali. Juga, dalam beberapa kes, ia akan membantu menyesuaikan dimensi kotak tangkapan sedikit atau bermain dengan zoom pada imej itu sendiri untuk mendapatkan hasil yang lebih tepat.

Apabila menangkap teks dari dokumen PDF yang diimbas, ketepatan adalah ok, dengan beberapa pengubahsuaian akhir biasanya diperlukan pada output yang diambil (bergantung kepada kualiti imbasan awal). Juga, saya perhatikan bahawa perisian mungkin mengambil beberapa saat lebih lama untuk diproses, terutamanya apabila diminta menukar banyak teks.

Bahawa semua dikatakan, secara keseluruhan saya fikir alat itu berfungsi dengan baik, terutamanya kerana ia tersedia secara bebas - saya menggalakkan anda untuk mencubanya.

Addendum 11/16/2015:

Sebagai pilihan lain, bagi mereka yang mempunyai akaun Google, ia juga mungkin menggunakan keupayaan OCR Google dengan memuat naik fail ke Google Drive anda (maklumat lanjut boleh didapati di sini). Selain itu, ada juga plugin OCR yang tersedia untuk pengguna Google Chrome yang dipanggil Copyfish yang anda juga mungkin mahu lihat juga.

Bagaimana untuk menangkap teks dari imej dengan perisian ocr