哈希技術部落格


Slider

[OCR]使用python辨識圖片中的文字

日常生活中,有時候我們需要將圖片中的文字記錄下來,但如果文字很多的時候,有沒有更好的方式幫助我們呢?這時候,辨識圖片中的文字就會派上用場!目前許多常見的軟體例如Line、onenote、google文件…等,也有提供圖片文字辨識的功能。

今天,我們會分享如何透過孩子學習的python,實現這項便利的功能哦!

圖片文字辨識OCR

辨識圖片中的文字,通常會稱作光學文字辨識(Optical Character Recognition)簡稱OCR。搜尋OCR也會找到許多教學以及應用,我們則著重在透過簡單的程式,示範如何讓孩子也能製作自己的圖片文字辨識程式。

例如最近有許多宣導如何正確使用口罩的圖片,透過OCR程式,就可以將其中的文字辨識出來哦


透過python模組使用OCR

首先,我們需要安裝OCR模組會使用到的相關內容

pip install PIL 
pip install pytesseract 

安裝模組以後,我們還需要下載OCR會使用到的資料到你的模組資料夾中。
下載位置:https://github.com/UB-Mannheim/tesseract/wiki

接下來,將圖片放到與你python程式同樣位置的資料夾中,並執行以下範例程式

from PIL import Image
import pytesseract

ImageText = pytesseract.image_to_string( Image.open( "test.png" ),lang = "chi_tra" )
print( ImageText )

我們以宣導口罩使用時機的圖片為範例,執行後就可以得到以下成果囉

如果想要辨識其他語言的文字,調整程式中 lang = “…..” 即可,例如想要辨識英文,可以調整成lang = “eng”

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *