python图像处理:pytesseract和PIL
- 作者: 五速梦信息网
- 时间: 2026年04月04日 13:31
大概介绍下相关模块的概念:
Python-tesseract 是光学字符识别Tesseract OCR引擎的Python封装类。能够读取任何常规的图片文件(JPG, GIF ,PNG , TIFF等)并解码成可读的语言。在OCR处理期间不会创建任何临文件
PIL (Python Imaging Library)是 Python 中最常用的图像处理库,目前版本为 1.1.7,我们可以 在这里 下载学习和查找资料。
Image 类是 PIL 库中一个非常重要的类,通过这个类来创建实例可以有直接载入图像文件,读取处理过的图像和通过抓取的方法得到的图像这三种方法。
python对图像的处理比较常见的是用pytesseract识别验证码,要安装pytesseract库,必须先安装其依赖的PIL及tesseract-ocr,其中PIL为图像处理库,而后面的tesseract-ocr则为google的ocr识别引擎。下载链接:http://www.waitalone.cn/python-php-ocr.html 该链接文档描述了如何配置相关环境,以及识别验证码的python代码,总结起来就三步:安装PIL.exe;安装tesseract-ocr-setup.exe;安装pip install pytesseract
1、识别图片简单的示例
我按照该代码示例实际操作时报了2个错误:
1、The _imaging C module is not installed
是因为环境配置的问题,我的系统是win7 64bit,开始的时候只安装了PIL-1.1.7.win-amd64-py2.7.exe,把PIL-1.1.7.win32-py2.7.exe安装后,在python命令行输入:import _imaging,如果不报错则问题应该就解决了
2、在 win 7 下使用 PIL 中的 Image 模块的 show() 函数时,报如下错:
解决方法:将 PIL 安装目录下的 ImageShow.py 文件的第 99 行:(我的 python 安装在 C:\python 2.7, ImageShow.py 文件在:C:\Python27\Lib\site-packages\PIL\ImageShow.py)
替换为:
2、实际情况中,电脑本地并没有验证码图片,都是从网页中的验证码图片链接抓取的,实际示例:
以上本亲测可行,不过验证码识别率不是很高,简单的图片识别率还是可以的
附录:Image模块用法介绍【转】
1. 简介。
图像处理是一门应用非常广的技术,而拥有非常丰富第三方扩展库的 Python 当然不会错过这一门盛宴。PIL (Python Imaging Library)是 Python 中最常用的图像处理库,目前版本为 1.1.7,我们可以 在这里 下载学习和查找资料。
Image 类是 PIL 库中一个非常重要的类,通过这个类来创建实例可以有直接载入图像文件,读取处理过的图像和通过抓取的方法得到的图像这三种方法。
2. 使用。
导入 Image 模块。然后通过 Image 类中的 open 方法即可载入一个图像文件。如果载入文件失败,则会引起一个 IOError ;若无返回错误,则 open 函数返回一个 Image 对象。现在,我们可以通过一些对象属性来检查文件内容,即:
这里有三个属性,我们逐一了解。
format : 识别图像的源格式,如果该文件不是从文件中读取的,则被置为 None 值。
size : 返回的一个元组,有两个元素,其值为象素意义上的宽和高。
mode : RGB(true color image),此外还有,L(luminance),CMTK(pre-press image)。
现在,我们可以使用一些在 Image 类中定义的方法来操作已读取的图像实例。比如,显示最新载入的图像:
输出原图:

3. 函数概貌。
3.1 Reading and Writing Images : open( infilename ) , save( outfilename )
3.2 Cutting and Pasting and Merging Images :
crop() : 从图像中提取出某个矩形大小的图像。它接收一个四元素的元组作为参数,各元素为(left, upper, right, lower),坐标系统的原点(0, 0)是左上角。
paste() :
merge() :
其效果图为:

旋转一幅图片:
3.3 几何变换。
3.3.1 简单的几何变换。
各个调整之后的图像为:
图片1:
图片2:
图片3:
图片4:
3.3.2 色彩空间变换。
convert() : 该函数可以用来将图像转换为不同色彩模式。
3.3.3 图像增强。
Filters : 在 ImageFilter 模块中可以使用 filter 函数来使用模块中一系列预定义的增强滤镜。
3.4 序列图像。
即我们常见到的动态图,最常见的后缀为 .gif ,另外还有 FLI / FLC 。PIL 库对这种动画格式图也提供了一些基本的支持。当我们打开这类图像文件时,PIL 自动载入图像的第一帧。我们可以使用 seek 和 tell 方法在各帧之间移动。
3.5 更多关于图像文件的读取。
最基本的方式:im = Image.open("filename")
类文件读取:fp = open("filename", "rb"); im = Image.open(fp)
字符串数据读取:import StringIO; im = Image.open(StringIO.StringIO(buffer))
从归档文件读取:import TarIO; fp = TarIo.TarIO("Image.tar", "Image/test/lena.ppm"); im = Image.open(fp)
基本的 PIL 目前就练习到这里。其他函数的功能可点击 这里 进一步阅读。
扩展阅读:python如何下载网页图片
http://blog.csdn.net/wudishine/article/details/11528791
- 上一篇: Python图像处理丨如何调用OpenCV绘制直方图
- 下一篇: Python图片处理库之PIL
相关文章
-
Python图像处理丨如何调用OpenCV绘制直方图
Python图像处理丨如何调用OpenCV绘制直方图
- 互联网
- 2026年04月04日
-
python完美验证码识别库
python完美验证码识别库
- 互联网
- 2026年04月04日
-
python往list集合中添加元素
python往list集合中添加元素
- 互联网
- 2026年04月04日
-
Python图片处理库之PIL
Python图片处理库之PIL
- 互联网
- 2026年04月04日
-
Python统计分析可视化库seaborn(相关性图,变量分布图,箱线图等等)
Python统计分析可视化库seaborn(相关性图,变量分布图,箱线图等等)
- 互联网
- 2026年04月04日
-
python提取mysql中指定列参数,并循环打印
python提取mysql中指定列参数,并循环打印
- 互联网
- 2026年04月04日





