Python语言技术文档

微信小程序技术文档

php语言技术文档

jsp语言技术文档

asp语言技术文档

C#/.NET语言技术文档

html5/css技术文档

javascript

点击排行

您现在的位置:首页 > 技术文档 > Python多媒体

Python用imghdr模块识别图片格式实例解析

来源:中文源码网    浏览:443 次    日期:2024-03-27 00:48:50
【下载文档:  Python用imghdr模块识别图片格式实例解析.txt 】


Python用imghdr模块识别图片格式实例解析
imghdr模块
功能描述:imghdr模块用于识别图片的格式。它通过检测文件的前几个字节,从而判断图片的格式。
唯一一个API
imghdr.what(file, h=None)
第一个参数file可以是用rb模式打开的file对象或者表示路径的字符串和PathLike对象。h参数是一段字节串。函数返回表示图片格式的字符串。
>>> import imghdr
>>> imghdr.what('test.jpg')
'jpeg'
具体的返回值和描述如下:
返回值
描述
检测方式
jpeg
用JFIF或者Exif格式保存的JPEG图片
第7到第10个字节是b'JFIF'或者b'Exif'
png
可移植网络图形格式(Portable Network Graphic Format)
以字节串b'\x89PNG\r\n\x1a\n'开头
gif
GIF(Graphics Interchange Format)的87版本和89版本
前6个字节为b'GIF87a'或者b'GIF89a'
tiff
TIFF(Tag Image File Format)的两种字节顺序
前两个字节为b'MM'或者b'II'
rgb
SGI ImgLib
以字节串b'\x01\xda'开头
pbm
Portable Bitmap
第1个字节为b'P',第2个字节为b'1'或b'4',第3个字节为b'\t'或b'\n'或b'\r'
pgm
Portable Graymap Files
第1个字节为b'P',第2个字节为b'2'或b'5',第3个字节为b'\t'或b'\n'或b'\r'
ppm
Portable Pixmap Files
第1个字节为b'P',第2个字节为b'3'或b'6',第3个字节为b'\t'或b'\n'或b'\r'
rast
Sun Raster
以字节串b'\x59\xA6\x6A\x95'开头
xbm
X Bitmap Files
以字节串b'#define ‘开头
bmp
Bitmap,Windows标准图像文件格式
以字节串b'BM'开头
webp
谷歌的WebP格式,Python3.5加入
以字节串b'RIFF'开头并且第9到第12个字节为b'WEBP'
exr
OpenEXR,Python3.5加入
以字节串b'\x76\x2f\x31\x01'开头
模块内部缺陷
当h参数不为空时,模块会忽略掉file参数,直接检测h参数,但此时file参数又是必须提供的,算是一个设计缺陷吧。博主个人感觉这个h参数根本没有存在的意义,没必要放在参数列表里面。
>>> import imghdr
>>> imghdr.what('test.jpg', b'\x89PNG\r\n\x1a\n')
'png'
>>>
自定义检测流程
imghdr内部使用了test_jpeg、test_png、test_gif等函数检测文件的格式。模块内部维护了一个函数列表imghdr.tests,每次调用what函数的时候,会按列表里的顺序调用检测函数,当检测函数返回结果时退出循环。用户可以通过修改这个列表达到修改检测流程的目的。同时,也可以自行添加检测函数到列表里面。
下面这个例子,博主添加了一个函数放在检测流程的最后提示文件不是图片:
>>> import imghdr
>>> def final(h, f):
... print("This file isn\'t a image!")
...
>>> imghdr.tests.append(final)
>>> imghdr.what("imghdr.md")
This file isn't a image!
自行添加检测函数需要接收两个参数h和f,h是用来检测的字节串,f是file对象。但是在模块内部自带的检测函数都是没用到这个f参数的…
命令行启动imghdr模块
博主读源码的时候发现了官方文档里面没提到的两个函数,提供了直接用命令行启动imghdr模块的方法。
只需要调用python -m imghdr [-r] file1 file2...就可以直接检测文件的类型。file可以是文件也可以是文件夹。该命令默认只检测文件夹下一层的文件类型,如果需要递归检测,则加上-r参数。
每个文件以”文件名: 文件类型/None”的形式打印一行输出结果。
总结:可能是因为使用的人少的原因,imghdr这个模块内部有挺多小问题,不过只要老老实实按照官方提供的文档使用是不会出事的。博主后面试着改一下这个模块然后pr上去。
以上就是本文关于Python用imghdr模块识别图片格式实例解析的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

相关内容