python模块之imghdr检测图片类型

2024-07-04 09:22:35 阅读次数：37

python模块之imghdr检测图片类型

1. imghdr是什么

imghdr是一个用来检测图片类型的模块，传递给它的可以是一个文件对象，也可以是一个字节流。【仅仅根据文件后缀判断文件类型显然不准，在python有一个内置模块imghdr可以用来判断图片的真实类型。】

能够支持的图片格式：

2. 如何使用

提供了一个api叫做imghdr.what，这个方法接受两个参数，第一个参数是一个文件对象，第二个参数是一个字节流数组。

文件对象用来对本地文件做检测，字节流用来对网络上的做检测。

当需要对文件进行检测的时候只传入第一个参数即可。

当需要对一个字节流检测的时候第一个参数传None，第二个参数传入字节流即可，当第二个参数被指定的时候第一个参数就会被忽略掉了所以值是什么无所谓

其返回值是一个字符串，是上面表格中的一个，表示检测到的此图片的类型。

2.1 对文件做检测：对磁盘文件检测

只传第一个参数的时候通常是对已经存储在本地磁盘上的文件检测一下格式，一个简单的例子如下：

import imghdr

#  检测一个文件内部真实的文件类型
with open('./download/image/dog.jpg', 'rb') as f:
    print(imghdr.what(f))

运行效果：

python模块之imghdr检测图片类型

2.2 对流做检测：在爬虫中的应用

在写爬虫的时候如果爬取图片的话，在保存的时候我们需要知道图片的格式，不然gif的保存为了png什么的就动不起来了，但是有一些图片的格式是不太容易由url中识别出来的，比如有些图片的url是这个样子的

像这种要做后缀截取的话需要考虑很多情况，搞很多用例来测，有点得不偿失啊，所以这个时候imghdr就派上用场了。

这是一个简单的爬取图片检测后缀格式的例子：

import imghdr
import urllib3
import uuid


class Spider:
    """
    蜘蛛侠,爬爬爬
    """
    pool_manager = urllib3.PoolManager()

    @staticmethod
    def get(url):
        return Spider.pool_manager.urlopen('GET', url)


class ImageDownLoader:
    """
    图片下载器
    """

    @staticmethod
    def download(url, path):
        """
        这个方法用来下载图片并保存
        :param url:  图片的路径
        :param path: 要保存到的路径
        :return:
        """
        response = Spider.get(url)
        save_name = path + uuid.uuid1().hex + "." + imghdr.what(None, response.data)  #  python中uuid来生成机器唯一标识
        with open(save_name, 'wb') as img_file:
            img_file.write(response.data)


if __name__ == '__main__':
    ImageDownLoader.download

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

python模块之imghdr检测图片类型

python模块之imghdr检测图片类型

python模块之imghdr检测图片类型

1. imghdr是什么

2. 如何使用

2.1 对文件做检测：对磁盘文件检测

2.2 对流做检测：在爬虫中的应用

相关文章

python四种抽样方法的使用：随机抽样、聚类抽样、系统抽样、分层抽样

视频 | Python测试开发之调试print代码实例

python简单介绍及基础知识（一）

使用Python扩展PAM（part 2）

1行Python代码，把Excel转成PDF，python-office功能更新~

IronPython 与 c# 交互之导入Python模块的两种方法

python性能测试之pyperformance

Python高维统计建模变量选择:SCAD平滑剪切绝对偏差惩罚、Lasso惩罚函数比较

一篇文章教会你Python中三种简单函数的使用

一篇文章带你剖析Python 字节流处理神器struct

作者介绍

最新文章

【python基础】学习路线

python实战三：使用循环while模拟用户登录

python递归遍历路径下的所有文件和文件夹

仅用pygame+python实现植物大战僵尸-----完成比完美更重要

Flask 实现用户登录功能的完整示例：前端与后端整合（附Demo）

python——偏函数的使用

热门文章

python list转dict

定义一个函数，接收三个参数返回一元二次方程

python 倒排索引(Inverted Index)

python取两个列表的并集、交集、差集

解决numpy报错UFuncTypeError: Cannot cast ufunc ‘add‘ output from dtype(‘x‘) to dtype(‘x‘)

python使用xlwt创建与保存excel文件

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

keras环境搭建

解决matplotlib绘图，设置画布大小时，多出现一个空白图

有序排列

Linux Command jq 格式转换

抽取文档主题之gensim实现

python将1970开始的时间戳转换为标准时间