• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

python准确判断文件类型

python 搞代码 4年前 (2022-01-09) 19次浏览 已收录 0个评论

判断文件类型在开发中非常常见的需求,怎样才能准确的判断文件类型呢?首先大家想到的是文件的后缀,但是非常遗憾的是这种方法是非常不靠谱的,因为文件的后缀是可以随意更改的,而大家都知道后缀在linux系统下是没有这个概念的,所以仅靠判断后缀无法准确判断一个文件的类型。还有第二种方法是判断文件的头,每种文件在文件的头中会标识这种文件的类型,下面我们来看看如何用python来判断文件的类型。

python通过文件头判断文件类型的方法:

#! /usr/bin/python# pythontab<i>本文来源gaodai$ma#com搞$代*码网2</i>提醒您注意中文编码问题,指定编码为utf-8# -*- coding: utf-8 -*- import struct# 支持文件类型 # 用16进制字符串的目的是可以知道文件头是多少字节 # 各种文件头的长度不一样,少则2字符,长则8字符 def typeList():   return {     "FFD8FF": "JPEG",     "89504E47": "PNG"}    # 字节码转16进制字符串 def bytes2hex(bytes):   num = len(bytes)   hexstr = u""   for i in range(num):     t = u"%x" % bytes[i]     if len(t) % 2:       hexstr += u"0"    hexstr += t   return hexstr.upper()    # 获取文件类型 def filetype(filename):   binfile = open(filename, 'rb') # 必需二制字读取   tl = typeList()   ftype = 'unknown'  for hcode in tl.keys():     numOfBytes = len(hcode) / 2 # 需要读多少字节     binfile.seek(0) # 每次读取都要回到文件头,不然会一直往后读取     hbytes = struct.unpack_from("B"*numOfBytes, binfile.read(numOfBytes)) # 一个 "B"表示一个字节     f_hcode = bytes2hex(hbytes)     if f_hcode == hcode:       ftype = tl[hcode]       break  binfile.close()   return ftype    if __name__ == '__main__':   print filetype('./test.jpg')

常见文件格式的文件头

文件格式 文件头(十六进制)JPEG (jpg) FFD8FFPNG (png) 89504E47GIF (gif) 47494638TIFF (tif) 49492A00Windows Bitmap (bmp) 424DCAD (dwg) 41433130Adobe Photoshop (psd) 38425053Rich Text Format (rtf) 7B5C727466XML (xml) 3C3F786D6CHTML (html) 68746D6C3EEmail [thorough only] (eml) 44656C69766572792D646174653AOutlook Express (dbx) CFAD12FEC5FD746FOutlook (pst) 2142444EMS Word/Excel (xls.or.doc) D0CF11E0MS Access (mdb) 5374616E64617264204A

搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:python准确判断文件类型
喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址