• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

Python XML转Json之XML2Dict的使用方法

python 搞代码 4年前 (2022-01-08) 20次浏览 已收录 0个评论

今天小编就为大家分享一篇Python XML转Json之XML2Dict的使用方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

1. Json读写方法

 def parseFromFile(self, fname): """ Overwritten to read JSON files. """ f = open(fname, "r") return json.load(f) def serializeToFile(self, fname, annotations): """ Overwritten to write JSON files. """ f = open(fname, "w") json.dump(annotations, f, indent=4, separators=(',', ': '), sort_keys=True) f.write("\n") 

2. xml文件的工具包XML2Dict

将xml转换成Python本地字典对象, 访问子元素和字典常用方法类似,略有不同, 使用 “.”

注: 使用xml2dict库,需要在本地项目添加 xml2dict.py, object_dict.py,下载链接

加载xml文件

 from xml2dict import XML2Dict xml = XML2Dict() r = xml.parse("待处理文件名.xml") 

xml示例[voc2007格式]:

  VOC2007AL_00001.JPG 80011603 l_fasterUnspecified00 270376352503 l_fasterUnspecified00 262746355871 r_fasterUnspecified00 412376494486 r_fasterUnspecified00 411748493862

分析下这个文件的格式:

最外一层被包围

往里一层是:,,,其中object是列表,包括name和bndbox,示例访问annotation下级元素

 # -*- coding: utf-8 -*- from xml2dict import XML2Dict xml = XML2Dict() r = xml.parse('Annotations/AL_00001.xml') for item in r.annotation: print item print '---<strong style="color:transparent">来源gaodaima#com搞(代@码网</strong>---------' for item in r.annotation.object: print item.name, item.bndbox.xmin, item.bndbox.xmax, item.bndbox.ymin, item.bndbox.ymax

执行结果:

 object folder size value filename ------------ l_faster 270 352 376 503 l_faster 262 355 746 871 r_faster 412 494 376 486 r_faster 411 493 748 862

完整代码[xml2json]

 # -*- coding: utf-8 -*- from xml2dict import XML2Dict import json import glob def serializeToFile(fname, annotations): """ Overwritten to write JSON files. """ f = open(fname, "w") json.dump(annotations, f, indent=4, separators=(',', ': '), sort_keys=True) f.write("\n") def getAnnos(file_name="", prefix=''): xml = XML2Dict() root = xml.parse(file_name) # get a dict object anno = root.annotation image_name = anno.filename item = {'filename': prefix + image_name, 'class': 'image', 'annotations': []} for obj in anno.object: cls = {'l_faster': 'C1', 'r_faster': 'C2'}[obj.name] box = obj.bndbox x, y, width, height = int(box.xmin), int(box.ymin), int(box.xmax) - int(box.xmin), int(box.ymax) - int(box.ymin) item['annotations'] += [{ "class": cls, "height": height, "width": width, "x": x, "y": y }] return item if __name__ == '__main__': annotations = [] anno_name = 'AR_001-550.json' files = glob.glob('Annotations/AR_*.xml') files = sorted(files) # print files.sort() for filename in files: item = getAnnos(filename, prefix='TFS/JPEGImages/') print item print '-----------------' annotations += [item] #"xmls/AL_00001.xml" serializeToFile(anno_name, annotations) 

以上就是Python XML转Json之XML2Dict的使用方法的详细内容,更多请关注gaodaima搞代码网其它相关文章!


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:Python XML转Json之XML2Dict的使用方法

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址