python入门项目06:批量处理文件
创始人
2024-05-30 22:34:23
0

文章目录

  • 前言
  • 一、理论知识
    • 1.1 OS模块
    • 1.2 XML的解析
  • 二、使用步骤
    • 1.引入库
    • 2.创建新文件夹
    • 3文件操作
    • 4 修改文件
  • 总结


前言

本文要完成的是对于较多XML文档的自动修改,这部分往往在大量的图像标注的修改中会使用到,同时也不要局限于本文中所提到的使用场景。


一、理论知识

python中有大量的第三方库可以供我们使用,因此我们需要对所用到的库进行简单的学习,有大致印象即可,等到需要某个功能上网查一下就行了。
在python编程时,经常和文件、目录打交道,所以离不了os模块

1.1 OS模块

此部分网上有大量的教程,在此不再赘述。可以参考此文章:OS模块的学习
在这里插入图片描述

1.2 XML的解析

xml.etree.ElementTree模块实现了一个简单而高效的API用于解析和创建XML数据。 参考文章:XML

二、使用步骤

1.引入库

代码如下(示例):

import xml.etree.ElementTree as ET
import os

2.创建新文件夹

代码如下(示例):

xmldir = 'xml'
newxmldir = 'newxml'if not os.path.exists(newxmldir): #如果没有存放新xml的文件,那么
#就创建一个.os.makedirs(newxmldir)

3文件操作

for xml in os.listdir(xmldir):xmlpath = os.path.join(xmldir, xml)newxmlpath = os.path.join(newxmldir, xml)print("****************************")print("原始路径:   ",xmlpath)print("新文件的路径:", xmlpath)

上面代码实现的功能是遍历每一个文件,并找到原来的路径和存放新文件的路径。
在这里插入图片描述
得到这一步,下面要在上述的循环中进行修改操作

4 修改文件

tree = ET.parse(xmlpath)root = tree.getroot()  #root 有tag和attrib两个属性#print(root.tag,root.attrib)#for child in root:# print(child.tag, child.attrib)  查看树子支的标签for obj in root.findall('country'):name = obj.find('rank')if name.text == '1':name.text = '修改1'elif name.text == '4':name.text = '修改4'tree.write(newxmlpath, 'UTF-8')

在这里插入图片描述
上图是我们要修改的xml文档,假设一开始的文档中都是这种格式的数据。
观察可以发现其中的三个大框都是country,在这个节点的下面有rank,year,gdppc等子节点,所以假设我们要修改的为rank
修改结果如下:
在这里插入图片描述
具体的操作结合代码观看,一一对应的修改,不要盲目的找一个就用,因为数据格式还是多少有点区别的。

总结

本文实现的功能是批量化修改已有的xml文件。这种自动化的处理正是python的优雅之处,可以帮我们解决很多机械化的操作。
下面是全文的代码:(仅供参考)

#-*- coding: utf-8 -*-
import xml.etree.ElementTree as ET
import osxmldir = 'xml'
newxmldir = 'newxml'if not os.path.exists(newxmldir): #如果没有存放新xml的文件,那么就创建一个.os.makedirs(newxmldir)for xml in os.listdir(xmldir):xmlpath = os.path.join(xmldir, xml)newxmlpath = os.path.join(newxmldir, xml)print("****************************")print("原始路径:   ",xmlpath)print("新文件的路径:", xmlpath)tree = ET.parse(xmlpath)root = tree.getroot()  #root 有tag和attrib两个属性#print(root.tag,root.attrib)#for child in root:# print(child.tag, child.attrib)  查看树子支的标签for obj in root.findall('country'):name = obj.find('rank')if name.text == '1':name.text = '修改1'elif name.text == '4':name.text = '修改4'tree.write(newxmlpath, 'UTF-8')print(xmlpath + ' 已修改')

其中一部分print是用作测试功能的,可以省略的,只是为了更好的理解。

相关内容

热门资讯

喜欢穿一身黑的男生性格(喜欢穿... 今天百科达人给各位分享喜欢穿一身黑的男生性格的知识,其中也会对喜欢穿一身黑衣服的男人人好相处吗进行解...
发春是什么意思(思春和发春是什... 本篇文章极速百科给大家谈谈发春是什么意思,以及思春和发春是什么意思对应的知识点,希望对各位有所帮助,...
网络用语zl是什么意思(zl是... 今天给各位分享网络用语zl是什么意思的知识,其中也会对zl是啥意思是什么网络用语进行解释,如果能碰巧...
为什么酷狗音乐自己唱的歌不能下... 本篇文章极速百科小编给大家谈谈为什么酷狗音乐自己唱的歌不能下载到本地?,以及为什么酷狗下载的歌曲不是...
华为下载未安装的文件去哪找(华... 今天百科达人给各位分享华为下载未安装的文件去哪找的知识,其中也会对华为下载未安装的文件去哪找到进行解...
怎么往应用助手里添加应用(应用... 今天百科达人给各位分享怎么往应用助手里添加应用的知识,其中也会对应用助手怎么添加微信进行解释,如果能...
家里可以做假山养金鱼吗(假山能... 今天百科达人给各位分享家里可以做假山养金鱼吗的知识,其中也会对假山能放鱼缸里吗进行解释,如果能碰巧解...
一帆风顺二龙腾飞三阳开泰祝福语... 本篇文章极速百科给大家谈谈一帆风顺二龙腾飞三阳开泰祝福语,以及一帆风顺二龙腾飞三阳开泰祝福语结婚对应...
四分五裂是什么生肖什么动物(四... 本篇文章极速百科小编给大家谈谈四分五裂是什么生肖什么动物,以及四分五裂打一生肖是什么对应的知识点,希...
美团联名卡审核成功待激活(美团... 今天百科达人给各位分享美团联名卡审核成功待激活的知识,其中也会对美团联名卡审核未通过进行解释,如果能...