pythonxml解析dom_解析XML：DOM

在之前所写的解析XML：ElementTree一文中，我是用Python标准库里的xml.etree.ElementTree来实现的。不过这种对于含有命名空间的XML则显得不大方便和直观。其实Python标准库里还提供了更简单的方法，那就是利用The Document Object Model API，即xml.dom。这种方法通过检索DOM树实现。还是以之前的XML文档为例：0131121153

weixin_39739170

378人浏览 · 2020-12-17 11:16:40

weixin_39739170 · 2020-12-17 11:16:40 发布

1311211532361125903

提交成功

首先将其解析到内存中：>>> import xml.dom.minidom

>>> dom = xml.dom.minidom.parseString(xml)

>>> dom

接下来就可以采用类似JavaScript里DOM树的操作方法来找到我们想要的节点，例如获取“0”：>>> nodes = dom.getElementsByTagName('State')

>>> nodes

[]

然后遍历该节点内的节点找到所需的文本内容(这里节点内仅包含一个文本子节点)：>>> text = ''

>>> for node in nodes[0].childNodes:

if node.nodeType == xml.dom.minidom.Node.TEXT_NODE:

text += node.data

>>> text

u'0'

这种方法方便而易于理解，不过如果DOM树很大，那性能可能相对较低。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda