XML 指可扩展标记语言(eXtensible Markup Language),常被设计用来传输和存储数据。

在进行医学图像标注时,我们常使用XML格式文件来存储标注,以下展示了使用Python来提取标注的坐标值。

测试文本样例:

img.png

233

212

229

227

229

238

上述示例为一个标注文件的简化版本,我们需要将其中的坐标值(x1, y1), (x2, y2), (x3, y3)提取出来。

import xml.dom.minidom

if __name__ == '__main__':

xml_path = r"test.xml"

dom = xml.dom.minidom.parse(xml_path)

root = dom.documentElement

i = 1

try:

while 1:

x = root.getElementsByTagName("x" + str(i))

y = root.getElementsByTagName("y" + str(i))

i += 1

print(x[0].firstChild.data, " ", y[0].firstChild.data)

except Exception:

# 因为坐标个数不确定,所以我们使用异常来结束

pass

输出:

233 212

229 227

229 238

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐