python txt 和 xml 格式互转

图片检测 label 文件 txt 和 xml 互转

爱学习的小道长

1954人浏览 · 2022-09-09 09:55:14

爱学习的小道长 · 2022-09-09 09:55:14 发布

背景：

图片检测中标注文件 txt 格式和 xml 格式互相转化

label.txt

Car 1701 915 1920 1039
Car 625 765 808 839
Car 1827 783 1919 859
Cyclist 1252 767 1317 835
Cyclist 1395 816 1487 894
Car 24 636 135 683
Car 1027 673 1075 717
Car 900 685 950 730
Car 912 651 949 684

label.xml
在这里插入图片描述

xml --> txt

import xml.etree.ElementTree as ET
import os


# 数据标签
classes = ['Pedestrian','Cyclist','Car','Bus','Tram','Truck','Dump_Truck','Cement_truck','Fule_Tank','Trailer','Misc','TrafficLight_Dig','TrafficLight_Black','TrafficLight_Yellow','yup','yright','ycircle','TrafficLight_Red','rup','rright','rleft','rperson','rcircle','TrafficLight_Green','gup','gdown','gright','gleft','gcircle','gperson','gbike']



def convert_annotation(xmlpath,txtpath,xmlname):
    name = xmlname.split('.')[0]

    if not os.path.exists(txtpath):
        os.makedirs(txtpath)
    txtfile = os.path.join(txtpath, name +".txt")

    xmlfile = os.path.join(xmlpath,xmlname)
    with open(xmlfile, "r", encoding='UTF-8') as in_file:
        with open(txtfile, "w+" ,encoding='UTF-8') as out_file:
            tree=ET.parse(in_file)

            root = tree.getroot()
            size = root.find('size')
            w = int(size.find('width').text)
            h = int(size.find('height').text)
            d = int(size.find('depth').text)
            out_file.truncate()
            for obj in root.find('outputs').find('object'):
                cls = obj.find('name').text
                if cls not in classes:
                    continue
                cls_id = classes.index(cls)
                xmlbox = obj.find('bndbox')
                b = (int(xmlbox.find('xmin').text), int(xmlbox.find('ymin').text), int(xmlbox.find('xmax').text),
                     int(xmlbox.find('ymax').text))


                out_file.write(cls + " " + " ".join([str(a) for a in b]) + '\n')
        print(txtfile + " was written ！！")


if __name__ == "__main__":

    rootpath = '/media/wxf/Elements/data/video'
    xmlpath = rootpath + os.sep + 'label_xml'
    txtpath = rootpath + os.sep + 'label_xml2txt'

    xml_list = os.listdir(xmlpath)

    for i in range(0, len(xml_list)):
        path = os.path.join(xmlpath, xml_list[i])
        if ('.xml' in path) or ('.XML' in path):
            convert_annotation(xmlpath, txtpath, xml_list[i])
            print('done', i)
        else:
            print('not xml file', i)

txt --> xml

import os
import numpy as np
import xml.etree.ElementTree as ET
from xml.etree.ElementTree import Element, SubElement, tostring
from xml.dom.minidom import parseString

import cv2
import time


def MakeTxt2Xml(txt_path,xml_path,png_path):
    data = np.loadtxt(txt_path,dtype=np.str_)
    if data.size == 0:
        output = "Begin process, " + txt_path + " is null!!!"
        print(output)
    if data.ndim == 1:
        data = np.array([data])
    doc_root = ET.Element('doc')
    tree = ET.ElementTree(doc_root)

    img_path_element = ET.Element('path')
    img_path_element.text = png_path
    doc_root.append(img_path_element)

    outputs_element = ET.Element('outputs')
    object_element = SubElement(outputs_element,'object')
    # element.append(SubElement) 与  subelement = SubElement(main_element,'subelement') 是相同的意思
    for i in range(data.shape[0]):

        item_element = SubElement(object_element, 'item')


        name_element = SubElement(item_element, 'name')
        name_element.text = data[i][0]

        bndbox_element = SubElement(item_element, 'bndbox')

        xmin_element = SubElement(bndbox_element, 'xmin')
        xmin_element.text = str(data[i][1])

        ymin_element = SubElement(bndbox_element, 'ymin')
        ymin_element.text = str(data[i][2])

        xmax_element = SubElement(bndbox_element, 'xmax')
        xmax_element.text = str(data[i][3])

        ymax_element = SubElement(bndbox_element, 'ymax')
        ymax_element.text = str(data[i][4])


    doc_root.append(outputs_element)

    time_element = ET.Element('time_labeled')
    # time_element.text = time.strftime("%Y-%m-%d_%H:%M:%S", time.localtime())
    time_element.text = str(int(round(time.time() * 1000)))
    doc_root.append(time_element)

    labeled_element = ET.Element('labeled')
    if (os.path.exists(txt_path)):
        labeled_element.text = str("true")
    else:
        labeled_element.text = str("false")
    doc_root.append(labeled_element)

    size_element = ET.Element('size')
    width_element = SubElement(size_element, 'width')
    img = cv2.imread(png_path)
    # width_element.text = str(img.shape[1])
    # height_element = SubElement(size_element, 'height')
    # height_element.text = str(img.shape[0])
    # depth_element = SubElement(size_element, 'depth')
    # depth_element.text = str(img.shape[2])
    width_element.text = str(1920)
    height_element = SubElement(size_element, 'height')
    height_element.text = str(1080)
    depth_element = SubElement(size_element, 'depth')
    depth_element.text = str(3)

    doc_root.append(size_element)

    xml = tostring(doc_root)
    dom = parseString(xml)

    # xml_name = pic_name.replace(".jpg", "")
    # xml_name = os.path.join(save_xml_path, xml_name + '.xml')
    with open(xml_path, 'wb') as f:
        f.write(dom.toprettyxml(indent='\t', encoding='utf-8'))
    print(xml_path+" is writed!")



if __name__ == "__main__":
    labeltxt = "/media/wxf/Elements/data/video/label_txt"
    labelxml = "/media/wxf/Elements/data/video/label_xml"
    img_path = "."


    for txt in sorted(os.listdir(labeltxt)):
        txt_path = os.path.join(labeltxt,txt)
        name = txt.split(".")[-2]
        xml_path = labelxml + os.sep + name + ".xml"
        png_path = img_path + os.sep + name + ".png"
        if os.path.exists(txt_path):
            # print(txt_path)
            MakeTxt2Xml(txt_path,xml_path,png_path)

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。