碰到一个问题,要对多语言包里的xml进行内容筛选,

进行文本内容处理,Python是个不错的选择

import sys

import os

def main():

icount = 0

fileName = sys.argv[1] + "\\resources.xml"

outName = sys.argv[1] + "\\tmp.txt"

outfile = open(outName, 'w')

infile = open(fileName, 'r')

for line in infile:

if line.find("xml version") >= 0:

outfile.write(line)

outfile.write("\n")

if line.find("resources xmln") >= 0 or line.find("") >= 0:

outfile.write(line)

infile.close()

outfile.close()

os.remove(fileName)

os.rename(outName, fileName)

main()

利用python来进行文件字符串的处理

需要注意的是,如果源文件是Linux上的文件,其换行符是0A , 在windows上执行,写入的文件中,换行符是0D 0A (\r\n)

采用二进制读写方式可以解决这个问题

outfile = open(outName, 'wb')

infile = open(fileName, 'rb')

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐