使用python将多个字幕文件合并

下载电影字幕的时候，经常会出现一个字幕文件被分成cd1.srt、cd2.srt，但电影是一整块的尴尬情况。为了解决此问题，写了以下代码来合并多个这样的文件读取字幕文件def read_srt(path):content = ""with open(path) as f:content = f.read()return content小测试content = read_srt('1.srt')pri

羊城迷鹿

2176人浏览 · 2020-08-15 00:14:54

羊城迷鹿 · 2020-08-15 00:14:54 发布

下载电影字幕的时候，经常会出现一个字幕文件被分成cd1.srt、cd2.srt，但电影是一整块的尴尬情况。为了解决此问题，写了以下代码来合并多个这样的文件

读取字幕文件

def read_srt(path):
    content = ""
    with open(path) as f:
        content = f.read()
        return content

小测试

content = read_srt('1.srt')
print(content)

在这里插入图片描述

content = read_srt('2.srt')
print(content)

在这里插入图片描述

可以看到字幕的合并要做到两点，一个是内容要合并，一个是序号要对齐，因为2.srt中序号也是从1开始的。

字幕拆分

def get_sequences(content):
    sequences = content.split('\n\n')
    sequences = [sequence.split('\n') for sequence in sequences]
    # 去除每一句空值
    sequences = [list(filter(None, sequence)) for sequence in sequences]
    # 去除整体空值
    return list(filter(None, sequences))

小测试

sequences = get_sequences(content)
sequences

在这里插入图片描述

字幕修改

def change_sequences(sequences, start_index):
    for sequence in sequences:
        sequence[0] = str(start_index)
        start_index += 1

生成新字幕

def save_srt(names):
    new_content = []
    start_index = 1
    for name in names:
        content = read_srt(name)
        sequences = get_sequences(content)
        change_sequences(sequences, start_index)
        start_index = len(sequences) + 1
        new_content += sequences
    new_content = ['\n'.join(word) for word in new_content]
    new_content = '\n\n'.join(new_content)
    print(new_content)
    with open('result.srt', 'a') as f:
        f.write(new_content)

save_srt(['1.srt', '2.srt'])

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda

魔乐社区

如何快速上手 hvac：HashiCorp Vault Python 客户端零基础入门指南

**hvac** 是 HashiCorp Vault 的 Python 3.X 客户端库，专为开发者提供简单高效的 Vault 交互方式。无论你是需要管理密钥、配置身份验证，还是实现安全的秘密数据存储，hvac 都能帮助你轻松搞定 Vault 的各项操作。本文将带你零基础快速入门，从安装到基础操作，让你在几分钟内即可上手使用这个强大的工具。[![hvac 客户端 Logo](https://r