Biopython从pdb文件中提取蛋白质链的信息

使用Biopython的PDB模块可以方便地解析PDB文件并提取你需要的信息。

qq_27390023

1618人浏览 · 2024-09-09 20:57:04

qq_27390023 · 2024-09-09 20:57:04 发布

使用Biopython的PDB模块可以方便地解析PDB文件并提取你需要的信息。下面是一个示例代码，用于提取PDB文件中的链名称、序列和长度：

示例代码

from Bio import PDB

# 读取PDB文件
pdb_file = "/Users/zhengxueming/Downloads/1a0h.pdb"
parser = PDB.PDBParser(QUIET=True)
structure = parser.get_structure("protein", pdb_file)

# 初始化保存信息的列表
chain_info = []

# 遍历所有模型、链和残基
for model in structure:
    for chain in model:
        chain_id = chain.id
        sequence = []
        for residue in chain:
            # 检查是否是标准氨基酸
            if PDB.is_aa(residue):
                sequence.append(PDB.Polypeptide.three_to_one(residue.resname))
        # 提取链的序列和长度
        seq_str = ''.join(sequence)
        chain_length = len(sequence)
        chain_info.append((chain_id, chain_length, seq_str))

# 打印链的信息
for chain_id, chain_length, seq_str in chain_info:
    print(f"链ID: {chain_id}, 长度: {chain_length}, 序列: {seq_str}")

代码说明

PDBParser：用于解析PDB文件。
structure：从PDB文件中解析得到的蛋白质结构对象。
is_aa(residue)：检查是否为标准氨基酸。
three_to_one(residue.resname)：将三字母氨基酸代码转换为一字母代码。
链长度和序列：对于每个链，计算其序列并记录长度。

如果你有特定的需求，比如要处理非标准氨基酸或不同的残基类型，也可以根据需要调整代码。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda

魔乐社区

如何快速上手 hvac：HashiCorp Vault Python 客户端零基础入门指南

**hvac** 是 HashiCorp Vault 的 Python 3.X 客户端库，专为开发者提供简单高效的 Vault 交互方式。无论你是需要管理密钥、配置身份验证，还是实现安全的秘密数据存储，hvac 都能帮助你轻松搞定 Vault 的各项操作。本文将带你零基础快速入门，从安装到基础操作，让你在几分钟内即可上手使用这个强大的工具。[![hvac 客户端 Logo](https://r