Bio.PDB.DSSP 模块

使用 DSSP 程序计算二级结构和可及性。

您需要有一个可用的 DSSP 版本(以及许可证,学术用途免费)才能使用它。有关 DSSP,请参阅 https://swift.cmbi.umcn.nl/gv/dssp/

以下可使用可及表面积 (ASA) 值,默认为 Sander 和 Rost 值

Ahmad

Ahmad 等人,2003 https://doi.org/10.1002/prot.10328

Miller

Miller 等人,1987 https://doi.org/10.1016/0022-2836(87)90038-6

Sander

Sander 和 Rost,1994 https://doi.org/10.1002/prot.340200303

Wilke

Tien 等人,2013 https://doi.org/10.1371/journal.pone.0080635

此处使用的 DSSP 二级结构代码为

代码

结构

H

α 螺旋 (4-12)

B

孤立 β 桥残基

E

G

3-10 螺旋

I

π 螺旋

T

转角

S

弯曲

-

用法

DSSP 类可用于在 PDB 或 mmCIF 文件上运行 DSSP,并提供对 DSSP 二级结构和可及性的处理。

注意 DSSP 只能处理一个模型,并且只会对提供的 PDB 文件中的第一个模型运行计算。

示例

典型用法

from Bio.PDB import PDBParser
from Bio.PDB.DSSP import DSSP
p = PDBParser()
structure = p.get_structure("1MOT", "/local-pdb/1mot.pdb")
model = structure[0]
dssp = DSSP(model, "/local-pdb/1mot.pdb")

请注意,DSSP-2 包中的最新 DSSP 可执行文件已从 dssp 重命名为 mkdssp。如果使用的是最新 DSSP 版本,您可能需要提供 DSSP 可执行文件的名称

dssp = DSSP(model, '/local-pdb/1mot.pdb', dssp='mkdssp')

DSSP 数据由一个元组访问 - (链 ID,残基 ID)

a_key = list(dssp.keys())[2]
dssp[a_key]

为单个残基返回的 dssp 数据是以下形式的元组

元组索引

0

DSSP 索引

1

氨基酸

2

二级结构

3

相对 ASA

4

Phi

5

Psi

6

NH–>O_1_relidx

7

NH–>O_1_energy

8

O–>NH_1_relidx

9

O–>NH_1_energy

10

NH–>O_2_relidx

11

NH–>O_2_energy

12

O–>NH_2_relidx

13

O–>NH_2_energy

Bio.PDB.DSSP.version(version_string)

解析语义版本方案,以便轻松比较。

Bio.PDB.DSSP.ss_to_index(ss)

二级结构符号到索引。

H=0 E=1 C=2

Bio.PDB.DSSP.dssp_dict_from_pdb_file(in_file, DSSP='dssp', dssp_version='3.9.9')

从 PDB 文件创建 DSSP 字典。

参数:
in_file字符串

pdb 文件

DSSP字符串

DSSP 可执行文件(子进程的参数)

dssp_version字符串

DSSP 可执行文件的版本

返回:
(out_dict, keys)元组

一个字典,将 (chainid,resid) 映射到氨基酸类型、二级结构代码和可及性。

示例

如何使用 dssp_dict_from_pdb_file

from Bio.PDB.DSSP import dssp_dict_from_pdb_file
dssp_tuple = dssp_dict_from_pdb_file("/local-pdb/1fat.pdb")
dssp_dict = dssp_tuple[0]
print(dssp_dict['A',(' ', 1, ' ')])
Bio.PDB.DSSP.make_dssp_dict(filename)

DSSP 字典,将标识符映射到属性。

从 DSSP 文件返回一个 DSSP 字典,将 (chainid,resid) 映射到 aa、ss 和可及性。

参数:
filename字符串

DSSP 输出文件

class Bio.PDB.DSSP.DSSP(model, in_file, dssp='dssp', acc_array='Sander', file_type='')

基础:AbstractResiduePropertyMap

运行 DSSP 并解析二级结构和可及性。

在 PDB/mmCIF 文件上运行 DSSP,并提供对 DSSP 二级结构和可及性的处理。

注意 DSSP 只能处理一个模型。

示例

如何使用 DSSP

from Bio.PDB import PDBParser
from Bio.PDB.DSSP import DSSP
p = PDBParser()
structure = p.get_structure("1MOT", "/local-pdb/1mot.pdb")
model = structure[0]
dssp = DSSP(model, "/local-pdb/1mot.pdb")
# DSSP data is accessed by a tuple (chain_id, res_id)
a_key = list(dssp.keys())[2]
# (dssp index, amino acid, secondary structure, relative ASA, phi, psi,
# NH_O_1_relidx, NH_O_1_energy, O_NH_1_relidx, O_NH_1_energy,
# NH_O_2_relidx, NH_O_2_energy, O_NH_2_relidx, O_NH_2_energy)
dssp[a_key]
__init__(model, in_file, dssp='dssp', acc_array='Sander', file_type='')

创建 DSSP 对象。

参数:
modelModel

结构的第一个模型

in_file字符串

PDB 文件或 DSSP 文件。

dssp字符串

dssp 可执行文件(即子进程的参数)

acc_array字符串

可及表面积 (ASA),来自 Miller 等人 (1987)、Sander & Rost (1994)、Wilke:Tien 等人 (2013) 或 Ahmad 等人 (2003),作为字符串 Sander/Wilke/Miller/Ahmad。默认为 Sander。

file_type:字符串

文件类型开关:PDB、MMCIF 或 DSSP。默认情况下,从文件扩展名推断。