Bio.PDB.DSSP 模块
使用 DSSP 程序计算二级结构和可及性。
您需要有一个可用的 DSSP 版本(以及许可证,学术用途免费)才能使用它。有关 DSSP,请参阅 https://swift.cmbi.umcn.nl/gv/dssp/。
以下可使用可及表面积 (ASA) 值,默认为 Sander 和 Rost 值
- Ahmad
Ahmad 等人,2003 https://doi.org/10.1002/prot.10328
- Miller
Miller 等人,1987 https://doi.org/10.1016/0022-2836(87)90038-6
- Sander
Sander 和 Rost,1994 https://doi.org/10.1002/prot.340200303
- Wilke
Tien 等人,2013 https://doi.org/10.1371/journal.pone.0080635
此处使用的 DSSP 二级结构代码为
代码
结构
H
α 螺旋 (4-12)
B
孤立 β 桥残基
E
链
G
3-10 螺旋
I
π 螺旋
T
转角
S
弯曲
-
无
用法
DSSP 类可用于在 PDB 或 mmCIF 文件上运行 DSSP,并提供对 DSSP 二级结构和可及性的处理。
注意 DSSP 只能处理一个模型,并且只会对提供的 PDB 文件中的第一个模型运行计算。
示例
典型用法
from Bio.PDB import PDBParser
from Bio.PDB.DSSP import DSSP
p = PDBParser()
structure = p.get_structure("1MOT", "/local-pdb/1mot.pdb")
model = structure[0]
dssp = DSSP(model, "/local-pdb/1mot.pdb")
请注意,DSSP-2 包中的最新 DSSP 可执行文件已从 dssp
重命名为 mkdssp
。如果使用的是最新 DSSP 版本,您可能需要提供 DSSP 可执行文件的名称
dssp = DSSP(model, '/local-pdb/1mot.pdb', dssp='mkdssp')
DSSP 数据由一个元组访问 - (链 ID,残基 ID)
a_key = list(dssp.keys())[2]
dssp[a_key]
为单个残基返回的 dssp 数据是以下形式的元组
元组索引
值
0
DSSP 索引
1
氨基酸
2
二级结构
3
相对 ASA
4
Phi
5
Psi
6
NH–>O_1_relidx
7
NH–>O_1_energy
8
O–>NH_1_relidx
9
O–>NH_1_energy
10
NH–>O_2_relidx
11
NH–>O_2_energy
12
O–>NH_2_relidx
13
O–>NH_2_energy
- Bio.PDB.DSSP.version(version_string)
解析语义版本方案,以便轻松比较。
- Bio.PDB.DSSP.ss_to_index(ss)
二级结构符号到索引。
H=0 E=1 C=2
- Bio.PDB.DSSP.dssp_dict_from_pdb_file(in_file, DSSP='dssp', dssp_version='3.9.9')
从 PDB 文件创建 DSSP 字典。
- 参数:
- in_file字符串
pdb 文件
- DSSP字符串
DSSP 可执行文件(子进程的参数)
- dssp_version字符串
DSSP 可执行文件的版本
- 返回:
- (out_dict, keys)元组
一个字典,将 (chainid,resid) 映射到氨基酸类型、二级结构代码和可及性。
示例
如何使用 dssp_dict_from_pdb_file
from Bio.PDB.DSSP import dssp_dict_from_pdb_file dssp_tuple = dssp_dict_from_pdb_file("/local-pdb/1fat.pdb") dssp_dict = dssp_tuple[0] print(dssp_dict['A',(' ', 1, ' ')])
- Bio.PDB.DSSP.make_dssp_dict(filename)
DSSP 字典,将标识符映射到属性。
从 DSSP 文件返回一个 DSSP 字典,将 (chainid,resid) 映射到 aa、ss 和可及性。
- 参数:
- filename字符串
DSSP 输出文件
- class Bio.PDB.DSSP.DSSP(model, in_file, dssp='dssp', acc_array='Sander', file_type='')
-
运行 DSSP 并解析二级结构和可及性。
在 PDB/mmCIF 文件上运行 DSSP,并提供对 DSSP 二级结构和可及性的处理。
注意 DSSP 只能处理一个模型。
示例
如何使用 DSSP
from Bio.PDB import PDBParser from Bio.PDB.DSSP import DSSP p = PDBParser() structure = p.get_structure("1MOT", "/local-pdb/1mot.pdb") model = structure[0] dssp = DSSP(model, "/local-pdb/1mot.pdb") # DSSP data is accessed by a tuple (chain_id, res_id) a_key = list(dssp.keys())[2] # (dssp index, amino acid, secondary structure, relative ASA, phi, psi, # NH_O_1_relidx, NH_O_1_energy, O_NH_1_relidx, O_NH_1_energy, # NH_O_2_relidx, NH_O_2_energy, O_NH_2_relidx, O_NH_2_energy) dssp[a_key]
- __init__(model, in_file, dssp='dssp', acc_array='Sander', file_type='')
创建 DSSP 对象。
- 参数:
- modelModel
结构的第一个模型
- in_file字符串
PDB 文件或 DSSP 文件。
- dssp字符串
dssp 可执行文件(即子进程的参数)
- acc_array字符串
可及表面积 (ASA),来自 Miller 等人 (1987)、Sander & Rost (1994)、Wilke:Tien 等人 (2013) 或 Ahmad 等人 (2003),作为字符串 Sander/Wilke/Miller/Ahmad。默认为 Sander。
- file_type:字符串
文件类型开关:PDB、MMCIF 或 DSSP。默认情况下,从文件扩展名推断。