Bio.SCOP.Raf 模块
ASTRAL RAF (快速访问格式) 序列图。
ASTRAL RAF 序列图记录了 PDB SEQRES 记录(代表实验中使用的分子序列)与 ATOM 记录(代表实验观察到的原子)之间的关系。
这些数据来自蛋白质数据库 CIF 文件。CIF 文件中的已知错误会手动更正,原始 PDB 文件作为最终仲裁者,以防出现差异。
残基用残基 ID 引用。它由 PDB 残基序列号(最多 4 位数字)和可选的 PDB 插入代码(一个 ASCII 字母字符,a-z,A-Z)组成。例如“1”、“10A”、“1010b”、“-1”。
参见“ASTRAL RAF 序列图”:http://astral.stanford.edu/raf.html
字典 protein_letters_3to1_extended 提供了从 PDB 文件中找到的 3 字母氨基酸代码到 1 字母代码的映射。3 字母代码包括化学修饰的残基。
- Bio.SCOP.Raf.normalize_letters(one_letter_code)
将 RAF 单字母氨基酸代码转换为 IUPAC 标准代码。
字母大写,“.”(“未知”)转换为“X”。
- class Bio.SCOP.Raf.SeqMapIndex(filename)
基类:
dict
RAF 文件索引。
RAF 文件本身约为 50 MB。此索引提供了快速、随机访问 RAF 记录的功能,而无需将整个文件加载到内存中。
索引键是 PDB ID 和链 ID 的连接。例如“2drcA”,
"155c_"
。RAF 使用下划线来表示空白链 ID。- __init__(filename)
初始化 RAF 文件索引。
- 参数
filename – 要索引的文件
- __getitem__(key)
从索引文件中返回一个项目。
- getSeqMap(residues)
获取一组残基的序列图。
- 参数
residues – Residues 实例,或可转换为 Residues 实例的字符串。
- class Bio.SCOP.Raf.SeqMap(line=None)
基类:
object
ASTRAL RAF (快速访问格式) 序列图。
这是一个类似列表的对象;您可以使用 index() 找到特定残基的位置,将此 SeqMap 切片成片段,并使用 extend() 将片段粘合在一起。
- 属性
pdbid – PDB 4 个字符 ID
pdb_datestamp – 来自 PDB 文件
version – RAF 格式版本。例如 0.01
flags – RAF 标志。(有关详细信息,请参见发布说明。)
res – Res 对象列表,每个对象代表此序列图中的一个残基
- __init__(line=None)
初始化类。
- index(resid, chainid='_')
返回给定 resid 和 chainid 的 SeqMap 的索引。
- __getitem__(index)
从 SeqMap 中提取单个 Res 对象。
- append(res)
将另一个 Res 对象追加到残基映射列表的末尾。
- extend(other)
将另一个 SeqMap 追加到 self 的末尾。
两个 SeqMap 必须具有相同的 PDB ID、PDB 日期戳和 RAF 版本。RAF 标志在不一致时会被擦除。这可能发生在从不同链获取片段时。
- __iadd__(other)
SeqMap 对象的原地加法。
- __add__(other)
SeqMap 对象的加法。
- getAtoms(pdb_handle, out_handle)
从 PDB 文件中提取所有相关的 ATOM 和 HETATOM 记录。
扫描 PDB 文件以查找 ATOM 和 HETATOM 记录。如果链 ID、残基 ID(seqNum 和 iCode)和残基类型与此序列图中的残基匹配,则记录会回显到输出句柄。
这通常用于查找域或其他残基子集的坐标。
- 参数
pdb_handle – 指向相关 PDB 文件的句柄。
out_handle – 所有输出都写入此文件类对象。
- class Bio.SCOP.Raf.Res
基类:
object
来自 RAF 记录的单个残基映射。
- 属性
chainid – 单个字符链 ID。
resid – 残基 ID。
atom – 来自 ATOM 记录的氨基酸单字母代码。
seqres – 来自 SEQRES 记录的氨基酸单字母代码。
- __init__()
初始化类。
- Bio.SCOP.Raf.parse(handle)
遍历 RAF 文件,为每一行提供一个 SeqMap 对象。
- 参数
handle – 文件类对象。