Bio.SCOP 包
子模块
模块内容
SCOP:蛋白质结构分类。
SCOP 数据库旨在提供所有已知蛋白质结构的手动构建分类,这些结构被分类为一个层次结构,其主要级别为家族、超家族和折叠。
“SCOP 可解析文件”:http://scop.mrc-lmb.cam.ac.uk/legacy/parse/
此模块中的 Scop 对象代表整个 SCOP 分类。它可以从三个 SCOP 可解析文件构建,根据需要进行修改,并转换回相同的文件格式。可以使用 SCOP 标识符 (sid) 从 Scop 中获取单个 SCOP 结构域 (由 Domain 类表示)。
- nodeCodeDict - 已知 2 个字母节点代码和较长描述之间的映射。
已知的节点类型为 'cl' (类)、'cf' (折叠)、'sf' (超家族)、'fa' (家族)、'dm' (结构域)、'sp' (物种)、'px' (结构域)。将来可能会添加其他节点类型。
此模块还提供访问 WWW 上 SCOP 的代码。
- 函数
search - 访问主 CGI 脚本 (已弃用,不再可用)。
_open - 内部使用的函数。
- Bio.SCOP.cmp_sccs(sccs1, sccs2)
按顺序排列 SCOP 简明分类字符串 (sccs)。
a.4.5.1 < a.4.5.11 < b.1.1.1
sccs (例如 a.4.5.11) 简洁地表示结构域的分类。字母代表类,数字分别代表折叠、超家族和家族。
- Bio.SCOP.parse_domain(term)
将 ASTRAL 标题字符串转换为 Scop 结构域。
ASTRAL (http://astral.stanford.edu/) 标题包含 SCOP 结构域的简明描述。在将 Domain 对象转换为字符串时使用类似的格式。此方法返回的 Domain 包含大多数 SCOP 信息,但它不会位于 SCOP 层次结构中 (即父节点将为 None)。描述由 SCOP 蛋白质和物种描述组成。
典型的 ASTRAL 标题如下所示 - >d1tpt_1 a.46.2.1 (1-70) 胸腺嘧啶磷酸化酶 {大肠杆菌}
- class Bio.SCOP.Scop(cla_handle=None, des_handle=None, hie_handle=None, dir_path=None, db_handle=None, version=None)
Bases:
object
整个 SCOP 层次结构。
root - 层次结构的根节点
- __init__(cla_handle=None, des_handle=None, hie_handle=None, dir_path=None, db_handle=None, version=None)
从 SCOP 可解析文件或 SQL 后端构建 SCOP 层次结构。
如果没有给出文件句柄,则返回具有单个空根节点的 Scop 对象。
如果给出了目录和版本 (使用 dir_path=.., version=…) 或每个文件的句柄,则整个 scop 树将在内存中构建。
如果给出了 MySQLdb 数据库句柄,则树将根据需要构建,最大限度地缩短构建时间。要构建 SQL 数据库,请使用 write_xxx_sql 方法创建表格。
- getRoot()
获取根节点。
- getDomainBySid(sid)
从其 sid 返回结构域。
- getNodeBySunid(sunid)
从其 sunid 返回节点。
- getDomains()
返回所有 SCOP 结构域的有序元组。
- write_hie(handle)
从此对象构建 HIE SCOP 可解析文件。
- write_des(handle)
从此对象构建 DES SCOP 可解析文件。
- write_cla(handle)
从此对象构建 CLA SCOP 可解析文件。
- getDomainFromSQL(sunid=None, sid=None)
使用 sunid 或 sid 从 SQL 后端加载节点。
- getAscendentFromSQL(node, type)
使用 SQL 后端获取祖先。
- getDescendentsFromSQL(node, type)
使用数据库后端获取节点的后代。
这避免了重复的 SQL 调用迭代,因此比反复调用 node.getChildren() 快得多。
- write_hie_sql(handle)
将 HIE 数据写入 SQL 数据库。
- write_cla_sql(handle)
将 CLA 数据写入 SQL 数据库。
- write_des_sql(handle)
将 DES 数据写入 SQL 数据库。
- class Bio.SCOP.Node(scop=None)
Bases:
object
SCOP 层级结构中的一个节点。
- 属性
sunid – SCOP 唯一标识符。例如 '14986'
parent – 父节点
children – 子节点列表
sccs – SCOP 简洁分类字符串。例如 'a.1.1.2'
type – 2 个字母的节点类型代码。例如 'px' 代表域
description – 描述文本。
- __init__(scop=None)
初始化 SCOP 层级结构中的一个节点。
如果构造函数中提供了一个 Scop 实例,则将使用它通过 SQL 方法查找相关引用。如果没有提供实例,则假设整个树都存在并已连接。
- __str__()
将节点表示为字符串。
- toHieRecord()
返回一个 Hie.Record。
- toDesRecord()
返回一个 Des.Record。
- getChildren()
返回此节点的子节点列表。
- getParent()
返回此节点的父节点。
- getDescendents(node_type)
返回指定类型的所有后代节点列表。
节点类型可以是两个字母的代码或更长的描述,例如 'fa' 或 'family'。
- getAscendent(node_type)
返回指定类型的祖先节点,或 None。
节点类型可以是两个字母的代码或更长的描述,例如 'fa' 或 'family'。
- class Bio.SCOP.Domain(scop=None)
Bases:
Node
一个 SCOP 域。SCOP 层级结构中的叶节点。
- 属性
sid - SCOP 域标识符。例如
"d5hbib_"
residues - 一个 Residue 对象。它定义了构成此域的 PDB 原子集合。
- __init__(scop=None)
初始化一个 SCOP Domain 对象。
- __str__()
将 SCOP Domain 表示为字符串。
- toDesRecord()
返回一个 Des.Record。
- toClaRecord()
返回一个 Cla.Record。
- class Bio.SCOP.Astral(dir_path=None, version=None, scop=None, astral_file=None, db_handle=None)
Bases:
object
ASTRAL 数据库的表示。
ASTRAL 数据库的抽象,它包含所有 SCOP 域的序列,以及按百分比标识或 evalue 的聚类。
- __init__(dir_path=None, version=None, scop=None, astral_file=None, db_handle=None)
初始化 astral 数据库。
- 您必须提供 SCOP 文件的目录
- dir_path - 字符串,scopseq-x.xx 目录的路径
(不是目录本身),以及
version - 版本号。
- 或者,一个 FASTA 文件
astral_file - 字符串,FASTA 文件的路径(将加载到内存中)
- 或者,一个 MYSQL 数据库
db_handle - 包含 astral 数据表的 'astral' 的 MYSQL 数据库的数据库句柄。这可以使用 writeToSQL 创建。
- domainsClusteredByEv(id)
获取按 evalue 聚类的域。
- domainsClusteredById(id)
获取按百分比标识聚类的域。
- getAstralDomainsFromFile(filename=None, file_handle=None)
从包含 sid 列表的文件中获取 scop 域。
- getAstralDomainsFromSQL(column)
从 MYSQL 数据库中加载 ASTRAL 域。
从 MYSQL 数据库的 astral 表中的一列中加载一组 astral 域(可以使用 writeToSQL(… 创建)。
- getSeqBySid(domain)
从其 sid 获取给定域的 seq 记录。
- getSeq(domain)
返回与域关联的 seq。
- hashedDomainsById(id)
以字典形式获取按序列标识聚类的域。
- hashedDomainsByEv(id)
以字典形式获取按 evalue 聚类的域。
- isDomainInId(dom, id)
如果域在百分比 ID 的 astral 聚类中,则返回 true。
- isDomainInEv(dom, id)
如果域在 evalue 的 ASTRAL 聚类中,则返回 true。
- writeToSQL(db_handle)
将 ASTRAL 数据库写入 MYSQL 数据库。
- Bio.SCOP.search(pdb=None, key=None, sid=None, disp=None, dir=None, loc=None, cgi='http://scop.mrc-lmb.cam.ac.uk/legacy/search.cgi', **keywds)
访问 SCOP 搜索并返回对结果的句柄(已弃用)。
访问 search.cgi 并返回结果句柄。有关参数的说明,请参见在线帮助文件:http://scop.mrc-lmb.cam.ac.uk/legacy/help.html
如果出现网络错误,则引发 IOError。
此函数现已弃用,将在 Biopython 的未来版本中删除,因为此 search.cgi API 现在不再适用于托管在 EBI 的 SCOP。