Bio.SCOP 包

子模块

模块内容

SCOP:蛋白质结构分类。

SCOP 数据库旨在提供所有已知蛋白质结构的手动构建分类,这些结构被分类为一个层次结构,其主要级别为家族、超家族和折叠。

此模块中的 Scop 对象代表整个 SCOP 分类。它可以从三个 SCOP 可解析文件构建,根据需要进行修改,并转换回相同的文件格式。可以使用 SCOP 标识符 (sid) 从 Scop 中获取单个 SCOP 结构域 (由 Domain 类表示)。

  • nodeCodeDict - 已知 2 个字母节点代码和较长描述之间的映射。

    已知的节点类型为 'cl' (类)、'cf' (折叠)、'sf' (超家族)、'fa' (家族)、'dm' (结构域)、'sp' (物种)、'px' (结构域)。将来可能会添加其他节点类型。

此模块还提供访问 WWW 上 SCOP 的代码。

函数
  • search - 访问主 CGI 脚本 (已弃用,不再可用)。

  • _open - 内部使用的函数。

Bio.SCOP.cmp_sccs(sccs1, sccs2)

按顺序排列 SCOP 简明分类字符串 (sccs)。

a.4.5.1 < a.4.5.11 < b.1.1.1

sccs (例如 a.4.5.11) 简洁地表示结构域的分类。字母代表类,数字分别代表折叠、超家族和家族。

Bio.SCOP.parse_domain(term)

将 ASTRAL 标题字符串转换为 Scop 结构域。

ASTRAL (http://astral.stanford.edu/) 标题包含 SCOP 结构域的简明描述。在将 Domain 对象转换为字符串时使用类似的格式。此方法返回的 Domain 包含大多数 SCOP 信息,但它不会位于 SCOP 层次结构中 (即父节点将为 None)。描述由 SCOP 蛋白质和物种描述组成。

典型的 ASTRAL 标题如下所示 - >d1tpt_1 a.46.2.1 (1-70) 胸腺嘧啶磷酸化酶 {大肠杆菌}

class Bio.SCOP.Scop(cla_handle=None, des_handle=None, hie_handle=None, dir_path=None, db_handle=None, version=None)

Bases: object

整个 SCOP 层次结构。

root - 层次结构的根节点

__init__(cla_handle=None, des_handle=None, hie_handle=None, dir_path=None, db_handle=None, version=None)

从 SCOP 可解析文件或 SQL 后端构建 SCOP 层次结构。

如果没有给出文件句柄,则返回具有单个空根节点的 Scop 对象。

如果给出了目录和版本 (使用 dir_path=.., version=…) 或每个文件的句柄,则整个 scop 树将在内存中构建。

如果给出了 MySQLdb 数据库句柄,则树将根据需要构建,最大限度地缩短构建时间。要构建 SQL 数据库,请使用 write_xxx_sql 方法创建表格。

getRoot()

获取根节点。

getDomainBySid(sid)

从其 sid 返回结构域。

getNodeBySunid(sunid)

从其 sunid 返回节点。

getDomains()

返回所有 SCOP 结构域的有序元组。

write_hie(handle)

从此对象构建 HIE SCOP 可解析文件。

write_des(handle)

从此对象构建 DES SCOP 可解析文件。

write_cla(handle)

从此对象构建 CLA SCOP 可解析文件。

getDomainFromSQL(sunid=None, sid=None)

使用 sunid 或 sid 从 SQL 后端加载节点。

getAscendentFromSQL(node, type)

使用 SQL 后端获取祖先。

getDescendentsFromSQL(node, type)

使用数据库后端获取节点的后代。

这避免了重复的 SQL 调用迭代,因此比反复调用 node.getChildren() 快得多。

write_hie_sql(handle)

将 HIE 数据写入 SQL 数据库。

write_cla_sql(handle)

将 CLA 数据写入 SQL 数据库。

write_des_sql(handle)

将 DES 数据写入 SQL 数据库。

class Bio.SCOP.Node(scop=None)

Bases: object

SCOP 层级结构中的一个节点。

属性
  • sunid – SCOP 唯一标识符。例如 '14986'

  • parent – 父节点

  • children – 子节点列表

  • sccs – SCOP 简洁分类字符串。例如 'a.1.1.2'

  • type – 2 个字母的节点类型代码。例如 'px' 代表域

  • description – 描述文本。

__init__(scop=None)

初始化 SCOP 层级结构中的一个节点。

如果构造函数中提供了一个 Scop 实例,则将使用它通过 SQL 方法查找相关引用。如果没有提供实例,则假设整个树都存在并已连接。

__str__()

将节点表示为字符串。

toHieRecord()

返回一个 Hie.Record。

toDesRecord()

返回一个 Des.Record。

getChildren()

返回此节点的子节点列表。

getParent()

返回此节点的父节点。

getDescendents(node_type)

返回指定类型的所有后代节点列表。

节点类型可以是两个字母的代码或更长的描述,例如 'fa' 或 'family'。

getAscendent(node_type)

返回指定类型的祖先节点,或 None。

节点类型可以是两个字母的代码或更长的描述,例如 'fa' 或 'family'。

class Bio.SCOP.Domain(scop=None)

Bases: Node

一个 SCOP 域。SCOP 层级结构中的叶节点。

属性
  • sid - SCOP 域标识符。例如 "d5hbib_"

  • residues - 一个 Residue 对象。它定义了构成此域的 PDB 原子集合。

__init__(scop=None)

初始化一个 SCOP Domain 对象。

__str__()

将 SCOP Domain 表示为字符串。

toDesRecord()

返回一个 Des.Record。

toClaRecord()

返回一个 Cla.Record。

class Bio.SCOP.Astral(dir_path=None, version=None, scop=None, astral_file=None, db_handle=None)

Bases: object

ASTRAL 数据库的表示。

ASTRAL 数据库的抽象,它包含所有 SCOP 域的序列,以及按百分比标识或 evalue 的聚类。

__init__(dir_path=None, version=None, scop=None, astral_file=None, db_handle=None)

初始化 astral 数据库。

您必须提供 SCOP 文件的目录
  • dir_path - 字符串,scopseq-x.xx 目录的路径

    (不是目录本身),以及

  • version - 版本号。

或者,一个 FASTA 文件
  • astral_file - 字符串,FASTA 文件的路径(将加载到内存中)

或者,一个 MYSQL 数据库
  • db_handle - 包含 astral 数据表的 'astral' 的 MYSQL 数据库的数据库句柄。这可以使用 writeToSQL 创建。

domainsClusteredByEv(id)

获取按 evalue 聚类的域。

domainsClusteredById(id)

获取按百分比标识聚类的域。

getAstralDomainsFromFile(filename=None, file_handle=None)

从包含 sid 列表的文件中获取 scop 域。

getAstralDomainsFromSQL(column)

从 MYSQL 数据库中加载 ASTRAL 域。

从 MYSQL 数据库的 astral 表中的一列中加载一组 astral 域(可以使用 writeToSQL(… 创建)。

getSeqBySid(domain)

从其 sid 获取给定域的 seq 记录。

getSeq(domain)

返回与域关联的 seq。

hashedDomainsById(id)

以字典形式获取按序列标识聚类的域。

hashedDomainsByEv(id)

以字典形式获取按 evalue 聚类的域。

isDomainInId(dom, id)

如果域在百分比 ID 的 astral 聚类中,则返回 true。

isDomainInEv(dom, id)

如果域在 evalue 的 ASTRAL 聚类中,则返回 true。

writeToSQL(db_handle)

将 ASTRAL 数据库写入 MYSQL 数据库。

Bio.SCOP.search(pdb=None, key=None, sid=None, disp=None, dir=None, loc=None, cgi='http://scop.mrc-lmb.cam.ac.uk/legacy/search.cgi', **keywds)

访问 SCOP 搜索并返回对结果的句柄(已弃用)。

访问 search.cgi 并返回结果句柄。有关参数的说明,请参见在线帮助文件:http://scop.mrc-lmb.cam.ac.uk/legacy/help.html

如果出现网络错误,则引发 IOError。

此函数现已弃用,将在 Biopython 的未来版本中删除,因为此 search.cgi API 现在不再适用于托管在 EBI 的 SCOP。