Bio.ExPASy.Prosite 模块

用于解析来自 ExPASy 上 Prosite 的 prosite dat 文件的解析器。

参见 https://www.expasy.org/prosite/

已测试版本
  • 20.43 版,2009 年 2 月 10 日

  • 2017 年 3 月 15 日发布的 2017_03 版。

函数
  • read 读取包含一个 Prosite 记录的 Prosite 文件

  • parse 迭代 Prosite 文件中的记录。

  • Record 保存 Prosite 数据。

Bio.ExPASy.Prosite.parse(handle)

解析 Prosite 记录。

此函数用于解析包含多个记录的 Prosite 文件。

参数
  • handle - 文件句柄。

Bio.ExPASy.Prosite.read(handle)

读取一条 Prosite 记录。

此函数用于解析只包含一条记录的 Prosite 文件。

参数
  • handle - 文件句柄。

class Bio.ExPASy.Prosite.Record

基类: object

保存来自 Prosite 记录的信息。

主要属性
  • name 记录的 ID。例如 ADH_ZINC

  • type 条目类型。例如 PATTERN、MATRIX 或 RULE

  • accession 例如 PS00387

  • created 条目创建日期。(对于 2017 年 1 月之前的版本,为 MMM-YYYY;对于 2017 年 1 月之后的版本,为 DD-MMM-YYYY)

  • data_update “主要” 数据最后更新日期。

  • info_update 除“主要” 数据之外的其他数据最后更新日期。

  • pdoc PROSITE DOCumentation 的 ID。

  • description 自由格式描述。

  • pattern PROSITE 模式。参见文档。

  • matrix 描述矩阵条目的字符串列表。

  • rules 规则定义列表(来自 RU 行)。(字符串)

  • prorules prorule 列表(来自 PR 行)。(字符串)

数值结果
  • nr_sp_release SwissProt 版本。

  • nr_sp_seqs 该版本 Swiss-Prot 中的序列数。(int)

  • nr_total Swiss-Prot 中的命中次数。包含 (命中次数, 序列数) 的元组

  • nr_positive 真阳性。包含 (命中次数, 序列数) 的元组

  • nr_unknown 可能为阳性。包含 (命中次数, 序列数) 的元组

  • nr_false_pos 假阳性。包含 (命中次数, 序列数) 的元组

  • nr_false_neg 假阴性。(int)

  • nr_partial 假阴性,因为它们是片段。(int)

评论
  • cc_taxo_range 分类范围。参见文档了解格式

  • cc_max_repeat 蛋白质中重复的最大次数

  • cc_site 关注的位点。包含 (模式位置, 描述) 元组的列表

  • cc_skip_flag 该条目可以忽略吗?

  • cc_matrix_type

  • cc_scaling_db

  • cc_author

  • cc_ft_key

  • cc_ft_desc

  • cc_version 版本号(在 19.0 版中引入)

以下是包含 (Swiss-Prot 登录号, Swiss-Prot 名称) 元组的列表。

数据银行参考
  • dr_positive

  • dr_false_neg

  • dr_false_pos

  • dr_potential 可能命中,但指纹区域尚未可用。

  • dr_unknown 可能属于

  • pdb_structs PDB 条目列表。

__init__()

初始化类。