Bio.UniProt.GOA 模块
UniProt-GOA 的 GAF、GPA 和 GPI 格式解析器。
Uniprot-GOA 自述文件 + GAF 格式说明:ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/UNIPROT/README
基因关联文件,GAF 格式:http://geneontology.org/docs/go-annotation-file-gaf-format-2.2/ http://geneontology.org/docs/go-annotation-file-gaf-format-2.1/ http://geneontology.org/docs/go-annotation-file-gaf-format-2.0/
基因产物关联数据 (GPA 格式) 自述文件:http://geneontology.org/docs/gene-product-association-data-gpad-format/
基因产物信息 (GPI 格式) 自述文件:http://geneontology.org/docs/gene-product-information-gpi-format/
GO 注释文件位于此处:ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/
- Bio.UniProt.GOA.gpi_iterator(handle)
读取 GPI 格式文件。
此函数应用于读取 gp_information.goa_uniprot 文件。目前,只有一种格式,但可能会改变,因此此函数是将来包装器的占位符。
- Bio.UniProt.GOA.gpa_iterator(handle)
读取 GPA 格式文件。
此函数应用于读取 gene_association.goa_uniprot 文件。读取第一条记录,并根据需要返回 gpa 1.1 或 gpa 1.0 迭代器
- Bio.UniProt.GOA.gafbyproteiniterator(handle)
遍历基因关联文件中的记录。
返回具有相同 DB_Object_ID 的所有连续记录的列表此函数应用于读取 gene_association.goa_uniprot 文件。读取第一条记录,并根据需要返回 gaf 2.0 或 gaf 1.0 迭代器2016-04-09:添加了 GAF 2.1 迭代器并修复了迭代器分配中的错误目前,GAF 2.1 使用 GAF 2.0 迭代器
- Bio.UniProt.GOA.gafiterator(handle)
遍历 GAF 1.0 或 2.x 文件。
此函数应用于读取 gene_association.goa_uniprot 文件。读取第一条记录,并根据需要返回 gaf 2.x 或 gaf 1.0 迭代器
示例:打开、读取、遍历和过滤结果。
原始数据文件已缩减至约 600 行。
原始来源 ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/YEAST/goa_yeast.gaf.gz
>>> from Bio.UniProt.GOA import gafiterator, record_has >>> Evidence = {'Evidence': set(['ND'])} >>> Synonym = {'Synonym': set(['YA19A_YEAST', 'YAL019W-A'])} >>> Taxon_ID = {'Taxon_ID': set(['taxon:559292'])} >>> with open('UniProt/goa_yeast.gaf', 'r') as handle: ... for rec in gafiterator(handle): ... if record_has(rec, Taxon_ID) and record_has(rec, Evidence) and record_has(rec, Synonym): ... for key in ('DB_Object_Name', 'Evidence', 'Synonym', 'Taxon_ID'): ... print(rec[key]) ... Putative uncharacterized protein YAL019W-A ND ['YA19A_YEAST', 'YAL019W-A'] ['taxon:559292'] Putative uncharacterized protein YAL019W-A ND ['YA19A_YEAST', 'YAL019W-A'] ['taxon:559292'] Putative uncharacterized protein YAL019W-A ND ['YA19A_YEAST', 'YAL019W-A'] ['taxon:559292']
- Bio.UniProt.GOA.writerec(outrec, handle, fields=GAF20FIELDS)
将单个 UniProt-GOA 记录写入输出流。
调用者应了解格式版本。默认值:gaf-2.0如果标题具有值,则假设这是第一条记录,将写入标题。
- Bio.UniProt.GOA.writebyproteinrec(outprotrec, handle, fields=GAF20FIELDS)
将 GAF 记录列表写入输出流。
调用者应了解格式版本。默认值:gaf-2.0如果标题具有值,则假设这是第一条记录,将写入标题。通常,该列表是 fafbyproteinrec 读取的列表,其中包含具有相同 DB_Object_ID 的所有连续行
- Bio.UniProt.GOA.record_has(inrec, fieldvals)
接受记录和字段值的字典。
格式为 {‘field_name’: set([val1, val2])}。如果记录中的任何字段具有匹配的值,则该函数返回 True。否则,返回 False。