Bio.motifs.transfac 模块
解析 TRANSFAC 文件。
- class Bio.motifs.transfac.Motif(alphabet='ACGT', alignment=None, counts=None, instances=None)
基类:
Motif
,dict
存储一个 TRANSFAC 基序的信息。
此类继承自 Bio.motifs.Motif 基类,以及 Python 字典。解析器找到的所有基序信息都尽可能存储为基类的属性;有关这些属性的描述,请参阅 Bio.motifs.Motif 基类。与基序关联的所有其他信息都存储在字典中,以 (键,值) 对的形式存储,其中键是 TRANSFAC 文件中找到的两位字母字段。引用是一个例外:它们存储在 .references 属性中。
这些字段通常在 TRANSFAC 文件中找到
AC: Accession number AS: Accession numbers, secondary BA: Statistical basis BF: Binding factors BS: Factor binding sites underlying the matrix [sequence; SITE accession number; start position for matrix sequence; length of sequence used; number of gaps inserted; strand orientation.] CC: Comments CO: Copyright notice DE: Short factor description DR: External databases [database name: database accession number] DT: Date created/updated HC: Subfamilies HP: Superfamilies ID: Identifier NA: Name of the binding factor OC: Taxonomic classification OS: Species/Taxon OV: Older version PV: Preferred version TY: Type XX: Empty line; these are not stored in the Record.
引用存储在 .references 属性中,它是一个包含以下键的字典列表
RN: Reference number RA: Reference authors RL: Reference data RT: Reference title RX: PubMed ID
有关更多信息,请参阅 TRANSFAC 文档。
- multiple_value_keys = {'BF', 'BS', 'CC', 'DR', 'DT', 'HC', 'HP', 'OV'}
- reference_keys = {'RA', 'RL', 'RT', 'RX'}
- __getitem__(key)
为 key 中包含的位置返回一个新的 Motif 对象。
>>> from Bio import motifs >>> motif = motifs.create(["AACGCCA", "ACCGCCC", "AACTCCG"]) >>> print(motif) AACGCCA ACCGCCC AACTCCG >>> print(motif[:-1]) AACGCC ACCGCC AACTCC
- class Bio.motifs.transfac.Record
基类:
list
存储 TRANSFAC 矩阵表中的信息。
记录继承自包含各个基序的列表。
- 属性
version - 版本号,对应 TRANSFAC 文件中的 'VV' 字段;
- __init__()
初始化类。
- __str__()
将 TRANSFAC 矩阵转换为字符串。
- Bio.motifs.transfac.read(handle, strict=True)
将 transfac 格式句柄解析为 Record 对象。
- Bio.motifs.transfac.write(motifs)
以 TRANSFAC 格式写入基序的表示。