Bio.SeqIO.PhdIO 模块
Bio.SeqIO 对“phd”文件格式的支持。
PHD 文件是由 PHRED 输出的,并由 PHRAP 和 CONSED 使用。
您应该通过 Bio.SeqIO 函数使用此模块,使用格式名称“phd”。另请参阅底层的 Bio.Sequencing.Phd 模块。
例如,使用 Bio.SeqIO,我们可以从 Biopython 单元测试中读取一个示例 PHRED 文件
>>> from Bio import SeqIO
>>> for record in SeqIO.parse("Phd/phd1", "phd"):
... print(record.id)
... print("%s..." % record.seq[:10])
... print("%s..." % record.letter_annotations["phred_quality"][:10])
34_222_(80-A03-19).b.ab1
ctccgtcgga...
[9, 9, 10, 19, 22, 37, 28, 28, 24, 22]...
425_103_(81-A03-19).g.ab1
cgggatccca...
[14, 17, 22, 10, 10, 10, 15, 8, 8, 9]...
425_7_(71-A03-19).b.ab1
acataaatca...
[10, 10, 10, 10, 8, 8, 6, 6, 6, 6]...
由于 PHRED 文件包含质量得分,您可以将它们保存为 FASTQ 或 QUAL 文件,例如使用 Bio.SeqIO.write(…), 或者只需使用 SeqRecord 对象的 format 方法
>>> print(record[:50].format("fastq"))
@425_7_(71-A03-19).b.ab1
acataaatcaaattactnaccaacacacaaaccngtctcgcgtagtggag
+
++++))'''')(''')$!$''')''''(+.''$!$))))+)))'''''''
或者,
>>> print(record[:50].format("qual"))
>425_7_(71-A03-19).b.ab1
10 10 10 10 8 8 6 6 6 6 8 7 6 6 6 8 3 0 3 6 6 6 8 6 6 6 6 7
10 13 6 6 3 0 3 8 8 8 8 10 8 8 8 6 6 6 6 6 6 6
注意,这些示例仅显示前 50 个碱基以保持输出简短。
- Bio.SeqIO.PhdIO.PhdIterator(source: IO[str] | PathLike | str | bytes) Iterator[SeqRecord]
从 PHD 文件返回 SeqRecord 对象。
- 参数
source - 以文本模式打开的输入流,或文件的路径
这使用 Bio.Sequencing.Phd 模块来完成繁重的工作。
- class Bio.SeqIO.PhdIO.PhdWriter(handle: IO | PathLike | str | bytes)
Bases:
SequenceWriter
用于写入 Phd 格式文件的类。
- __init__(handle: IO | PathLike | str | bytes) None
初始化类。
- write_record(record)
将单个 Phd 记录写入文件。