Bio.SeqIO.TwoBitIO 模块

Bio.SeqIO 对 UCSC 的“twoBit”(.2bit) 文件格式的支持。

此解析器读取存储在 twoBit 文件中的索引,以及每个序列的掩码区域和 N。它还创建序列数据对象(_TwoBitSequenceData 对象),这些对象只支持两种方法:__len__ 和 __getitem__。前者将返回序列的长度,而后者将返回所请求区域的序列(作为字节对象)。

使用索引中的信息,__getitem__ 方法计算请求区域开始的​​文件位置,并且只读取请求的序列区域。请注意,仅在明确请求的情况下才会加载记录的完整序列,这使得解析器具有内存效率。

TwoBitIterator 对象实现 __getitem__、keys 和 __len__ 方法,允许将其用作字典。

class Bio.SeqIO.TwoBitIO.TwoBitIterator(source)

基类:SequenceIterator

UCSC twoBit (.2bit) 文件的解析器。

__init__(source)

读取文件索引。

parse(stream)

遍历文件中的序列。

__getitem__(name)

将与给定名称关联的序列作为 SeqRecord 对象返回。

keys()

返回一个包含文件中序列名称的列表。

__len__()

返回序列数量。

__abstractmethods__ = frozenset({})
__parameters__ = ()