Bio.SeqIO.TwoBitIO 模块
Bio.SeqIO 对 UCSC 的“twoBit”(.2bit) 文件格式的支持。
此解析器读取存储在 twoBit 文件中的索引,以及每个序列的掩码区域和 N。它还创建序列数据对象(_TwoBitSequenceData 对象),这些对象只支持两种方法:__len__ 和 __getitem__。前者将返回序列的长度,而后者将返回所请求区域的序列(作为字节对象)。
使用索引中的信息,__getitem__ 方法计算请求区域开始的文件位置,并且只读取请求的序列区域。请注意,仅在明确请求的情况下才会加载记录的完整序列,这使得解析器具有内存效率。
TwoBitIterator 对象实现 __getitem__、keys 和 __len__ 方法,允许将其用作字典。