Bio.Align.bigbed 模块

Bio.Align 对 bigBed 格式的比对文件的支持。

bigBed 格式将一系列成对比对存储在一个索引的二进制文件中。通常它们用于转录本与基因组的比对。与 BED 格式一样，比对位置和比对分数被存储，但比对序列没有存储。

有关更多信息，请参见 http://genome.ucsc.edu/goldenPath/help/bigBed.html。

您应该通过 Bio.Align 函数来使用此模块。

class Bio.Align.bigbed.Field(as_type, name, comment)

基础类: tuple

__getnewargs__(): 将 self 作为普通元组返回。用于 copy 和 pickle。

static __new__(_cls, as_type, name, comment): 创建 Field(as_type, name, comment) 的新实例。

__repr__(): 返回格式良好的表示字符串。

__slots__ = ()

as_type: 字段编号 0 的别名。

comment: 字段编号 2 的别名。

name: 字段编号 1 的别名。

class Bio.Align.bigbed.AutoSQLTable(name, comment, fields)

基础类: list

描述 (可能扩展的) BED 格式列的 AutoSQL 表。

default: AutoSQLTable = [('string', 'chrom', 'Reference sequence chromosome or scaffold'), ('uint', 'chromStart', 'Start position in chromosome'), ('uint', 'chromEnd', 'End position in chromosome'), ('string', 'name', 'Name of item.'), ('uint', 'score', 'Score (0-1000)'), ('char[1]', 'strand', '+ or - for strand'), ('uint', 'thickStart', 'Start of where display should be thick (start codon)'), ('uint', 'thickEnd', 'End of where display should be thick (stop codon)'), ('uint', 'reserved', 'Used as itemRgb as of 2004-11-22'), ('int', 'blockCount', 'Number of blocks'), ('int[blockCount]', 'blockSizes', 'Comma separated list of block sizes'), ('int[blockCount]', 'chromStarts', 'Start positions relative to chromStart')]

__init__(name, comment, fields): 创建一个 AutoSQL 表，描述 (扩展的) BED 格式的列。

classmethod from_bytes(data): 返回使用字节对象数据初始化的 AutoSQLTable。

classmethod from_string(data): 返回使用字符串对象数据初始化的 AutoSQLTable。

__str__(): 返回 str(self)。

__bytes__()

__getitem__(i): x.__getitem__(y) <==> x[y]

__annotations__ = {'default': 'AutoSQLTable'}

class Bio.Align.bigbed.AlignmentWriter(target, bedN=12, declaration=None, targets=None, compress=True, itemsPerSlot=512, blockSize=256, extraIndex=())

基础类: AlignmentWriter

bigBed 文件格式的比对文件写入器。

fmt: str | None = 'bigBed'

mode = 'wb'

__init__(target, bedN=12, declaration=None, targets=None, compress=True, itemsPerSlot=512, blockSize=256, extraIndex=())

创建 AlignmentWriter 对象。

参数

target - 输出流或文件名。
bedN - BED 文件中的列数。
此值必须介于 3 到 12 之间；默认值为 12。
declaration - 一个 AutoSQLTable 对象，用于声明 BED 文件中的字段。
仅当 BED 文件包含额外（自定义）字段时才需要。默认值为 None。
targets - 一个 SeqRecord 对象列表，其中包含染色体，
按照它们在比对中出现的顺序排列。每个 SeqRecord 中的序列内容可能未定义，但序列长度必须定义，例如

SeqRecord(Seq(None, length=248956422), id=”chr1”)

如果 targets 为 None（默认值），则比对必须具有一个 .targets 属性，该属性提供 SeqRecord 对象列表。
compress - 如果为 True（默认），则使用 zlib 压缩数据。
如果为 False，则不压缩数据。使用 compress=False 可实现更快的搜索。
blockSize - 在 r-tree 中捆绑的项目数。
有关更多信息，请参阅 UCSC 的 bedToBigBed 程序。默认值为 256。
itemsPerSlot - 在最低级别捆绑的数据点数。
有关更多信息，请参阅 UCSC 的 bedToBigBed 程序。使用 itemsPerSlot=1 可实现更快的搜索。默认值为 512。
extraIndex - 包含要索引的额外列名称的字符串列表。
默认值为一个空列表。

write_file(stream, alignments)

将比对写入文件流，并返回比对的数量。

alignments - 返回 Alignment 对象的列表或迭代器 stream - 输出文件流。

write_alignments(alignments, output, reductions, extra_indices)

将比对写入输出文件，并返回比对的数量。

alignments - 返回 Alignment 对象的列表或迭代器 stream - 输出文件流。

__abstractmethods__ = frozenset({})

class Bio.Align.bigbed.AlignmentIterator(source)

Bases: AlignmentIterator

bigBed 文件的比对迭代器。

bigBed 文件中存储的成对比对将被加载并逐步返回。其他比对信息将存储为每个比对的属性。

fmt : str | None = 'bigBed'

mode = 'b'

__len__()

返回比对的数量。

比对的数量将被缓存。如果尚未计算，则迭代器将重新回到开头，并将通过迭代比对来计算比对的数量。然后，迭代器将返回到文件中的原始位置。

search(chromosome=None, start=None, end=None)

迭代与指定染色体区域重叠的比对。

此方法搜索索引以查找与指定染色体重叠或部分重叠指定染色体区域（从 start 到 end）的比对。

参数

chromosome - 染色体名称。如果为 None（默认值），则包含所有比对。
start - 染色体上的起始位置。如果为 None（默认值），则使用 0 作为起始位置。
end - 染色体上的结束位置。如果为 None（默认值），则使用染色体的长度作为结束位置。

__abstractmethods__ = frozenset({})