Bio.Align.Applications 包

模块内容

比对命令行工具包装器(已过时)。

我们决定在将来移除此模块,并建议您直接通过 subprocess 模块构建您的命令并调用它。

class Bio.Align.Applications.MuscleCommandline(cmd='muscle', **kwargs)

基类:AbstractCommandline

用于多序列比对程序 MUSCLE 的命令行包装器。

http://www.drive5.com/muscle/

备注

最后测试的版本:3.7,简要测试了 3.8

参考文献

Edgar, Robert C. (2004), MUSCLE: multiple sequence alignment with high accuracy and high throughput, Nucleic Acids Research 32(5), 1792-97.

Edgar, R.C. (2004) MUSCLE: a multiple sequence alignment method with reduced time and space complexity. BMC Bioinformatics 5(1): 113.

示例

>>> from Bio.Align.Applications import MuscleCommandline
>>> muscle_exe = r"C:\Program Files\Alignments\muscle3.8.31_i86win32.exe"
>>> in_file = r"C:\My Documents\unaligned.fasta"
>>> out_file = r"C:\My Documents\aligned.fasta"
>>> muscle_cline = MuscleCommandline(muscle_exe, input=in_file, out=out_file)
>>> print(muscle_cline)
"C:\Program Files\Alignments\muscle3.8.31_i86win32.exe" -in "C:\My Documents\unaligned.fasta" -out "C:\My Documents\aligned.fasta"

您通常会使用 muscle_cline() 或通过 Python subprocess 模块运行命令行,如 Biopython 教程中所述。

__init__(cmd='muscle', **kwargs)

初始化类。

property anchors

在树依赖的优化迭代中使用锚点优化

此属性控制 -anchors 开关的添加,将此属性视为布尔值。

property anchorspacing

锚点列之间的最小间距

这控制 -anchorspacing 参数及其相关值的添加。将此属性设置为所需的参数值。

property brenner

使用 Steve Brenner 的根比对方法

此属性控制 -brenner 开关的添加,将此属性视为布尔值。

property center

中心参数 - 应为负数

这控制 -center 参数及其相关值的添加。将此属性设置为所需的参数值。

property cluster

执行输入序列的快速聚类,使用 -tree1 保存树

此属性控制 -cluster 开关的添加,将此属性视为布尔值。

property cluster1

迭代 1 中使用的聚类方法

这控制 -cluster1 参数及其相关值的添加。将此属性设置为所需的参数值。

property cluster2

迭代 2 中使用的聚类方法

这控制 -cluster2 参数及其相关值的添加。将此属性设置为所需的参数值。

property clw

以 CLUSTALW 格式写入输出(带有 MUSCLE 头)

此属性控制 -clw 开关的添加,将此属性视为布尔值。

property clwout

将 CLUSTALW 输出(带有 MUSCLE 头)写入指定的文件名

这控制 -clwout 参数及其相关值的添加。将此属性设置为所需的参数值。

property clwstrict

以 CLUSTALW 格式写入输出,带有版本 1.81 头

此属性控制 -clwstrict 开关的添加,将此属性视为布尔值。

property clwstrictout

将 CLUSTALW 输出(带有版本 1.81 头)写入指定的文件名

这控制 -clwstrictout 参数及其相关值的添加。将此属性设置为所需的参数值。

property core

不要捕获异常

此属性控制 -core 开关的添加,将此属性视为布尔值。

property diagbreak

允许两个对角线合并成一个对角线的最大距离

这控制 -diagbreak 参数及其相关值的添加。将此属性设置为所需的参数值。

property diaglength

对角线的最小长度

这控制 -diaglength 参数及其相关值的添加。将此属性设置为所需的参数值。

property diagmargin

丢弃对角线末端这么多位置

这控制 -diagmargin 参数及其相关值的添加。将此属性设置为所需的参数值。

property diags

查找对角线(对于相似的序列更快)

此属性控制 -diags 开关的添加,将此属性视为布尔值。

property dimer

对 SP 分数使用更快的(稍微不太准确的)二聚体近似值

此属性控制 -dimer 开关的添加,将此属性视为布尔值。

property distance1

迭代 1 的距离度量

这控制 -distance1 参数及其相关值的添加。将此属性设置为所需的参数值。

property distance2

迭代 2 的距离度量

这控制 -distance2 参数及其相关值的添加。将此属性设置为所需的参数值。

property fasta

以 FASTA 格式写入输出

此属性控制 -fasta 开关的添加,将此属性视为布尔值。

property fastaout

将 FASTA 格式输出写入指定的文件名

这控制 -fastaout 参数及其相关值的添加。将此属性设置为所需的参数值。

property gapextend

空位扩展罚分

这控制 -gapextend 参数及其相关值的添加。将此属性设置为所需的参数值。

property gapopen

Gap 开启分数 - 负数

此属性控制 -gapopen 参数及其相关值的添加。将此属性设置为所需的参数值。

property group

在输出中分组相似的序列

此属性控制 -group 开关的添加,将此属性视为布尔值。

property html

以 HTML 格式写入输出

此属性控制 -html 开关的添加,将此属性视为布尔值。

property htmlout

将 HTML 输出写入指定的文件名

此属性控制 -htmlout 参数及其相关值的添加。将此属性设置为所需的参数值。

property hydro

疏水区域的窗口大小

此属性控制 -hydro 参数及其相关值的添加。将此属性设置为所需的参数值。

property hydrofactor

疏水区域中 gap 罚分的乘数

此属性控制 -hydrofactor 参数及其相关值的添加。将此属性设置为所需的参数值。

property in1

用于 profile 对齐的第一个输入文件名

此属性控制 -in1 参数及其相关值的添加。将此属性设置为所需的参数值。

property in2

用于 profile 对齐的第二个输入文件名

此属性控制 -in2 参数及其相关值的添加。将此属性设置为所需的参数值。

property input

输入文件名

此属性控制 -in 参数及其相关值的添加。将此属性设置为所需的参数值。

property le

使用对数期望 profile 分数 (VTML240)

此属性控制 -le 开关的添加,将此属性视为布尔值。

property log

日志文件名

此属性控制 -log 参数及其相关值的添加。将此属性设置为所需的参数值。

property loga

日志文件名(追加到现有文件)

此属性控制 -loga 参数及其相关值的添加。将此属性设置为所需的参数值。

property matrix

NCBI 或 WU-BLAST 格式蛋白质替换矩阵的路径 - 还要设置 -gapopen、-gapextend 和 -center

此属性控制 -matrix 参数及其相关值的添加。将此属性设置为所需的参数值。

property maxdiagbreak

在 v3.8 中已弃用,请使用 -diagbreak 代替。

此属性控制 -maxdiagbreak 参数及其相关值的添加。将此属性设置为所需的参数值。

property maxhours

最大运行时间(小时)

此属性控制 -maxhours 参数及其相关值的添加。将此属性设置为所需的参数值。

property maxiters

最大迭代次数

此属性控制 -maxiters 参数及其相关值的添加。将此属性设置为所需的参数值。

property maxtrees

在迭代 2 中构建的最大树木数量

此属性控制 -maxtrees 参数及其相关值的添加。将此属性设置为所需的参数值。

property minbestcolscore

列必须具有的最小分数才能成为锚点

此属性控制 -minbestcolscore 参数及其相关值的添加。将此属性设置为所需的参数值。

property minsmoothscore

列必须具有的最小平滑分数才能成为锚点

此属性控制 -minsmoothscore 参数及其相关值的添加。将此属性设置为所需的参数值。

property msf

以 MSF 格式写入输出

此属性控制 -msf 开关的添加,将此属性视为布尔值。

property msfout

将 MSF 格式的输出写入指定的文件名

此属性控制 -msfout 参数及其相关值的添加。将此属性设置为所需的参数值。

property noanchors

在依赖树的细化迭代中不使用锚点优化

此属性控制 -noanchors 开关的添加,将此属性视为布尔值。

property nocore

捕获异常

此属性控制 -nocore 开关的添加,将此属性视为布尔值。

property objscore

依赖树细化使用的目标分数

此属性控制 -objscore 参数及其相关值的添加。将此属性设置为所需的参数值。

property out

输出文件名

此属性控制 -out 参数及其相关值的添加。将此属性设置为所需的参数值。

property phyi

以 PHYLIP 交错格式写入输出

此属性控制 -phyi 开关的添加,将此属性视为布尔值。

property phyiout

将 PHYLIP 交错格式输出写入指定的文件名

此属性控制 -phyiout 参数及其相关值的添加。将此属性设置为所需的参数值。

property phys

以 PHYLIP 顺序格式写入输出

此属性控制 -phys 开关的添加,将此属性视为布尔值。

property physout

将 PHYLIP 顺序格式输出写入指定的文件名

此属性控制 -physout 参数及其相关值的添加。将此属性设置为所需的参数值。

property profile

执行 profile 对齐

此属性控制 -profile 开关的添加,将此属性视为布尔值。

property quiet

不显示进度消息

此属性控制 -quiet 开关的添加,将此属性视为布尔值。

property refine

仅执行依赖树的细化

此属性控制 -refine 开关的添加,将此属性视为布尔值。

property refinew

仅使用滑动窗口方法执行依赖树的细化

此属性控制 -refinew 开关的添加,将此属性视为布尔值。

property refinewindow

-refinew 的窗口长度

此属性控制 -refinewindow 参数及其相关值的添加。将此属性设置为所需的参数值。

property root1

在迭代 1 中用于根树的方法

此属性控制 -root1 参数及其相关值的添加。将此属性设置为所需的参数值。

property root2

用于在第 2 次迭代中将树进行根化的方式

这控制了 `-root2` 参数及其相关值的添加。将此属性设置为所需的參數值。

property scorefile

分数文件名,包含对齐中每列的平均 BLOSUM62 分数,每行一个。

这控制了 `-scorefile` 参数及其相关值的添加。将此属性设置为所需的參數值。

property seqtype

序列类型

这控制了 `-seqtype` 参数及其相关值的添加。将此属性设置为所需的參數值。

property smoothscoreceil

用于平滑的列分数最大值

这控制了 `-smoothscoreceil` 参数及其相关值的添加。将此属性设置为所需的參數值。

property smoothwindow

用于锚定列平滑的窗口

这控制了 `-smoothwindow` 参数及其相关值的添加。将此属性设置为所需的參數值。

property sp

使用成对和蛋白 profile 得分(PAM200)

此属性控制 `-sp` 开关的添加,将此属性视为布尔值。

property spn

使用成对和蛋白核苷酸 profile 得分

此属性控制 `-spn` 开关的添加,将此属性视为布尔值。

property spscore

计算多重比对的 SP 目标得分

这控制了 `-spscore` 参数及其相关值的添加。将此属性设置为所需的參數值。

property stable

在输出中不要分组类似的序列(在 v3.8 中不支持)

此属性控制 `-stable` 开关的添加,将此属性视为布尔值。

property sueff

在 UPGMB 聚类中使用的常数

这控制了 `-sueff` 参数及其相关值的添加。将此属性设置为所需的參數值。

property sv

使用成对和 profile 得分(VTML240)

此属性控制 `-sv` 开关的添加,将此属性视为布尔值。

property tree1

保存第 1 次迭代的 Newick 树

这控制了 `-tree1` 参数及其相关值的添加。将此属性设置为所需的參數值。

property tree2

保存第 2 次迭代的 Newick 树

这控制了 `-tree2` 参数及其相关值的添加。将此属性设置为所需的參數值。

property usetree

使用给定的 Newick 树作为引导树

这控制了 `-usetree` 参数及其相关值的添加。将此属性设置为所需的參數值。

property verbose

写入参数设置和进度

此属性控制 `-verbose` 开关的添加,将此属性视为布尔值。

property version

将版本字符串写入 stdout 并退出

此属性控制 `-version` 开关的添加,将此属性视为布尔值。

property weight1

在第 1 次迭代中使用的加权方案

这控制了 `-weight1` 参数及其相关值的添加。将此属性设置为所需的參數值。

property weight2

在第 2 次迭代中使用的加权方案

这控制了 `-weight2` 参数及其相关值的添加。将此属性设置为所需的參數值。

class Bio.Align.Applications.ClustalwCommandline(cmd='clustalw', **kwargs)

基类:AbstractCommandline

用于 clustalw(版本一或二)的命令行包装器。

http://www.clustal.org/

备注

上次检查的版本:1.83 和 2.1

参考文献

Larkin MA, Blackshields G, Brown NP, Chenna R, McGettigan PA, McWilliam H, Valentin F, Wallace IM, Wilm A, Lopez R, Thompson JD, Gibson TJ, Higgins DG. (2007). Clustal W and Clustal X version 2.0. Bioinformatics, 23, 2947-2948.

示例

>>> from Bio.Align.Applications import ClustalwCommandline
>>> in_file = "unaligned.fasta"
>>> clustalw_cline = ClustalwCommandline("clustalw2", infile=in_file)
>>> print(clustalw_cline)
clustalw2 -infile=unaligned.fasta

你通常会使用 `clustalw_cline()` 或通过 Python 子进程模块运行命令行,如 Biopython 教程中所述。

__init__(cmd='clustalw', **kwargs)

初始化类。

property align

进行完整的多个比对。

此属性控制 `-align` 开关的添加,将此属性视为布尔值。

property bootlabels

树显示中 bootstrap 值的节点或分支位置

这控制了 `-bootlabels` 参数及其相关值的添加。将此属性设置为所需的參數值。

property bootstrap

对 NJ 树进行引导(n=引导次数;默认=1000)。

这控制了 `-bootstrap` 参数及其相关值的添加。将此属性设置为所需的參數值。

property case

LOWER 或 UPPER(仅用于 GDE 输出)

这控制了 `-case` 参数及其相关值的添加。将此属性设置为所需的參數值。

property check

概述命令行参数。

此属性控制 `-check` 开关的添加,将此属性视为布尔值。

property clustering

NJ 或 UPGMA

这控制了 `-clustering` 参数及其相关值的添加。将此属性设置为所需的參數值。

property convert

以不同的文件格式输出输入序列。

此属性控制 `-convert` 开关的添加,将此属性视为布尔值。

property dnamatrix

DNA 权重矩阵=IUB、CLUSTALW 或文件名

这控制了 `-dnamatrix` 参数及其相关值的添加。将此属性设置为所需的參數值。

property endgaps

没有末端间隙分离罚分。

此属性控制 `-endgaps` 开关的添加,将此属性视为布尔值。

property fullhelp

输出完整的帮助内容。

此属性控制 `-fullhelp` 开关的添加,将此属性视为布尔值。

property gapdist

间隙分离笔。 范围

这控制着 -gapdist 参数及其相关值的添加。 将此属性设置为所需的参数值。

property gapext

空位扩展罚分

这控制着 -gapext 参数及其相关值的添加。 将此属性设置为所需的参数值。

property gapopen

间隙开放惩罚

此属性控制 -gapopen 参数及其相关值的添加。将此属性设置为所需的参数值。

property helixendin

螺旋内被视为末端的残基数

这控制着 -helixendin 参数及其相关值的添加。 将此属性设置为所需的参数值。

property helixendout

螺旋外被视为末端的残基数

这控制着 -helixendout 参数及其相关值的添加。 将此属性设置为所需的参数值。

property helixgap

螺旋核心残基的间隙惩罚

这控制着 -helixgap 参数及其相关值的添加。 将此属性设置为所需的参数值。

property help

概述命令行参数。

此属性控制着 -help 开关的添加,将此属性视为布尔值。

property hgapresidues

列出亲水残基。

此属性控制着 -hgapresidues 开关的添加,将此属性视为布尔值。

property infile

输入序列。

这控制着 -infile 参数及其相关值的添加。 将此属性设置为所需的参数值。

property iteration

NONE 或 TREE 或 ALIGNMENT

这控制着 -iteration 参数及其相关值的添加。 将此属性设置为所需的参数值。

property kimura

使用 Kimura 的校正。

此属性控制着 -kimura 开关的添加,将此属性视为布尔值。

property ktuple

词语大小

这控制着 -ktuple 参数及其相关值的添加。 将此属性设置为所需的参数值。

property loopgap

循环区域的间隙惩罚

这控制着 -loopgap 参数及其相关值的添加。 将此属性设置为所需的参数值。

property matrix

蛋白质权重矩阵=BLOSUM、PAM、GONNET、ID 或 文件名

此属性控制 -matrix 参数及其相关值的添加。将此属性设置为所需的参数值。

property maxdiv

% 身份用于延迟

这控制着 -maxdiv 参数及其相关值的添加。 将此属性设置为所需的参数值。

property maxseqlen

允许的最大输入序列长度

这控制着 -maxseqlen 参数及其相关值的添加。 将此属性设置为所需的参数值。

property negative

使用矩阵中负值的蛋白质比对

此属性控制着 -negative 开关的添加,将此属性视为布尔值。

property newtree

新创建的引导树的输出文件名

这控制着 -newtree 参数及其相关值的添加。 将此属性设置为所需的参数值。

property newtree1

配置文件 1 的新引导树的输出文件名

这控制着 -newtree1 参数及其相关值的添加。 将此属性设置为所需的参数值。

property newtree2

配置文件 2 的新引导树的输出文件

这控制着 -newtree2 参数及其相关值的添加。 将此属性设置为所需的参数值。

property nohgap

亲水间隙关闭

此属性控制着 -nohgap 开关的添加,将此属性视为布尔值。

property nopgap

残基特异性间隙关闭

此属性控制着 -nopgap 开关的添加,将此属性视为布尔值。

property nosecstr1

不要对配置文件 1 使用二级结构间隙惩罚掩码

此属性控制着 -nosecstr1 开关的添加,将此属性视为布尔值。

property nosecstr2

不要对配置文件 2 使用二级结构间隙惩罚掩码

此属性控制着 -nosecstr2 开关的添加,将此属性视为布尔值。

property noweights

禁用序列加权

此属性控制着 -noweights 开关的添加,将此属性视为布尔值。

property numiter

要执行的最大迭代次数

这控制着 -numiter 参数及其相关值的添加。 将此属性设置为所需的参数值。

property options

列出命令行参数

此属性控制着 -options 开关的添加,将此属性视为布尔值。

property outfile

输出序列比对文件名

这控制着 -outfile 参数及其相关值的添加。 将此属性设置为所需的参数值。

property outorder

输出分类单元顺序:INPUT 或 ALIGNED

这控制着 -outorder 参数及其相关值的添加。 将此属性设置为所需的参数值。

property output

输出格式:CLUSTAL(默认)、GCG、GDE、PHYLIP、PIR、NEXUS 和 FASTA

这控制着 -output 参数及其相关值的添加。 将此属性设置为所需的参数值。

property outputtree

nj OR phylip OR dist OR nexus

这控制着 -outputtree 参数及其相关值的添加。 将此属性设置为所需的参数值。

property pairgap

间隙惩罚

这控制着 -pairgap 参数及其相关值的添加。 将此属性设置为所需的参数值。

property pim

输出百分比身份矩阵(在计算树时)。

此属性控制着 -pim 开关的添加,将此属性视为布尔值。

property profile

通过配置文件比对合并两个比对

此属性控制 -profile 开关的添加,将此属性视为布尔值。

property profile1

概要文件(旧比对)。

此属性控制 -profile1 参数及其关联值的添加。将此属性设置为所需的参数值。

property profile2

概要文件(旧比对)。

此属性控制 -profile2 参数及其关联值的添加。将此属性设置为所需的参数值。

property pwdnamatrix

DNA 权重矩阵=IUB、CLUSTALW 或文件名

此属性控制 -pwdnamatrix 参数及其关联值的添加。将此属性设置为所需的参数值。

property pwgapext

空位扩展罚分

此属性控制 -pwgapext 参数及其关联值的添加。将此属性设置为所需的参数值。

property pwgapopen

间隙开放惩罚

此属性控制 -pwgapopen 参数及其关联值的添加。将此属性设置为所需的参数值。

property pwmatrix

蛋白质权重矩阵=BLOSUM、PAM、GONNET、ID 或 文件名

此属性控制 -pwmatrix 参数及其关联值的添加。将此属性设置为所需的参数值。

property quicktree

使用 FAST 算法构建比对引导树

此属性控制 -quicktree 开关的添加,将此属性视为布尔值。

property quiet

将控制台输出减少到最少

此属性控制 -quiet 开关的添加,将此属性视为布尔值。

property range

要写入的序列范围,从 m 开始到 m+n。输入为字符串,例如“24,200”。

此属性控制 -range 参数及其关联值的添加。将此属性设置为所需的参数值。

property score

任一:PERCENT 或 ABSOLUTE

此属性控制 -score 参数及其关联值的添加。将此属性设置为所需的参数值。

property secstrout

STRUCTURE、MASK、BOTH 或 NONE 输出到比对文件中。

此属性控制 -secstrout 参数及其关联值的添加。将此属性设置为所需的参数值。

property seed

引导程序的种子数。

此属性控制 -seed 参数及其关联值的添加。将此属性设置为所需的参数值。

property seqno_range

OFF 或 ON(NEW - 用于所有输出格式)

此属性控制 -seqno_range 参数及其关联值的添加。将此属性设置为所需的参数值。

property seqnos

OFF 或 ON(仅适用于 Clustal 输出)

此属性控制 -seqnos 参数及其关联值的添加。将此属性设置为所需的参数值。

property sequences

将 profile2 序列按顺序添加到 profile1 比对中

此属性控制 -sequences 开关的添加,将此属性视为布尔值。

property stats

将一些比对统计信息记录到文件中。

此属性控制 -stats 参数及其关联值的添加。将此属性设置为所需的参数值。

property strandendin

被视为末端的链内残基数。

此属性控制 -strandendin 参数及其关联值的添加。将此属性设置为所需的参数值。

property strandendout

被视为末端的链外残基数。

此属性控制 -strandendout 参数及其关联值的添加。将此属性设置为所需的参数值。

property strandgap

链核心残基的间隙罚分。

此属性控制 -strandgap 参数及其关联值的添加。将此属性设置为所需的参数值。

property terminalgap

结构末端的间隙罚分。

此属性控制 -terminalgap 参数及其关联值的添加。将此属性设置为所需的参数值。

property topdiags

最佳对角线的数量。

此属性控制 -topdiags 参数及其关联值的添加。将此属性设置为所需的参数值。

property tossgaps

忽略包含间隙的位置。

此属性控制 -tossgaps 开关的添加,将此属性视为布尔值。

property transweight

转换权重

此属性控制 -transweight 参数及其关联值的添加。将此属性设置为所需的参数值。

property tree

计算 NJ 树。

此属性控制 -tree 开关的添加,将此属性视为布尔值。

property type

PROTEIN 或 DNA 序列

此属性控制 -type 参数及其关联值的添加。将此属性设置为所需的参数值。

property usetree

引导树的文件名。

这控制了 `-usetree` 参数及其相关值的添加。将此属性设置为所需的參數值。

property usetree1

profile1 的引导树的文件名

此属性控制 -usetree1 参数及其关联值的添加。将此属性设置为所需的参数值。

property usetree2

profile2 的引导树的文件名

此属性控制 -usetree2 参数及其关联值的添加。将此属性设置为所需的参数值。

property window

最佳对角线周围的窗口。

此属性控制 -window 参数及其关联值的添加。将此属性设置为所需的参数值。

class Bio.Align.Applications.ClustalOmegaCommandline(cmd='clustalo', **kwargs)

基类:AbstractCommandline

clustal omega 命令行包装器。

http://www.clustal.org/omega

备注

最后检查的版本:1.2.0

参考文献

Sievers F, Wilm A, Dineen DG, Gibson TJ, Karplus K, Li W, Lopez R, McWilliam H, Remmert M, Söding J, Thompson JD, Higgins DG (2011). Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Molecular Systems Biology 7:539 https://doi.org/10.1038/msb.2011.75

示例

>>> from Bio.Align.Applications import ClustalOmegaCommandline
>>> in_file = "unaligned.fasta"
>>> out_file = "aligned.fasta"
>>> clustalomega_cline = ClustalOmegaCommandline(infile=in_file, outfile=out_file, verbose=True, auto=True)
>>> print(clustalomega_cline)
clustalo -i unaligned.fasta -o aligned.fasta --auto -v

通常,您将使用 clustalomega_cline() 或通过 Python 子进程模块来运行命令行,如 Biopython 教程中所述。

__init__(cmd='clustalo', **kwargs)

初始化类。

property auto

自动设置选项(可能会覆盖您的一些选项)

此属性控制 –auto 开关的添加,将此属性视为布尔值。

property clusteringout

聚类输出文件

此属性控制 –clustering-out 参数及其关联值的添加。将此属性设置为所需的参数值。

property clustersize

子集群中序列的软最大值

这控制着添加 –cluster-size 参数及其相关值。将此属性设置为所需的参数值。

property dealign

取消对齐输入序列

此属性控制添加 –dealign 开关,将其视为布尔值。

property distmat_full

使用完整距离矩阵进行引导树计算(速度慢;默认情况下为 mBed)

此属性控制添加 –full 开关,将其视为布尔值。

property distmat_full_iter

在迭代期间使用完整距离矩阵进行引导树计算(默认情况下为 mBed)

此属性控制添加 –full-iter 开关,将其视为布尔值。

property distmat_in

成对距离矩阵输入文件(跳过距离计算)。

这控制着添加 –distmat-in 参数及其相关值。将此属性设置为所需的参数值。

property distmat_out

成对距离矩阵输出文件。

这控制着添加 –distmat-out 参数及其相关值。将此属性设置为所需的参数值。

property force

强制覆盖文件。

此属性控制添加 –force 开关,将其视为布尔值。

property guidetree_in

引导树输入文件(跳过距离计算和引导树聚类步骤)。

这控制着添加 –guidetree-in 参数及其相关值。将此属性设置为所需的参数值。

property guidetree_out

引导树输出文件。

这控制着添加 –guidetree-out 参数及其相关值。将此属性设置为所需的参数值。

property help

打印帮助信息并退出。

此属性控制添加 -h 开关,将其视为布尔值。

property hmm_input

HMM 输入文件

这控制着添加 –hmm-in 参数及其相关值。将此属性设置为所需的参数值。

property infile

多序列输入文件

这控制着添加 -i 参数及其相关值。将此属性设置为所需的参数值。

property infmt

强制序列输入文件格式(默认:自动)

允许的值:a2m、fa[sta]、clu[stal]、msf、phy[lip]、selex、st[ockholm]、vie[nna]

这控制着添加 –infmt 参数及其相关值。将此属性设置为所需的参数值。

property isprofile

禁用检查是否为概要文件,强制概要文件(默认情况下为否)

此属性控制添加 –is-profile 开关,将其视为布尔值。

property iterations

(组合引导树/HMM)迭代次数

这控制着添加 –iterations 参数及其相关值。将此属性设置为所需的参数值。

property log

将所有非必要输出记录到此文件中。

这控制着添加 -l 参数及其相关值。将此属性设置为所需的参数值。

property long_version

打印长版本信息并退出

此属性控制添加 –long-version 开关,将其视为布尔值。

property max_guidetree_iterations

引导树迭代的最大次数

这控制着添加 –max-guidetree-iterations 参数及其相关值。将此属性设置为所需的参数值。

property max_hmm_iterations

HMM 迭代的最大次数

这控制着添加 –max-hmm-iterations 参数及其相关值。将此属性设置为所需的参数值。

property maxnumseq

允许的最大序列数

这控制着添加 –maxnumseq 参数及其相关值。将此属性设置为所需的参数值。

property maxseqlen

允许的最大序列长度

这控制着添加 –maxseqlen 参数及其相关值。将此属性设置为所需的参数值。

property outfile

多序列比对输出文件(默认:标准输出)。

这控制着添加 -o 参数及其相关值。将此属性设置为所需的参数值。

property outfmt

MSA 输出文件格式:a2m=fa[sta]、clu[stal]、msf、phy[lip]、selex、st[ockholm]、vie[nna](默认:fasta)。

这控制着添加 –outfmt 参数及其相关值。将此属性设置为所需的参数值。

property outputorder

MSA 输出顺序与输入/引导树中相同

这控制着添加 –output-order 参数及其相关值。将此属性设置为所需的参数值。

property percentid

将距离转换为百分比一致性(默认情况下为否)

此属性控制添加 –percent-id 开关,将其视为布尔值。

property profile1

预先比对的多序列文件(比对的列将保持固定)。

这控制着添加 –profile1 参数及其相关值。将此属性设置为所需的参数值。

property profile2

预先比对的多序列文件(比对的列将保持固定)。

这控制着添加 –profile2 参数及其相关值。将此属性设置为所需的参数值。

property residuenumber

以 Clustal 格式打印残基编号(默认情况下为否)

此属性控制添加 –residuenumber 开关,将其视为布尔值。

property seqtype

{蛋白质、RNA、DNA} 强制使用序列类型(默认:自动)。

这控制着添加 -t 参数及其相关值。将此属性设置为所需的参数值。

property threads

要使用的处理器数量

这控制着添加 –threads 参数及其相关值。将此属性设置为所需的参数值。

property usekimura

对比对的序列使用 Kimura 距离校正(默认情况下为否)

此属性控制添加 –use-kimura 开关,将其视为布尔值。

property verbose

详细输出

此属性控制添加 -v 开关,将其视为布尔值。

property version

打印版本信息并退出

此属性控制添加 –version 开关,将其视为布尔值。

property wrap

在输出中换行前的残基数

这控制着添加 –wrap 参数及其相关值。将此属性设置为所需的参数值。

class Bio.Align.Applications.PrankCommandline(cmd='prank', **kwargs)

基类:AbstractCommandline

用于多序列比对程序 PRANK 的命令行包装器。

http://www.ebi.ac.uk/goldman-srv/prank/prank/

备注

最后检查版本:081202

参考文献

Loytynoja, A. 和 Goldman, N. 2005. 用于包含插入序列的序列渐进多重比对的算法。美国国家科学院院刊,102:10557–10562。

Loytynoja, A. 和 Goldman, N. 2008. 基于系统发育的间隙放置可防止序列比对和进化分析中的错误。科学,320:1632。

示例

要对 FASTA 文件(unaligned.fasta)进行比对,并将输出以对齐的 FASTA 格式输出,输出文件名以“aligned”开头(您不能显式选择文件名),不输出树,也不输出 XML,请使用

>>> from Bio.Align.Applications import PrankCommandline
>>> prank_cline = PrankCommandline(d="unaligned.fasta",
...                                o="aligned", # prefix only!
...                                f=8, # FASTA output
...                                notree=True, noxml=True)
>>> print(prank_cline)
prank -d=unaligned.fasta -o=aligned -f=8 -noxml -notree

您通常会使用 prank_cline() 或通过 Python 子进程模块运行命令行,如 Biopython 教程中所述。

__init__(cmd='prank', **kwargs)

初始化类。

property F

强制跳过插入:与 +F 相同

此属性控制 -F 开关的添加,将此属性视为布尔值。

property codon

是否进行密码子感知比对

此属性控制 -codon 开关的添加,将此属性视为布尔值。

property convert

将输入比对转换为新格式。不执行比对

此属性控制 `-convert` 开关的添加,将此属性视为布尔值。

property d

输入文件名

这控制 -d 参数及其关联值的添加。将此属性设置为所需的参数值。

property dnafreqs

DNA 频率 - ‘A,C,G,T’。例如 ‘25,25,25,25’ 作为带引号的字符串值。默认值:经验值

这控制 -dnafreqs 参数及其关联值的添加。将此属性设置为所需的参数值。

property dots

将插入间隙显示为点

此属性控制 -dots 开关的添加,将此属性视为布尔值。

property f

输出比对格式。默认值:8 FASTA 选项为:1. IG/Stanford 8. Pearson/Fasta 2. GenBank/GB 11. Phylip3.2 3. NBRF 12. Phylip 4. EMBL 14. PIR/CODATA 6. DNAStrider 15. MSF 7. Fitch 17. PAUP/NEXUS

这控制 -f 参数及其关联值的添加。将此属性设置为所需的参数值。

property fixedbranches

使用输入值的固定分支长度

这控制 -fixedbranches 参数及其关联值的添加。将此属性设置为所需的参数值。

property gapext

间隙扩展概率。默认值:dna 0.5 / prot 0.5

这控制着 -gapext 参数及其相关值的添加。 将此属性设置为所需的参数值。

property gaprate

间隙打开率。默认值:dna 0.025 prot 0.0025

这控制 -gaprate 参数及其关联值的添加。将此属性设置为所需的参数值。

property kappa

转换/颠换比率。默认值:2

这控制 -kappa 参数及其关联值的添加。将此属性设置为所需的参数值。

property longseq

在成对比对中节省空间

此属性控制 -longseq 开关的添加,将此属性视为布尔值。

property m

用户定义的比对模型文件名。默认值:HKY2/WAG

这控制 -m 参数及其关联值的添加。将此属性设置为所需的参数值。

property matinitsize

矩阵初始大小倍数

这控制 -matinitsize 参数及其关联值的添加。将此属性设置为所需的参数值。

property matresize

矩阵调整大小倍数

这控制 -matresize 参数及其关联值的添加。将此属性设置为所需的参数值。

property maxbranches

使用输入值的最大分支长度

这控制 -maxbranches 参数及其关联值的添加。将此属性设置为所需的参数值。

property mttranslate

使用 mt 表翻译为蛋白质

此属性控制 -mttranslate 开关的添加,将此属性视为布尔值。

property nopost

不计算后验支持。默认值:计算

此属性控制 -nopost 开关的添加,将此属性视为布尔值。

property notree

不输出 dnd 树文件(PRANK 版本早于 v.120626)

此属性控制 -notree 开关的添加,将此属性视为布尔值。

property noxml

不输出 XML 文件(PRANK 版本早于 v.120626)

此属性控制 -noxml 开关的添加,将此属性视为布尔值。

property o
输出文件名前缀。默认值:‘output’

将写入:output.?.fas(取决于请求的格式)、output.?.xml 和 output.?.dnd

这控制着添加 -o 参数及其相关值。将此属性设置为所需的参数值。

property once

只运行一次。默认值:如果未提供引导树,则运行两次

此属性控制 -once 开关的添加,将此属性视为布尔值。

property printnodes

输出每个节点;主要用于调试

此属性控制 -printnodes 开关的添加,将此属性视为布尔值。

property pwdist

用于计算引导树的预期成对距离。默认值:dna 0.25 / prot 0.5

这控制 -pwdist 参数及其关联值的添加。将此属性设置为所需的参数值。

property pwgenomic

进行成对比对,不使用引导树

此属性控制 -pwgenomic 开关的添加,将此属性视为布尔值。

property pwgenomicdist

成对比对的距离。默认值:0.3

这控制 -pwgenomicdist 参数及其关联值的添加。将此属性设置为所需的参数值。

property quiet

减少详细程度

此属性控制 -quiet 开关的添加,将此属性视为布尔值。

property realbranches

禁用分支长度截断

此属性控制 -realbranches 开关的添加,将此属性视为布尔值。

property rho

嘌呤/嘧啶比率。默认值:1

此选项控制是否添加 -rho 参数及其关联值。将此属性设置为所需的参数值。

property scalebranches

缩放分支长度。默认值:dna 1 / prot 2

此选项控制是否添加 -scalebranches 参数及其关联值。将此属性设置为所需的参数值。

property shortnames

在第一个空格处截断名称

此属性控制是否添加 -shortnames 开关,将此属性视为布尔值。

property showtree

输出 dnd 树文件(PRANK v.120626 及更高版本)

此属性控制是否添加 -showtree 开关,将此属性视为布尔值。

property showxml

输出 XML 文件(PRANK v.120626 及更高版本)

此属性控制是否添加 -showxml 开关,将此属性视为布尔值。

property skipins

在后验支持中跳过插入

此属性控制是否添加 -skipins 开关,将此属性视为布尔值。

property t

输入引导树文件名

这控制着添加 -t 参数及其相关值。将此属性设置为所需的参数值。

property termgap

正常情况下对末端缺失进行惩罚

此属性控制是否添加 -termgap 开关,将此属性视为布尔值。

property translate

翻译成蛋白质

此属性控制是否添加 -translate 开关,将此属性视为布尔值。

property tree

输入引导树作为 Newick 字符串

此选项控制是否添加 -tree 参数及其关联值。将此属性设置为所需的参数值。

property twice

始终运行两次

此属性控制是否添加 -twice 开关,将此属性视为布尔值。

property uselogs

速度较慢,但应适用于更多序列

此属性控制是否添加 -uselogs 开关,将此属性视为布尔值。

property writeanc

输出祖先序列

此属性控制是否添加 -writeanc 开关,将此属性视为布尔值。

class Bio.Align.Applications.MafftCommandline(cmd='mafft', **kwargs)

基类:AbstractCommandline

MAFFT 多序列比对程序的命令行包装器。

http://align.bmr.kyushu-u.ac.jp/mafft/software/

备注

最后针对版本验证:MAFFT v6.717b(2009/12/03)

参考文献

Katoh, Toh (BMC Bioinformatics 9:212, 2008) 通过将结构信息整合到基于 MAFFT 的框架中来提高多 ncRNA 比对的准确性(描述了 RNA 结构比对方法)

Katoh, Toh (Briefings in Bioinformatics 9:286-298, 2008) MAFFT 多序列比对程序的最新进展(概述了版本 6)

Katoh, Toh (Bioinformatics 23:372-374, 2007) Errata PartTree:一种从大量未比对序列构建近似树的算法(描述了 PartTree 算法)

Katoh, Kuma, Toh, Miyata (Nucleic Acids Res. 33:511-518, 2005) MAFFT 版本 5:多序列比对准确性的改进(描述了 G-INS-i、L-INS-i 和 E-INS-i 策略的[祖先版本])

Katoh, Misawa, Kuma, Miyata (Nucleic Acids Res. 30:3059-3066, 2002)

示例

>>> from Bio.Align.Applications import MafftCommandline
>>> mafft_exe = "/opt/local/mafft"
>>> in_file = "../Doc/examples/opuntia.fasta"
>>> mafft_cline = MafftCommandline(mafft_exe, input=in_file)
>>> print(mafft_cline)
/opt/local/mafft ../Doc/examples/opuntia.fasta

如果 mafft 二进制文件在路径中(通常在类 Unix 操作系统中是这种情况),则无需提供可执行文件位置

>>> from Bio.Align.Applications import MafftCommandline
>>> in_file = "../Doc/examples/opuntia.fasta"
>>> mafft_cline = MafftCommandline(input=in_file)
>>> print(mafft_cline)
mafft ../Doc/examples/opuntia.fasta

您通常会使用 mafft_cline() 或通过 Python subprocess 模块运行命令行,如 Biopython 教程中所述。

请注意,MAFFT 将将比对写入 stdout,您可能希望将其保存到文件,然后进行解析,例如:

stdout, stderr = mafft_cline()
with open("aligned.fasta", "w") as handle:
    handle.write(stdout)
from Bio import AlignIO
align = AlignIO.read("aligned.fasta", "fasta")

或者,要直接使用 AlignIO 解析输出,可以使用 StringIO 将字符串转换为句柄

stdout, stderr = mafft_cline()
from io import StringIO
from Bio import AlignIO
align = AlignIO.read(StringIO(stdout), "fasta")
__init__(cmd='mafft', **kwargs)

初始化类。

property LEXP

跳过比对的缺失扩展惩罚。默认值:0.00

此选项控制是否添加 –LEXP 参数及其关联值。将此属性设置为所需的参数值。

property LOP

跳过比对的缺失打开惩罚。默认值:-6.00

此选项控制是否添加 –LOP 参数及其关联值。将此属性设置为所需的参数值。

property aamatrix

使用用户定义的 AA 评分矩阵。默认值:BLOSUM62

此选项控制是否添加 –aamatrix 参数及其关联值。将此属性设置为所需的参数值。

property adjustdirection

根据第一个序列调整方向。默认关闭。

此属性控制是否添加 –adjustdirection 开关,将此属性视为布尔值。

property adjustdirectionaccurately

根据第一个序列调整方向,适用于高度发散的数据;速度非常慢,默认关闭。

此属性控制是否添加 –adjustdirectionaccurately 开关,将此属性视为布尔值。

property amino

假设序列是氨基酸(True/False)。默认值:自动

此属性控制是否添加 –amino 开关,将此属性视为布尔值。

property auto

自动选择策略。默认关闭。

此属性控制 –auto 开关的添加,将此属性视为布尔值。

property bl

使用 BLOSUM 编号矩阵。默认值:62

此选项控制是否添加 –bl 参数及其关联值。将此属性设置为所需的参数值。

property clustalout

输出格式:clustal(True)或 fasta(False,默认)

此属性控制是否添加 –clustalout 开关,将此属性视为布尔值。

property dpparttree

使用基于 DP 的距离的 PartTree 算法。默认值:关闭

此属性控制是否添加 –dpparttree 开关,将此属性视为布尔值。

property ep

偏移值,类似于缺失扩展惩罚,用于组间比对。默认值:0.123

此选项控制是否添加 –ep 参数及其关联值。将此属性设置为所需的参数值。

property fastapair

所有成对比对都使用 FASTA(Pearson 和 Lipman 1988)计算。默认值:关闭

此属性控制是否添加 –fastapair 开关,将此属性视为布尔值。

property fastaparttree

使用基于 FASTA 的距离的 PartTree 算法。默认值:关闭

此属性控制是否添加 –fastaparttree 开关,将此属性视为布尔值。

property fft

在组间比对中使用 FFT 近似。默认值:开启

此属性控制是否添加 –fft 开关,将此属性视为布尔值。

property fmodel

将 AA/nuc 成分信息整合到评分矩阵中(True)还是不整合(False,默认)

此属性控制是否添加 –fmodel 开关,将此属性视为布尔值。

property genafpair

所有成对比对使用广义仿射间隙成本的局部算法计算(Altschul 1998)。默认:关闭

此属性控制 –genafpair 开关的添加,将此属性视为布尔值。

property globalpair

所有成对比对使用 Needleman-Wunsch 算法计算。默认:关闭

此属性控制 –globalpair 开关的添加,将此属性视为布尔值。

property groupsize

不要使比对大于序列数。默认:输入序列数

此属性控制 –groupsize 开关的添加,将此属性视为布尔值。

property input

输入文件名

这控制输入参数及其关联值的添加。将此属性设置为所需的参数值。

property input1

用于 mafft-profile 命令的第二个输入文件名

这控制 input1 参数及其关联值的添加。将此属性设置为所需的参数值。

property inputorder

输出顺序:与输入相同(True,默认)或基于比对(False)

此属性控制 –inputorder 开关的添加,将此属性视为布尔值。

property jtt

使用 JTT PAM 数(Jones 等人 1992)矩阵。数字 > 0。默认:BLOSUM62

这控制 –jtt 参数及其关联值的添加。将此属性设置为所需的参数值。

property lep

局部成对比对的偏移值。默认:0.1

这控制 –lep 参数及其关联值的添加。将此属性设置为所需的参数值。

property lexp

局部成对比对的间隙扩展罚分。默认:-0.1

这控制 –lexp 参数及其关联值的添加。将此属性设置为所需的参数值。

property localpair

所有成对比对使用 Smith-Waterman 算法计算。默认:关闭

此属性控制 –localpair 开关的添加,将此属性视为布尔值。

property lop

局部成对比对的间隙打开罚分。默认:0.123

这控制 –lop 参数及其关联值的添加。将此属性设置为所需的参数值。

property maxiterate

执行迭代细化的循环次数。默认:0

这控制 –maxiterate 参数及其关联值的添加。将此属性设置为所需的参数值。

property memsave

使用 Myers-Miller(1988)算法。默认:当比对长度超过 10,000(aa/nt)时自动打开。

此属性控制 –memsave 开关的添加,将此属性视为布尔值。

property namelength

CLUSTAL 和 PHYLIP 输出中的名称长度。

MAFFT v6.847(2011)添加了 –namelength,用于与 –clustalout 选项一起使用以生成 CLUSTAL 输出。

MAFFT v7.024(2013)添加了对 –phylipout 选项的支持,用于 PHYLIP 输出(默认 10)。

这控制 –namelength 参数及其关联值的添加。将此属性设置为所需的参数值。

property nofft

在组间比对中不要使用 FFT 近似。默认:关闭

此属性控制 –nofft 开关的添加,将此属性视为布尔值。

property noscore

在迭代细化阶段不检查比对分数。默认:关闭(检查分数)

此属性控制 –noscore 开关的添加,将此属性视为布尔值。

property nuc

假设序列是核苷酸(True/False)。默认:自动

此属性控制 –nuc 开关的添加,将此属性视为布尔值。

property op

组间比对的间隙打开罚分。默认:1.53

这控制 –op 参数及其关联值的添加。将此属性设置为所需的参数值。

property partsize

PartTree 算法中的分区数。默认:50

这控制 –partsize 参数及其关联值的添加。将此属性设置为所需的参数值。

property parttree

使用 6mer 距离的快速树构建方法。默认:关闭

此属性控制 –parttree 开关的添加,将此属性视为布尔值。

property phylipout

输出格式:phylip(True)或 fasta(False,默认)

此属性控制 –phylipout 开关的添加,将此属性视为布尔值。

property quiet

不报告进度(True)或不报告进度(False,默认)。

此属性控制 –quiet 开关的添加,将此属性视为布尔值。

property reorder

输出顺序:比对(True)或输入顺序(False,默认)

此属性控制 –reorder 开关的添加,将此属性视为布尔值。

property retree

在渐进阶段,引导树构建次数。6mer 距离有效。默认:2

这控制 –retree 参数及其关联值的添加。将此属性设置为所需的参数值。

property seed

在 alignment_n(fasta 格式)中给出的种子比对与输入中的序列比对。

这控制 –seed 参数及其关联值的添加。将此属性设置为所需的参数值。

property sixmerpair

距离是根据共享的 6mer 数计算的。默认:开启

此属性控制 –6merpair 开关的添加,将此属性视为布尔值。

property thread

要使用的线程数。默认:1

这控制 –thread 参数及其关联值的添加。将此属性设置为所需的参数值。

property tm

使用跨膜 PAM 数(Jones 等人 1994)矩阵。数字 > 0。默认:BLOSUM62

这控制 –tm 参数及其关联值的添加。将此属性设置为所需的参数值。

property treeout

引导树输出到 input.tree 文件(True)或不输出(False,默认)

此属性控制 –treeout 开关的添加,将此属性视为布尔值。

property weighti

从成对比对计算的一致性项的加权因子。默认:2.7

这控制 –weighti 参数及其关联值的添加。将此属性设置为所需的参数值。

class Bio.Align.Applications.DialignCommandline(cmd='dialign2-2', **kwargs)

基类:AbstractCommandline

用于多序列比对程序 DIALIGN2-2 的命令行包装器。

http://bibiserv.techfak.uni-bielefeld.de/dialign/welcome.html

备注

最后针对版本检查:2.2

参考文献

B. Morgenstern (2004)。DIALIGN:BiBiServ 上的多 DNA 和蛋白质序列比对。核酸研究 32, W33-W36。

示例

要将 FASTA 文件 (unaligned.fasta) 与输出文件 aligned.*(包括 FASTA 输出文件 aligned.fa)一起比对,请使用

>>> from Bio.Align.Applications import DialignCommandline
>>> dialign_cline = DialignCommandline(input="unaligned.fasta",
...                                    fn="aligned", fa=True)
>>> print(dialign_cline)
dialign2-2 -fa -fn aligned unaligned.fasta

您通常会使用 dialign_cline() 或通过 Python 子进程模块运行命令行,如 Biopython 教程中所述。

__init__(cmd='dialign2-2', **kwargs)

初始化类。

property afc

创建额外的输出文件 ‘*.afc’ ,包含所有用于对齐的片段数据。警告:此文件可能非常大!

此属性控制是否添加 -afc 开关,将其视为布尔值。

property afc_v

与 ‘-afc’ 相似,但更详细:片段被显式打印。警告:此文件可能更大!

此属性控制是否添加 -afc_v 开关,将其视为布尔值。

property anc

锚定对齐。需要一个包含锚点的文件 <seq_file>.anc。

此属性控制是否添加 -anc 开关,将其视为布尔值。

property cs

如果片段被翻译,不仅会查看 ‘Watson 链’,还会查看 ‘Crick 链’。

此属性控制是否添加 -cs 开关,将其视为布尔值。

property cw

以 CLUSTAL W 格式创建额外的输出文件。

此属性控制是否添加 -cw 开关,将其视为布尔值。

property ds

‘dna alignment speed up’ - 未翻译的核酸片段仅在以至少两个匹配开始时才被考虑。这会加速 DNA 对齐,但会降低灵敏度。

此属性控制是否添加 -ds 开关,将其视为布尔值。

property fa

以 FASTA 格式创建额外的输出文件。

此属性控制是否添加 -fa 开关,将其视为布尔值。

property ff

创建文件 *.frg ,包含有关所有属于各自最佳成对对齐的片段的信息,以及有关多重对齐中一致性的信息。

此属性控制是否添加 -ff 开关,将其视为布尔值。

property fn

输出文件命名为 <out_file>.<extension>。

这控制是否添加 -fn 参数及其关联的值。将此属性设置为所需的参数值。

property fop

创建文件 *.fop ,包含所有属于各自成对对齐的片段的坐标。

此属性控制是否添加 -fop 开关,将其视为布尔值。

property fsm

创建文件 *.fsm ,包含所有属于最终对齐的片段的坐标。

此属性控制是否添加 -fsm 开关,将其视为布尔值。

property input

输入文件名。必须是 FASTA 格式。

这控制输入参数及其关联值的添加。将此属性设置为所需的参数值。

property iw

关闭重叠权重(默认情况下,如果对齐多达 35 个序列,则使用重叠权重)。此选项会加快对齐速度,但可能会导致对齐质量下降。

此属性控制是否添加 -iw 开关,将其视为布尔值。

property lgs

‘长基因组序列’ - 组合以下选项:-ma、-thr 2、-lmax 30、-smin 8、-nta、-ff、-fop、-ff、-cs、-ds、-pst。

此属性控制是否添加 -lgs 开关,将其视为布尔值。

property lgs_t

与 ‘-lgs’ 相似,但在肽水平上评估所有片段对(而不是 ‘-lgs’ 选项中的 ‘混合对齐’)。因此比 -lgs 快,但对于非编码区域不太敏感。

此属性控制是否添加 -lgs_t 开关,将其视为布尔值。

property lmax

最大片段长度 = x(默认:x = 40 或 x = 120 用于 ‘翻译’ 的片段)。较小的 x 会加快程序速度,但可能会影响对齐质量。

这控制是否添加 -lmax 参数及其关联的值。将此属性设置为所需的参数值。

property loa

(长输出) 额外的文件 *.log ,其中包含有关用于成对对齐的片段的信息以及有关多重对齐过程中一致性的信息。

此属性控制是否添加 -lo 开关,将其视为布尔值。

property ma

如果对齐核酸序列,则由 P-片段和 N-片段组成的 ‘混合对齐’。

此属性控制是否添加 -ma 开关,将其视为布尔值。

property mask

在输出对齐中,不属于选定片段的残基将被 ‘*’ 字符替换(而不是以小写字符打印)。

此属性控制是否添加 -mask 开关,将其视为布尔值。

property mat

创建文件 *mat ,其中包含从用于对齐的片段中得出的替换计数。

此属性控制是否添加 -mat 开关,将其视为布尔值。

property mat_thr

与 ‘-mat’ 相似,但仅考虑权重得分 > t 的片段。

此属性控制是否添加 -mat_thr 开关,将其视为布尔值。

使用 ‘最大连接’ 聚类来构建序列树(而不是 UPGMA)。

此属性控制是否添加 -max_link 开关,将其视为布尔值。

使用 ‘最小连接’ 聚类。

此属性控制是否添加 -min_link 开关,将其视为布尔值。

property mot

‘motif’ 选项。

这控制是否添加 -mot 参数及其关联的值。将此属性设置为所需的参数值。

property msf

以 MSF 格式创建单独的输出文件。

此属性控制 -msf 开关的添加,将此属性视为布尔值。

property n

输入序列是核酸序列。不翻译片段。

此属性控制是否添加 -n 开关,将其视为布尔值。

property nt

输入序列是核酸序列,并且 ‘核酸片段’ 被翻译成 ‘肽片段’。

此属性控制是否添加 -nt 开关,将其视为布尔值。

property nta

‘no textual alignment’ - 文本对齐被抑制。如果其他输出文件是感兴趣的,例如使用 -ff、-fop、-fsm 或 -lo 创建的片段文件,此选项很有意义。

此属性控制是否添加 -nta 开关,将其视为布尔值。

property o

快速版本,生成的对齐可能略有不同。

此属性控制是否添加 -o 开关,将其视为布尔值。

property ow

强制使用重叠权重(默认情况下,仅当对齐多达 35 个序列时才使用重叠权重,因为计算重叠权重非常耗时)。

此属性控制是否添加 -ow 开关,将其视为布尔值。

property pst

‘print status’。创建一个文件 *.sta 并更新它,其中包含有关程序运行当前状态的信息。如果对齐大型数据集,建议使用此选项,因为它允许用户估计剩余的运行时间。

此属性控制是否添加 -pst 开关,将此属性视为布尔值。

property smin

片段中第一个残基对(或密码子对)的最小相似度值。加快蛋白质比对或翻译后的 DNA 片段比对的速度,但会降低灵敏度。

此属性控制是否添加 -smin 开关,将此属性视为布尔值。

property stars

表示序列之间局部相似度程度的“*”字符的最大数量。默认情况下,不使用星号,而是使用 0 到 9 之间的数字。

这控制是否添加 -stars 参数及其关联值。将此属性设置为所需的参数值。

property stdo

结果写入标准输出。

此属性控制是否添加 -stdo 开关,将此属性视为布尔值。

property ta

打印标准文本比对(覆盖特殊选项中对文本比对的抑制,例如 -lgs)

此属性控制是否添加 -ta 开关,将此属性视为布尔值。

property thr

阈值 T = x。

这控制是否添加 -thr 参数及其关联值。将此属性设置为所需的参数值。

property xfr

“排除片段” - 可以指定不考虑用于成对比对的片段列表

此属性控制是否添加 -xfr 开关,将此属性视为布尔值。

class Bio.Align.Applications.ProbconsCommandline(cmd='probcons', **kwargs)

基类:AbstractCommandline

多序列比对程序 PROBCONS 的命令行包装器。

http://probcons.stanford.edu/

备注

上次检查版本:1.12

参考文献

Do, C.B., Mahabhashyam, M.S.P., Brudno, M., and Batzoglou, S. 2005. PROBCONS: Probabilistic Consistency-based Multiple Sequence Alignment. Genome Research 15: 330-340.

示例

要使用 ClustalW 格式比对 FASTA 文件(unaligned.fasta)并将输出保存到文件中,并使用其他默认设置,请使用

>>> from Bio.Align.Applications import ProbconsCommandline
>>> probcons_cline = ProbconsCommandline(input="unaligned.fasta",
...                                      clustalw=True)
>>> print(probcons_cline)
probcons -clustalw unaligned.fasta

您通常会使用 probcons_cline() 或通过 Python 子进程模块运行命令行,如 Biopython 教程中所述。

请注意,PROBCONS 会将比对写入 stdout,您可能希望将其保存到文件中,然后解析,例如

stdout, stderr = probcons_cline()
with open("aligned.aln", "w") as handle:
    handle.write(stdout)
from Bio import AlignIO
align = AlignIO.read("aligned.fasta", "clustalw")

或者,要直接使用 AlignIO 解析输出,可以使用 StringIO 将字符串转换为句柄

stdout, stderr = probcons_cline()
from io import StringIO
from Bio import AlignIO
align = AlignIO.read(StringIO(stdout), "clustalw")
__init__(cmd='probcons', **kwargs)

初始化类。

property a

按比对顺序而不是输入顺序打印序列(默认:关闭)

此属性控制是否添加 -a 开关,将此属性视为布尔值。

property annot

将多序列比对的注释写入 FILENAME

这控制是否添加 -annot 参数及其关联值。将此属性设置为所需的参数值。

property clustalw

使用 CLUSTALW 输出格式而不是 MFA

此属性控制是否添加 -clustalw 开关,将此属性视为布尔值。

property consistency

使用 0 <= REPS <= 5(默认:2)次一致性转换传递

这控制是否添加 -c 参数及其关联值。将此属性设置为所需的参数值。

property emissions

还重新估计发射概率(默认:关闭)

此属性控制是否添加 -e 开关,将此属性视为布尔值。

property input

输入文件名。必须是多个 FASTA 比对(MFA)格式

这控制输入参数及其关联值的添加。将此属性设置为所需的参数值。

property ir

使用 0 <= REPS <= 1000(默认:100)次迭代细化传递

这控制是否添加 -ir 参数及其关联值。将此属性设置为所需的参数值。

property pairs

生成所有成对的成对比对

此属性控制是否添加 -pairs 开关,将此属性视为布尔值。

property paramfile

从 FILENAME 读取参数

这控制是否添加 -p 参数及其关联值。将此属性设置为所需的参数值。

property pre

使用 0 <= REPS <= 20(默认:0)轮预训练

这控制是否添加 -pre 参数及其关联值。将此属性设置为所需的参数值。

property train

计算 EM 转换概率,存储在 FILENAME 中(默认:无训练)

这控制着添加 -t 参数及其相关值。将此属性设置为所需的参数值。

property verbose

在比对时报告进度(默认:关闭)

此属性控制 `-verbose` 开关的添加,将此属性视为布尔值。

property viterbi

使用 Viterbi 算法生成所有对(自动启用 -pairs)

此属性控制是否添加 -viterbi 开关,将此属性视为布尔值。

class Bio.Align.Applications.TCoffeeCommandline(cmd='t_coffee', **kwargs)

基类:AbstractCommandline

TCoffee 比对程序的命令行对象。

http://www.tcoffee.org/Projects_home_page/t_coffee_home_page.html

T-Coffee 命令行工具有许多开关和选项。此包装器实现了 VERY 有限数量的选项 - 如果您想帮助改进它,请与我们联系。

备注

上次检查版本:Version_6.92

参考文献

T-Coffee: A novel method for multiple sequence alignments. Notredame, Higgins, Heringa, JMB,302(205-217) 2000

示例

要使用 ClustalW 格式比对 FASTA 文件(unaligned.fasta)并将输出保存到文件(aligned.aln)中,并使用其他默认设置,请使用

>>> from Bio.Align.Applications import TCoffeeCommandline
>>> tcoffee_cline = TCoffeeCommandline(infile="unaligned.fasta",
...                                    output="clustalw",
...                                    outfile="aligned.aln")
>>> print(tcoffee_cline)
t_coffee -output clustalw -infile unaligned.fasta -outfile aligned.aln

您通常会使用 tcoffee_cline() 或通过 Python 子进程模块运行命令行,如 Biopython 教程中所述。

SEQ_TYPES = ['dna', 'protein', 'dna_protein']
__init__(cmd='t_coffee', **kwargs)

初始化类。

property convert

指定您要执行文件转换

此属性控制 `-convert` 开关的添加,将此属性视为布尔值。

property gapext

表示对扩展间隙应用的惩罚(负整数)

这控制着 -gapext 参数及其相关值的添加。 将此属性设置为所需的参数值。

property gapopen

表示对打开间隙应用的惩罚(负整数)

此属性控制 -gapopen 参数及其相关值的添加。将此属性设置为所需的参数值。

property infile

指定输入文件。

这控制着 -infile 参数及其相关值的添加。 将此属性设置为所需的参数值。

property matrix

指定要使用的替换矩阵的文件名。默认:blosum62mt

此属性控制 -matrix 参数及其相关值的添加。将此属性设置为所需的参数值。

property mode

指定特殊模式:genome、quickaln、dali、3dcoffee

此选项控制 -mode 参数及其关联值的添加。将此属性设置为所需的参数值。

property outfile

指定输出文件。默认值:<您的序列>.aln

这控制着 -outfile 参数及其相关值的添加。 将此属性设置为所需的参数值。

property outorder

指定序列输出的顺序,可以是 'input'、'aligned' 或者包含序列顺序的 Fasta 文件的 <文件名>

这控制着 -outorder 参数及其相关值的添加。 将此属性设置为所需的参数值。

property output

指定输出类型。

一个(或多个,以逗号分隔)以下选项:'clustalw_aln'、'clustalw'、'gcg'、'msf_aln'、'pir_aln'、'fasta_aln'、'phylip'、'pir_seq'、'fasta_seq'

这控制着 -output 参数及其相关值的添加。 将此属性设置为所需的参数值。

property quiet

关闭日志输出

此属性控制 -quiet 开关的添加,将此属性视为布尔值。

property type

指定要对齐的序列类型

此属性控制 -type 参数及其关联值的添加。将此属性设置为所需的参数值。

class Bio.Align.Applications.MSAProbsCommandline(cmd='msaprobs', **kwargs)

基类:AbstractCommandline

MSAProbs 的命令行包装器。

http://msaprobs.sourceforge.net

备注

最后检查版本:0.9.7

参考文献

Yongchao Liu, Bertil Schmidt, Douglas L. Maskell: “MSAProbs: 基于成对隐马尔可夫模型和配分函数后验概率的多序列比对”。生物信息学,2010,26(16): 1958 -1964

示例

>>> from Bio.Align.Applications import MSAProbsCommandline
>>> in_file = "unaligned.fasta"
>>> out_file = "aligned.cla"
>>> cline = MSAProbsCommandline(infile=in_file, outfile=out_file, clustalw=True)
>>> print(cline)
msaprobs -o aligned.cla -clustalw unaligned.fasta

您通常会使用 cline() 或通过 Python 子进程模块运行命令行,如 Biopython 教程中所述。

__init__(cmd='msaprobs', **kwargs)

初始化类。

property alignment_order

按比对顺序而不是输入顺序打印序列(默认:关闭)

此属性控制是否添加 -a 开关,将此属性视为布尔值。

property annot

将多序列比对的注释写入 FILENAME

这控制是否添加 -annot 参数及其关联值。将此属性设置为所需的参数值。

property clustalw

使用 CLUSTALW 输出格式而不是 FASTA 格式

此属性控制是否添加 -clustalw 开关,将此属性视为布尔值。

property consistency

使用 0 <= REPS <= 5(默认:2)次一致性变换

这控制是否添加 -c 参数及其关联值。将此属性设置为所需的参数值。

property infile

多序列输入文件

此选项控制 infile 参数及其关联值的添加。将此属性设置为所需的参数值。

property iterative_refinement

使用 0 <= REPS <= 1000(默认:10)次迭代优化

这控制是否添加 -ir 参数及其关联值。将此属性设置为所需的参数值。

property numthreads

指定要使用的线程数,否则自动检测

此选项控制 -num_threads 参数及其关联值的添加。将此属性设置为所需的参数值。

property outfile

指定输出文件名(默认:STDOUT)

这控制着添加 -o 参数及其相关值。将此属性设置为所需的参数值。

property verbose

在比对时报告进度(默认:关闭)

此属性控制添加 -v 开关,将其视为布尔值。

property version

打印 MSAPROBS 版本

此选项控制 -version 参数及其关联值的添加。将此属性设置为所需的参数值。