Bio.SeqUtils.IsoelectricPoint 模块

使用 Bjellqvist 方法计算多肽的等电点。

pK 值和方法取自

* Bjellqvist, B.,Hughes, G.J., Pasquali, Ch., Paquet, N., Ravier, F.,
Sanchez, J.-Ch., Frutiger, S. & Hochstrasser, D.F.
The focusing positions of polypeptides in immobilized pH gradients can be
predicted from their amino acid sequences. Electrophoresis 1993, 14,
1023-1031.

* Bjellqvist, B., Basse, B., Olsen, E. and Celis, J.E.
Reference points for comparisons of two-dimensional maps of proteins from
different human cell types defined in a pH scale where isoelectric points
correlate with polypeptide compositions. Electrophoresis 1994, 15, 529-539.

我根据 David L. Tabb 的笔记设计了算法,该笔记可从以下地址获得:http://fields.scripps.edu/DTASelect/20010710-pI-Algorithm.pdf

class Bio.SeqUtils.IsoelectricPoint.IsoelectricPoint(protein_sequence, aa_content=None)

基类:object

用于计算蛋白质在给定 pH 值下的 IEP 或电荷的类。

参数:
:protein_sequence: 包含蛋白质的 ``Bio.Seq`` 或字符串对象

序列。

:aa_content: 一个字典,以氨基酸字母为键,其

出现次数作为整数,例如 {"A": 3, "C": 0, ...}。默认值:None。如果为 None,则将根据给定的序列计算字典。

示例

此类的所有方法都可以从类本身访问,也可以从 ProtParam.ProteinAnalysis 对象访问(部分名称不同)

>>> from Bio.SeqUtils.IsoelectricPoint import IsoelectricPoint as IP
>>> protein = IP("INGAR")
>>> print(f"IEP of peptide {protein.sequence} is {protein.pi():.2f}")
IEP of peptide INGAR is 9.75
>>> print(f"Its charge at pH 7 is {protein.charge_at_pH(7.0):.2f}")
Its charge at pH 7 is 0.76
>>> from Bio.SeqUtils.ProtParam import ProteinAnalysis as PA
>>> protein = PA("PETER")
>>> print(f"IEP of {protein.sequence}: {protein.isoelectric_point():.2f}")
IEP of PETER: 4.53
>>> print(f"Charge at pH 4.53: {protein.charge_at_pH(4.53):.2f}")
Charge at pH 4.53: 0.00

方法

:charge_at_pH(pH): 计算蛋白质在给定 pH 值下的电荷

:pi(): 计算等电点

__init__(protein_sequence, aa_content=None)

初始化类。

charge_at_pH(pH)

计算蛋白质在给定 pH 值下的电荷。

pi(pH=7.775, min_=4.05, max_=12)

计算并返回等电点作为浮点数。

这是一个使用二分法递归函数。关于二分法的维基百科页面:https://en.wikipedia.org/wiki/Bisection_method

参数
  • pH: 计算蛋白质当前电荷的 pH 值。此 pH 值位于区间中心(min_max_ 的平均值)。

  • min_: 区间的最小值。初始值默认为 4.05,低于理论最小值,此时蛋白质完全由天冬氨酸组成。

  • max_: 区间的最大值。初始值默认为 12,高于理论最大值,此时蛋白质完全由精氨酸组成。