第一节 限制性核酸内切酶
限制性核酸内切酶(restriction endonuclease)简称限制性内切酶,有时也简称内切酶,是一类能从DNA分子中水解磷酸二酯键,从而切断双链DNA的核酸水解酶。它们不同于一般的脱氧核糖核酸酶(DNase),它们具有特定的核苷酸识别序列,酶切位点大多很严格,是体外剪切DNA片段的重要工具。
一、限制性内切酶的发现
限制性核酸内切酶的发现得益于对细菌限制和修饰现象(restriction and modification,简称R/M体系)的研究。在20世纪60年代,当人们在对噬菌体的宿主特异性的限制-修饰现象进行研究时就注意到这样的现象:大多数的细菌对噬菌体的感染都存在一定的障碍(限制),即几乎没有一种噬菌体能感染两种不同的细菌;某一种噬菌体感染某一细菌受到限制,但是当其感染后的子代噬菌体再重新感染同一菌株就不会再受到限制(表3-1),这种现象当时称作寄主控制的专一性(host controlled specificity)。
表3-1 噬菌体感染不同菌株的感染率
细菌限制和修饰这种现象的分子生物学研究发现该现象是由两种酶所决定的,并提出限制性内切酶和限制酶的概念,随后从E.coli K中首次分离出限制性内切酶EcoB、EcoK。限制性内切酶和修饰酶的发现很好地解释了细菌的限制和修饰现象,细菌可以抵御新病毒的入侵,而这种“限制”病毒生存的办法则可归功于细胞内部可降解外源DNA的限制性内切酶,而重新感染不受到限制则归功于修饰的甲基转移酶。例如,噬菌体λ(B)感染菌株K时由于受到EcoK核酸酶的攻击,感染受到限制,菌株K得到保护。但是当进入菌株K所有的λ(B)被降解前可能受到了甲基化修饰,因而在菌株K内产生所有的子代的噬菌体都是受到甲基化修饰的,所以当噬菌体λ(B)的子代噬菌体再次感染菌株K时就不会受到EcoK核酸酶的攻击,因而没有感染受到限制。
微生物细胞内的限制性内切酶通常伴随一到两种修饰酶(甲基化酶),它起到保护细胞自身的DNA不被自身限制性内切酶破坏的作用。修饰酶识别的位点与相应的限制性内切酶相同,但其作用并不是切开DNA链,而是甲基化每条DNA链中的一个碱基。甲基化所形成的甲基基团能伸入到限制性内切酶识别位点的双螺旋的大沟中,阻碍限制性内切酶发挥作用,从而保护了DNA不被内切酶切割。这样,限制性内切酶和它的“搭档”修饰酶一起组成限制-修饰(R-M)系统。在一些R-M系统中,限制性内切酶和修饰酶是两种不同的蛋白,它们各自独立行使自己的功能;另一些R-M系统本身就是一种大的限制-修饰功能复合酶,由不同亚基或同一亚基的不同结构域来分别执行限制或修饰功能。
1965年阿尔伯首次从理论上提出了生物体内存在着一种具有切割基因功能的限制性内切酶,并于1968年首次从E.coli K中分离出Ⅰ型限制性内切酶EcoB和EcoK。1970年美国约翰·霍布金斯大学的史密斯于偶然中发现,流感嗜血杆菌(Haemophilus influ-enzae)能迅速降解外源的噬菌体DNA,其细胞提取液也可降解E.coli的DNA,但不能降解自身DNA,从而找到HincⅡ(HindⅡ)限制性内切酶。这是首次分离出了Ⅱ型限制性内切酶;同年内森斯使用Ⅱ型限制性内切酶首次完成了对基因的切割。HincⅡ限制性内切酶位点和切割位点如下:
从此以后,越来越多的限制酶被纯化和分类,并且许多种类已经在实践中得到应用。1986年下半年发现600多种限制酶和近百种甲基化酶,到1998年纯化分类的3000多种限制性内切酶中,有30%是New England Biolabs(NEB)公司发现的,已发现的限制性内切酶中超过200种有特异识别序列。目前商业化的限制酶超过500种,其中包括来源于大肠杆菌的EcoRⅠ和EcoRⅡ,以及来源于Heamophilus influenzae的HindⅡ和HindⅢ,它们成为在基因操作实验中广泛使用的限制性内切酶。更详细的内切酶相关信息推荐到NEB的官方网站上查询。
二、限制性内切酶的种类
随着越来越多的限制性内切酶被发现,以及更多内切酶的蛋白被测序表明,限制性内切酶的变化多种多样,若从分子水平上分类,应当远远不止我们现在知道的三种。例如从大小上来说,它们可以小到如PvuⅡ由157个氨基酸组成,也可以比1250个氨基酸的CjeⅠ更大。因此传统上限制性内切酶的分类是将限制性内切酶按照亚基组成、酶切位置、识别位点、辅助因子等因素划分为Ⅰ型、Ⅱ型和Ⅲ型三大类,虽然也有分出 Ⅳ型的说法,但是现在大多主张分为前三类。
Ⅰ型限制性内切酶有识别位点,但没有特定的酶切位点,在分子结构上它是多个亚基组成的蛋白复合体,兼有限制性内切酶和修饰酶活性,能识别专一的核苷酸顺序,并在识别点附近的一些核苷酸上切割DNA分子中的双链,但是切割的核苷酸顺序没有专一性,而是随机的。类型Ⅰ的限制与修饰系统种类很少,只占1%左右,如EcoK和EcoB,是由R亚基和M亚基两个亚基组成,并各作为一个独立亚基存在于酶分子中,分别执行限制酶和甲基化酶功能。此外,还有负责识别DNA序列的S亚基,分别由hsdR、hsdM和hsdS基因编码,属于同一个操纵子控制,EcoK编码基因的结构为R2M2S,EcoB编码基因的结构为R2M4S2。
EcoB酶的识别位点如下,链中的A*为甲基化位点,N表示任意碱基。
TGA*(N)8TGCT
EcoK酶的识别位点如下,链中的A°为可能的甲基化位点。
AA℃(N)6GTGC
但是EcoB酶和EcoK酶的切割位点在识别位点1000 bp以外,且无特异性。
以前人们认为Ⅰ型限制性内切酶是很稀有的,但现在通过对基因组测序的结果发现,这一类酶其实很常见。由于Ⅰ型限制性内切酶没有固定的酶切位点,切割长短不一而无特异性,不产生确定的限制性片段和明确的跑胶条带,无法用于分析DNA结构或克隆基因,在DNA重组技术或基因工程中没有多大用处,因而尽管Ⅰ型酶在生化研究中很有意义,在基因操作中不具备实用性。
Ⅱ型限制与修饰系统在细菌中所占的比例最大,达93%,Ⅱ型限制性内切酶能识别专一的核苷酸顺序,并在识别的序列顺序的内部或者外部的固定位置上切割双链DNA。从分子结构上来说Ⅱ型酶是最简单的,一般是同源二聚体(homodimer),由两个彼此按相反方向结合在一起的相同亚单位组成,每个亚单位作用在DNA链的两个互补位点上。修饰酶是单体,修饰作用一般由两个甲基转移酶来完成,分别作用于其中一条链,但甲基化的碱基在两条链上是不同的。Ⅱ型限制酶识别回文对称序列,在回文序列内部或附近切割DNA,产生带3′-OH和5′-磷酸基团的DNA产物,需Mg2+的存在才能发挥活性,相应的修饰酶只需S-腺苷甲硫氨酸(SAM)。Ⅱ型限制性内切酶识别序列主要为4~6 bp,或8 bp以上且呈二重对称的特殊序列,但有少数酶识别更长的序列或简并序列,有些酶识别序列是隔开的,切割位置因酶而异。
在Ⅱ型限制性内切酶中存在一些特殊的类型,比如FokⅠ和N.AlwⅠ,它们在识别位点之外切开DNA。这些酶相对分子质量大小居中,约为400~650个氨基酸左右,它们识别连续的非对称序列,有一个结合识别位点的域和一个专门切割DNA的功能域。这类酶一般被分为Ⅱs型(typeⅡs),约占5%。Ⅱs型内切酶与Ⅱ型内切酶具有相似的辅因子要求,但识别序列是非对称,也是非间断的,长度为4~7 bp,切割位点可能在识别位点一侧的20 bp范围内。一般认为这些酶主要以单体的形式结合到DNA上,但与临近的酶结合成二聚体,协同切开DNA链,因此一些Ⅱs型的酶在切割有多个识别位点的DNA分子时,活性可能更高。
在Ⅱ型限制性内切酶中还有一个特殊的类型,该酶仅仅切割双链DNA中的一条链,造成一个切口,这类限制酶也称切口(或切刻)内切酶(nicking endonuclease),如N.BbvCⅠA识别序列和切割位点如下:
为了区分,这类酶在命名时前面要加一个N。
Ⅱ型限制性内切酶的识别和切割的核苷酸都是专一的,所以总能得到同样限制性酶切DNA片段,切割长短是固定,电泳可以获得明确的电泳条带,这种限制性内切酶是DNA重组技术中最常用的工具酶之一,是商业化酶的主要部分。
除了Ⅰ型和Ⅱ型内切酶外,还有一类界于Ⅰ与Ⅱ之间的Ⅲ型限制性内切酶,例如EcoPⅠ,在细菌中含量很少所占比例不到1%。Ⅲ型内切酶是一类集限制和修饰功能于一体的酶,相对分子质量较大,通常由850~1250个氨基酸组成,由M和R两个亚基组成蛋白质复合物,其中M亚基具有识别与修饰的功能,R亚基具有核酸酶的活性。Ⅲ型内切酶需要在Mg2+以及辅助因子ATP和SAM的条件下才能呈现对DNA分子的切割活性。有些Ⅲ型内切酶在反应过程中可能会沿着DNA分子移动,并从识别序列的一侧单链切割DNA,如EcoP1和EcoP15,它们的识别序列分别是AGACC和CAGCAG,切割位点则在下游24~26 bp处,由于是单链切割,很少能产生完全切割的DNA片段;而另一些Ⅲ型内切酶,如BcgⅠ,识别序列为CGANNNNNNTGC,在识别位点的两端切开DNA链,产生一小段含识别序列的片段。这些酶的氨基酸序列各不相同,但其结构组成是一致的,与Ⅰ型一样,Ⅲ型内切酶识别序列是不连续的,切割位点是不固定,因此不产生特异性的限制性DNA片段电泳条带,在基因操作中不具备实用性。
三种类型的内切酶比较见表3-2。
表3-2 三种类型内切酶的比较
在基因操作中所说的限制性内切酶或修饰酶,除非特指,一般均指Ⅱ型酶。
三、限制性内切酶的命名
按照国际命名法,限制性内切酶属于水解酶类。其分布极广,几乎在所有细菌的属、种中都发现至少一种限制性内切酶,多者在一个属中就有几十种,例如,在嗜血杆菌属中(Haemophilus)现已发现的就有22种。为了避免限制性内切酶的混淆,1973年,Smith和Nathans对内切酶的命名提出建议,以对限制性内切酶命名进行规范,1980年,Roberts对限制性内切酶的命名进行分类和系统化。现在通用的命名原则是:
名称由3~4个字母组成,方式是:属名+种名+株名+序号。
第一个字母,斜体,大写,取自来源细菌属名的第一个字母。
第二字母,斜体,小写,取自来源细菌种名的第一个字母。
第三字母,斜体,小写,取种名的第二个字母,且小写;若种名有词头,且已命名过内切酶,则取词头后的第一字母代替。
第四字母,若有株名,株名则作为第四字母,是否大小写,根据原来的情况而定。
顺序号,若在同一菌株中分离了几个限制性核酸内切酶,则按先后顺序用罗马数字Ⅰ,Ⅱ,Ⅲ,……来代表。
如限制性内切酶HindⅢ,Hin指来源于流感嗜血杆菌(Haemophilus influenzae),d表示来自菌株Rd,Ⅲ表示序号(表3-3)。以前在限制性内切酶和修饰酶前加R或M,且菌株号和序号小写,但现在限制性内切酶名称中的R省略不写。
表3-3 限制性核酸内切酶的命名实例
四、Ⅱ型限制性内切酶的序列识别特性
Ⅱ型限制性核酸内切酶识别序列的长度一般为4~8个碱基,最常见的是4个或6个碱基,少数也有识别5个或者7、9、10、11个碱基的。某一DNA含有某一内切酶识别位点的理论个数与内切酶识别碱基的个数、碱基组成及DNA的碱基组成有关,可以进行估算。
如果识别位置在DNA分子中分布是随机的,不考虑内切酶和DNA的碱基组成,那么每隔4n bp(n,酶识别序列的长度)就有一个识别位点,就是说限制性内切酶识别的碱基数决定了当一种DNA分子被这种酶降解后的片段的大小。如当识别序列为4个和6个碱基时,平均每44=256个和46=4096个碱基中会出现一个识别位点,通过公式计算就可以预测一段DNA可能被切割成多少个片段,但这只是理论的估算。实际上,很多物种的(G+C)%含量都不是等于50%的,因此DNA序列中四种碱基不是完全相等的,识别相同碱基数的不同的内切酶,在同一DNA序列上的出现的频率是不一样的。
例如,某一段DNA序列的(G+C)%含量为60%,用同样是识别6个碱基的内切酶KpnⅠ和EcoRⅠ来切割,两个酶的识别序列在这一序列上出现的频率是不一样的,得到的片段数目也不一样。可以通过以下方法计算得到。
KpnⅠ和EcoRⅠ的识别序列分别是AGGCCT和GAATTC。
(G+C)%含量为60%得知各碱基含量:A%=T%=20%,G%=C%=30%,
序列AGGCCT出现的频率为:
1/(20%A×30%G×30%G×30%C×30%C×20%T)≈3086;
序列GAATTC出现的频率为:
1/(30%G×20%A×20%A×20%T×20%T×30%C)≈6944。
由上可知,在(G+C)%含量为60%的DNA序列上,识别序列AGGCCT的KpnⅠ大约3086 bp就会出现一个识别位点,而识别序列GAATTC的EcoRⅠ大约6944 bp才会出现一个识别位点,两者相差1倍以上。
不同限制性内切酶具有自己特异性的识别序列,大多数Ⅱ型限制性内切酶都以同源二聚体的形式结合到DNA上,因而Ⅱ型内切酶的识别序列一般都是对称回文结构序列,但有少数的酶是以一单聚体结合到DNA上,其识别序列为非对称序列,如MboⅡ。
一些Ⅱ型限制性内切酶识别的序列是连续对称回文结构,如EcoRⅠ识别序列为GAATTC;而一些酶识别是不连续的对称回文结构序列,如BglⅠ识别的序列为GCC-NNNNNGGC(N为任意碱基),但其真正具有特征的识别序列是GCC和GGC。
一些Ⅱ型限制性内切酶识别的序列中的一个或几个碱基是可变的,如HaeⅡ识别序列为RGCGCY(R=A或G,Y=C或T)[2],这类内切酶称为可变酶,它们识别序列的长度往往≥6个碱基。
一些识别简并序列的限制酶包含了另一种限制酶的功能,如EcoRⅠ识别和切割位点为G↓AATTC,ApoⅠ识别和切割位点为R↓AATTY(R=A或G,Y=C或T),因此ApoⅠ可识别和切割EcoRⅠ的序列,这种现象也称为“同功多位”。
一种酶的识别序列包含于另一些酶的识别序列之中的内切酶称为嵌套酶(Subset酶)。如BamHⅡ的识别序列是GGATCC,Sau3AⅠ识别的是BamHⅠ识别序列中间的GATC 4个碱基。
Ⅱ型限制性内切酶对DNA的切割位置大多数在识别序列内部,例如EcoRⅠ的识别序列和切割位点为,它切割双链DNA的两个切点都在识别序列的内部。有些内切酶的切割位置在识别序列的外部,切割位置在识别序列外部的又可以分成在两端、两侧和单侧。在两端是指酶切割双链DNA的位点分别在识别序列最外一个碱基的外侧,例如Sau3AⅠ;在两侧是指切割双链DNA的两个切点分别在识别序列的两侧,例如,其切割位点与识别序列有一个以上的碱基分割;在外侧是酶切点双链DNA的两个切点都是在识别位序列位点外的一侧,例如BbvⅠ和HgaⅠ等。切割位点在两侧的内切酶还有一类特殊的,与其他酶不同,它们不是只产生一个断点,而是在识别位点的两侧各切开一个断点,并得到一段DNA小片段,例如BcgⅠ和BsaXⅠ等。识别位点与切割位点不一致,且切割点在识别位点外侧10个碱基左右,如MboⅡ切割位点在下游第8个碱基,FokⅠ切割位点在识别位点下游第9个碱基。这类识别位点与切割位置不一致的内切酶被称为远距离裂解酶(distant cleavage)。
五、Ⅱ型限制性内切酶的切割特性
识别序列为对称回文结构序列且切割位点在识别序列内的内切酶(平端酶除外),切割双链DNA后形成两条单链带有几个伸出核苷酸的切口,它们之间正好互补配对,这样的切口叫黏性末端(cohesive end),这样形成的两个末端是相同的,也是互补的。黏性末端可以分为5′黏端和3′黏端,在对称轴5′侧切割产生5′黏端,如EcoRⅠ;在对称轴3′侧切割产生3′黏端,如PstⅠ。两种不同的限制性内切酶切割后存在以下3种情况:
①识别序列不同,切割位点不同,产生酶切片段的末端不同,如EcoRⅠ和PstⅠ;
②识别序列相同,但是切割位点不同,产生酶切片段的末端不同,如KpnⅠ和Asp718Ⅰ;
③识别序列不同,但是切割位点相同,产生酶切片段的黏性末端是相同的,如BglⅡ和BamHⅠ。切割能产生相同黏性末端的内切酶被称为同尾酶(isocaudiners),同尾酶产生的黏性末端可以进行黏性末端连接,但是连接后产生的新序列不能都被原来的酶识别。
注意:所有平端酶产生的末端均是相同的,并可以相互进行连接,但一般不把它作为同尾酶来研究,所以平端酶不能被称为同尾酶。
来源不同、命名也不同的限制酶具有相同的识别序列和切割位点,产生相同末端的内切酶称为同裂酶(isoschizomer)或异源同工酶,例如,HpaⅡ和MspⅠ来源不同,识别序列和切割位点均为C↓CGG。对于同裂酶的定义存在着不同观点,有观点认为来源于不同微生物,但能识别相同DNA序列的限制性内切酶,切割位点可以相同也可以不同。如Acc65Ⅰ和KpnⅠ的识别序列均为GGTACC,但它们的切割位点不同,分别为GGTAC↓C和G↓GTACC,它们也被称为同裂酶;SmaⅠ和XmaⅠ它们识别序列均为CCCGGG,但SmaⅠ切后产生平末端,而XmaⅠ切后产生黏性末端,它们也被称为同裂酶。也有观点认为同裂酶应该分为完全同裂酶和不完全同裂酶,像HpaⅡ和MspⅠ有相同的识别序列和切割位点是完全同裂酶;而有相同的识别序列,但切割位点不同是不完全同裂酶,也称异工酶。在国内外的资料,同裂酶的英文以isoschizomer表示占绝大多数,只有极少数国内资料将其表示为isocaudomer,对前面所提的不完全同裂酶,国外都一致称为neoschizomer。
同裂酶之间的性质有所不同,如对离子强度、反应温度以及对甲基化碱基的敏感性等方面可能有所差别,有一些同裂酶对于切割位点上的甲基化碱基的敏感性有所差别,可用来研究DNA甲基化作用。
一些内切酶在识别序列的回文对称轴处同时切割DNA的两条链,断裂DNA的末端为平末端,如HaeⅢ(GG↓CC)、SmaⅠ(CCC↓GGG)和EcoRⅤ(GAT↓ATC),这类限制性内切酶也称为平端酶。不同平端酶产生的DNA平末端是相同的,可任意相互连接,但连接效率较黏性末端低。
有些内切酶识别序列的碱基数为奇数的非对称序列,如BbvCⅠ,它的识别序列和切割位点为CC↓TCAGC,其切割的DNA产物的末端为非对称的序列。
能识别简并序列的可变酶,其识别序列中可能有非对称的序列,切割DNA产物可以产生非对称末端。如AccⅠ,它的识别序列和切割位点为GT↓MKAC(M=A或C,K=G或T),由于识别碱基可变的,也就是说它可识别4种序列,其中GTAGAC和GTCTAC都为非对称序列,而GTCGAC和GTATAC是对称的。
识别序列为间隔的不连续序列的内切酶,如DraⅢ,其识别序列和切割位点为CACNNN↓GTG,间隔区域的序列是任意碱基的,切割DNA产物也可以产生非对称末端。
切割位置在识别序列外部的内切酶,如EarⅠ,其识别序列切割位点分别是,切割DNA产物可以产生非对称末端。
需要注意的是,如果内切酶识别序列是连续的且切割位点在识别序列内部的,它切割不同DNA的末端是可以相互连接的。如果是能识别简并序列的可变酶、识别间隔序列的内切酶和切割位置在识别序列外部的内切酶,由于存在碱基的可变性,它们切割不同DNA产生的末端有可能是不相同的,这时是不能相互连接的。
六、限制性内切酶对其他基质DNA的作用
研究发现有些限制性内切酶除了分解双链DNA分子,还能够降解其他类型的核酸分子。EcoRⅠ、HindⅢ、SalⅠ、MspⅠ、AluⅠ、TaqⅠ和HacⅡ等能分解DNA-RNA杂交分子;Hha l、Sfa l、MbaⅡ、HinfⅠ、HpaⅡ、PstⅠ、BluⅠ、AvaⅠ、HacⅡ、DdeⅠ、Sau3AL、AccⅡ和Hpa l等能切割单链DNA。目前还没有发现AluⅠ、BbvⅠ、DpnⅠ、FnuDⅡ、FokⅠ、HpaⅡ、Hph、MboⅠ、MboⅡ、MspⅠ、Sau3AⅠ和SfaNⅠ能切割单链DNA的活性。虽然有些内切酶能降解单链DNA,但其效率和稳定性都较差,如HhaⅠ、HinP1Ⅰ和MnlⅠ切割单链DNA的效率是双链DNA的50%,HaeⅢ切割单链DNA的效率是双链的10%,而BstNⅠ、DdeⅠ、HgaⅠ、HinfⅠ和TaqⅠ切割单链DNA的效率是双链的1%。
在分子水平上来看,内切酶几乎不可能识别并切开单链DNA,而某些内切酶之所以能够降解单链DNA,一般认为是因为这些内切酶识别了这些单链DNA上多个回文结构之间堆积形成的暂时性双链结构。因此,内切酶对单链DNA的切割受很多因素的影响,这些因素包括:DNA上识别位点的数目,这些位点之间的距离,单链DNA堆积形成二聚体的稳定性(富含GC的底物要比富含AT的单链DNA底物切割效率高),以及在识别位点之外有多少个保护碱基序列,等等,因此内切酶对单链DNA的切割稳定性和重复性差,在基因重组中没有太多实际用途。
七、Ⅱ型限制性内切酶的星号活性
内切酶星号活性(star activity)也称为次级活性或者第二活力,其定义为:在非标准的反应条件下,内切酶切割与识别位点相似但不完全相同的序列,得到不同的酶解片段的酶活性称为星号活性。酶的星号活性在酶的名称右上角加一个星号(*)表示,如EcoRⅠ*。
EcoRⅠ的星号活性实例:
正常:识别GAATTC 6个核苷酸序列。
异常:可识别AATT 4个核苷酸序列。
现象:酶切产物电泳出现的DNA条带数比正常情况下多。
有观点认为,这种星号活性可能是内切酶的一种普遍特性,如果提供相应反应条件,所有内切酶都会出现非特异性切割。产生星号活力的实质是:单碱基替换、识别序列外侧碱基缩短以及单链切割。早期研究表明,在低盐浓度、高pH条件下,EcoRⅠ可能切割NAATTN序列;后来研究表明,只要识别中心的四碱基序列AATT,不出现A/T替换,它可以切割其他任何单碱基替代序列。
NEB已证实下列酶存在星号活性,ApoⅠ、AseⅠ、BamHⅠ、BssHⅡ、EcoRⅠ、EcoRV、HindⅢ、HinfⅠ、PstⅠ、PvuⅡ、SalⅠ、ScaⅠ、TaqⅠ、XmnⅠ。
容易产生星号活性的因素主要有以下几方面:
①甘油浓度过高,较高的甘油浓度是引起星号活性的常见原因。甘油浓度以体积分数表示,有些酶在甘油浓度>5%时就引起信号活性;在限制性内切酶的浓度与DNA数量的比值为50 U/μg DNA时,甘油的含量为7.5%,便能引起星号活性;当用酶浓度较低至10 U/μg DNA时,甘油含量高于15%或以上,也会引起星号活性。
②酶与底物DNA比例过高,会引起星号活性。不同的酶,比例不同,通常酶用量>100 U/μg DNA时就可能引起星号活性。可见实验中应使用尽量少的酶,这样可以避免过度消化;也可以降低甘油浓度,加酶量一般不超过反应体积的10%。
③离子强度也有影响。不合适的低盐浓度(<25 mmol/L)会引起星号活性。
④阳性离子的变化也有影响。Mn2+、Cu2+、Co2+、Zn2+等阳离子替换Mg2+会引起星号活性,如将反应缓冲液中Mg2+改为Mn2+时,可促使EcoRⅠ和HindⅢ产生星号活性。
⑤溶液中pH的变化,高pH(>pH 8.0)时容易引起星号活性,如用EcoRⅠ酶解时,反应体系中的pH由2.5升高到8.5时也会出现星号活性。
⑥有机溶剂残留的影响,DMSO、乙醇、乙烯乙二醇、二甲基乙酰胺、二甲基甲酰胺、Sulphalane等有机溶剂的存在都可以引起星号活性。
由此可见,只有在相当特殊的条件下,才会产生星号活性,而在正常条件下,使用酶配套的缓冲液,一般的内切酶就不会出现星号活性。抑制星号活性的方法有:尽量用较少的酶进行完全消化反应,这样可以避免过度消化以及过高的甘油浓度;尽量避免有机溶剂(如制备DNA时引入的乙醇)的污染;将离子浓度提高到100~150 mmol/L(若酶活性不受离子强度影响);将反应缓冲液的pH降到7.0,二价离子用Mg2+等。
八、DNA的分子结构及构型对酶切效率的影响
DNA分子结构对限制性内切酶的活性有很大影响,例如,HaeⅢ,EcoRⅠ,MSPⅠ和HindⅢ需要酶切位点呈双链状态,并且至少有两圈双螺旋结构才能被切割,即使有些酶能分解单链DNA,其切割位点仍然需要呈双链分子结构。
限制性内切酶切割线性DNA时,对识别序列两端的非识别序列也有长度的要求,也就是说在识别序列两端必须有一定数量的核苷酸,否则限制性内切酶将难以发挥切割活性。用20个单位(units)限制性内切酶切割1 mg标记的寡核苷酸做测试时,发现不同的酶对识别序列两端的长度有不同的要求(表3-4)。相对来说,EcoRⅠ对两端的序列长度要求较小,在识别序列外侧有一个碱基对时,2 h的切割活性可达90%,而AccⅠ和HindⅢ对两端的序列长度要求较高。用线性DNA片段(线性载体)检测末端长度对切割的影响时,同样发现识别序列的末端长度对酶切效率有明显影响,且不同的酶对末端长度的要求是不同的。因此在设计PCR引物时,如果要在5′末端引入一个酶切位点,为了保证能够顺利切割扩增的PCR产物末端的酶切位点,必须要在引物的5′末端加上能够满足酶切要求的碱基数目,也称保护碱基。
表3-4 DNA末端长度对酶切效率的影响
由于末端长度对酶切效率的影响,对于多克隆上相邻酶切位点,选择不同的酶组合及不同的酶切顺序,酶切效率会有很大的差异。例如,下面一质粒多克隆上XhoⅠ、EcoRⅠ和PstⅠ三个相邻酶切位点(图3-1),用不同的酶组合和不同酶切顺序,酶切效率不同。
图3-1 XhoⅠ、EcoRⅠ和PstⅠ三个酶切位点相邻
如果第一次酶切用EcoRⅠ,酶切效率为100%,第二次用XhoⅠ,酶切效率为97%;而如果第二次用PstⅠ,则酶切效率只有37%。如果第一次用XhoⅠ,酶切效率为100%,第二次用EcoRⅠ,酶切效率为100%;如果先用PstⅠ,再用EcoRⅠ进行酶切,其效率则只有88%。可见对于多克隆位点,如果两个内切酶的位点相临近,要进行双酶切时,不同酶切顺序,酶切效率会有很大的差异,了解末端长度对切割的影响还可帮助在双酶切多克隆位点时选择合适酶切顺序和合适的组合。
DNA的超螺旋结构对酶切效率也有影响,完全酶解超螺旋结构DNA所需的酶量要比已经酶切成线性的DNA所需的酶量多,不同的限制内切酶受超螺旋结构影响的程度不同,如SalⅠ受影响大于BamHⅠ(表3-5)。
表3-5 不同酶受超螺旋结构的影响
九、内切酶的位点优势效应
某些限制性内切酶对同一DNA分子上的多个识别位点的切割效率不同,这种现象被称为内切酶的位点优势效应。例如,λDNA分子上有5个EcoRⅠ识别位点,然而EcoRⅠ并不是随机切割λDNA分子上的5个识别位点,λDNA右侧位点的切割速率比中间位点快10倍;HindⅢ对λDNA不同位点的切割速率则有14倍的差异;SacⅡ在λDNA上有4个识别位点,其中3个位于序列中间,1个位于靠近右末端(第40,386位碱基),中间3个位点的切割速率是末端位点的50倍。
位点优势效应与限制性内切酶的特性有关,有些酶只能切割含有两个识别序列的双链DNA分子。例如,BspMⅠ、SfiⅠ和NgoMIⅤ为同源四聚体蛋白,它们结合2个识别序列,并两条链同时切开4个磷酸二酯键。这些酶的底物DNA分子上必须有两个识别位点,当只有一个识别序列时,切割就变得相当困难。只能切割含有2个识别序列DNA分子的现象虽不是很普遍,但在Ⅱs型内切酶中还是相当常见的,这些酶通常情况下为单体,但切割两条链DNA时会很快结合形成二聚体,这些酶包括FokⅠ、BsgⅠ、BpmⅠ和MboⅡ。另外一些酶,如EcoRⅡ和NaeⅠ所需的两个识别位点中,一个位点作为目标被切割,另一位点作为变构因子协助切割。对这些酶而言,第二个协助切割的位点可以在底物DNA上,也可以以寡核苷酸的形式存在。HpaⅡ、NarⅠ和SacⅡ在某些底物的一些位点切割效率很低,或是干脆无法切开,其作用机制尚不明了。NaeⅠ、NarⅠ和BspMⅠ很难被切开只有一个识别位点的质粒,pBR322质粒上有4个NarⅠ识别位点,在标准条件下,1单位的NarⅠ在1 h内就可以完全切开其中的两个位点,即使加入50单位的NarⅠ消化超过16 h也不能将另外的2个位点完全切开。同样的,pBR322质粒上的4个NaeⅠ识别位点中,有两个很容易被切开,第三个被切开的速率较慢,而剩下的一个最难,切割速率仅为前者的1/50。NaeⅠ和NarⅠ在λDNA上各只有1个识别位点,即使加大酶的用量,它们也只能部分切开λDNA。因此,这些酶的活力单位的定义均以腺病毒-2的DNA为底物,它们在腺病毒-2上有10个以上的识别位点。例如,NarⅠ或NaeⅠ的活力单位定义为:50μL反应体系,1 h内完全切割1μg病毒-2的DNA所需要的酶量。
内切酶的位点优势效应这一特性对于DNA的部分酶切非常重要,但其机制尚未完全明了,一般认为内切酶的位点优势效应是与酶识别的序列的相邻序列的碱基和长度有关,与甲基化无关。有报道称腺病毒-2上的CTCGAG序列很难被PaeR7Ⅰ切开,却很容易被PaeR7Ⅰ的同裂酶XhoⅠ切开,被认为是相邻序列影响了酶的切割效率;CTCGAG的5′末端CT序列降低了PaeR7Ⅰ的切割效率,而甲基化不会影响切割效率。
十、甲基化对内切酶的影响
当从有Dam或Dcm甲基化酶基因的大肠杆菌中提取DNA,用相应的限制性内切酶进行切割时,有些内切酶的部分或全部酶切位点不能被切割,产生这一现象的原因是,当E.coli甲基化酶的识别位点与内切酶的识别位点重叠时,相应的碱基被甲基化,致使内切酶无法进行切割,例如,从dam+E.coli中分离的质粒DNA完全不能被识别序列为GATC的MboⅠ所切割。
大多实验用大肠杆菌中都存在Dam、Dcm和M.EcoKⅠ三种位点特异性的DNA甲基化酶。Dam甲基化酶由dam基因编码产生,它专一地将S-腺苷甲硫氨酸上的甲基转移到GATC序列中腺嘌呤的N6上。Dcm甲基化酶,由dcm基因编码产生,它专一地对CCAGG和CCTGG序列内部的胞嘧啶C5位置进行甲基化。EcoKⅠ甲基化酶,即M.EcoKⅠ,对AAC(N6)GTGC和GCAC(N6)GTT上的腺嘌呤进行修饰。由于在DNA随机序列中EcoKⅠ的识别位点每8 kb才出现一次,Dam大约每256 bp出现一次,Dcm大约每512 bp出现一次,因此,应用时更多地关注Dam和Dcm的影响。
有些内切酶对Dam甲基化不敏感,如BamHⅠ,Sau3AⅠ,BglⅡ,PvuⅠ等。有些内切酶对Dam甲基化敏感,如BclⅠ,ClaⅠ,MboⅠ,XbaⅠ等。如XbaⅠ根据识别序列后续碱基的不同,有时会受甲基化影响。XbaⅠ的识别序列是TCTAGA,里面不含有Dam甲基化识别位点GATC,因此甲基化不影响XbaⅠ的切割,但是,如果识别位点前面是GA,即GATCTAGA,或者后面有TC,即TCTAGATC,这时候甲基化识别序列和内切酶的识别序列重叠了,那么该序列被甲基化后不会被XbaⅠ切开。从大肠杆菌提取的质粒DNA,因为识别序列被甲基化,不能被XbaⅠ切割,而如果是PCR产物,由于没有被甲基化,就能XbaⅠ切割。因此在设计限制性内切酶酶切位点时也应考虑到内切酶甲基化影响,在使用内切酶时,应仔细阅读内切酶使用说明书中关于受甲基化影响的详细信息。
被Dam或Dcm甲基化的限制性位点可以通过克隆DNA至dam-/dcm-菌株而消除甲基化,从而可以被相应的内切酶切割。dam-/dcm-菌株有E.coli HST04、JM110和SCS110等。
在高等真核生物中发现的CpG甲基转移酶(CpG MTases),将甲基基团转移至胞嘧啶残基的C5位点。CpG甲基化形式受遗传因素的影响,具有组织特异性,并与基因表达相关。因此,在酶切真核基因组DNA时尤其要关注CpG甲基化对内切酶酶切效率的影响,一旦真核生物DNA被克隆到原核宿主菌中,将不存在CpG甲基化形式。
十一、限制性内切酶使用注意事项
限制性内切酶对热不稳定,不太常用的酶多保存在-70℃,每周或每天用的酶保存在-20℃。有些酶需要不同的保存条件,所以商品酶都是按照产品说明书的要求进行保存。
为避免在-20℃条件下结冰及反复冻融使酶失活,商品酶一般用50%甘油作为酶的保护剂,因此加酶的体积不要超过反应总体积的1/10,避免酶活性受到甘油的影响产生星号活性。有些商品酶浓度很高,浓缩的限制酶可在使用前用1×的酶缓冲液稀释,切勿用水稀释以免酶失活,稀释后的酶不能长期保存。准备使用的酶稍离心,然后直立放置于-20℃备用,使用时酶通常是最后加入,当加完所有的组分后再从-20℃取出酶,并直立放在冰上或者预冷-20℃的有孔的铁块上,取完酶立即旋紧盖子放回于-20℃保存。手拿酶管时不要接触酶管含酶的部分,移酶时尽可能用长的吸头,避免污染。用完后需要及时送回原处。酶反复从-20℃拿出来会吸收空气中的水分,使甘油和酶的浓度都发生改变,出现酶结冰的情况,所以取完酶应立即旋紧盖子放回于-20℃保存,对于大包装的内切酶最好分装保存。
商品的内切酶一般会配有一种以上的缓冲液,一般按离子强度的差异分为高、中、低三种类型,不同的酶在不同类型的缓冲液中的活力不同,产品说明书会提供一个不同类型缓冲液下酶活力信息。如果要进行双酶切时选择合适的缓冲液就显得至关重要了,如果两种酶反应温度一致而最高活力的缓冲液不同时,有些供应商还会提供一种通用缓冲液,也可查阅由供应商提供的各种酶在不同缓冲液中的活力表,如果有一种缓冲液能同时使2种酶的活力都超过50%的话,就可以用这种缓冲液作为双酶切的反应缓冲液;若找不到共用的缓冲液,则可以先用低盐的缓冲液进行第一种酶的反应,然后再加适量NaCl和第二种酶;或先用低盐缓冲液再用高盐缓冲液(DNA可纯化或不纯化),如果内切酶对离子浓度很敏感的可以考虑纯化更换缓冲液。双酶切时,若两种酶切的条件不同,则分别进行两次酶切,切完一次后,纯化,再进行下一次酶切;反应温度不同的,先进行低温的酶切反应,再进行高温的酶切反应;若盐浓度要求不同,先在低盐浓度下酶切,再在高盐浓度下酶切。有些酶的缓冲液需要添加牛血清白蛋白(BSA)或明胶,其目的是对内切酶起保护作用,可以防止蛋白酶的分解和非特异性吸附等,能减轻某些有害环境因素,如加热、表面张力及化学因素,引起的酶变性作用,在酶的保存液中或酶活性不够稳定或长时间的酶反应体系中都加定量的BSA。由于BSA会与DNA结合,在电泳时会出现条带模糊的拖尾现象,因此,在电泳前可加入适量的SDS,并置65℃保温5 min后点样,可以消除BSA的影响。
反应体积需要根据实验目的来定,常规的酶切反应体积一般为10~50μL,鉴定的酶切体积为10~20μL,若酶切大量的DNA,可以将DNA分成几部分进行酶切,然后分别电泳检测,再混合进行下一步的实验。反应混合物中DNA底物的浓度不宜太大,小体积中过高浓度的DNA会形成黏性溶液,抑制酶的扩散,并降低酶活性,浓度过低也会影响酶活性,建议酶切反应的DNA浓度为0.1~0.4μg/μL。酶的用量产品说明书会提供一个参考值,但是在需要使用高酶量的时候需要注意甘油的最终浓度不要超过5%,也就是说10μL的体积,酶的用量不要超过1μL。酶切反应的全部组分加完后,可用移液器的吸头将反应液小心混匀,或用手指轻弹一下管壁,再在桌面离心机上低速稍离心(short spin)一下,使管内的液体全部离心到管底就可以下一步保温了,一般不能使用振荡器进行混匀。
大多数内切酶的反应温度都是37℃,但也有许多例外的情况,例如,SmaⅠ是25℃,MaeⅠ是45℃,来源于耐热菌的TaqⅠ最适反应温度为65℃。反应温度低于或高于最适反应温度,都会影响内切酶的活性,甚至最终导致完全失活。例如,SmaⅠ的最适合温度是25℃,37℃时酶仍表现出活性,但是其活性下降50%;TaqⅠ的最适温度为65℃,37℃的活性仅为65℃的1/10。
反应时间的选择,一般酶切鉴定30 min就可以了。要完全酶切可以采用少量的酶,长时间的反应,或较高的酶量,短时间处理。反应温度高于37℃或需长时间保温时,要注意水分蒸发会使反应体系中的反应体积变小(高温时甚至会变干),使各组分浓度发生改变,从而影响到酶切的效果。这时,可以使用封闭的恒温系统进行保温,减少体系上下的温差,从而减少水分蒸发,也可以将矿物油覆盖在反应液上以减少水分蒸发。
如果酶切只是为了电泳鉴定,不需要进行下一步实验的,可直接用电泳上样缓冲液来终止反应,然后立即进行电泳。如果要进行下一步酶切反应,需要进行内切酶的灭活。灭活的方法有加热、乙醇沉淀、酚/氯仿抽提、添加EDTA或SDS、用试剂盒纯化DNA等方法,加热失活法终止反应(65~85℃,20 min)最为常用,但它并不适用于所有的酶,有些来自高温菌的内切酶,由于其能够耐受较高的温度,热处理不一定完全灭活,需要用苯酚/氯仿/乙醇抽提或者试剂盒方法进行纯化。电泳回收也是实验室常用的除酶的手段。具体到某种一种酶可能有些方法不能完全灭活,这一点需要注意,因此要根据自己的实验要求选择最合适和简单的灭活方法。
限制性核酸内切酶酶切DNA的效率很大程度上取决于DNA本身的纯度,纯度高的DNA酶切效率高,纯度低的DNA酶切效率低。如果由于DNA纯度较低,在正常的酶切效率较低时,可以适当做如下补救:适当增加酶的用量,如每μg DNA由1个单位提高5~10倍,当然对于一些价格较昂贵的酶,从这种角度讲也是一种损失,在实验设计时要权衡考虑。适当扩大反应体积,可使污染物相应得到稀释,减少污染物对酶活性的抑制;适当延长酶解的反应时间,但有DNase污染的DNA不能用此法;如RNA过多可在反应体系中加入适量的RNase来消除RNA的影响。
不同的内切酶特性差异很大,受甲基化影响程度不一样,降解DNA的活力不一样,是否具有位点优势效应等特性都会影响到内切酶在实际基因重组实验中的应用。虽然大多数内切酶都已经是基因重组产品,但由于不同的商品内切酶在表达和纯化上的难度不一样,价格差异很大,活力也不一样,因此在实验设计时要尽量考虑用活力较高、价格相对较便宜的内切酶。