原核表达是表达外源基因常用的方法,具有操作简单、快捷,需时较短,表达产量高,适合工业化等优点。本文作者根据自己的实践经验,总结了原核表达的一些技巧。
将植物、动物、微生物等的目的基因插入合适载体后导入大肠杆菌用于表达大量蛋白质的方法一般称为原核表达。这种方法在蛋白纯化、定位及功能分析等方面都有应用。大肠杆菌表达用于表达重组蛋白有以下优点:易于生长和控制;易于培养,实验耗费少;可选择多种大肠杆菌菌株及与之匹配的具各种特性的质粒。原核表达是近年来表达外源蛋白常用的方法,本文根据自己的实践经验,着重谈谈对原核表达中的技巧问题。
一、原核蛋白表达中各操作步骤的关键因素及技巧
1.表达前的准备要素:原核表达注重表达前对目的片段、表达载体及表达菌株的分析、选择。正所谓“磨刀不误砍柴功”,经过细致、周全的分析、准备、设计可带来较为顺当的实验,可免去许多不必要的麻烦。
(1)对表达载体的分析
载体的选择:同样的载体,同样的系统,很可能表达这个蛋白表达量起高,但另外一个就是做不出来,所以表达载体的选择非常重要,没有万能的载体。选择载体通常我们关心质粒上的几个功能组件及所带来的问题:是否为诱导表达型载体,启动子的强弱、多克隆位点、限制性内切酶的位置、终止密码子的有无及位置,融合Tag的有无,筛选报告基因的位置等。所选载体一定要保持原来的遗传背景(有些载体经过多次交换已变异)。选择表达载体时,要根据所表达蛋白的最终应用考虑,如果为了方便纯化,可选择融合表达;如果为了获得天然蛋白,可选择非融合表达。融合表达时在选择外源DNA同载体分子连接反应时,对转录和转译过程中密码结构的阅读不能发生干扰。
翻译的起始位点:要表达目的蛋白,在该基因的5’端必须有一起始位点,现在大部分的表达载体都提供起始位点,起始密码子与核糖体结合位点的距离都已被优化,一般情况下不需要自己再加,实际操作时要留意载体图谱上是否注明有起始密码子和终止密码子,如无,还得根据自己的实际情况加上。
在起始密码子附近的mRNA二级结构:外源基因其始转录后,保持mRNA的有效延伸、终止及稳定存在是外源基因有效表达的关键,尤其是在起始密码子附近的mRNA二级结构可能会抑制翻译的起始或者造成翻译暂停从而产生不完全的蛋白。如果利用Primer Premier软件分析DNA或RNA结构上有柄(stem)结构,并且结合长度超过8个碱基,这种结构会因为位点专一突变等因素而变得不稳定,影响正常的翻译。 一般做原核表达服务的公司都会进行优化(http://www.detaibio.com/protein-service-bacterial.html)。
(2)对目的片段的分析
基因(或蛋白)的大小:原核表达的成功与否与所要表达的蛋白(或基因)大小有关,一般说来小于5kD或者大于100kD的蛋白表达都是较难的的。蛋白越小,越容易被内源蛋白水解酶所降解。在这种情况下可以采取串联表达,在每个表达单位(即单体蛋白)间设计蛋白水解或者是化学断裂位点。如果蛋白较小,那么加入融合标签GST、Trx、MBP或者其它较大的促进融合的蛋白标签就较有可能使蛋白正确折叠,并以融合形式表达。如果蛋白较大,大于60kD的蛋白建议使用较小的标签(如6×组氨酸标签)。对于结构研究较清楚的蛋白可以采取截取表达。当然表达时要根据目的进行截取,如果是要进行抗体制备而截取,那么一定要保证截取的部位抗原性较强。对于抗原性也可以利用软件分析,比如Vector NIT Suite或者一些在线软件,不过在分析之余也要认识到这是一种资料统计的结论,如果蛋白和免疫动物亲缘关系较远的话还是不妨一试的。
表达序列的GC含量:表达序列中的GC含量超过70%的时候可能会降低蛋白在大肠杆菌中的表达水平。GC含量可以利用DNA STAR、VectorNTI Suite等软件进行预测。
亲疏水性:经常做表达的人都发现表达亲水区域时表达量会比较高,如果你要表达一个膜蛋白,它的疏性会增加实验难度。有许多软件可以对氨基酸的亲疏水性进行分析,比如VectorNIT Suite,除此之外还可以利用在线跨膜区预测软件对跨膜区进行预测。
2.原核蛋白表达系统——获得目的基因
基因工程中,目的基因的制备有直接分离法、构建基因组文库分离法,构建cDNA基因文库分离法、聚合酶链式反应扩增法(PCR)和化学合成法。原核表达一般都是利用PCR把目的基因克隆扩增出来。PCR法的关键是设计引物,可以使用两个软件,PrimerPremier或者Oligo来分析。如果要表达全长,用不着考虑太多,从一头一尾找至少8个匹配序列在加上与载体匹配的序列就行。注意以下几点:、先查查表达外源片段中含有什么内切酶位点,否则设计重了,酶切后电泳就会老发现有预期外的小片段出现。根据载体上的酶切位点设计引物,现在许多类似T载原理的克隆方法也可以应用到原核表达中,如果T载克隆方法要定向,设计引物时很多时候要多加4个碱基。、在设计酶切位点的5端要加保护碱基,使限制性内切酶能有效识别,不同内切酶所需的保护碱基不同,SalⅠ不需要保护碱基,EcoRⅤ需要1个,NotⅠ需要2个,HindⅢ最好有3个,一般情况下,都设计2个,可参考有关书籍。、特别 注意起始密码子和终止密码子的读码框,不要造成目的片段碱基移码。如果载体上有起始密码子ATG,可不另加,但是通常ATG后不是紧跟外源片段的,中间还含有载体序列,这种情况一定要保证中间这段序列不会造成你外源序列的移码。按情况需要,可以加1到2个碱基在引物中使读码框正确。同理,正常的终止密码子才能保证蛋白的产出。大部分载体也有终止密码子,如果你对载体的不放心,也可以在引物中设计上终止密码子。、在PCR反应体系中,引物的最适浓度为0.1-1.0umol/I。引物过多会影响PCR的产量。⑥所设计的一对引物之间的Tm值相差不宜过大,最好能一样。一般来说,PCR反应的退火温度不超过Tm值上下5℃;⑦一对引物不宜形成发夹结构、互相配对,若配对时最好不要是G-C的结合(可以用软件分析);⑧3端以G、C结尾为宜;⑨把上游引物设计成有义链,下游设计成反义链,否则没有片段出现。
3.构建重组表达载体
将目的片段有效地插入表达载体中是原核表达中较为关键的步骤,一般构建的重组载体有插入重组和置换重组两种类型,优先考虑能产生粘性末端的限制性内切酶,以便高效连接。作者将构建重组表达载体分为酶切过程和连接过程。
(1)酶切过程:将目的片段和表达质粒用限制性内切酶进行双酶切,酶切产物经琼脂糖电泳后,用试剂盒回收有效片段。酶切反应体系首先应根据所切底物的大小和浓度计算出限制性内切酶的用量,试剂公司提供的限制性内切酶包装上通常标明总的酶活性单位和容积活性。对于能被高效切割的DNA样品(起决于特定的识别序列)用酶量少,反之则多。
(2)连接过程:在T4DNA连接酶作用下,载体和片段连接。连接反映体系中,连接酶的用量越大,反应速度越大,但用量过大,酶液中的甘油会影响连接效果,也会造成浪费,一般20μl体系中用5U足够。另外,连接酶的最适温度虽为37℃,在此温度中酶的活性最高,但此温度能使粘性末端的氢键结合不稳定,易脱开。建议在26℃,4h反应可得较好效果。目的片段和载体的摩尔比例在2:1(或3:1)为好,DNA总量应根据实际浓度控制在一定范围,多了,DNA分子运动慢,反而影响连接效果,假阳性多。少了,片段和载体在反映体系中难以碰撞连接,以至没有连接的菌落。20μl体系中,10μl底物即可。
4.转化如大肠杆菌蛋白表达宿主菌
将连接产物转化感受态大肠杆菌,根据重组载体的标志(如抗Amp或蓝白斑)作筛选,挑取单菌落,碱裂解法小量抽提质粒,用PCR和双酶切法作初步鉴定后进行测序验证,进一步检测目的基因的插入方向、阅读框架及片段序列是否正确。测序时可挑选多个菌落进行测定,因为在PCR、连接等过程中,有不确定因素会导致目的片段发生碱基错配甚至移码突变。将经过测序分析正确的大肠杆菌质粒DNA转化表达宿主菌的感受态细胞。
5.诱导表达
原核蛋白表达,一般需要诱导表达,诱导表达过程中,把构建好的载体转化到宿主菌中表达,不同的表达载体对应有不同的表达菌株,一些特别设计的菌株更有助于解决一些表达难题。在此不再多说,请参照有关书籍。
6.表达蛋白的分析、纯化、检测
诱导表达成功后,表达蛋白的分析、纯化、检测应该顺当,按一般的实验步骤做没太大的问题。
虽然,在大肠杆菌中表达的蛋白由于缺少高级修饰和糖基化、磷酸化等翻译后加工,常形成包涵体而影响表达蛋白的生物学活性及构象等缺点,但原核表达具有的操作简单、快捷,需时较短,表达产量高,适合工业化等优点,仍是我们合成外源蛋白的首选。原核表达的全过程有许多不确定因素,所以每完成一步都得检验结果是否正确,当实验遇到困难时如何进行分析,找到问题的症结是我们实验的关键。