首页  专利技术  食品,饮料机械,设备的制造及其制品加工制作,储藏技术

克劳氏芽孢杆菌的分泌、转录和芽孢形成基因的制作方法

2025-09-28 15:00:09 396次浏览
专利名称:克劳氏芽孢杆菌的分泌、转录和芽孢形成基因的制作方法
技术领域
本发明涉及经遗传操作而生成所表达蛋白质的能力得到改变的细胞。具体而言,本发明涉及具有外源核酸序列导入其中的革兰氏阳性微生物,以及用于在这些宿主细胞中生成蛋白质的方法,诸如芽孢杆菌属的成员。更具体的说,本发明涉及目的多肽的表达、生成和分泌,以及经遗传操作而生成所表达蛋白质的能力得到改变的细胞。具体而言,本发明提供了微生物对所选择多肽的增强表达。
背景技术
革兰氏阳性微生物,诸如芽孢杆菌属的成员,已经被用于大规模工业发酵,这部分归功于它们将发酵产物分泌到培养液中的能力。所分泌的蛋白质输出穿过细胞膜和细胞壁,随后释放到外部培养基中。是将多肽分泌到周质空间还是培养基中,这受制于工业发酵需要仔细考虑的多种参数。
事实上,异源多肽的分泌是工业中广泛使用的一种技术。通常,用编码待表达的目的异源多肽的核酸转化细胞,从而生成大量的期望多肽。这种技术可用于生成比天然生成数量多得多的多肽。这些表达多肽具有许多工业应用,包括治疗和农业用途,以及用于食品、化妆品、清洁组合物、动物饲料、等。因此,提高多肽表达在许多领域备受关注。
发明概述本发明涉及经遗传操作而生成所表达蛋白质的能力得到改变的细胞。具体而言,本发明涉及具有外源核酸序列导入其中的革兰氏阳性微生物,以及用于在这些宿主细胞中生成蛋白质的方法,诸如芽孢杆菌属的成员。更具体的说,本发明涉及目的多肽的表达、生成和分泌,以及经遗传操作而生成所表达蛋白质的能力得到改变的细胞。具体而言,本发明提供了微生物对所选择多肽的增强表达。
在有些实施方案中,本发明提供了编码参与革兰氏阳性宿主细胞中的肽分泌的蛋白质的核苷酸序列,以及用于提高细胞的蛋白质分泌的方法。
在有些实施方案中,本发明提供了用于提高多肽生成和/或分泌的方法。在一个优选实施方案中,这些方法中所使用的细胞表达至少一种衍生自克劳氏芽孢杆菌(Bacillus clausii)的分泌相关蛋白质。在特别优选的方法中,细胞经转化而表达蛋白质。在一个实施方案中,所述方法任选包括灭活细胞中的至少一种分泌相关蛋白质。所述方法还包括在适合于表达并分泌多肽的条件下培养细胞。
本发明还提供了编码分泌相关蛋白质的核酸序列。在一个优选实施方案中,核酸序列衍生自克劳氏芽孢杆菌。在其它实施方案中,提供了克劳氏芽孢杆菌分泌因子的变体。在另一些实施方案中,提供了由核酸序列编码的分泌相关蛋白质推定氨基酸序列的至少部分序列信息。
本发明还提供了用于在宿主细胞中生成碱性蛋白酶的方法。在一个实施方案中,将bcl2627的超表达用于诱导碱性蛋白酶的增强表达和/或分泌。
在另一个实施方案中,本发明提供了克劳氏芽孢杆菌spoIIE和degU核酸序列。在有些实施方案中,这些序列进行了体外诱变。在另一些实施方案中,将这些诱变序列重新导入宿主细胞。在一个实施方案中,宿主细胞是克劳氏芽孢杆菌;而在其它实施方案中,宿主细胞是其它生物体,包括但不限于枯草芽孢杆菌(Bacillus subtilis)。
本发明提供了包含克劳氏芽孢杆菌分泌因子的核酸序列,其中分泌因子选自下组SecA、SecD、SecE、SecF、SecG、SecY、Ffh、FtsY、SipS、SipT、SipV、和SipW。在有些优选实施方案中,核酸序列选自下组SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ IDNO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO8、SEQID NO6、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、和SEQ ID NO28。在候选实施方案中,可杂交核苷酸序列在低严谨度、中严谨度、和高严谨度的严谨度条件下保持与SEQ ID NO10、SEQ IDNO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQID NO20、SEQ ID NO8、SEQ ID NO6、SEQ ID NO22、SEQID NO24、SEQ ID NO26、和SEQ ID NO28的核苷酸序列杂交。在其它实施方案中,本发明提供了包含SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO8、SEQ ID NO6、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、和SEQ ID NO28所示至少一种核苷酸序列的至少一部分的载体。在特别优选的实施方案中,载体还包含编码至少一种目的多肽的核苷酸序列。在另一些实施方案中,本发明提供了包含这些载体的表达盒。在有些优选实施方案中,本发明提供了包含这些表达盒的芽孢杆菌属的宿主细胞。在有些优选实施方案中,宿主细胞分泌至少一种选自下组的克劳氏芽孢杆菌分泌因子SecA、SecD、SecE、secF、SecG、SecY、Ffh、FtsY、SipS、SipT、SipV、和SipW。在候选实施方案中,分泌因子包含选自下组的氨基酸序列SEQ IDNO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQID NO17、SEQ ID NO19、SEQ ID NO7、SEQ ID NO5、SEQID NO21、SEQ ID NO23、SEQ ID NO25、和SEQ ID NO27。在其它实施方案中,氨基酸序列包含选自下组的氨基酸序列的片段SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO7、SEQ ID NO5、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、和SEQ ID NO27。在另一些实施方案中,氨基酸序列包含选自下组的氨基酸序列的变体SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO7、SEQ ID NO5、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、和SEQ ID NO27。
本发明还提供了包含克劳氏芽孢杆菌转录因子的核苷酸序列,其中转录因子选自下组DegS、DegU、和Bcl2627。在有些优选实施方案中,核苷酸序列选自下组SEQ ID NO4、SEQ ID NO30、和SEQ ID NO32。在其它实施方案中,本发明提供了在低严谨度、中严谨度、和高严谨度的严谨度条件下保持与权利要求15的核苷酸序列杂交的可杂交核苷酸序列。在另一些实施方案中,本发明提供了包含选自下组的核苷酸序列的至少一部分的载体SEQ ID NO4、SEQ IDNO30、和SEQ ID NO32。在有些优选实施方案中,载体还包含编码至少一种目的多肽的核苷酸序列。在另一些实施方案,本发明提供了包含这些载体的表达盒。在其它实施方案中,本发明提供了包含这些表达盒的芽孢杆菌属的宿主细胞。在另一些实施方案中,宿主细胞分泌至少一种克劳氏芽孢杆菌转录因子。在其它实施方案中,转录因子包含选自下组的氨基酸序列SEQ ID NO3、SEQ ID NO29、和SEQ ID NO31。在有些实施方案中,氨基酸序列包含选自下组的氨基酸序列的片段SEQ ID NO3、SEQ ID NO29、和SEQ ID NO31。在有些候选实施方案中,氨基酸序列包含选自下组的氨基酸序列的变体SEQ ID NO3、SEQ ID NO29、和SEQ ID NO31。
本发明还提供了包含克劳氏芽孢杆菌芽孢形成因子SpoIIE蛋白质的核苷酸序列。在有些实施方案中,序列包含SEQ ID NO2。在其它实施方案中,本发明提供了在低严谨度、中严谨度、和高严谨度的严谨度条件下保持与权利要求28的核苷酸序列杂交的可杂交核苷酸序列。本发明还提供了包含SEQ ID NO2的核苷酸序列的至少一部分的载体。在有些优选实施方案中,载体还包含编码至少一种目的多肽的核苷酸序列。在另一些实施方案中,本发明提供了包含这些载体的表达盒。在其它实施方案中,本发明提供了包含这些表达盒的芽孢杆菌属的宿主细胞。在有些特别优选的实施方案中,宿主细胞分泌至少一种克劳氏芽孢杆菌芽孢形成因子。在另一些实施方案中,芽孢形成因子包含SEQ ID NO1的氨基酸序列。在有些实施方案中,氨基酸序列包含SEQ ID NO1所示氨基酸序列的片段;而在候选实施方案中,氨基酸序列包含SEQ ID NO1所示氨基酸序列的变体。
本发明还提供了用于生成目的蛋白的方法,包括下列步骤在适当条件下培养芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含编码目的蛋白的核苷酸序列,且其中所述宿主细胞经过核苷酸序列的转化,所述核苷酸序列编码包含选自下组的氨基酸序列的蛋白质SEQID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、和31;并容许所述目的蛋白表达。在有些实施方案中,氨基酸序列与具有选自下组的氨基酸序列的蛋白质的序列至少85%相同SEQ IDNO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、和31。在其它实施方案中,氨基酸序列包含选自下组的氨基酸序列的变体氨基酸序列SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、和31。在候选实施方案中,氨基酸序列包含选自下组的氨基酸序列的片段氨基酸序列SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、和31。本发明还提供了包含杂合克劳氏芽孢杆菌序列的氨基酸序列。
附图描述

图1显示了来自克劳氏芽孢杆菌的SpoIIE的推导氨基酸序列(SEQID NO1)。
图2显示了来自克劳氏芽孢杆菌的spoIIE的DNA序列(SEQ IDNO2)。
图3A显示了来自克劳氏芽孢杆菌的DegU的推导氨基酸序列(SEQID NO3)。
图3B显示了来自克劳氏芽孢杆菌的DegS的推导氨基酸序列(SEQID NO29)。
图4A显示了来自克劳氏芽孢杆菌的degU的DNA序列(SEQ IDNO4)。
图4B显示了来自克劳氏芽孢杆菌的degS的DNA序列(SEQ IDNO30)。
图5显示了来自克劳氏芽孢杆菌的FtsY的推导氨基酸序列(SEQID NO5)。
图6显示了来自克劳氏芽孢杆菌的ftsY的DNA序列(SEQ ID NO6)。
图7显示了来自克劳氏芽孢杆菌的Ffh的推导氨基酸序列(SEQ IDNO7)。
图8显示了来自克劳氏芽孢杆菌的ffh的DNA序列(SEQ ID NO8)。
图9显示了来自克劳氏芽孢杆菌的SecA的推导氨基酸序列(SEQID NO9)。
图10显示来自克劳氏芽孢杆菌的secA的DNA序列(SEQ ID NO10)。
图11显示了来自克劳氏芽孢杆菌的SecD的推导氨基酸序列(SEQID NO11)。
图12显示了来自克劳氏芽孢杆菌的secD的DNA序列(SEQ IDNO12)。
图13显示了来自克劳氏芽孢杆菌的SecE的推导氨基酸序列(SEQID NO13)。
图14显示了来自克劳氏芽孢杆菌的secE的DNA序列(SEQ IDNO14)。
图15显示了来自克劳氏芽孢杆菌的SecF的推导氨基酸序列(SEQID NO15)。
图16显示了来自克劳氏芽孢杆菌的secF的DNA序列(SEQ IDNO16)。以“M”表示的核苷酸残基指该核苷酸可以是C或A。
图17显示了来自克劳氏芽孢杆菌的SecG的推导氨基酸序列(SEQID NO17)。
图18显示了来自克劳氏芽孢杆菌的secG的DNA序列(SEQ IDNO18)。
图19显示了来自克劳氏芽孢杆菌的SecY的推导氨基酸序列(SEQID NO19)。
图20显示了来自克劳氏芽孢杆菌的secY的DNA序列(SEQ IDNO20)。
图21描绘了三个物种间spoOB区的同线性(synteny)。采用反相PCR的染色体步查来连接克劳氏芽孢杆菌spoOB区的两个毗连群。由此产生的闭合容许我们检查该区基因组织的保守性(或缺乏性),该区包含发育磷酸化(phosphorelay)信号转导系统中心成分的基因。三个染色体中yrxA至spoOB区是保守的;克劳氏芽孢杆菌中的nifS位于至今未连上的第三个毗连群上。枯草芽孢杆菌spoOB上游区域的基因排列在这里比较的物种中是独特的。克劳氏芽孢杆菌中spoOB毗连的hemEHY区在耐盐芽孢杆菌(B.haloduran)中被ABC转运子操纵子和转座酶基因分开。这种情形在克劳氏/耐盐比较中最有可能证明是共有的,因为这两种物种具有过量的100个转座酶基因。
图22描绘了芽孢杆菌中的芽孢形成磷酸化。该系统是决定细胞是否进入芽孢形成的中心信号加工系统。它是由精巧的二元系统组成的,其中该系统由信号感觉组氨酸激酶和应答调节器组成。这一独特系统应答多种信号的进一步精细调整是通过特定磷酸酶(Rap蛋白质)来实现的,而后者又是通过同源磷酸酶抑制肽(即Phr蛋白质的加工形式)的作用来调节的。细菌物种中大量的二元系统(枯草芽孢杆菌中有至少35个)要求激酶/应答调节器蛋白质对之间分子识别的灵敏的特异性,以确保信号不会错误的转导给同源系统即所谓的串话干扰(cross-talk)。绿色箭头指示转录或功能激活。红线指示转录遏制或功能失活。
图23描绘了枯草芽孢杆菌(Bsu)、克劳氏芽孢杆菌、和耐盐芽孢杆菌(Bhalo)的磷酸化组分蛋白质SpoOF、SpoOB和SpoOA的比对。在所有三个物种中都保守的残基以星号指示;在枯草芽孢杆菌和克劳氏芽孢杆菌之间保守的残基是红色的,在克劳氏芽孢杆菌和耐盐芽孢杆菌之间保守的残基是蓝色的,而在枯草芽孢杆菌和耐盐芽孢杆菌之间保守的残基是绿色的。蛋白质的镶嵌本性在较低同源性SpoOB蛋白质之间尤其明显,在非保守位置,在克劳氏芽孢杆菌与枯草芽孢杆菌之间以及克劳氏芽孢杆菌与耐盐芽孢杆菌之间看到大约10%同一性,而在枯草芽孢杆菌/耐盐芽孢杆菌比较中观察到大约20%同一性。
活性位点D54(OF)、H30(OB)和D56(OA)残基标有记号(Pi)。SpoOA的DNA结合螺旋-转角-螺旋序列标有上划线(_H-T-H_)。指示了SpoOF螺旋1(!)、环4(#)和螺旋5($)中赋予应答调节器之间相互作用特异性即防止串话干扰的残基(Hoch和Varughese,J.Bacteriol.,1834941-4949,2001);以SpoOA中同源残基的相应标识显示了SpoOB中的接触残基。虽然这些特异性残基在SpoOF和SpoOA中是完全保守的(除了耐盐芽孢杆菌SpoOA中的保守E21D替代),但是SpoOB的11个接触残基中只有4个是完全保守的,额外的残基44、45、67和100被保守替代。这可能反映了磷酸化信号转导系统中配偶体分子识别的一定程度弹性,尽管这些相互作用确实必须保持高度特异。
图24描绘了来自三个芽孢杆菌物种的假定Rap蛋白质的多序列比对。比对是使用ClustalW进行的。树形图是使用Phylip软件包构建的。为了计算距离矩阵,使用了Dayhoff PAM矩阵(“bh”指示来自耐盐芽孢杆菌的序列,“bcl”指示来自克劳氏芽孢杆菌的序列,而“bs”指示来自枯草芽孢杆菌的序列)。
尽管不想将本发明限制于任何具体机制或理论,树形图提出早期获得的共同祖先基因后来在三个基因组中分离。耐盐芽孢杆菌在其基因组中编码的少量Rap磷酸酶方面相对于枯草芽孢杆菌和克劳氏芽孢杆菌是独特的。枯草芽孢杆菌RapD(来自其它枯草芽孢杆菌Rap序列)与同样超出主要克劳氏芽孢杆菌分组的一对克劳氏芽孢杆菌Rap蛋白质最紧密相关。与Rap磷酸酶相似且跟随着潜在Phr编码基因(但是目前注解为未知功能)的枯草芽孢杆菌YopK与克劳氏芽孢杆菌bcl80和耐盐芽孢杆菌BH0061同源。克劳氏芽孢杆菌bcl80比YopK短得多,只与386个氨基酸的YopK的N端160个氨基酸共享同源性。BH0061注解为4-二磷酰胞苷-2-C-甲基-D-赤藻糖醇激酶,而且比YopK短100个氨基酸。
图25显示了来自克劳氏芽孢杆菌的SipS的推导氨基酸序列(SEQID NO21)。
图26显示了来自克劳氏芽孢杆菌的sipS的DNA序列(SEQ ID NO22) 。
图27显示了来自克劳氏芽孢杆菌的SipT的推导氨基酸序列(SEQID NO23)。
图28显示了来自克劳氏芽孢杆菌的sipT的DNA序列(SEQ ID NO24)。
图29显示了来自克劳氏芽孢杆菌的SipV的推导氨基酸序列(SEQID NO25)。
图30显示了来自克劳氏芽孢杆菌的sipV的DNA序列(SEQ ID NO26)。
图31显示了来自克劳氏芽孢杆菌的SipW的推导氨基酸序列(SEQID NO27)。
图32显示了来自克劳氏芽孢杆菌的sipW的DNA序列(SEQ IDNO28)。
图33显示了与来自嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)的转录激活子基因nprA同源的bcl2627的推导氨基酸序列(SEQ ID NO31)。
图34显示了来自克劳氏芽孢杆菌的基因bcl2627的DNA序列(SEQID NO32)。
发明描述只使用下列定义和实施例,现在将详细的描述本发明作为参考。特意引用本文提及的所有专利和发表物,包括这些专利和发表物中公开的所有序列,作为参考。
本发明涉及经遗传操作而生成所表达蛋白质的能力得到改变的细胞。具体而言,本发明涉及具有外源核酸序列导入其中的革兰氏阳性微生物,以及用于在这些宿主细胞中生成蛋白质的方法,诸如芽孢杆菌属的成员。更具体的说,本发明涉及目的多肽的表达、生成和分泌,以及经遗传操作而生成所表达蛋白质的能力得到改变的细胞。具体而言,本发明提供了微生物对所选择多肽的增强表达。
定义特意引用本文提及的所有专利和发表物,包括这些专利和发表物中公开的所有序列,作为参考。除非本文另有定义,本文所使用的所有技术和科学术语具有与本发明所属领域普通技术人员通常理解相同的含义(参阅如Singleton等人,《Dictionary of Microbiology andMolecular Biology》,第2版,John Wiley & Sons,纽约,1994;以及Hale和Marham,《The Harper Collins Dictionary of Biology》,HarperPerennial,纽约,1991;二者都为技术人员提供了本文所用许多术语的普通词典)。虽然与本文所述相似或相当的许多方法和材料都可用于实践或测试本发明,然而本发明描述了优选的方法和材料。数值范围包括限定该范围的端值。除非另有指示,核酸以由左至右书写5′至3′方向;而氨基酸序列以由左至右书写氨基至羧基方向。本文提供的标题并非对本发明各个方面或实施方案的限制,而是构成整个说明书。因此,下文定义的术语通过参考整个说明书得到更充分的定义。
在用于本文时,“宿主细胞”指有能力担当宿主和表达载体用于表达依照本发明的表达盒的细胞。在一个实施方案中,宿主细胞是革兰氏阳性微生物。在有些优选实施方案中,该术语指芽孢杆菌属的细胞。
在用于本文时,“芽孢杆菌属”包括本领域技术人员知道的所有成员,包括但不限于枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacillus licheniformis)、迟缓芽孢杆菌(Bacillus lentus)、短芽孢杆菌(Bacillus brevis)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、克劳氏芽孢杆菌(Bacillusclausii)、耐盐芽孢杆菌(Bacillus halodurans)、巨大芽孢杆菌(Bacillusmegaterium)、凝结芽孢杆菌(Bacillus coagulans)、环状芽孢杆菌(Bacillus circulans)、灿烂芽孢杆菌(Bacillus lautus)、和苏云金芽孢杆菌(Bacillus thuringiensis)。认识到芽孢杆菌属仍在进行分类学改组。因此,该属意欲包括已经重新分类的物种,包括但不限于诸如现在命名为“嗜热脂肪地芽孢杆菌(Geobacillusstearothermophilus)”的嗜热脂肪芽孢杆菌等生物体。认为界定芽孢杆菌属的特征是存在氧气时生成抵抗性内生孢子,尽管该特征也应用于最近命名的脂环酸芽孢杆菌属(Alicyclobacillus)、双芽孢芽孢杆菌属(Amphibacillus)、解硫胺素芽孢杆菌属(Aneurinibacillus)、无氧芽孢杆菌属(Anoxybacillus)、短芽孢杆菌属(Brevibacillus)、线状芽孢杆菌属(Filobacillus)、薄壁芽孢杆菌属(Gracilibacillus)、盐芽孢杆菌属(Halobacillus)、类芽孢杆菌属(Paenibacillus)、盐水芽孢杆菌属(Salibacillus)、热芽孢杆菌属(Thermobacillus)、尿芽孢杆菌属(Ureibacillus)、和处女芽孢杆菌属(Virgibacillus)。
在用于本文时,术语“多肽”指由氨基酸残基通过肽键相连而成的化合物。在用于本文时,术语“蛋白质”可以与术语“多肽”同义,或者可以另外指两种或多种多肽的复合物。因此,术语“蛋白质”、“肽”、和“多肽”可以互换使用。
另外,“目的蛋白”或“目的多肽”指将要由宿主细胞表达并分泌的蛋白质/多肽。目的蛋白可以是至今考虑在原核细胞和/或真核细胞中表达的任何蛋白质。在一个实施方案中,由宿主细胞所采用的分泌相关蛋白或系统转移的目的蛋白包括包含信号肽的蛋白质。目的蛋白对于宿主细胞而言可以是同源的或者是异源的。在有些实施方案中,目的蛋白是分泌性多肽,特别是选自下组的酶淀粉水解酶、蛋白水解酶、纤维素水解酶、氧化还原酶和植物壁降解酶。在其它实施方案中,这些酶包括淀粉酶、蛋白酶、木聚糖酶、脂肪酶、漆酶、酚氧化酶、氧化酶、角质酶、纤维素酶、半纤维素酶、酯酶、过氧化物酶、过氧化氢酶、葡糖氧化酶、植酸酶、果胶酶、葡糖苷酶、异构酶、转移酶、半乳糖苷酶和几丁质酶。在另一些实施方案中,所表达的多肽是激素、生长因子、受体、疫苗、抗体、诸如此类。尽管不想将本发明限于任何具体的蛋白质/多肽,然而在有些最优选的实施方案中,所表达的多肽是蛋白酶。
在用于本文时,术语“嵌合多肽”和“融合多肽”可以互换使用,指包含至少两个分开且不同的区域的蛋白质,所述区域可以是或者不是来源于同一蛋白质。例如,信号肽与目的蛋白相连可以称为嵌合多肽或嵌合蛋白,其中信号肽与目的蛋白通常不相关。
在用于本文时,“分泌相关蛋白”指参与由宿主细胞分泌目的蛋白的蛋白质。分泌相关蛋白可以帮助新生(即合成过程中或紧随其后)蛋白质正确折叠、帮助蛋白质由胞内移动到胞外环境(如穿过细胞质到达细胞膜和/或穿过细胞膜/细胞壁到达胞外环境、等等)、适当加工、诸如此类。蛋白质在胞内合成直至它出现在细胞膜外表面上这一过程中,认为参与所述蛋白质移动的任何方面的蛋白质具有分泌相关活性或功能。在一个实施方案中,分泌相关蛋白包括参与帮助新生目的蛋白实现正确折叠构象的蛋白质。在另一个实施方案中,分泌相关蛋白包括来自Sec途径的蛋白质。术语“分泌相关蛋白”、“分泌相关因子”、和“分泌因子”在本文中都可以互换使用。
在用于本文时,术语“杂合子”指包含衍生自两种或多种直向同系物(ortholog)的序列(如分泌因子)。因此,“杂合基因”或“杂合蛋白”分别指所含两个或多个片段序列衍生自两种或多种芽孢杆菌菌株的基因或蛋白。
在一个实施方案中,直向同源序列包含来自单一直向同系物的序列。在另一个实施方案中,直向同源序列包含少于5个来自单一直向同系物的序列。在另一个实施方案中,直向同源序列包含来自两个直向同系物的序列。在另一个实施方案中,直向同源序列包含单一氨基酸。在另一个实施方案中,直向同源序列包含2个至5、10、15、20个氨基酸。在另一个实施方案中,直向同源序列包含分泌因子序列总氨基酸残基的大约2%至大约50%。
在另一个实施方案中,直向同源序列包含超过2个且少于5、10、15、20、25、30、35、40、45或50个氨基酸。在另一个实施方案中,与野生型克劳氏芽孢杆菌分泌因子相比,直向同源序列总计包含杂合分泌因子序列的少于大约50%。
在用于本文时,术语“嵌合多肽”和“融合多肽”可以互换使用,指包含至少两个分开且不同的区域的蛋白质,它们可以是或者不是来源于同一蛋白质。例如,信号肽与目的蛋白相连可以称为嵌合多肽或嵌合蛋白,其中信号肽与目的蛋白通常不相关。
在用于本文时,术语“嵌合DNA构建物”和“异源核酸构建物”指由不同基因的部分包括调控元件构成的基因(即已经导入宿主的)。因此,在有些实施方案中,嵌合基因指与非其天然启动子可操作连接的内源基因。用于转化宿主细胞的嵌合基因构建物通常由可操作地连接蛋白质编码序列或(在可选择标记嵌合基因中)可选择标记基因(编码赋予转化细胞以抗菌剂抗性的蛋白质)的转录调控区(启动子)构成。在一个实施方案中,可用于转化宿主细胞的本发明典型嵌合基因构建物包含组成性或可诱导的转录调控区、信号肽编码序列、蛋白质编码序列、和终止子序列。在其它实施方案中,嵌合基因包含可操作连接phr基因的启动子。在其它实施方案中,嵌合基因包含可操作连接编码目的蛋白的基因的启动子。在还有一些实施方案中,若想分泌靶蛋白,嵌合基因构建物还包含编码信号肽的第二种DNA序列。
因此,“杂合”用于描述分泌因子及其编码核苷酸,而“嵌合”用于描述含调控元件的DNA构建物。因此,嵌合基因或嵌合DNA构建物可以编码杂合分泌因子。
在用于本文时,“变体”指通过向C和N末端或其一添加一个或多个氨基酸、替代氨基酸序列中一个或一些不同位点的一个或多个氨基酸、删除蛋白质两端或其一或氨基酸序列中一个或多个位点的一个或多个氨基酸、和/或在氨基酸序列中一个或多个位点插入一个或多个氨基酸而由蛋白质前体(如克劳氏芽孢杆菌分泌因子)衍生的蛋白质。“克劳氏芽孢杆菌分泌因子变体”指经过上文所述修饰的克劳氏芽孢杆菌分泌因子。优选如下实现克劳氏芽孢杆菌分泌因子变体的制备修饰编码天然蛋白质的DNA序列,将该DNA序列转化到适当宿主中,并表达经修饰DNA序列以形成衍生酶。本发明的变异克劳氏芽孢杆菌分泌因子包括与酶前体氨基酸序列相比包含变化的氨基酸序列的肽,其中变异克劳氏芽孢杆菌分泌因子保持克劳氏芽孢杆菌分泌因子前体的特征性分泌因子特性但在某些特定方面可能具有变化的特性。例如,在有些实施方案中,变异克劳氏芽孢杆菌分泌因子在氧化性条件下的稳定性升高了且仍保持它们的特征性分泌因子活性。然而,变体的活性相对于分泌因子前体可能升高也可能降低。设想依照本发明的变体可以衍生自编码克劳氏芽孢杆菌分泌因子变体的DNA片段,其中所表达克劳氏芽孢杆菌分泌因子变体的功能活性得到了保持。例如,在有些实施方案中,编码克劳氏芽孢杆菌分泌因子的DNA片段还包含连接在克劳氏芽孢杆菌分泌因子DNA序列5′或3′末端的编码铰链或接头的DNA序列或部分,其中所编码克劳氏芽孢杆菌分泌因子结构域的功能活性得到了保持。
在用于本文时,术语“信号肽”指待分泌蛋白质的氨基末端延伸。“信号序列”在本文中可以互换使用。在最优选的实施方案中,分泌性蛋白质使用氨基末端蛋白质延伸,这些延伸在将蛋白质前体靶向并转移穿过膜中发挥重要作用,并且在膜转移过程中或紧随其后被信号肽酶通过蛋白质水解切除。在优选实施方案中,信号序列是衍生自芽孢杆菌的Sec依赖性信号肽。
在用于本文时,术语“增强”指改善目的蛋白的生成。在优选实施方案中,本发明提供了增强的(即改善的)目的蛋白生成和分泌。在这些实施方案中,“增强的”生成指与宿主(即野生型细胞)的正常生成水平相比得到了改善。因此,对于异源蛋白质而言,基本上任何表达都是增强的,因为细胞通常不生成这些蛋白质。
在用于本文时,术语“分离的”和“纯化的”指除去了至少一种与其天然相关的成分的核酸或氨基酸。
在用于本文时,术语“异源蛋白质”指通常在宿主细胞中非天然存在的蛋白质或多肽。异源蛋白质的实例包括诸如水解酶等酶,包括蛋白酶、纤维素酶、淀粉酶、其它糖酶、和脂肪酶;诸如消旋酶、差向酶、互变异构酶、或变位酶等异构酶;转移酶、激酶和磷酸酶、激素、生长因子、细胞因子、抗体、诸如此类。因此,在有些实施方案中,异源蛋白质包括重要的治疗性蛋白质或肽(如生长因子、细胞因子、配体、受体和抑制剂),以及疫苗和抗体。在候选实施方案中,蛋白质指重要的商业性工业蛋白质或肽。该术语意欲涵盖由天然存在基因、突变基因、和/或合成基因编码的蛋白质。
在用于本文时,术语“异源核酸构建物”和“异源核酸序列”指对序列在其中表达的细胞而言并非天然的遗传序列的一部分。就控制序列而言,“异源”指控制序列(即启动子或增强子)原本不发挥调控现在所调控的同一基因的功能。一般而言,异源核酸序列对于它们所存在的细胞或基因组部分而言并非内源的,而是通过感染、转染、显微注射、电穿孔、诸如此类添加到细胞中的。在有些实施方案中,“异源核酸构建物”包含的控制序列/DNA编码序列联合物与在天然细胞中发现的控制序列/DNA编码序列联合物相同或不同。
在用于本文时,术语“同源蛋白质”指宿主细胞中天然或自然存在的蛋白质或多肽。本发明涵盖通过重组DNA技术生成同源蛋白质的宿主细胞。本发明还涵盖在编码天然存在同源蛋白质(诸如例如蛋白酶)的核酸中具有一处或多处删除或者一处或多处中断并重新导入重组形式(即表达盒)的同源蛋白质编码核酸的宿主细胞。在其它实施方案中,宿主细胞生成同源蛋白质。
在用于本文时,术语“核酸分子”包括RNA、DNA和cDNA分子。可以理解,由于遗传密码简并性,可以生成编码给定蛋白质的多种核苷酸序列。
在用于本文时,术语“载体”指设计用于在不同宿主细胞之间进行转移的核酸构建物。“表达载体”指有能力在外源细胞中掺入并表达异源DNA片段的载体。许多原核和真核表达载体可以通过商业途径获得。适当表达载体的选择属于本领域技术人员知识范围之内。
在用于本文时,术语“表达盒”和“表达载体”指通过重组或合成方式生成的且含有容许在靶细胞中转录特定核酸的一系列特定核酸元件的核酸构建物。重组表达盒可以整合入质粒、染色体、线粒体DNA、质体DNA、病毒、或核酸片段。通常,除了其它序列,表达载体的重组表达盒部分还包含待转录的核酸序列和启动子。
在用于本文时,术语“质粒”指在许多细菌和一些真核细胞中用作克隆载体且形成染色体外自主复制遗传元件的环状双链(ds)DNA构建物。
在用于本文时,术语“可选择标记编码核苷酸序列”指能够在宿主细胞中表达并赋予所述细胞以在存在相应选择剂或缺乏必需营养时生长的能力的核苷酸序列。
在用于本文时,术语“可选择标记”指能够在宿主细胞中表达并容许易于选择包含载体的那些宿主的基因。这些可选择标记的实例包括但不限于抗菌剂(如卡那霉素、红霉素、放线菌素、氯霉素和四环素)。因此,术语“可选择标记”指能显示宿主细胞摄取了所引入的目的DNA或者发生了一些其它反应的基因。通常,可选择标记指赋予宿主细胞以抗菌剂抗性或代谢优势从而容许将包含外源DNA的细胞与在转化过程中未接受任何外源序列的细胞区分开来的基因。“驻留型可选择标记”指位于待转化微生物染色体上的可选择标记。驻留型可选择标记编码与转化用DNA构建物上可选择标记不同的基因。
在用于本文时,术语“启动子”指发挥指导下游基因转录的功能的核酸序列。在优选实施方案中,启动子对于将要表达靶基因的宿主细胞而言是适当的。启动子与其它转录和翻译调控核酸序列(也称为“控制序列”)一起都是表达指定基因所必需的。一般而言,转录和翻译调控序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列、以及增强子或激活子序列。
当核酸与另一种核酸序列处于功能相关性位置时称其为“可操作连接”。例如,若编码分泌前导序列(即信号肽)的DNA表达成参与多肽分泌的前蛋白,则称其可操作连接编码多肽的DNA;若启动子或增强子影响序列的转录,则称其可操作连接编码序列;或者若核糖体结合位点的定位促进翻译,则称其可操作连接编码序列。一般而言,“可操作连接”指所连接的DNA序列是连续的,在分泌前导序列的情况中,既是连续的又处于读码状态。然而,增强子不必是连续的。连接是通过便利限制性位点处的连接来实现的。如果不存在这些位点,那么依照常规实践使用合成寡核苷酸衔接头或接头。
在用于本文时,术语“基因”指参与生成多肽链的DNA区段,它可以包含或者不含编码区之前或之后的区域(例如5′非翻译(5′UTR)或“前导”序列和3′UTR或“尾随”序列)以及单个编码区段(外显子)之间的居间序列(内含子)。
在有些实施方案中,基因编码重要的治疗性蛋白质或肽,诸如生长因子、细胞因子、配体、受体和抑制剂,以及疫苗和抗体。基因还可以编码重要的商业性工业蛋白质或肽,诸如酶(如蛋白酶、糖酶诸如淀粉酶和葡糖淀粉酶、纤维素酶、氧化酶和脂肪酶)。然而,本发明不想限于任何具体的酶或蛋白质。在有些实施方案中,目的基因是天然存在基因、突变基因或合成基因。
在用于本文时,“删除”定义为核苷酸或氨基酸序列中一个或多个核苷酸或氨基酸残基缺失的变化。
在用于本文时,“插入”或“添加”指与天然存在序列(如克劳氏芽孢杆菌分泌因子)相比核苷酸或氨基酸序列中导致一个或多个核苷酸或氨基酸残基增加的变化。
在用于本文时,“替代”是指用不同的核苷酸或氨基酸取代一个或多个核苷酸或氨基酸。
在用于本文时,“同源基因”指来自不同但通常相关物种的一对基因,它们彼此对应且彼此相同或非常相似。该术语涵盖由物种形成(即新物种的发展)所分离的基因(如直向同源基因),以及由遗传复制分离的基因(如平行进化基因)。
在用于本文时,“直向同系物”和“直向同源基因”指由共同祖先基因通过物种形成而进化的不同物种中的基因(即同源基因)。通常,直向同系物在进化过程中保持相同功能。直向同系物的鉴定可用于在最新测序的基因组中可靠预测基因功能。
在用于本文时,“平行进化同系物”和“平行进化基因”指基因组内因复制而相关的基因。虽然直向同系物在进化过程中保持相同功能,然而平行进化同系物进化得到了新的功能,尽管有些功能常常与原始功能有关。平行进化基因的实例包括但不限于编码胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶、和凝血酶的基因,它们都是丝氨酸蛋白酶且一起存在于相同物种中。
在用于本文时,“同源性”指序列相似性或同一性,优选同一性。此同源性是使用本领域已知标准技术测定的(参阅如Smith和Waterman,Adv.Appl.Math.,2482,1981;Needleman和Wunsch,J.Mol.Biol.,48443,1970;Pearson和Lipman,Proc.Natl.Acad.Sci.USA,852444,1988;诸如威斯康星遗传学软件包(遗传学计算小组,麦迪逊,威斯康星州)中的GAP、BESTFIT、FASTA、和TFASTA等程序;以及Devereux等人,Nucl.Acids Res.,12387-395,1984)。
有用算法的一个实例是PILEUP。PILEUP使用渐进成对比对法由一组相关序列生成多序列比对。它还能够绘制树形图,显示用于生成比对的群集关系。PILEUP是Feng和Doolittle渐进比对法(Feng和Doolittle,J.Mol.Evol.,35351-360,1987)的简化。该方法与Higgins和Sharp所述(Higgins和Sharp,CABIOS,5151-153,1989)相似。有用的FILEUP参数包括缺省缺口权3.00,缺省缺口长度权0.10,和加权末端缺口。
有用算法的另一个实例是由Altschul等人描述的BLAST算法(Altschul等人,J.Mol.Biol.,215403-410,1990;和Karlin等人,Proc.Natl.Acad.Sci.USA,905873-5787,1993)。特别有用的BLAST程序是WU-BLAST-2程序(参阅Altschul等人,Meth.Enzymol.,266460-480,1996)。WU-BLAST-2使用几个搜索参数,其中的大多数设置成缺省值。可调节参数设置成如下数值交叠跨度=1,交叠分数=0.125,词阈值(T)=11。HSP S和HSP S2参数是动态数值,而且是由程序自身根据具体序列的组成和用于搜索目的序列的具体数据库的组成而确定的。然而,可以调整该数值以提高灵敏度。氨基酸序列同一性百分比值是将匹配相同残基数目除以比对区中“较长”序列的残基总数而得出的。“较长”序列指在比对区具有最多实际残基的序列(忽略为了使比对得分最大化而通过WU-BLAST-2引入的缺口)。
因此,“核酸序列同一性百分比”定义为候选序列中与参照核酸序列的核苷酸残基相同的核苷酸残基所占的百分比。优选方法使用WU-BLAST-2的BLASTN模块,设置成缺省参数,交叠跨度和交叠分数分别设成1和0.125。
比对可以包括在待比对序列中引入缺口。另外,对于比参照核酸序列包含更多或更少核苷酸的序列,可以理解将根据同源核苷酸数目与核苷酸总数相比来确定同源性百分比。因此,例如,将使用比本文所鉴定的和下文所讨论的那些序列更短的序列的核苷酸数目来确定较短序列的同源性。
在用于本文时,术语“杂交”指本领域所知道的一条核酸链通过碱基配对而结合互补链的过程。
在用于本文时,“最高严谨度”指通常发生于大约Tm-5℃(比探针Tm低5℃)的杂交水平;“高严谨度”比Tm低大约5℃至10℃;“中严谨度”比Tm低大约10℃至20℃;而“低严谨度”比Tm低大约20℃至25℃。正如本领域技术人员将理解的,最高严谨度杂交可用于鉴定或检测相同多核苷酸序列,而中或低严谨度杂交可用于鉴定或检测多核苷酸序列同系物。
若核酸序列与参考核酸序列在中至高严谨度杂交和清洗条件下彼此特异杂交,则认为这两种序列“选择性可杂交”。杂交条件基于核酸结合复合物或探针的熔化温度I。例如,“最高严谨度”通常发生于大约Tm-5℃(比探针Tm低5℃);“高严谨度”比Tm低大约5℃至10℃;“中严谨度”比探针Tm低大约10℃至20℃;而“低严谨度”比Tm低大约20℃至25℃。就功能而言,最高严谨度条件可用于鉴定与杂交探针具有严谨同一性或接近严谨同一性的序列;而中或低严谨度杂交可用于鉴定或检测多核苷酸序列同系物。
中和高严谨度杂交条件在本领域是众所周知的。高严谨度条件的实例包括于大约42℃在50%甲酰胺、5X SSC、5X Denhardt氏溶液、0.5%SDS和100μg/ml变性载体DNA中杂交,随后在2X SSC和0.5%SDS中于室温清洗两次,在0.1X SSC和0.5%SDS中于42℃再清洗两次。
在用于本文时,“重组体”包括通过导入异源核酸序列而经过修饰的细胞或载体,或者由经过如此修饰的细胞衍生的细胞。因此,例如,重组细胞表达在天然形式(即非重组)细胞中未发现相同形式的基因,或者出于慎重的人为干涉而表达在其它情况中异常表达、不足表达或根本不表达的天然基因。“重组”核酸通常指装配两个或多个核酸片段而生成嵌合基因。
在用于本文时,术语“转化”、“稳定转化”、和“转基因”在用于指称细胞时指细胞具有非天然(异源)核酸序列整合到其基因组中或作为游离质粒维持两个或多个世代。
在用于本文时,术语“表达”指根据基因的核酸序列生成多肽的过程。该包括包括转录和翻译二者。
在用于本文时,术语“导入”在用于将核酸序列插入细胞时指“转染”、“转化”、或“转导”,而且包括将核酸序列整合入原核或真核细胞,其中核酸序列可以整合入细胞的基因组(如染色体、质粒、质体、或线粒体DNA)、转变成自主复制子、或瞬时表达(例如转染的mRNA)。
在用于本文时,“转化用DNA”、“转化用序列”、和“DNA构建物”指用于将序列导入宿主细胞或生物体的DNA。转化用DNA指用于将序列导入宿主细胞或生物体的DNA。该DNA可以是通过PCR在体外生成的,或者是通过任何其它适当技术生成的。在有些优选实施方案中,转化用DNA包含引入的序列;而在其它优选实施方案中,它还包含侧翼为同源盒的引入序列。在另一个实施方案中,转化用DNA可以包含其它非同源序列添加在末端(即填充(stuffer)或侧翼序列)。末端可以是闭合的,使得转化用DNA形成闭合环状,例如插入载体中。
在一个优选实施方案中,突变DNA序列是通过至少一个密码子的位点饱和诱变而生成的。在另一个优选实施方案中,对两个或多个密码子进行位点饱和诱变。在另一个实施方案中,突变DNA序列与野生型序列具有超过40%、超过45%、超过50%、超过55%、超过60%、超过65%、超过70%、超过75%、超过80%、超过85%、超过90%、超过95%、或超过98%同源性。在候选实施方案中,通过任何已知突变方法在体内生成突变DNA,诸如例如放射、亚硝基胍、诸如此类。然后分离期望DNA序列,并用于本文提供的方法。
在候选实施方案中,转化用DNA序列包含同源盒而不存在引入序列。在该实施方案中,期望删除两个同源盒之间的内源DNA序列。另外,在有些实施方案中,转化用序列是野生型的;而在其它实施方案中,它们是突变型或经修饰序列。另外,在有些实施方案中,转化用序列是同源的;而在其它实施方案中,它们是异源的。
在用于本文时,术语“引入序列”指导入芽孢杆菌染色体或基因组的DNA序列。在优选实施方案中,引入序列编码一种或多种目的蛋白。在有些实施方案中,引入序列包含待转化细胞基因组中可能早已存在或不存在的序列(即它可以是同源或异源序列)。在有些实施方案中,引入序列编码一种或多种目的蛋白、基因、和/或经突变或经修饰基因。在有些实施方案中,引入序列包含可选择标记,诸如赋予抗菌剂抗性的基因。
在一个实施方案中,引入序列编码至少一种异源蛋白质,包括但不限于激素、酶、和生长因子。在另一个实施方案中,酶包括但不限于水解酶,诸如蛋白酶、酯酶、脂肪酶、酚氧化酶、通透酶、淀粉酶、支链淀粉酶、纤维素酶、葡萄糖异构酶、漆酶和蛋白质二硫化物异构酶。
在候选实施方案中,引入序列编码功能性野生型基因或操纵子、功能性突变基因或操纵子、或者非功能性基因或操纵子。在有些实施方案中,可以将非功能性序列插入基因以破坏基因的功能。
在用于本文时,术语“靶序列”指宿主细胞中编码某一序列的DNA序列,其中在所述某一序列处期望将引入序列插入宿主细胞基因组。在有些实施方案中,靶序列编码功能性野生型基因或操纵子;而在其它实施方案中,靶序列编码功能性突变基因或操纵子或者非功能性基因或操纵子。
在用于本文时,术语“侧翼序列”指位于所讨论序列上游或下游的任何序列(如对于基因ABC,基因B的侧翼是A和C基因序列)。在优选实施方案中,引入序列的侧翼是每边一个的同源盒。在另一个实施方案中,引入序列和同源盒包含侧翼为每边一个填充序列的单元。在有些实施方案中,侧翼序列只存在于一端(或是3′或是5′);但在优选实施方案中,两端都有侧翼序列。每个同源盒的序列与芽孢杆菌染色体序列同源。这些序列指导芽孢杆菌染色体中哪里整合新构建物和芽孢杆菌染色体的哪些部分将被引入序列取代。
在用于本文时,术语“填充序列”指同源盒侧翼的任何额外DNA(通常是载体序列)。然而,该术语涵盖任何非同源DNA序列。不受任何理论的限制,填充序列为细胞提供了启动DNA摄取的非重要靶标。
在用于本文时,术语“染色体整合”指将引入序列导入宿主细胞(如芽孢杆菌)染色体中的过程。转化用DNA的同源盒与染色体的同源区比对。随后,同源盒之间的序列在双交换(即同源重组)中被引入序列取代。
在用于本文时,术语“同源重组”指两个DNA分子或配对染色体(如在交换过程中)之间相同核苷酸序列位点处的DNA片段交换。在一个优选实施方案中,染色体整合是通过同源重组实现的。
在用于本文时,术语“突变体库”指基因组大部分相同但包含一个或多个基因的不同同系物的细胞群。这些库可用于例如鉴定具有改善特性的基因或操纵子的方法。
在用于本文时,术语“超感受态”和“超级感受态”指超过1%的细胞群能够用染色体DNA(如芽孢杆菌DNA)转化。或者,这些术语指超过10%的细胞群能够用自主复制质粒(如芽孢杆菌质粒)转化。优选的是,超级感受态细胞以超过野生型或亲本细胞群所观察到的比率得到转化。超感受态和超级感受态在本文中可以互换使用。
在用于本文时,术语“扩增”和“基因扩增”指特定DNA序列不成比例的复制使得扩增基因以高于基因组中最初存在的更高拷贝数目存在的过程。在有些实施方案中,通过在存在药物(如可抑制酶的抑制剂)时的生长而对细胞的选择导致编码存在药物时生长所需要的基因产物的内源基因得到扩增,或者编码该基因产物的外源(即输入)序列的扩增,或二者兼有。
“扩增”是涉及模板特异性的核酸复制的特殊情况。它与非特异模板扩增(即依赖模板但不依赖特定模板的复制)形成对比。模板特异性与复制保真度(即合成正确多核苷酸序列)和核苷酸(核糖或脱氧核糖)特异性在本文中是有区别的。模板特异性经常描述成术语“靶”特异性。靶序列指经过搜索而从其它核酸中分拣出来的“靶”。扩增技术主要设计来用于这种分拣。
在用于本文时,术语“共扩增”指将可扩增标记连同其它基因序列(即包含一种或多种非可选择基因诸如表达载体中所含的那些基因)一起导入单一细胞并应用适当选择压力使得细胞扩增可扩增标记和其它非可选择基因序列。可以将可扩增标记物理连接至其它基因序列上,或者可以将两段分开的DNA导入相同细胞,一段包含可扩增标记,而另一段包含非可选择标记。
在用于本文时,术语“可扩增标记”、“可扩增基因”、和“扩增载体”指基因或载体所编码的基因容许该基因在适当生长条件下扩增。
“模板特异性”在大多数扩增技术中是通过酶的选择来实现的。扩增酶指在其使用条件下只加工核酸异质混合物中特定核酸序列的酶。例如,在Qβ复制酶的情况中,MDV-1 RNA是复制酶的特异模板(参阅如Kacian等人,Proc.Natl.Acad.Sci.USA,693038,1972)。其它核酸不会由该扩增酶得到复制。类似的,在T7 RNA聚合酶的情况中,该扩增酶对其自身启动子具有严格特异性(参阅Chamberlin等人,Nature,228227,1970)。在T4 DNA连接酶的情况中,酶不会连接寡核苷酸或多核苷酸底物与模板之间在连接接合处存在错配的两段寡核苷酸或多核苷酸(参阅Wu和Wallace,Genomics,4560,1989)。最后,发现Taq和Pfu聚合酶由于它们在高温下发挥功能的能力而对引物所结合并限定的序列展示高特异性;高温产生支持引物与靶序列杂交而与非靶序列不杂交的热力学条件。
在用于本文时,术语“可扩增核酸”指可以通过任何扩增方法进行扩增的核酸。设想“可扩增核酸”将通常包含“样品模板”。
在用于本文时,术语“样品模板”指源自用来分析“靶”(下文定义的)是否存在的样品的核酸。相反,“背景模板”指样品中可能存在或不存在的不同于样品模板的核酸。最常见的背景模板是无意的。它可能是遗留的后果,或者它可能归咎于需要由样品纯化除去的核酸污染的存在。例如,测试样品中可能存在来自待检测生物体以外生物体的核酸作为背景。
在用于本文时,术语“引物”指以纯化的限制性消化产物形式天然存在的或通过合成而生成的寡核苷酸,在置于适当条件下时(即存在核苷酸和诱导剂诸如DNA聚合酶,而且处于适当温度和pH),它能够担当合成的起始点,诱导与核酸链互补的引物延伸产物的合成。为了获得最大扩增效率,引物优选单链,但是也可以是双链。如果是双链,在用于制备延伸产物前首先处理引物将它的两条链分开。优选的是,引物是寡脱氧核糖核苷酸。引物必需足够长,从而在存在诱导剂时引发延伸产物的合成。引物的精确长度将取决于许多因素,包括温度、引物来源和所用方法。
在用于本文时,术语“探针”指以纯化的限制性消化产物形式天然存在的或通过合成、重组或PCR扩增而生成的寡核苷酸(即核苷酸序列),它能够与另一种目的寡核苷酸杂交。探针可以是单链的或双链的。探针可用于特定基因序列的检测、鉴定和分离。设想本文所用任何探针将用任何“报告分子”标记,从而在任何检测系统中可检测,包括但不限于酶(如ELISA以及基于酶的组织化学测定法)、荧光、放射性、和发光系统。本发明不想限于任何具体检测系统或标记。
在用于本文时,术语“靶”在指称聚合酶链式反应时指由聚合酶链式反应所用引物结合的核酸区域。因此,“靶”需要经过搜索而从其它核酸中分拣出来。“区段”定义为靶序列内的核酸区域。
在用于本文时,术语“聚合酶链式反应”(“PCR”)指美国专利号4,683,195、4,683,202、和4,965,188(收入本文作为参考)的方法,包括用于提高基因组DNA混合物中靶序列区段浓度而无需克隆或纯化的方法。用于扩增靶序列的这种方法由下列步骤组成将大大过量的两种寡核苷酸引物导入包含期望靶序列的DNA混合物,随后在存在DNA聚合酶时进行精确顺序的热循环。两种引物与双链靶序列的对应链互补。为了实现扩增,将混合物变性,然后将引物与它们在靶分子内的互补序列退火。退火后,用聚合酶延伸引物以形成一对新的互补链。可以将变性、引物退火和聚合酶延伸这三个步骤重复多次(即变性、退火和延伸构成一个“循环”;可以进行许多“循环”)以获得高浓度的期望靶序列扩增区段。期望靶序列扩增区段的长度是由引物的相对位置决定的,因此这种长度是可控参数。由于该过程的重复性,将该方法称为“聚合酶链式反应”(下文的“PCR”)。因为靶序列的期望扩增区段成为混合物中的主要序列(就浓度而言),所以将它们称为“经PCR扩增”。
在用于本文时,术语“扩增试剂”指除了引物、核酸模板和扩增酶以外的扩增所需要的那些试剂(脱氧核糖核苷三磷酸、缓冲液、等)。通常,将扩增试剂及其它反应成分置于或装在反应容器(试管、微孔、等)中。
通过PCR,有可能将基因组DNA中单一拷贝的特定靶序列扩增至用几种不同方法(如与标记探针杂交;掺入生物素化引物随后进行亲和素-酶缀合物检测;将32P标记脱氧核糖核苷三磷酸诸如dCTP或dATP掺入扩增区段)可检测的水平。除了基因组DNA,使用适当引物分子组可以扩增任何寡核苷酸或多核苷酸序列。具体而言,通过PCR过程自身生成的扩增区段也是后续PCR扩增的有效模板。
在用于本文时,术语“PCR产物”、“PCR片段”、和“扩增产物”指完成两个或多个循环的PCR步骤即变性、退火和延伸后得到的化合物混合物。这些术语涵盖扩增一种或多种靶序列的一个或多个区段的情况。
在用于本文时,术语“RT-PCR”指RNA序列的复制和扩增。在该方法中,将逆转录与PCR偶联,最常见的是使用一种酶促流程,其中采用了热稳定聚合酶,正如美国专利号5,322,770中所述,收入本文作为参考。在RT-PCR中,通过聚合酶的逆转录酶活性将RNA模板转变成cDNA,然后通过聚合酶的聚合活性进行扩增(即如在其它PCR方法中的)。
在用于本文时,术语“限制性内切核酸酶”和“限制酶”指每一种能在特定核苷酸序列处或附近切割双链DNA的细菌酶。
发明详述本发明涉及经遗传操作而生成所表达蛋白质的能力得到改变的细胞。具体而言,本发明涉及具有外源核酸序列导入其中的革兰氏阳性微生物,以及用于在这些宿主细胞中生成蛋白质的方法,诸如芽孢杆菌属的成员。更具体的说,本发明涉及目的多肽的表达、生成和分泌,以及经遗传操作而生成所表达蛋白质的能力得到改变的细胞。具体而言,本发明提供了微生物对所选择多肽的增强表达。
许多工业重要产品(如酶、激素、生长因子、和其它蛋白质)是由芽孢杆菌属成员在大规模发酵过程中生成的,包括但不限于蛋白酶、脂肪酶、淀粉酶、和β-葡聚糖酶。这些产品(即目的蛋白)对于宿主或是同源的或是异源的。对于同源蛋白质,“过度表达”指宿主细胞中超过正常水平的表达。对于异源蛋白质,任何表达当然都是“过度表达”。因此,有利的是得到不能形成芽孢但具有目的基因的增强表达的细胞。
为了解决本领域的一些需求,在一个实施方案中本发明提供了来自革兰氏阳性宿主细胞的编码参与蛋白质分泌的分泌因子的核酸序列。在有些实施方案中,这些序列找到了用途,即用本发明提供的发明性克劳氏芽孢杆菌基因取代宿主芽孢杆菌物种基因以改变目的蛋白的分泌特征,使得经转化宿主芽孢杆菌细胞的蛋白质生成水平更高。在一个优选实施方案中,宿主芽孢杆菌细胞是枯草芽孢杆菌。在一个候选实施方案中,宿主细胞是克劳氏芽孢杆菌。在另一个实施方案中,本发明提供了用于增强任何目的蛋白的分泌(即生成和表达)的方法。克劳氏芽孢杆菌核苷酸序列在本发明的开发过程中,收集了来自极端环境的大量细菌菌株。根据16S RNA基因序列鉴定了一种专性嗜碱芽孢杆菌即克劳氏芽孢杆菌。将这种菌株称为“PB92”。菌株PB92保存于ATCC保藏中心(编号ATCC 31408)、代尔夫特技术大学微生物学实验室(the Laboratory forMicrobiology of the Technical University of Delft)保藏中心(编号OR60)、和日本工业科学和技术署发酵研究学院(the FermentationResearch Institute of the Agency of Industrial Science and Technology)保藏中心(编号FERM-P 3304)。
正如下文极为详细讨论的,将克劳氏芽孢杆菌(PB92)序列与枯草芽孢杆菌和耐盐芽孢杆菌的基因组进行了比较。虽然克劳氏芽孢杆菌序列与来自芽孢杆菌属的这两个不同成员的序列高度相似,但是数据表明克劳氏芽孢杆菌与耐盐芽孢杆菌的相关性比克劳氏芽孢杆菌与枯草芽孢杆菌的相关性更密切。然而,如图21所示,也有清楚例子显示克劳氏芽孢杆菌的基因与枯草芽孢杆菌比耐盐芽孢杆菌更相似。
测序使用本领域知道的标准方法对克劳氏芽孢杆菌PB92基因组的鸟枪库进行测序。随后装配单个序列,产生了450个无交叠毗连群,总长度4,345,345碱基对。使用Orpheus软件(Frishman等人,Nuc.AcidsRes.,262941-7,1998)自动进行基因预测。根据外在证据手工细化所有预测的开放读码框(ORF)边界。使用BLASTX再次评估在无冗余蛋白质数据库中未能找到匹配的基因组基因间区域和ORF。然后由比对区域推断OFR。还注解了其它基因元件(tRNA、rRNA、scRNA、可转座元件)。从数据组中更改或除去位于已知基因元件内部或与其交叠的ORF。用于自动和手工注解基因产物的主要工具是Pedant-ProTMSequence Analysis Suite(Frishman等人,Bioinformatics,1744-57,2001)。将提取的蛋白质进行详尽的生物信息学分析,包括相似性搜索、蛋白质基元鉴定、以及蛋白质二级结构和特征预测,包括敏感ntg折叠识别。对每个ORF,依照MIPSFunctional Catalogue(Mewes等人,Nature,3877-65,1997)手工进行功能分类。
序列图1-20和25-32显示了多个调控和/或分泌相关蛋白质的序列。图1显示了来自克劳氏芽孢杆菌的SpoIIE的推导氨基酸序列(SEQ IDNO1)。图2显示了来自克劳氏芽孢杆菌的spoIIE的DNA序列(SEQID NO2)。期望生产菌株具有芽孢形成缺陷的特征。因此,通过实验来评估本发明开发过程中所鉴定的克劳氏芽孢杆菌的芽孢形成特征。
枯草芽孢杆菌能够在存在巨大环境压力时进入芽孢形成,诸如极度缺乏营养。作出这一决定后触发了转向芽孢形成发育状态的非常精细且费能的转变。芽孢形成所需要表达的超过50种基因处于8种芽孢形成控制基因的控制之下,即spoOA、spoOB、spoOIE、spoOF、spoOH、spoOJ、spoOK、和spoOL,其中spoOA是最关键的控制因子。芽孢形成控制基因的突变容许细胞不顾所处环境而不进入芽孢形成并继续生成异源和/或同源蛋白质。尽管并不想将本发明限制于任何具体的机制或理论,然而相信克劳氏芽孢杆菌spoIIE基因以与枯草芽孢杆菌同系物相似的方式发挥功能。因此,设想通过突变克劳氏芽孢杆菌的spoIIE基因来生成芽孢形成缺陷的有益菌株。
图3显示了来自克劳氏芽孢杆菌的DegS(SEQ ID NO29)和DegU(SEQ ID NO3)的推导氨基酸序列,而图4A显示了来自克劳氏芽孢杆菌的degS(SEQ ID NO30)和degU(SEQ ID NO4)的DNA编码序列。枯草芽孢杆菌的deg S和degU基因属于二元调控系统家族,且编码参与控制不同细胞功能表达的蛋白质,包括降解酶合成、DNA摄取能力和鞭毛存在。在这两种基因中都鉴定了两类突变。一类突变导致受调控基因(即受degU系统调控的基因)的表达降低(degU-突变),而另一类导致表达增强(degU(Hy)突变)(Msadeck等人,在Sonenshein等人编的《Bacillus subtillus and Other Gram-Positive Bacteria》,美国微生物学学会,华盛顿特区,第729-745页,1993)。这第二类突变与多效性表型有关,在枯草芽孢杆菌中包括在存在葡萄糖的情况下形成芽孢的能力、缺乏鞭毛、且遗传能力降低。
已知几种芽孢杆菌生产菌株在degS或degU基因中携带一个或多个突变从而赋予菌株某些特征,诸如较低的分解抑制和较好的酶分泌。因此,试图为克劳氏芽孢杆菌degS和/或degU找到相似用途。因此,认为需要1)进行degS和/或degU基因的体外随机诱变,用这些诱变群取代这两种野生型基因或其中之一,并选择赋予上文所述表型的突变体;2)在天然DegU基因的残基中导入一个或多个突变,诸如H17X(X表示任何其它氨基酸)、T103X、E112X、V136X、等,其中“X”指任何氨基酸;和/或3)在天然DegS基因的残基中导入一个或多个突变,诸如V238X,其中“X”指任何氨基酸。将携带一个或多个这些突变的突变基因用于取代克劳氏芽孢杆菌中的野生型基因。另外,本发明涵盖提高磷酸化的任何degS和/或degU突变;和4)用多拷贝质粒所携带的或较强启动子所转录的克劳氏芽孢杆菌degS和/或degU基因转化该杆菌自身以获得这些基因的较高水平表达。在有些实施方案中,基因是野生型的;而在其它实施方案中,基因是突变型的。
本发明提供了另一种目的基因。图33和图34分别提供了“基因2627”的氨基酸序列(SEQ ID NO31)和DNA序列(SEQ ID NO32),它与来自嗜热脂肪芽孢杆菌的转录激活子基因nprA同源。在嗜热脂肪芽孢杆菌中,nprA基因位于编码中性蛋白酶nprS的基因邻近。已经观察到nprA基因的超表达(诸如将其克隆到多拷贝质粒中)提高了邻近的中性蛋白酶的表达(Nishiya和Imanaka,J.Bacteriol.,1724861-4869,1990)。因此希望在克劳氏中超表达基因2627,用多拷贝质粒所携带的或整合在染色体中的处于较强启动子转录控制下的基因2627转化克劳氏芽孢杆菌,以获得这种基因的较高表达水平。
Sec依赖性蛋白质转运途径负责将含有氨基末端信号序列的蛋白质转运穿过细胞质膜。Sec机制由细胞膜中的蛋白质通道(由SecY、SecE、SecG和SecDF(在枯草芽孢杆菌中)或SecD和SecF(在耐盐芽孢杆菌中)构成)和转运马达(SecA)组成。已知Sec机制使其未折叠状态的底物“穿过”膜。因此,这种机制本质上不能转运胞液中折叠的蛋白质。鉴定了来自克劳氏芽孢杆菌的这种转运系统的许多成分。
几乎所有的分泌型蛋白质都使用称为信号肽的氨基末端蛋白质延伸,它在蛋白质前体穿膜的靶向和转移中发挥重要作用,而且在穿膜过程中或之后立即被信号肽酶通过蛋白水解切除。新合成的蛋白质前体在细胞质中得到统称为“伴侣”(chaperone)的特定蛋白质的识别。这些伴侣防止要转移的多肽过早聚集或折叠而导致形成输出不相容的构象。
大多数输出蛋白是以未折叠构象通过一般分泌(Sec)途径转移的。细胞质伴侣和靶向因子(像与哺乳动物信号识别颗粒(SRP)54kDa亚基同源的Ffh蛋白质和与哺乳动物SRP受体α亚基同源的FtsY蛋白质)促进前蛋白靶向膜中的Sec移位酶。图5-20分别提供了克劳氏芽孢杆菌的FtsY、Ffh、SecA、SecD、SecE、SecF、SecG、和SecY的氨基酸序列和DNA序列。在这些图中,SecE、SecG和Ffh提供的是部分序列。然而,本发明意欲涵盖这些基因和多肽的完整序列。
在转移穿过膜后,信号肽被信号肽酶切除,这是由膜释放所转移蛋白质并将其分泌到培养基中的先决条件。因此,在有些实施方案中,目的蛋白具有需要切除的信号肽。本文鉴定的信号肽酶称为SipS、SipT、SipV、SipW(见图25-32)。设想任何上述蛋白质将找到与本领域已知直向同系物相似方式的用途。
杂交类似物在本发明的一个实施方案中,若蛋白质帮助新生蛋白质正确折叠或者由胞内转移至胞外环境,则将其称为“分泌相关蛋白”。在本发明的一个实施方案中,分泌相关蛋白是野生型蛋白质的变体,其中它与图5、7、9、11、13、15、17、19、21、23、25或27的任一氨基酸序列具有超过大约40%、更优选超过大约60%、更优选至少75%、更优选超过大约80%、甚至更优选超过大约85%且最优选超过大约90%的整体同源性。在有些实施方案中,同源性高达大约93-95%;或者在特别优选的实施方案中达到98%。
因此,本发明提供了用于检测革兰氏阳性多核苷酸同系物的方法,包括使基因组或cDNA来源的革兰氏阳性微生物核酸与编码克劳氏芽孢杆菌调控和/或分泌相关蛋白的核酸序列的部分或整个杂交。
本发明的范围还包括能够在中等至最高严谨度条件下与编码克劳氏芽孢杆菌调控和/或分泌相关蛋白的核苷酸序列杂交的革兰氏阳性微生物多核苷酸序列。
本发明的范围还包括能够在中等至最高严谨度条件下与编码图1-20和25-32克劳氏芽孢杆菌调控和/或分泌相关蛋白的任一核苷酸序列的部分或整个杂交且编码调控和/或分泌相关蛋白的新革兰氏阳性微生物多核苷酸序列。
另外,本领域已知的扩增方法,诸如聚合酶链式反应(PCR),可用于扩增克劳氏芽孢杆菌序列。在有些实施方案中,将来自编码图1-20和25-32克劳氏芽孢杆菌调控和/或分泌相关蛋白的任一核苷酸序列的至少大约10个核苷酸且多达大约60个核苷酸、优选大约12-30个核苷酸、且更优选大约20-25个核苷酸的核酸序列用作探针或PCR引物。
在另一个实施方案中,本发明提供了编码与野生型序列具有超过40%、超过45%、超过50%、超过55%、超过60%、超过65%、超过70%、超过75%、超过80%、超过85%、超过90%、超过95%、或超过98%同源性的调控和/或分泌相关蛋白的DNA序列。
杂合体本发明还提供了编码杂合分泌因子的核酸和包含杂合分泌因子的氨基酸序列。在这些实施方案中,杂合分泌相关因子保持相应克劳氏芽孢杆菌分泌相关因子的功能。在有些实施方案中,本发明提供了克劳氏芽孢杆菌与其它物种之间的杂合体,包括但不限于枯草芽孢杆菌。因此,在有些实施方案中,微生物包含克劳氏芽孢杆菌序列以及来自另一种生物体的序列,诸如枯草芽孢杆菌。
在一个实施方案中,直向同源序列包含来自单一直向同系物的序列。在另一个实施方案中,直向同源序列包含来自单一直向同系物的少于5种序列。在另一个实施方案中,直向同源序列包含来自两个直向同系物的序列。在另一个实施方案中,直向同源序列包含一个氨基酸。在另一个实施方案中,直向同源序列包含2个至5、10、15、20个氨基酸。在还有一个实施方案中,直向同源序列总计包含分泌因子序列的大约2%至大约50%。
在候选实施方案中,直向同源序列包含超过2个且少于5、10、15、20、25、30、35、40、45或50个氨基酸。在另一个实施方案中,与野生型克劳氏芽孢杆菌分泌因子相比,直向同源序列总计包含杂合分泌因子序列的少于大约50%。
目的蛋白本发明在增强胞内和/或胞外蛋白质生成方面特别有用。在有些实施方案中,蛋白质是同源的;而在其它实施方案中,蛋白质是异源的。本发明可用于生成多种蛋白质,包括但不限于激素、酶、生长因子、细胞因子、抗体、诸如此类。本发明具体可用于生成酶,包括但不限于水解酶,诸如蛋白酶、酯酶、脂肪酶、酚氧化酶、通透酶、淀粉酶、支链淀粉酶、纤维素酶、葡萄糖异构酶、漆酶和蛋白质二硫化物异构酶。然而,本发明还可用于生成激素,包括但不限于促卵泡激素、促黄体素、促肾上腺皮质激素释放因子、生长激素抑制素、促性腺激素、血管加压素、催产素、促红细胞生成素、胰岛素、诸如此类。
生长因子是结合细胞表面受体且主要结果为激活细胞增殖和/或分化的蛋白质。除了酶和激素,本发明还可用于生成生长因子,包括但不限于血小板衍生生长因子、表皮生长因子、神经生长因子、成纤维细胞生长因子、胰岛素样生长因子、转化生长因子、等。细胞因子是生长因子的独特家族。主要由白细胞分泌的细胞因子刺激体液和细胞免疫应答,以及激活吞噬细胞。细胞因子包括但不限于集落刺激因子、白介素(如IL-1[α和β]、IL-2至IL-13)和干扰素(α、β和γ)。人类白介素-3(IL-3)是包含133个氨基酸残基的15kDa蛋白质。IL-3是物种特异性集落刺激因子,刺激骨髓培养物形成巨核细胞、嗜中性粒细胞和巨噬细胞集落。
除了上述蛋白质,本发明还试图用于涉及抗体的实施方案。抗体包括但不限于希望大量生成的来自任何物种的免疫球蛋白。尤其优选的是抗体是人类抗体。免疫球蛋白可以来自任何类型(即IgG、IgA、IgM、IgE、或IgD)。
本发明在增强具有非极性或基本非极性羧基末端的蛋白质的生成和分泌方面特别有用。因此,设想包含信号肽和非极性或基本非极性羧基末端的蛋白质在本发明中找到具体用途。蛋白质可以是同源的或异源的。
在本发明的有些实施方案中,目的蛋白融合了信号肽。本发明特别涉及了来自两种分泌途径的信号肽。第一种途径是Sec依赖性途径。该途径已经详细表征,并且已经描述了许多推定的信号肽。本发明意欲涵盖所有Sec依赖性信号肽。具体实例包括但不限于AmyL和AprE序列。AmyL序列指α-淀粉酶的信号序列,而AprE指AprE信号肽序列(AprE是来自枯草芽孢杆菌的枯草杆菌蛋白酶(也称为碱性蛋白酶))。只要在宿主细胞中有功能(即指导目的蛋白进入分泌途径),就可以使用衍生自任何来源的任何信号序列。
宿主细胞本发明提供了用于在革兰氏阳性微生物诸如芽孢杆菌属成员中表达、生成和分泌期望蛋白质的宿主微生物和表达手段。
在一般实施方案中,本发明方法可用于增强胞内生成或经Sec依赖性分泌途径分泌的任何目的蛋白的表达和/或分泌。因此,可通过重组DNA方法融合Sec依赖性信号肽的任何目的蛋白都可用于本发明。
用编码一种或多种本发明克劳氏芽孢杆菌分泌因子的核苷酸序列转化宿主细胞,使得宿主细胞能够增强目的蛋白的分泌。在有些实施方案中,目的蛋白是内源的;而在其它实施方案中,目的蛋白是异源的。在有些实施方案中,目的蛋白是天然目的蛋白融合Sec依赖性信号序列的嵌合蛋白。在一个优选实施方案中,克劳氏芽孢杆菌分泌因子基因可操作连接启动子。启动子可以是组成性的或可诱导的。在一个实施方案中,启动子是枯草芽孢杆菌aprE启动子。然而,优选启动子是宿主细胞中负责直向同系物基因转录的启动子。例如,在枯草芽孢杆菌中secA启动子可用于表达克劳氏芽孢杆菌secA基因,枯草芽孢杆菌secY启动子可用于表达克劳氏芽孢杆菌secY基因,等等。
还设想了通过改变可诱导启动子的诱导水平,有可能调控基因产物的表达,从而调控目的蛋白的分泌。
在有些实施方案中,宿主细胞是革兰氏阳性细胞。在优选实施方案中,革兰氏阳性细胞是芽孢杆菌属的成员。在用于本文时,芽孢杆菌属包括本领域技术人员知道的所有成员,包括但不限于枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、解淀粉芽孢杆菌、耐盐芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、巨大芽孢杆菌、灿烂芽孢杆菌、和苏云金芽孢杆菌。在有些特别优选的实施方案中,芽孢杆菌属成员选自下组枯草芽孢杆菌、克劳氏芽孢杆菌、和地衣芽孢杆菌。
DNA构建物本发明提供了用于在宿主微生物中增强期望的异源或同源蛋白质的生成和分泌的表达系统。可以通过任何合适方法将DNA构建物的各种成分装配起来,包括PCR和/或连接。应当注意的是,只要DNA构建物具有期望的最终结构,就可以使用任何技术。在优选实施方案中,将DNA构建物整合入载体,包括但不限于整合性单拷贝载体、整合性可扩增载体或多拷贝载体。
启动子如上文所述,启动子可以是可诱导的或组成性的。用于本文的优选启动子是与克劳氏芽孢杆菌分泌因子对应的来自宿主细胞的启动子。或者,可以使用与分泌因子通常相关的克劳氏芽孢杆菌启动子。在另一个实施方案中,启动子可以是在宿主细胞中有功能而并非克劳氏芽孢杆菌分泌因子的天然启动子的任何启动子。
信号序列/目的蛋白在本发明的有些优选实施方案中,载体包含至少一个拷贝的编码革兰氏阳性微生物分泌因子的核酸,且优选包含多个拷贝。在其它实施方案中,载体包含整合到宿主细胞基因组中的序列(如克劳氏芽孢杆菌),优选单一拷贝。在其它实施方案中,提供了携带这两种基因(即天然和导入序列)的宿主细胞。在其它实施方案中,本发明提供了包含天然目的基因的载体;而在其它实施方案中,载体包含杂合序列。因此,本发明提供了多个实施方案,其中导入序列、杂合体、和天然序列以任何合适组合存在。
在有些优选实施方案中,革兰氏阳性微生物是芽孢杆菌。在另一个优选实施方案中,革兰氏阳性微生物是枯草芽孢杆菌。在一个优选实施方案中,将编码克劳氏芽孢杆菌分泌相关因子或其片段或融合蛋白的多核苷酸或者编码所述分泌因子氨基酸变体的多核苷酸同系物序列用于生成分别在革兰氏阳性宿主细胞中指导分泌相关因子或其氨基酸变体表达的重组DNA分子。在一个优选实施方案中,宿主细胞属于芽孢杆菌属。在另一个优选实施方案中,宿主细胞是枯草芽孢杆菌。
正如本领域技术人员将理解的,生成具有非天然存在密码子的多核苷酸序列可能是有益的。因此,例如,在有些实施方案中,选择了特定革兰氏阳性宿主细胞偏爱的密码子(参阅Murray等人,Nuc.AcidsRes.,17477-508,1989)以提高表达速率或生成具有期望特性的重组RNA转录本,诸如与由天然存在序列生成的转录本相比较更长的半衰期。
可用于本发明的经改变的克劳氏芽孢杆菌分泌因子多核苷酸序列包括导致多核苷酸编码相同或功能相当分泌因子同系物的删除、插入、和/或不同核苷酸残基的替代。在候选实施方案中,所编码蛋白质包含产生沉默变化并导致功能相当克劳氏芽孢杆菌分泌因子变体的氨基酸残基删除、插入和/或替代。只要变体保持调控分泌的能力,就可以根据残基极性、电荷、可溶性、疏水性、亲水性、和/或两性性质的相似性来进行慎重的氨基酸替代。例如,带负电的氨基酸包括天冬氨酸和谷氨酸;带正电的氨基酸包括赖氨酸和精氨酸;而不带电的极性头部基团具有相似亲水性数值的氨基酸包括亮氨酸、异亮氨酸、缬氨酸;甘氨酸、丙氨酸;天冬酰胺、谷氨酰胺;丝氨酸、苏氨酸、苯丙氨酸、和酪氨酸。
在有些实施方案中,本发明的克劳氏芽孢杆菌分泌因子多核苷酸进行了改造以更改基因产物的克隆、加工和/或表达。例如,可以使用本领域众所周知的技术来导入突变(如通过定点诱变来插入新的限制位点、改变糖基化模式、和/或改变密码子偏爱)。
芽孢杆菌宿主细胞的转化在本发明的有些实施方案中,通过能够在宿主细胞内复制的表达载体将编码至少一种目的多肽的核酸导入宿主细胞。适用于芽孢杆菌的复制和整合质粒在本领域是已知的(参阅如Harwood和Cutting编《Molecular Biological Methods for Bacillus》,John Wiley & Sons,1990,特别是第3章;适用于枯草芽孢杆菌的复制质粒,包括第92页所列)。虽然存在技术障碍,本领域技术人员知道有几种策略可用于在芽孢杆菌中直接克隆DNA。
本领域知道的用于转化芽孢杆菌的方法包括诸如质粒标记挽救转化等方法,涉及由携带部分同源驻留型质粒的感受态细胞摄取供体质粒(Contente等人,Plasmid,2555-571,1979;Haima等人,Mol.Gen.Genet.,223185-191,1990;Weinrauch等人,J.Bacteriol.,1541077-1087,1983;和Weinrauch等人,J.Bacteriol.,1691205-1211,1987)。在该方法中,在模拟染色体转化的过程中,导入的供体质粒与驻留型“辅助”质粒的同源区进行重组。
本领域还知道涉及通过原生质体转化进行转化的另一种方法(关于枯草芽孢杆菌参阅Chang和Cohen,Mol.Gen.Genet.,168111-115,1979;关于巨大芽孢杆菌参阅Vorobjeva等人,FEMS Microbiol.Lett.,7261-263,1980;关于解淀粉芽孢杆菌参阅Smith等人,Appl.Env.Microbiol.,51634,1986;关于苏云金芽孢杆菌参阅Fisher等人,Arch.Microbiol.,139213-217,1981;关于球形芽孢杆菌(Bacillussphaericus)参阅McDonald,J.Gen.Microbiol.,130203,1984;而关于幼虫芽孢杆菌(Bacillus larvae)参阅Bakhiet等人,49577,1985)。另外,Mann等人(Mann等人,Curr.Microbiol.,13131-135,1986)描述了芽孢杆菌原生质体的转化,而Holubova(Holubova,Microbiol.,3097,1985)描述了使用含DNA的脂质体将DNA导入原生质体的方法。在有些优选实施方案中,使用标记基因来指示宿主细胞中是否存在目的基因。
除了这些方法,在其它实施方案中,直接转化宿主细胞。在“直接转化”中,在将DNA构建物导入宿主(即芽孢杆菌)细胞前,不使用中间细胞对DNA构建物进行扩增或其它处理。将DNA构建物导入宿主细胞包括本领域知道的将DNA导入宿主细胞而无需插入质粒或载体的那些物理和化学方法。这些方法包括但不限于使用感受态细胞以及使用“人工手段”诸如氯化钙沉淀、电穿孔、等等来将DNA导入细胞。因此,本发明可用于裸露DNA、脂质体、诸如此类。在其它实施方案中,DNA构建物与质粒共转化而无需插入质粒。
载体/质粒为了在细胞中表达、生成和/或分泌目的蛋白,在适合于蛋白质表达的条件下,将包含至少一个拷贝(优选多个拷贝)的编码异源和/或同源蛋白质的核酸的表达载体转化到细胞中。在有些特别优选的实施方案中,将编码目的蛋白的序列(以及载体中包含的其它序列)整合到宿主细胞基因组中;而在其它实施方案中,质粒在细胞内保持自主染色体外元件。因此,本发明既提供了染色体外元件又提供了整合到宿主细胞基因组中的导入序列。
在本发明的有些实施方案中,在与目的蛋白相同的载体上将本发明的任何一种或多种分泌因子导入宿主细胞。或者,在其它实施方案中,在分开的载体上将本发明的任何一种或多种分泌因子导入宿主细胞。在分泌因子位于分开载体上的有些实施方案中,与包含目的蛋白的载体同时将载体用于转化宿主细胞。在候选实施方案中,顺序(即先用一种载体然后用第二种载体)转化宿主细胞。
在优选实施方案中,用于在革兰氏阳性微生物中表达本发明分泌因子的表达载体包含至少一种与革兰氏阳性分泌因子相关的启动子,该启动子在宿主细胞中有功能。在本发明的一个实施方案中,启动子对于所选择分泌因子是野生型启动子;而在本发明的另一个实施方案中,启动子与分泌因子是异源的,但在宿主细胞中仍有功能。
与通过重组DNA方法导入的编码期望蛋白质或多肽的异源核酸相关的其它启动子也可用于本发明。在本发明的一个实施方案中,宿主细胞能够过度表达异源蛋白或多肽,而包含一种或多种分泌因子的核酸是重组导入的。在本发明的一个优选实施方案中,将编码克劳氏芽孢杆菌分泌相关蛋白的核酸稳定整合到微生物基因组中。在另一个实施方案中,宿主细胞经改造过度表达本发明的分泌因子,而编码异源蛋白或多肽的核酸是通过重组DNA技术导入的。本发明涵盖能够过度表达本领域技术人员知道的其它分泌因子和/或本领域技术人员知道的或将来会鉴定的其它分泌因子的革兰氏阳性宿主细胞。
在一个优选实施方案中,表达载体包含多克隆位点盒,优选包含至少一个对载体而言独特的限制性内切核酸酶位点,以便于容易操作核酸。在一个优选实施方案中,载体还包含一种或多种可选择标记(如抗菌剂标记诸如红霉素、放线菌素、氯霉素、和四环素)。在另一个实施方案中,使用本领域已知技术将多拷贝复制性质粒用于将质粒整合到芽孢杆菌基因组DNA中。
培养宿主细胞用于转化子的表达和鉴定尽管标记基因表达的存在/缺乏指示目的基因也存在,还是应当确认其存在和表达情况。例如,在编码分泌相关蛋白的核酸插入标记基因序列之内的有些实施方案中,通过标记基因功能的缺乏来鉴定包含插入片段的重组细胞。或者,可以将标记基因与编码分泌因子的核酸串联安置且处于单一启动子的控制之下。标记基因应答诱导或选择的表达常常也指示分泌因子的表达。
或者,可以通过本领域技术人员知道的多种方法来鉴定包含分泌因子的编码序列和/或表达目的蛋白的宿主细胞。这些方法包括但不限于DNA-DNA或DNA-RNA杂交以及蛋白质生物测定法或免疫鉴定技术,包括用于检测和/或定量核酸或蛋白质的基于膜、基于溶液、或基于芯片的技术。
可以通过DNA-DNA或DNA-RNA杂交或使用由编码任何一种分泌相关蛋白的克劳氏芽孢杆菌多核苷酸衍生的探针、部分或片段的扩增来检测分泌相关蛋白多核苷酸序列的存在。
测量基因产物本领域技术人员知道多种测定法可用于检测和测量分泌性多肽的活性。具体而言,对于蛋白酶而言有通过280nm吸光度测量或使用Folin法(参阅Bergmeyer等人,《Methods of Enzymatic Analysis》,第5卷,“Peptidases,Proteinases and their Inhibitors”,Verlag Chemie,Weinheim,1984)比色测量的基于由酪蛋白或血红蛋白释放的酸溶性肽的测定法。本领域知道的其它测定法包括呈色底物的增溶(Ward,在Fogarty编的《Microbial Enzymes and Biotechnology》中,AppliedScience,伦敦,1983,第251-317页)。
用于测定宿主细胞中异源或同源蛋白质分泌水平和检测所分泌蛋白质的方法包括使用对蛋白质特异的多克隆或单克隆抗体的方法。实例包括酶联免疫吸附测定法(ELISA)、放射免疫测定法(RIA)、荧光免疫测定法(FIA)、和荧光激活细胞分拣法(FACS)。这些和其它测定法在本领域是众所周知的(参阅如Maddox等人,J.Exp.Med.,1581211,1983)。在本发明的一个优选实施方案中,使用本文提供的方法和组合物引起的分泌高于使用相同方法和组合物但未导入肽转运蛋白或肽转运操纵子基因产物的情况。
蛋白质纯化在优选实施方案中,在适合于表达和由细胞培养液回收所编码蛋白质的条件下,培养经编码异源或同源蛋白质的多核苷酸序列转化或者内源具有所述蛋白质的细胞。在有些实施方案中,其它重组构建物可以将异源或同源多核苷酸序列连接至编码便于纯化可溶性蛋白质的多肽结构域的核苷酸序列(如多种标签)上(Kroll等人,DNA Cell.Biol.,12441-53,1993)。
这些促进纯化的结构域包括但不限于金属螯合肽诸如容许在固定金属上纯化的组氨酸-色氨酸模块(Porath,Prot.Expr.Purif.,3263-281,1992)、容许在固定免疫球蛋白上纯化的蛋白A结构域、和FLAGS延伸/亲和纯化系统中利用的结构域(Immunex公司,西雅图,华盛顿州)。在纯化结构域与异源蛋白之间包含可切割接头序列诸如因子XA或肠激酶(Invitrogen,圣迭戈,加利福尼亚州)可用于促进纯化。
综上所述,显然本发明提供了经遗传改造而在至少一个编码分泌相关蛋白的基因中包含优选的不可逆突变(包括基因取代)的革兰氏阳性宿主微生物。在有些实施方案中,宿主微生物包含额外的蛋白酶删除,诸如成熟枯草杆菌蛋白酶和/或成熟中性蛋白酶的删除(参阅如美国专利号5,264,366)。在有些优选实施方案中,微生物还经遗传改造而生成期望蛋白或多肽。在一个优选实施方案中,革兰氏阳性微生物是芽孢杆菌属的成员。
本文收入上文说明书提及的所有发表物和专利作为参考。对于本领域熟练技术人员显而易见的是,可以对本发明所述方法和系统进行多种修改和更改而不偏离本发明的范围和精神。尽管已经参照具体的优选实施方案而描述本发明,应当理解的是本发明不应当过度限于这些具体实施方案。事实上,对于本领域和/或相关领域熟练技术人员显而易见的是,意欲将对用于执行本发明的所述模式进行的多种修改归于本发明的范围之内。
权利要求
1.包含克劳氏芽孢杆菌(Bacillus clausii)分泌因子的核苷酸序列,其中所述分泌因子选自下组SecA、SecD、SecE、SecF、SecG、SecY、Ffh、FtsY、SipS、SipT、SipV和SipW。
2.权利要求1的核苷酸序列,其中所述核苷酸序列选自下组SEQID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO8、SEQ ID NO6、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26和SEQ ID NO28。
3.在低严谨度、中严谨度和高严谨度的严谨度条件下保持与权利要求2的核苷酸序列杂交的可杂交核苷酸序列。
4.包含权利要求2的核苷酸序列的至少一部分的载体。
5.权利要求4的载体,还包含编码至少一种目的多肽的核苷酸序列。
6.包含权利要求4的载体的表达盒。
7.包含权利要求5的载体的表达盒。
8.包含权利要求7的表达盒的芽孢杆菌属的宿主细胞。
9.包含权利要求8的表达盒的芽孢杆菌属的宿主细胞。
10.权利要求9的宿主细胞,其中所述细胞分泌至少一种选自下组的克劳氏芽孢杆菌分泌因子SecA、SecD、SecE、SecF、SecG、SecY、Ffh、FtsY、SipS、SipT、SipV和SipW。
11.权利要求10的分泌因子,其中所述分泌因子包含选自下组的氨基酸序列SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO7、SEQ ID NO5、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25和SEQ ID NO27。
12.权利要求11的分泌因子,其中所述氨基酸包含选自下组的氨基酸序列的片段SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO7、SEQ ID NO5、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25和SEQ ID NO27。
13.权利要求11的分泌因子,其中所述氨基酸包含选自下组的氨基酸序列的变体SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO7、SEQ ID NO5、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25和SEQ ID NO27。
14.包含克劳氏芽孢杆菌转录因子的核苷酸序列,其中所述转录因子选自下组DegS、DegU和Bcl2627。
15.权利要求14的核苷酸序列,其中所述核苷酸序列选自下组SEQ ID NO4、SEQ ID NO30和SEQ ID NO32。
16.在低严谨度、中严谨度和高严谨度的严谨度条件下保持与权利要求15的核苷酸序列杂交的可杂交核苷酸序列。
17.包含权利要求15的核苷酸序列的至少一部分的载体。
18.权利要求17的载体,还包含编码至少一种目的多肽的核苷酸序列。
19.包含权利要求17的载体的表达盒。
20.包含权利要求18的载体的表达盒。
21.包含权利要求20的表达盒的芽孢杆菌属的宿主细胞。
22.包含权利要求21的表达盒的芽孢杆菌属的宿主细胞。
23.权利要求22的宿主细胞,其中所述细胞分泌至少一种克劳氏芽孢杆菌转录因子。
24.权利要求23的转录因子,其中所述转录因子包含选自下组的氨基酸序列SEQ ID NO3、SEQ ID NO29和SEQ ID NO31。
25.权利要求24的转录因子,其中所述氨基酸包含选自下组的氨基酸序列的片段SEQ ID NO3、SEQ ID NO29和SEQ ID NO31。
26.权利要求24的转录因子,其中所述氨基酸包含选自下组的氨基酸序列的变体SEQ ID NO3、SEQ ID NO29和SEQ ID NO31。
27.包含克劳氏芽孢杆菌芽孢形成因子SpoIIE蛋白质的核苷酸序列。
28.权利要求27的核苷酸序列,其中所述序列包含SEQ ID NO2。
29.在低严谨度、中严谨度和高严谨度的严谨度条件下保持与权利要求28的核苷酸序列杂交的核苷酸序列。
30.包含权利要求28的核苷酸序列的至少一部分的载体。
31.权利要求30的载体,还包含编码至少一种目的多肽的核苷酸序列。
32.包含权利要求30的载体的表达盒。
33.包含权利要求31的载体的表达盒。
34.包含权利要求32的表达盒的芽孢杆菌属的宿主细胞。
35.包含权利要求33的表达盒的芽孢杆菌属的宿主细胞。
36.权利要求35的宿主细胞,其中所述细胞分泌至少一种克劳氏芽孢杆菌芽孢形成因子。
37.权利要求36的芽孢形成因子,其中所述芽孢形成因子包含氨基酸序列SEQ ID NO1。
38.权利要求37的芽孢形成因子,其中所述氨基酸包含SEQ IDNO1所示氨基酸序列的片段。
39.权利要求37的芽孢形成因子,其中所述氨基酸包含SEQ IDNO1所示氨基酸序列的变体。
40.用于生成目的蛋白的方法,包括下列步骤(a)在适当条件下培养芽孢杆菌宿主细胞,其中所述芽孢杆菌宿主细胞包含编码目的蛋白的核苷酸序列,且其中所述宿主细胞已经用核苷酸序列进行了转化,所述核苷酸序列编码包含选自下组的氨基酸序列的蛋白质SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29和31;和(b)容许所述目的蛋白表达。
41.权利要求40的方法,其中所述氨基酸序列与具有选自下组的氨基酸序列的蛋白质的序列至少85%相同SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29和31。
42.权利要求41的方法,其中所述氨基酸序列包含选自下组的氨基酸序列的变体氨基酸序列SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29和31。
43.权利要求41的方法,其中所述氨基酸序列包含选自下组的氨基酸序列的片段氨基酸序列SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29和31。
44.权利要求41的方法,其中所述氨基酸序列包含杂合克劳氏芽孢杆菌序列。
全文摘要
本发明涉及经遗传操作而生成所表达蛋白质的能力得到改变的细胞。具体而言,本发明涉及具有外源核酸序列导入其中的革兰氏阳性微生物,以及用于在这些宿主细胞中生成蛋白质的方法,诸如芽孢杆菌属的成员。更具体的说,本发明涉及目的多肽的表达、生成和分泌,以及经遗传操作而生成所表达蛋白质的能力得到改变的细胞。具体而言,本发明提供了微生物对所选择多肽的增强表达。
文档编号C12Q1/68GK1639183SQ03804758
公开日2005年7月13日 申请日期2003年2月6日 优先权日2002年2月8日
发明者E·福拉里, A·范基姆内德 申请人:金克克国际有限公司
文档序号 : 【 447254 】

技术研发人员:E.福拉里,A.范基姆内德
技术所有人:金克克国际有限公司

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
E.福拉里A.范基姆内德金克克国际有限公司
用于强化橙汁的柑桔外皮粉末的制造方法及其产品的制作方法 糖尿病用组合物的制作方法
相关内容