首页  专利技术  食品,饮料机械,设备的制造及其制品加工制作,储藏技术

蛋白酶检测系统的制作方法

2025-09-23 14:40:03 502次浏览
专利名称:蛋白酶检测系统的制作方法
技术领域
本发明一般涉及细胞内蛋白酶检测系统。优选的系统包括嵌合底物蛋白质,其包括共价连接成分1)至少一种任选地掩蔽信号蛋白质(optionally mask signal protein);2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。本发明有广谱重要的应用,包括用于筛选以检测阻断一种或多种人类病原体产生的蛋白酶的化合物。
背景技术
蛋白酶是切割蛋白质特定肽键的酶。在生物组织中,蛋白酶有特异的蛋白水解活性,且其抑制剂参与调节多种生物功能。在多种生物过程中,生物必需的功能可通过导致活化蛋白质形成的蛋白酶对聚蛋白前体的蛋白酶剪切而被活化和调节。实例包括血液凝固、免疫防御过程、蛋白质通过细胞内膜的选择转运、宿主细胞中的病毒增殖等。因此,蛋白酶是特异的蛋白酶抑制剂作为新药开发中的主要靶标。
病毒蛋白酶抑制剂是作为新药开发的蛋白酶抑制剂的典型实例。由于病毒蛋白酶参与聚蛋白前体通过蛋白酶剪切的活化,因此蛋白酶是宿主细胞中病毒增殖起始及复制病毒正确衣壳装配的重要成分。
蛋白酶抑制剂已被开发以阻断导致获得性免疫缺陷综合症(AIDS)的HIV的增殖。例如安泼那韦(amprenavir)、那非那韦(nelfinavir)、印地那韦(indinavir)、利托那韦(ritonavir),和斯奎那韦(squinavir)已被FDA批准作为抑制HIV蛋白酶的药物,洛匹那韦(lopinavir)和依法韦仑(efavirenz)处于临床研究中。给予那些药物的患者显示HIV颗粒数降低到该药物疗法前的约10%。这显示蛋白酶抑制剂可用作有效的药物。但是,报道了这些治疗中的几种副作用(Miller,T.L.等人,2001),和报道了在长期治疗的情况下携带突变蛋白酶基因的突变体(Jacobsen,H等人,1996;Cote,H等人,2001)。因此,需要开发能特异阻断多种突变HIV病毒增殖的更多不同的蛋白酶抑制剂。
已经研究了蛋白酶抑制剂对其他人和动物病毒的抑制,例如HCV(Kasai,N.等人,2001)和HERV(Kuhelj,R.等人,2001)。基于同样的概念还进行了植物病毒病的研究。例如,通过在转基因植物中表达作为蛋白酶抑制剂的重组蛋白质,研究了由TEV(烟草蚀刻病毒)和PVY(马铃薯Y病毒)产生的聚蛋白的蛋白酶剪切抑制(Gutierres-Campos,R.等人,1999)。还进行了植物病毒蛋白酶蛋白水解位点鉴定的研究(Yoon,H.Y.等人,2000)。
已有多种尝试开发蛋白酶抑制剂。例如,多数情况下,在蛋白酶、其底物肽或蛋白质,和候选化学物质体外混合反应后,通过使用电泳检测底物切割进行蛋白酶抑制剂的筛选。由于已认识到重要的蛋白水解位点,因此氨基酸序列与蛋白水解位点相似的肽被合成并用于寻找蛋白酶抑制剂(Kettner,C.A.和Korant,B.D.,1987)。由于蛋白质三级结构的确定变得更容易并且还可能使用计算机模拟设计化学物质,所以已进行了许多研究以设计和合成与酶活性位点特异结合的分子(Wlodawer,A.和Erickson,J.W.,1993;Rodgers,J.D.等人,1998;Mardis,K.L.等人,2001)。并且,尝试使用荧光标记底物以提高蛋白酶活性检测的效率(Ermolief,J.等人,2000),并使用大肠杆菌(E.Coli)周质中表达的抗体片段作为蛋白酶抑制剂以扩大蛋白酶抑制剂的骨架结构(Kasai,N.等人,2001)。
现在使用的大多数蛋白酶活性筛选方法在体外进行。可是,在体外筛选方法中,不可能检测多种复杂的效果,例如候选药物转运入细胞的效率、候选药物在细胞中的稳定性和细胞毒性等。因此在体外筛选方法选择的候选药物活体检测前,需要许多另外的费时的实验。所以,需要开发更简单和更通用的体内筛选方法以检测候选蛋白酶抑制剂的细胞功能并筛选更特异的蛋白酶抑制剂。
已在多种体内或类似体内的条件下尝试检测蛋白酶剪切和筛选蛋白酶抑制剂。
例如,有使用存在于分离囊泡(vesicle)中的蛋白酶方法的报道(Hook,V.Y.,2001)。其他公开的方法包括使用组织切片的原位酶谱法(Yi,C.-F.等人,2001),和用蛋白酶的多肽底物处理细胞的方法(Kuhelj,R.等人,2001)。
然而对这些方法和相关方法缺点的认识渐增。
例如,多数方法据信仅近似体内环境。因此,这样的方法不一定反映可实质影响蛋白酶功能的细胞内环境。
另外,多数先前的的方法据信在敏感性、选择性,和便利性上有局限。据信这些缺点和其他缺点已经减低了过去筛选尝试的效率和可信度。
需要有更好的检测细胞内蛋白酶的体内方法,其更敏感和更易于使用。尤其需要有容易适合检测哺乳动物和病毒蛋白酶抑制剂的体内方法。

发明内容
本发明涉及细胞和组织内蛋白酶检测系统。在一个实施方案中,该系统包括至少一种嵌合蛋白质,其包括共价连接成分1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。优选的嵌合蛋白质有作为“分子标志(molecularbeacon)”的功能,其在蛋白酶存在的细胞内改变位置。本发明有广泛的应用,包括用于体内筛选以检测抑制或阻断人类病原体相关蛋白酶的化合物。
本发明优选的用途要求受试细胞或组织中包括至少一种活性蛋白酶。适当的蛋白酶包括那些细胞内源的,例如,那些公知的“持家”酶。其他适当的蛋白酶包括那些细胞或组织非自然发生的。例如,这样的蛋白酶可以是病原体感染产生的。另外,该蛋白酶在细胞或组织内的存在可以是欲在其中引入蛋白酶的实验操作的结果。在这些实施方案中,嵌合蛋白质(或其可检测的成分)亚细胞位置的变化被作为细胞或组织内存在蛋白酶的指示。因此本发明提供作为空间敏感的“分子标志”,其在细胞或组织内的定位是存在(或缺失)受试蛋白酶的指示。
显而易见,本发明是一个有广泛应用的发明。即,它可用于检测细胞或组织内广谱的蛋白酶。优选的蛋白酶能切割(水解),尤其优选,在嵌合蛋白质中的切割位点。有时此处的嵌合蛋白质将作为嵌合底物蛋白质以指示目的蛋白酶的切割潜能。位点特异的切割理解为通常在特异的切割位点或其附近分裂嵌合分子,并从中释放至少一种成分,例如,可选地掩蔽信号蛋白质、切割位点,或可检测的氨基酸序列。优选的释放包括至少一种可检测的氨基酸序列,但根据用途可包括嵌合分子的其他成分。
嵌合分子一种或多种成分更优选的释放是为了提供空间敏感的分子标志。例如,在一个实施方案中,可检测的氨基酸序列从嵌合底物蛋白质中释放并基本上自由地在整个宿主细胞或组织扩散。该扩散信号易于检测并可作为蛋白酶存在的指示。然而在另一发明实施方案中,一种或多种可检测的氨基酸序列的释放与通过可选地掩蔽信号蛋白质指导分子到另一亚细胞位置相关。在本发明的这个实施例中,更集中和更高强度的信号作为蛋白酶的指示。
在本发明的一些实施方案中,甚至在细胞或组织内存在蛋白酶的情况下,嵌合分子保持至少一种可检测的氨基酸序列是有用的,优选以符合读框的融合。在这一情况下,当蛋白酶存在时,通过参照可检测的氨基酸序列可监测嵌合分子的定位。在多数情况下,可检测的氨基酸序列(单独或与另一可检测的嵌合蛋白质成分结合)的释放和后续的亚细胞定位,易于通过一种或组合常规检测策略原位显像。
因此本发明的一个目的是将目的蛋白酶的存在和优选其活性与嵌合蛋白质的定位改变结合起来。该改变因信号位置(并优选强度)的增加或减少是易于检测的。作为实例,可检测的标记嵌合蛋白质(或一种或多种成分)的亚细胞分布最初可限制在相对小的区域,例如细胞器。该限制产生相对高的信号强度。然而在特异切割嵌合蛋白质的蛋白酶存在的情况下,该分布受到更少的束缚甚至扩散。限制的缺少产生相对低的信号强度。在这个实例中,通过蛋白酶的特异切割可与嵌合蛋白质(或标记成分)从细胞器到更大空间(例如胞质溶胶)的运动相关。另外,在活性蛋白酶的存在通过本发明与标记蛋白质从胞质溶胶到更狭窄空间(例如,细胞器或液泡)的亚细胞移动相关的实施方案中,信号强度可突然升高。在另一实施方案中,活性蛋白酶的存在可与很少或没有变化的信号强度相关。替代的,通过标记蛋白质从一个亚细胞位置向另一个亚细胞位置的移动来监测这种变化,例如,嵌合底物蛋白质从一个细胞器到另一细胞器或液泡的移动。
本发明的实施提供了许多重要的优点。
例如,本发明提供嵌合蛋白质,其被受试蛋白酶特异切割产生标记(和非标记)组分蛋白质。本发明优选的实施将亚细胞位置,并且优选地,标记蛋白质的信号强度与受试蛋白酶的存在(或缺失)相关。这一“双因子”检测策略提供高度灵敏和可信的蛋白酶检测。即,细胞或组织内的标记蛋白质的位置和其信号强度均可作为活性蛋白酶存在的指示。本发明还是高度选择性的,即,其容易鉴别细胞内不同的蛋白酶或同工酶的存在及同一蛋白酶无活性和活性形式的存在。本发明优选的嵌合蛋白质可用可获得的试剂和标准的重组操作制备,其使本发明易于应用。
另外,本发明是灵活的,可用于检测多种细胞中的活性蛋白酶,尤其是真核细胞,包括那些衍生自植物、酵母、真菌、动物,和昆虫的细胞。优选的嵌合蛋白质对细胞或组织中的基因表达影响很小,因此避免了潜在复杂的遗传影响。本发明还适宜许多种适当的蛋白酶切割位点和可检测的氨基酸序列。
因此,一方面,本发明提供细胞内蛋白酶检测系统,该系统优选包括至少一种上述的嵌合蛋白质。对于嵌合蛋白质,只要达到预期的结果,每一种蛋白质成分(可选地掩蔽信号蛋白质、蛋白酶切割位点,和可检测的序列)的连接顺序并不重要。然而典型地,连接顺序从一种成分的N末端开始并在另一种成分的C末端结束。
如前所述,嵌合蛋白质包括共价连接成分1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。优选地,该嵌合蛋白质包括少于约10种可选地掩蔽信号蛋白质,更优选少于约5种上述的蛋白质,一般约1、2,或3种这样的信号蛋白质。短语“可选地掩蔽”意指信号蛋白质的预期功能(一般是运输信号)被掩蔽或未掩蔽。术语“掩蔽”意指通过共价连接至少一种掩蔽序列到信号蛋白质上,可逆或不可逆地,基本上降低或优选地完全封闭信号蛋白质的预期功能。一般优选的被掩蔽的信号蛋白质包括约1种到约2种这样的掩蔽序列。一般优选的掩蔽序列由少于约200个氨基酸的残基组成,优选少于约50个残基,对于多数应用优选约3到约20个残基。多数发明应用特别优选的掩蔽序列为至少一种位点特异的蛋白酶切割位点,例如,1、2、3或4种这样的位点。
根据本发明另外的优选嵌合蛋白质包括,以共价连接成分,少于约10种蛋白酶特异的切割位点,优选少于约5种位点,其中经常优选约1、2、3,或4种这样的位点。
还进一步优选的嵌合蛋白质包括,作为共价连接成分,少于约10种可检测的氨基酸序列,优选少于约5种所述序列,其中一般优选约1、2、3,或4种这样的可检测的氨基酸序列。在一个实施方案中,该序列是荧光、磷光或化学发光的蛋白质或其功能片段。可检测的氨基酸序列的功能片段能以与全长序列基本上同样的敏感性被检测。在另一实施方案中,该氨酸序列是酶或其催化片段,其通过与适当的底物接触,可产生荧光、磷光或化学发光。来自可检测氨基酸序列的信号的检测和可选地定量的方法是本领域公知的并在下面更详细地解释。
另一方面,本发明提供基本上纯的嵌合蛋白质,其包括共价连接成分1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。
再一方面,本发明涉及核酸,其包括编码嵌合蛋白质的序列。在一个实施方案中,编码的嵌合蛋白质包括共价连接成分1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。
本发明还提供载体,其包括编码如此处所公开嵌合蛋白质的核酸。还提供细胞例如植物、酵母、动物,真菌或昆虫细胞,其包括并优选还表达嵌合蛋白质。
本发明还提供细胞内蛋白酶检测试剂盒。在一个实施方案中,试剂盒包括此处描述的系统,该系统优选包括至少一种a)如此处所描述的嵌合蛋白质;和b)包含编码此处公开嵌合蛋白质的任一核酸的载体。可选地,试剂盒还可包括包含编码嵌合蛋白质特异蛋白酶的核酸的载体和/或细胞,其包括并优选还表达嵌合蛋白质和蛋白酶。试剂盒还可用于筛选蛋白酶的抑制剂。
本发明提供另外的用途和优点。例如,提供有效和通用的蛋白酶特异抑制剂的体内筛选方法也是本发明的目的。因此在一个实施方案中,本发明提供(1)嵌合底物蛋白质,其包含至少一种指导向亚细胞器转运的信号蛋白质,至少一种蛋白酶特异的蛋白酶剪切位点,和至少一种荧光蛋白标记,和构建嵌合底物蛋白质的通用方法;(2)包含编码嵌合底物蛋白质的核酸序列的重组基因,其可用于转化细胞以表达嵌合底物蛋白质;(3)一个系统,其中嵌合底物蛋白质和其特异的蛋白酶共存在一个活细胞中,以便蛋白酶对底物的蛋白酶剪切可发生在一个活细胞中;(4)确定体内蛋白酶活性的有效分步的方法,其通过直接观测具有从与底物缀合的荧光蛋白标记发出的荧光信号的细胞,而直接鉴定活细胞中蛋白酶对嵌合底物蛋白质的切割;和(5)筛选蛋白酶特异抑制剂的有效分步的方法,其使用以上构建的系统以确定活细胞中蛋白酶活性。
通过论述涉及的技术问题,本发明提供分析特定蛋白酶活性和筛选蛋白酶抑制剂的更现实的体内方法,其中蛋白酶和其特异的底物共存在一个活细胞中,以便蛋白酶对底物的切割可发生在一个活细胞中,结果可从活细胞直接观察。
在相关方面,本发明提供检测细胞或组织内蛋白酶非常有用的方法。在本发明的实例中,该方法包括下述至少一个并优选所有的步骤a)将包含编码嵌合蛋白质的核酸的第一载体引入受试细胞或组织,其中嵌合蛋白质包括共价连接成分1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列,b)在使第一载体编码的嵌合蛋白质表达的条件下培养细胞或组织;和c)检测嵌合蛋白质(或其可检测的标记成分)的亚细胞定位和信号强度中的至少一个的变化作为细胞内蛋白酶存在的指示。
如上所述,该方法是灵活的并容易改变以适合预期使用。例如,如果需要,该方法还可包括引入第二载体到受试细胞或组织的步骤,该第二载体包含编码蛋白酶的核酸序列;并在细胞或组织中表达第二载体以在细胞或组织内产生蛋白酶。
本发明还提供蛋白酶抑制剂体内活性检测和可选地定量的方法。优选的抑制剂可以是目的细胞或组织内源的。然而,在许多发明实施方案中将给予细胞或组织该抑制剂,其包括自然发生的、合成的,和半合成的分子。这种分子可从化学文库中获得,并可包括那些已知的、可疑的或完全未知的抑制活性。例如,在特定蛋白酶抑制剂活性确定的实施方案中,本发明可用于证实蛋白酶在特定细胞、组织类型,或培养条件中的活性。在其他实施方案中,本发明可用于从化学文库中筛选候选化合物。在本发明的一个实例中,检测方法包括下述至少一个并优选所有的步骤a)将包含编码嵌合蛋白质的核酸的第一载体引入受试细胞或组织,其中嵌合蛋白质包括共价连接成分1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列,
b)在细胞或组织中引入编码至少一种受试蛋白酶的第二载体,优选上述的一个蛋白酶,c)将细胞或组织与候选化合物接触,d)在使第一载体编码的嵌合蛋白质和第二载体编码的蛋白酶表达的条件下培养细胞或组织;和e)检测嵌合蛋白质(或其可检测的标记成分)的亚细胞定位和信号强度中至少一个的变化作为蛋白酶抑制剂存在的指示。
上述检测方法是灵活的并容易适用于以单独的、低或高通量模式筛选候选化合物。例如,在一个实施方案中,该方法还包括使用自动或半自动设备,其优选来检测可检测的标记嵌合蛋白质或其标记蛋白质成分在亚细胞定位和信号强度的变化。更具体的设备包括适合检测细胞或组织内可检测序列的光学系统,该系统可向使用者提供实时结果或作为存储结果。
如果需要,通过参照适当的对照可监测嵌合蛋白质(或其可检测的标记成分)在亚细胞定位、信号强度(或二者)的可检测的变化。一种适当的对照是加入水、盐水或缓冲液,而不是步骤c)中要检测的化合物。当然,在特定方法的嵌合蛋白质、宿主细胞或组织等的性质已经确定的实施方案中,可不需要使用对照。
如上所述,本发明非常适合检测蛋白酶抑制剂。根据本发明,已知的蛋白酶抑制剂是确认的病毒疾病抑制剂。因为病毒蛋白酶对复制和病毒衣壳重新组装是必需的,所以蛋白酶抑制剂可通过抑制蛋白酶以抑制病毒增殖而用于病毒疾病的治疗。动物病毒可引起疾病,例如AIDS和肝炎等,植物病毒通过引起萎蔫的叶子和色斑而降低作物产量。
一方面,通过提供底物和多种蛋白酶特异抑制剂的体内筛选方法,本发明提供有效开发多种蛋白酶特异抑制剂的方案(framework)。该方法还可用于确定常规体外方法筛选的候选药物的效力。
附图简述

图1显示带有亚细胞器的运输信号并用荧光蛋白质标记的信号蛋白质的示意图。
图2(a)-(h)显示当荧光蛋白质标记的信号蛋白质在细胞中正确表达时它们定位分布的荧光照片。
(a)显示用绿色荧光蛋白质(GFP)标记的拟南芥属(Arabidopsis)外包膜蛋白质(AtOEP7)定位在叶绿体包膜;(b)、(c)和(d)显示用GFP标记的Rubisco(核酮糖二磷酸羧化酶-加氧酶)小亚单位(RbcS)、叶绿素a/b结合蛋白质(Cab),Rubisco活化酶(Rubisco activase)(RA)定位在叶绿体基质;(e)显示用GFP标记的F1-ATPase(F1-腺苷三磷酸酶)定位在线粒体;(f)显示用GFP标记的过氧化物酶体靶向基序(SKL)定位在过氧化物酶体;和(g)和(h)显示用GFP标记的H+-ATPase(H+-腺苷三磷酸酶)和Pleckstrin同源结构域(PH)(血小板-白细胞C激酶底物同源结构域)定位在质膜(plasma envelope)。
图3显示NIa蛋白酶重组基因和NIa蛋白酶体内底物,RFP:PS(NIa):AtOEP7:GFP的示意图(a)显示构建用以表达嵌合蛋白质RFP:PS(NIa):AtOEP7:GFP重组基因的结构,其用作本发明实施例2中NIa蛋白酶的体内底物,其中RFP、GFP、PS(NIa)、AtOEP7和35S分别代表红色荧光蛋白质、绿色荧光蛋白质、蛋白酶的蛋白酶剪切位点、拟南芥属外包膜蛋白质和CaMV35S启动子;和(b)显示实施例2中使用的表达NIa蛋白酶的重组基因的结构,其中NIa代表来自TVMV的NIa蛋白酶的编码区。
图4显示嵌合蛋白质RFP:PS(NIa):AtOEP7:GFP在图3(a)显示的重组基因转化的拟南芥属原生质体中表达后观察到的荧光照片(a)、(b)、(c),和(d)分别是绿色荧光信号、红色荧光信号,和绿色和红色荧光重叠信号的图像,及在亮视野下获得的图像。叶绿体中观察到的红色荧光信号是叶绿体的自发荧光信号,且胞质溶胶中观察到的红色荧光信号来自红色荧光蛋白质。
图5显示嵌合蛋白质RFP:PS(NIa):AtOEP7:GFP和NIa蛋白酶,在图3(a)和3(b)显示的重组基因转化的拟南芥属原生质体中共表达后观察到的荧光图像,其显示可观察到NIa蛋白酶对RFP:PS(NIa):AtOEP7:GFP的切割(a)、(b)、(c),和(d)分别是绿色荧光信号、红色荧光信号,和绿色和红色荧光重叠信号的图像,及在亮视野下获得的图像。叶绿体中观察到的红色荧光信号是叶绿体的自发荧光信号,且胞质溶胶中观察到的红色荧光信号来自红色荧光蛋白质。
图6是Western印迹,显示NIa蛋白酶对嵌合蛋白质REP:PS(NIa):AtOEP7:GEP的切割发生在拟南芥属原生质体中。图3(a)中显示的RFP:PS(NIa):AtOEP7:GFP和图3(b)中显示的NIa蛋白酶共表达(+)的情况和RFP:PS(NIa):AtOEP7:GFP单独表达(-)的情况相比。在70kD和35kD观察到的蛋白质条带分别对应于完整的嵌合蛋白质RFP:PS(NIa):AtOEP7:GFP和由蛋后酶剪切产生的AtOEP7:GFP蛋白质片段。
图7(a)-(j)是显示用于表达图1中显示的融合蛋白质的不同构建体质粒图谱的图(a)AtOEP7:GFP、(b)AtOEP7:RFP、(c)RbcS:GFP(d)RbcS:RFP、(e)Cab:GFP、(f)RA:GFP、(g)F1-ATPase:GFP、(h)GFP:SKL、(i)H+-ATPase:GFP、(j)GFP:PH。
图8(a)和(b)分别显示NIa蛋白酶和其嵌合底物蛋白质RFP:PS(NIa):AtOEP7:GFP的质粒图谱。标注了嵌合底物蛋白质的核酸序列的重要部分。
图9(a)和(b)分别显示HIV-1蛋白酶和其嵌合底物蛋白质RFP:PS(HIV-1):AtOEP7:GFP的质粒图谱。标注了蛋白酶剪切位点的核酸和蛋白质序列(SEQ ID NO57-74)。
图10显示编码可选地掩蔽嵌合底物蛋白质实例的重组基因的示意图,其中一种信号蛋白质的运输信号保持活性。PS代表蛋白酶剪切位点序列。FP-1和FP-2代表具有不同荧光波长的荧光蛋白质的编码序列。
图11显示嵌合底物蛋白质RFP:PS(HIV-1):AtOEP7:GFP在图9(b)中显示的重组质粒中的一种转化的拟南芥属原生质体中表达后观察到的荧光图像。图11(a)、(b)和(c)分别是绿色荧光信号、红色荧光信号,和绿色和红色荧光重叠信号的图像。绿色荧光图像中观察到的微弱红色荧光信号是叶绿体的自发荧光。
图12显示HIV-1蛋白酶和嵌合底物蛋白质RFP:PS(HIV-1):AtOEP7:GFP在图9(a)和(b)显示的重组基因转化的拟南芥属原生质体中共表达后观察到的荧光图像。图12(a)、(b)和(c)分别是绿色荧光信号、红色荧光信号,和绿色和红色荧光重叠信号的图像。绿色荧光图像中观察到的微弱红色荧光信号是叶绿体的自发荧光。
图13(a)和(b)显示嵌合底物蛋白质H+-ATPase:PS(NIa):GFP表达后观察到的图像。图13(c)和(d)显示NIa蛋白酶和嵌合底物蛋白质H+-ATPase:PS(NIa):GFP共表达后观察到的图像。图13(a)和(c)是绿色荧光信号的图像,图13(b)和(d)是在亮视野下获得的图像。绿色荧光图像中观察到的红色荧光是叶绿体的自发荧光。
实施本发明的最佳模式如上所述,本发明提供检测细胞或组织内蛋白酶非常有用的系统。如果需要,该系统容易改变以适应检测一种以上的蛋白酶,优选少于约3种蛋白酶,通常约1种蛋白酶。优选地,该系统包括嵌合蛋白质,其包括共价连接成分1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。一般优选的嵌合蛋白质由少于约20种成分组成,更优选少于约10种成分,对于大多数蛋白质通常优选约3种到约6种成分。本发明有广谱重要的应用,包括用于筛选以检测在体内降低或完全阻断蛋白酶活性的候选化合物。
根据本发明,“系统”包括一种或多种此处描述的嵌合分子及可向其添加的任何附加成分,例如可促进上述分子可溶性和稳定性的那些成分。实例包括但不限于血清蛋白质,例如牛血清白蛋白,缓冲液例如磷酸盐缓冲液,或可接受的载体或稳定剂。对可接受的载体、稳定剂等的详细论述,通常参见Reminington’s Pharmaceutical Sciences,Mack Pub.Co.,Easton,PA,1980。本发明的典型的系统还会包括至少一种此处描述的核酸、载体、处理细胞或组织。在这种发明实施方案中,嵌合蛋白质可作为有用的实验对照。优选的系统包括大约1到10、优选少于约5和更优选约1种溶解在可接受的载体中嵌合蛋白质,所述载体例如水或缓冲盐。优选地,系统以无菌提供。
短语“信号蛋白质”意指多肽序列,其具有靶向亚细胞器的特异运输信号或与其在细胞中的定位相关的特殊性质,例如聚集体形成。优选的信号蛋白质可参见整个此处公开内容,包括实施例部分。
本发明优选的嵌合蛋白质包括通过重组的、化学的或其他适当的方法共价连接到一起(即融合的)可选地掩蔽信号蛋白质、蛋白酶特异的切割位点和可检测的氨基酸序列。在大多数实施方案中,将优选重组方法。虽然大多数发明实施方案通常不需要,但一种或多种成分可通过肽接头序列在一个或几个位点融合。具体的肽接头序列会少于约30个氨基酸,更优选少于约15个氨基酸,还更优选约1个到约5个氨基酸。
该肽序列可包括一种或多种病原体诱导的或宿主细胞诱导的蛋白酶切割位点。可替代地,肽接头可用于协助嵌合蛋白质构建。特别优选的嵌合蛋白质可称为“符合读框的”融合分子。
如上所述,只要蛋白质有预期的功能,可几乎以任何方式组织此处公开的嵌合蛋白质成分。并如上所述,嵌合蛋白质的每一成分可通过至少一种适当的肽接头序列与另一成分隔开。
例如,嵌合蛋白质的任何一种成分均可包括该蛋白质的N末端。另外,任何一种成分均可包括嵌合蛋白质的C末端,该末端可包括另一成分,例如如下讨论的纯化标签序列。除另外指出外,对于氨基酸序列,短语“共价顺序连接”代表,肽键以N到C的方向连接到一起。对于核苷酸序列,该短语意味着表示一个核苷酸与另一个以5′到3′的方向连接。
作为该系统更具体的实例,嵌合蛋白质包括共价顺序连接的1)信号蛋白质;2)蛋白酶特异的切割位点;和3)可检测的氨基酸序列。可替代地,嵌合蛋白质可包括共价顺序连接的1)掩蔽序列;2)蛋白酶切割位点;3)信号蛋白质;和4)可检测的氨基酸序列。在另一实施方案中,根据系统特点使用的嵌合蛋白质共价顺序连接的1)信号蛋白质;2)蛋白酶切割位点;3)掩蔽序列;和4)可检测的氨基酸序列。
在嵌合蛋白质需要一种以上信号蛋白质的发明实施方案中,这样的蛋白质可包括共价顺序连接的1)第一信号蛋白质;2)蛋白酶切割位点;3)第二信号蛋白质;和4)可检测的氨基酸序列。更具体的,这样的蛋白质可包括共价顺序连接1)第一信号蛋白质;2)第一蛋白酶切割位点;3)掩蔽序列;4)第二信号蛋白质;和5)可检测的氨基酸序列。
在某些情况下,使系统中的嵌合蛋白质包括一种以上的蛋白酶切割位点是有用的,例如1、2、3或4种。在这种情况下,嵌合蛋白质可包括共价顺序连接1)掩蔽序列;2)第一蛋白酶切割位点;3)第一信号蛋白质;4)第二蛋白酶切割位点;5)第二信号蛋白质;和6)可检测的氨基酸序列。可替代地,嵌合蛋白质可包括共价顺序连接1)第一信号蛋白质;2)第一蛋白酶切割位点;3)第二信号蛋白质;4)第二蛋白酶切割位点;5)掩蔽序列;和6)可检测的氨基酸序列。
在另一发明实施方案中,嵌合蛋白质包括共价顺序连接1)蛋白酶特异切割位点;2)信号蛋白质;和3)可检测的氨基酸序列。可替代地,嵌合蛋白质可包括共价顺序连接1)第一信号蛋白质;2)第一可检测序列;3)蛋白酶切割位点;和4)第二可检测序列。在这一发明实例中,蛋白质还可包括共价连接在蛋白酶切割位点C末端和第二可检测序列N末端之间的第二信号蛋白质。
本发明还进一步提供嵌合蛋白质,其包括共价顺序连接1)第一信号蛋白质;2)蛋白酶切割位点;3)第二信号蛋白质;和4)第二可检测序列。可替代地,嵌合蛋白质可包括共价顺序连接1)第一可检测序列;2)蛋白酶切割位点;3)信号蛋白质;和4)第二可检测序列。
使用适当的分子量标记通过标准的SDS PAGE凝胶电泳确定,本发明更优选的嵌合蛋白质将具有小于约250kDa的分子大小,优选小于约200kDa,更优选的分子大小约25到约175kDa。
“多肽”指优选基本上由20种天然氨基酸的任何氨基酸组成的任何大小的任何聚合体。尽管术语“蛋白质”经常用于指相对大的蛋白质,而“肽”经常用于指小的多肽,但本领域中这些术语的使用经常重叠。除非另外指明,术语“多肽”通常指蛋白质、多肽和肽。
如此处所使用,术语“细胞”包括任何原代细胞或永生化的细胞系,如组织或器官中任何这样的细胞群。优选的细胞包括那些如人源的哺乳动物细胞、植物细胞、酵母、真菌和昆虫细胞。根据本发明,“宿主细胞”可是感染细胞或其可是如此处所描述的可用于扩增核酸或载体的细胞,例如大肠杆菌(E.coli)。
应当理解,本发明的特殊用途会经常要求特异的嵌合蛋白质构型。通过已确认的参数指导特异嵌合蛋白质成分或成分组的选择,其中包括信号蛋白质、蛋白酶特异切割位点,和选择的可检测氨基酸序列、要监测的蛋白酶,和应用要求的敏感性或选择性水平。
举例来说,本发明包括的实施方案,其中嵌合蛋白质包括一种信号蛋白质、一种可检测序列和一种蛋白酶特异的切割位点。在这个实例中,包括与信号蛋白质N或C末端连接的掩蔽序列经常是有用的。即,对于一些发明用途,不希望掩蔽序列与可检测序列连接。
本发明其他特殊的用途一般会要求其他特异的嵌合蛋白质构型。例如,如果一种具体蛋白质有一种信号蛋白质,和位于两种可检测氨基酸序列之间的一种蛋白酶特异切割位点,经常希望除去其中一种可检测氨基酸序列以优化系统。
带有多掩蔽序列会促进本发明的其他用途,其中序列可是信号序列、可检测的氨基酸序列或其他适当的序列,例如蛋白酶特异的切割位点。在这些实施方案中,具有一种或多种另外的掩蔽序列,例如蛋白酶切割位点,对达到系统的最大应用可能并不是必需的。然而在包括两种不同信号蛋白质、一种蛋白酶切割位点和两种可检测的氨基酸序列的实施方案中,其上的一种或两种掩蔽序列是有用的。
另外,特异的嵌合蛋白质可能包括可移去的标签序列,其在一些实施方案中,可能协助嵌合蛋白质的鉴定和/或纯化。一个实例是6Xhis和MYC标签。其他适合的标签序列是本领域众所周知的,如果需要可与本发明一起应用。
本发明的实施完全适合多种掩蔽或暴露的信号蛋白质和其功能片段。优选的实例通常足以将嵌合蛋白质(或该蛋白质的可检测成分,例如可检测序列)定位到细胞器或其他亚细胞区室。术语“区室”代表内部限制空间,例如液泡、过氧化物酶体、线粒体等。
优选的植物信号蛋白质定位嵌合蛋白质或其至少一种成分到植物细胞的细胞核、高尔基体、溶解液泡、储存液泡、过氧化物酶体、线粒体、内质网、质膜,或叶绿体。更优选的植物信号蛋白质包括AtOEP7;RbcS;Cab;RA;SKI;F1-ATPase;PH;FAPP;H+-ATPase;或其功能片段。优选的动物信号蛋白质定位嵌合蛋白质或其至少一种成分到动物细胞的细胞核、高尔基体、储存液泡、溶酶体、过氧化物酶体、内质网、质膜或线粒体。实例包括人肽蛋氨酸亚砜还原酶(MSRA)、细胞色素b2、11-β-羟基类固醇脱氢酶(11β-HSD)、G9-AKL、过氧化物酶整合膜蛋白质47(PMP47);或其功能片段。参见以下优选动物信号蛋白质序列的实施例。
如上所述,本发明的实施适合使用动物细胞有效的信号蛋白质。一般实例包括,但不限于,下面表I中列出的动物信号。
表I

1.类型A信号蛋白质可用作掩蔽信号蛋白质。
类型B信号蛋白质可用作暴露信号蛋白质。
参见Hansel等人FASEB J 2002年6月;16911-31(human peptidemethionine sulfoxide reductase;″MSRA″);Bomer U等人(1997)J BiolChem27230439-30446(Cytochrome b2);Naray-Fejes-Toth A和Fejes-Toth G(1996)J Biol Chem27115436-1544(11β-hydroxysteroiddehydrogenase(11β-HSD));McNew JA和Goodman JM(1994) J CellBiol1271245-1257(G9-AKL);Dyer等人,(1996)J Cell Biol133269-280(PMP47(peroxisomal integral membrane protein 47))。
当此处用于描述信号蛋白质时,短语“功能片段”,代表特定信号蛋白质的片段,其能提供至少约70%、优选高于约90%的全长序列的穿梭功能。信号蛋白质功能的检测和定量方法是公知的,包括使用实施例部分描述的荧光成像技术定位和定量信号强度。
显而易见,本发明是灵活的并不限于使用任何特定的蛋白酶特异的切割位点。例如,切割位点可被哺乳动物或病毒蛋白酶特异切割。术语“特异切割”是指蛋白酶特异切割位点中的肽键被受试蛋白酶特异断裂(即,水解)。即,蛋白酶切割位点不被宿主细胞中天然存在的蛋白酶断裂,包括通常称为持家蛋白酶的那些。可用多种技术监测那些蛋白酶切割位点的特异切割,包括SDS聚丙烯酰胺凝胶电泳方法。
优选的蛋白酶切割位点是那些被人类病原体相关蛋白酶特异水解的位点,例如,酵母、细菌、真菌、线虫,病毒或原生动物。更具体的实例包括巨细胞病毒(CMV);单纯疱疹病毒(HSV);肝炎病毒,优选甲型或丙型;疟原虫、人类免疫缺陷病毒(HIV)、卡波济肉瘤相关疱疹病毒(KSHV)、黄热病病毒、黄病毒、鼻病毒,或疟原虫,例如恶性疟原虫(P.falciparum)、间日疟原虫(P.vivax)、卵形疟原虫(P.ovale),或三日疟原虫(P.malariae)。一般地,疟原虫导致疟疾或多种与疟疾相关的医学并发症。认识到疟原虫天冬氨酸蛋白酶I和II(plasmepsin I和plasmepsin II)是相互联系的。在HSV作为目标的实施方案中,蛋白酶是HSV成熟蛋白酶。
多种特定的HIV-1和HCV蛋白酶特异的切割位点已经公开。参见例如,Gluzman,I.Y.等人,J.Clin.Invest.,941602(1994);Grakoui,A.等人,J.of Virol.,672832(1993);Kolykholov,AA.等人,J.of Virol.,687525(1994);和Barrie,K.A.等人,Virology,219407(1996),引用其内容作为参考。
另外的病原体特异的蛋白酶和特异切割位点已经公开,并可根据本发明应用。例如,HSV-1成熟蛋白酶和蛋白酶切割位点已经公开。参见例如,Hall,M.R.T.和W.Gibson,Virology,227160(1997)。另外,已在恶性疟原虫消化液泡中发现了疟原虫天冬氨酸蛋白酶I和II。对应的蛋白酶切割位点也已公开。参见例如,Moon,R.P.,Eur.J.Biochem,244552(1997)。
本发明使用的其他蛋白酶切割位点,被血液凝固、凋亡或细胞外基质相关的哺乳动物蛋白酶特异切割。参见下面的实施例和讨论。
本发明的实施适应使用一种或组合的可检测氨基酸序列,例如,那些直接或间接荧光、磷光,发光或化学发光的序列。在使用两种或更多这种可检测序列的实施方案中,其中一种可检测序列的发射波长总是与至少另一种可检测序列的发射波长不同。例如,优选的可检测序列衍生自某些众所周知的水母荧光蛋白质,包括那些已知在适当激发条件下,发射绿、红,和黄光的蛋白质。
如上所述,本发明还提供基本上纯的嵌合蛋白质。这种嵌合蛋白质可通过公知技术的适当组合分离和纯化。如需要,这种蛋白质可包括一种或多种此处所描述的纯化标签。这些方法包括,例如,利用溶解性的方法,例如盐沉淀和溶剂沉淀,利用分子量不同的方法,例如透析、超滤、凝胶过滤,和SDS聚丙烯酰胺凝胶电泳,利用电荷不同的方法,例如离子交换柱层析,利用特异亲和性的方法,例如亲和层析,利用疏水性不同的方法,例如反相高效液相色谱,和利用等电点不同的方法,例如等电聚焦电泳,金属亲和柱例如Ni-NTA。通常参见Sambrook等人,Molecular CloningA Laboratory Manual,2nd ed.(1989);Ausubel等人,Current Protocols in Molecular Biology,John Wiley & Sons,New York(1989);和Ausubel等人,Short Protocols in Molecular Biology,John Wiley& Sons,New York(1999)与这些方法相关的内容。
优选本发明的嵌合蛋白质是基本上纯的。即,嵌合蛋白质已经从其自然伴随的细胞取代物中分离出来,以便嵌合蛋白质优选以至少80%或90%到95%的同质性(W/W)存在。对于多数制药、临床和研究应用,嵌合蛋白质具有至少98到99%的同质性(W/W)是最优选的。一旦基本上纯化,嵌合蛋白质应当基本上没有细胞培养和相关应用的污染。一旦部分纯化或达到基本纯度,溶解的嵌合蛋白质可用于治疗,或进行如此处所公开的体外或体内试验。基本纯度可通过许多标准技术确定,例如色谱法和凝胶电泳。
适当的宿主细胞可用于制备目的以增殖编码目的嵌合蛋白质的核酸。因此宿主细胞可包括欲在其中产生嵌合蛋白质的原核、植物或真核细胞。因此宿主细胞尤其包括能增殖编码嵌合蛋白质的核酸的酵母、蝇、蠕虫、植物、蛙、哺乳动物细胞,植物细胞和器官。可使用的哺乳动物细胞系非限制性的实例包括CHO dhfl-细胞(Urlaub和Chasm,Proc.Natl.Acad.Sci.USA,774216(1980)),293细胞(Graham等人,J Gen.Virol.,3659(1977)),骨髓瘤细胞,象SP2或NSO(Galfre和Milstein,Meth.Enzymol.,73(B)3(1981))。其他适当的细胞公开在Sambrook等人,同上。
能增殖编码目的嵌合蛋白质的核酸的宿主细胞,也包括非哺乳动物真核细胞,包括昆虫(例如,Sp.frugiperda)、酵母(例如,啤酒糖酵母(S.cerevisiae)、粟酒裂殖糖酵母(S.Pombe)、巴斯德毕赤氏酵母(P.Pastoris)、乳克鲁维氏酵母(K.lactis)、多态丝状单孢菌(H.polymorpha);如Fleer,R.所做的一般综述Current Opinion in Biotechnology,3(5)486496(1992)),真菌和植物细胞(例如,拟南芥属和烟草属(Nicotinia))。还包括使用某些原核细胞,例如大肠杆菌和芽胞杆菌(Bacillus)。
编码目的嵌合蛋白质的核酸可通过转染细胞的标准技术引入宿主细胞。术语“转染”包含将核酸引入宿主细胞的所有常规技术,包括磷酸钙共沉淀、DEAE葡聚糖介导的转染、脂质转染、电穿孔、显微注射,病毒转导和/或整合。适当的转染宿主细胞的方法可见Sambrook等人(见上文)和其他实验室教科书。
本发明还提供分离目的嵌合蛋白质的制备方法。在该方法中,宿主细胞(例如,酵母、真菌、昆虫,细菌或动物细胞),其中已经引入与调控序列有效连接的编码目的蛋白质的核酸,在嵌合蛋白质存在下于生产规模的培养基中生长以刺激编码目的嵌合蛋白质的核苷酸序列转录。然后,从收获的宿主细胞或从培养基中分离目的嵌合蛋白质。可使用标准的蛋白质纯化技术从培养基或从收获的细胞中分离目的蛋白质。具体地,从许多种器具,包括滚瓶、旋转烧瓶、组织培养皿、生物反应器,或发酵罐中,可使用纯化技术大规模(即,至少毫克量)表达和纯化目的嵌合蛋白质。
因此本发明还提供编码嵌合底物蛋白质的核酸序列。编码嵌合底物蛋白质的核酸可用于转化细胞以在细胞中表达嵌合底物蛋白质。为转化细胞,重组基因必需包括启动子和其他与嵌合底物蛋白质编码区可操作连接的调控核酸序列。通过已知的参数指导启动子的选择,一般是宿主细胞的选择。
如上所述,本发明还提供核酸序列,尤其是编码本发明嵌合蛋白质的DNA序列。优选地,DNA序列由适合染色体外复制的载体携带,例如噬菌体、病毒、质粒、噬菌粒、粘粒、YAC,或附加体。特别地,编码目的嵌合蛋白质的DNA载体可用于促进此处描述的制备方法和获得大量嵌合蛋白质。DNA序列可插入适当的表达载体,即,含有插入蛋白质编码序列转录和翻译必需元件的载体。多种宿主载体系统可用于表达蛋白质编码序列。这些包括病毒(例如,痘苗病毒、腺病毒等)感染的哺乳动物细胞系统;病毒(例如,杆状病毒)感染的昆虫细胞系统;微生物,例如含有酵母载体的酵母,或用噬菌体DNA、质粒DNA或粘粒DNA转化的细菌。根据使用的宿主载体系统,可使用大量适当的转录和翻译成分中的任何一个。通常参见Sambrook等人,见上文和Ausubel等人,见上文。
大体上,根据本发明,优选的DNA载体包括磷酸二酯键连接的核苷酸序列,其包括,以5′到3′的方向,第一克隆位点,用于引入编码此处所描述的嵌合蛋白质的第一核苷酸序列。如果需要,蛋白质可与编码一种或多种适当标签序列的DNA连接。图7(a)-(j);8(a)-(b);和9(a)-(c)提供这种载体的实例。
在一些发明实施方案中,优选以“盒”的形式提供DNA载体编码的嵌合蛋白质。术语“盒”意思是编码的蛋白质(或其成分)易于通过标准的重组方法用另一成分取代。特别地,当用一种蛋白酶特异的切割位点或可检测的氨基酸序列与另一种“交换”时,以盒的形式装配的DNA载体是特别需要的。参见图7(a)-(j);8(a)-(b);和9(a)-(c),其中核心载体用于表达多种嵌合蛋白质。
更具体地,预见在一些实例中,某些病原体血清型,尤其是病毒株,可与个别该血清型或病毒株特异的蛋白酶切割位点相关。关于这一点,药物抗性HIV血清型的出现尤其成问题。在这种情况下,形式为盒的DNA载体中一种或多种存在的蛋白酶切割位点可用其他所需的预定的蛋白酶切割位点替换。具体的蛋白酶切割位点可根据特定病人中存在的病原体选择。
值得注意的是,本发明可作为显示受试细胞或组织中蛋白酶活性变化的有效“警告系统”。例如,在PCR或杂交实验已经表明编码病原体相关蛋白酶的基因组DNA存在的情况下,使用本发明可检测细胞或组织中活性蛋白酶的存在。本发明的这个特点在多种情况下是有用的,包括已知或怀疑病原体污染的细胞培养。
如上所述,本发明可用于检测目的宿主细胞或组织中一种或多种蛋白酶的存在。对于检测和分析蛋白酶抑制剂分子,此处描述的方法和组分尤其有用,如上所述,其中蛋白酶抑制剂分子可天然存在或是这种分子库(即,化学文库)的一部分。
A.使用本发明筛选候选蛋白酶抑制剂1.一般论述除本发明描述的实施例中使用的植物原生质体外,根据本发明,带细胞壁的正常植物细胞或人、动物,或昆虫细胞也可用于筛选蛋白酶抑制剂。因为更容易转化和培养及由于原生质体规则的球形也方便蛋白质定位的鉴定,因此经常优选植物细胞。然而,其他细胞和组织也是有用的,例如,目的蛋白酶不能以活性形式在植物细胞中表达时。例如,这种蛋白酶难以表达可能由于不适当的翻译后修饰。如果这个问题出现,可使用适当的动物或昆虫细胞解决它。在这种情况下,必需使用在所选细胞中有效的信号蛋白质。例如,如果人、动物,或昆虫细胞用于筛选,就不能使用叶绿体靶向的信号蛋白质,例如AtOEP7、RbcS、Cab和RA,因为叶绿体在这些细胞中不存在。对于人、动物,或昆虫细胞,可使用靶向到其他亚细胞器的信号蛋白质,例如线粒体、过氧化物酶体、质膜等。另外,必需根据使用的细胞正确选择包含启动子和其他调控元件的载体系统。
对于本发明的蛋白酶抑制剂的体内筛选,制备可表达目的蛋白酶和该蛋白酶特异的嵌合底物蛋白质的转化细胞。制备转化细胞最优选的方法是,用本发明提供的编码蛋白酶的重组质粒和编码嵌合底物蛋白质的重组质粒共转化细胞。如果蛋白酶是病毒蛋白酶,还可使用病毒感染在转化细胞中表达蛋白酶。
多种植物、动物、酵母、真菌和昆虫细胞的转化方法已经建立。例如,通过引入重组质粒转化细胞的方法包括,但不限于,使用PEG(聚乙二醇)、磷酸钾,或DEAE葡聚糖的化学介导方法,阳离子脂质介导的脂质转染、显微注射、电穿孔、电融合,和DNA轰击。根据使用的细胞类型,必需选择适当的转化方法并需要优化条件以达到有效转化。如果使用植物细胞的原生质体,例如拟南芥属或烟草原生质体,实施例1(c)中描述的PEG介导的转化方法是优选的方法。实施例1(c)中给出的条件对于拟南芥原生质体进行优化。如果使用带细胞壁的正常植物细胞,可根据植物细胞类型使用基因枪DNA轰击或PEG介导的转化方法。对于人、动物,或昆虫细胞,可使用磷酸钾介导或DEAE葡聚糖介导的转染方法或阳离子脂质介导的脂质转染方法转化细胞。
为筛选蛋白酶抑制剂,在表达蛋白酶和嵌合底物蛋白质时,转化细胞需要与候选化合物接触。一般地,候选化合物加入包含转化细胞的溶液,并将产生的溶液在适当的温度湿育。候选抑制剂可以选自化合物、肽、化合物或肽的混合物、和天然产物的提取物。根据细胞类型和温育温度,可改变表达蛋白质的温育时间。它可为约1小时到几天。对于拟南芥属原生质体,根据温育条件,温育时间可短至4小时和长至约1周。当拟南芥属原生质体在22℃于W5溶液中温育时,优选的温育时间是12到48小时。可以检测的候选抑制剂浓度为约0.1到100μg/ml。在一般筛选中,可使用的浓度为约1到几个μg/ml。在大量候选化合物需要筛选的情况下,在第一轮筛选中可使用约5-30种候选抑制剂的混合物。
根据本发明,可筛选几乎任何化合物或化合物组的抗蛋白酶活性。实例包括,但不限于,细胞因子、肿瘤抑制因子、抗体、受体、突变蛋白质、这种蛋白质的片段或部分,和活性RNA分子,例如,反义RNA分子或核酶。用于筛选的优选化合物是合成或半合成药物(有时指“小分子”)。例如,通过本方法容易检测已知人类病毒病原体抑制剂的衍生物库。参见例如,美国专利6,420,438;6,329,525;6,287,840;6,147,188;和6,046,190(其公开了多种可检测的分子和其衍生物)。
可使用本发明筛选另外的化合物。参见Pillay等人(1995)Rev.Med.Virol.(公开了多种潜在的病毒蛋白酶抑制剂化合物);和Wei等人(1995)Nature,373117(公开了印地那韦、ABT-538);Ho等人(1992)Ann.Intern.Med.113111(公开了抗疱疹剂)。另外,根据本发明,可筛选上述特异化合物的衍生物,包括但不限于,沙奎那韦(saquinavir)和其衍生物。
为鉴定候选化合物对蛋白酶活性的抑制,优选监测转化细胞作为时间函数的荧光图像。根据细胞条件表达时间可能改变,因此可能在不同时间出现蛋白水解活性或抑制。如果拟南芥属原生质体是要用的细胞,监测荧光图像的优选时间顺序是在表达开始后的12、18、24、36,和48小时。如果嵌合底物蛋白质有两种或多种不同的荧光标记,优选在两种或多种荧光标记特异的荧光波长上监测荧光图像。因为其可方便亚细胞器的鉴定,因此优选监测亮视野图像。为方便蛋白酶抑制剂的鉴定,为了比较,还优选监测未与候选抑制剂接触的转化细胞的荧光图像。装备有多色荧光滤光片装置的标准荧光显微镜,例如Zeiss Axioplan荧光显微镜或Nikon E800荧光显微镜,可以200×、400×,或600×的放大倍数用于监测荧光图像。扫描聚焦显微镜可用于获得更高分辨率的图像。
显而易见,本发明适合广谱嵌合底物蛋白质的构建和应用。例如,参见实施例1。
2.NIa蛋白酶的应用说明为使用如上所述构建的嵌合底物蛋白质检测蛋白酶活性,在本发明实施例中使用烟草叶脉色斑病毒(vein mottling virus)(TVMV)NIa蛋白酶作为模型系统。NIa蛋白酶是定性最好的病毒蛋白酶之一,并已知其切割TVMV产生的聚蛋白的七个特异位点。为达到最佳的蛋白酶活性,需要N末端的六个氨基酸残基(P6-P1)和C末端的四个氨基酸残基(P1’-P4’),并必需包括底物蛋白质P4-P1位的四个保守氨基酸残基(V-R-F-Q)。如果四个保守氨基酸残基的任何一个突变成甘氨酸(Gly),底物蛋白质的蛋白酶剪切就不能发生(Yoon,H.Y.等人,2000)。
当表达嵌合底物蛋白质(包含NIa蛋白酶蛋白水解位点(PS(NIa))的RFP:PS(NIa):AtOEP7:GFP)的重组基因通过聚乙二醇介导的转化方法引入原生质体时,GFP和RFP在胞质溶胶中积聚成大的聚集体(图4)。这种结果对应于蛋白酶没有作用的情况。在这种情况下,怀疑胞质溶胶中聚集体的积聚是AtOEP7蛋白质疏水区中疏水相互作用的结果。如果嵌合底物蛋白质的红色荧光不易与叶绿体的自发荧光区别时(图4(b)),可通过使用两种不同的荧光标记,并观察重叠荧光图像(图4(c))中绿色荧光和红色荧光是否相合,而清楚地测定底物反应。当编码NIa蛋白酶的质粒和编码RFP:PS(NIa):AtOEP7:GFP的质粒在转化中一起引入时,绿色和红色荧光信号被分别分离到叶绿体外包膜和胞质溶胶中(图5)。这种结果说明NIa蛋白酶成功地切割了嵌合底物蛋白质的蛋白水解位点以产生两种蛋白质,RFP和AtOEP7:GFP。通过观察由于信号蛋白质的作用,绿色荧光信号易位到叶绿体外包膜(图5(a))、红色荧光信号在胞质溶胶中弥散(图5(b)),和两种荧光信号的重叠图像(图5(c)),可鉴定蛋白酶反应。
通过与对照实验对比,可更清楚地看到本发明鉴定酶反应结果的效率。比较图4(a)和5(a),可观察到蛋白酶剪切使信号蛋白质的掩蔽运输信号活化,引起荧光分布的改变。比较图4(b)和5(b),可观察到,红色荧光蛋白质用作信号掩蔽蛋白质除掩蔽运输信号外,还在改变荧光信号的分布中发挥作用。
因此建议,嵌合底物蛋白质,其包括带信号蛋白质和荧光蛋白质的嵌合蛋白质和带蛋白水解位点的信号掩蔽蛋白质,可用作底物以确定蛋白酶活性及体内筛选其抑制剂。
3.高通量筛选方法总体考虑本发明提供的体内蛋白酶抑制剂筛选方法容易适用于高通量试验。高通量筛选方法,包括表达蛋白酶和其嵌合底物蛋白质的转化细胞与候选化合物接触、温育转化细胞、获得转化细胞的荧光图像、将荧光图像转换成数字数据,并分析数字数据以确定候选化合物是否抑制了蛋白酶。
在本发明的高通量筛选中,等量的转化细胞溶液加入96或384孔微量滴定板的阵列孔中,并且每个孔中加入不同的候选化合物。然后在控制环境中(适宜的温度、湿度,和空气构成)温育微量滴定板中的转化细胞以表达蛋白酶和其嵌合底物蛋白质。在预选温育时间后,用荧光显微镜获得每孔转化细胞的荧光图像。
高通量筛选装置由以下部分组成(1)多个微量滴定板中转化细胞样品阵列的培养箱、(2)自动采样器、(3)装备XY平移样品平台(XY-translation sample stage)和高分辨数字照相机的自动荧光显微镜。在预选温育时间后,自动采样器从每孔中取样一小部分转化细胞溶液并置于观察片上,例如载物玻片。采样可使用多吸头(tip)或吸管以平行方式或使用单吸头或吸管以连续方式进行。在每次采样后,吸头或吸管要用适当的洗液洗涤。转化细胞样品在预选位置以阵列的形式置于观察片上。XY平移平台在XY方向上固定和移动观察片以在显微镜物镜下定位每个样品。Z轴聚焦驱动器(focus drive)在Z方向上移动显微镜物镜或观察片以聚焦。对于每个样品,使用数字照相机在预选荧光波长上捕获荧光图像,输入个人计算机,并作为数字数据保存。装备自动控制器以控制吸管采样器、XY平移平台和Z聚焦驱动器。个人计算机提供显示器和数据分析软件。
通过检测亚细胞荧光分布可自动确定蛋白酶抑制剂。一般地,可从数字图像数据中计算观察细胞范围内荧光信号集中或分散的程度,并用作判断的标准。某些情况下,荧光信号分布的方式或形状可用作判断的标准。
适合本发明使用的高通量筛选实验方案的实例已经公开在美国专利号5,989,835和PCT申请WO 00/79241 A2中。
下述表2和3提供本发明使用的序列信息表2
PCR引物的SEQ ID NO(序列识别号)

表3信号蛋白质的SEQ ID NO

下面提供本发明使用的说明性的核酸和蛋白质序列信息。蛋白酶和其切割位点的实例提供在SEQ ID NO45-50、55-74,和77-120。实例包括NIa蛋白酶(SEQ ID NO45和46)和其切割位点(SEQ ID NO47-50)、HIV-1蛋白酶(SEQ ID NO55和56)和其切割位点(SEQ IDNO57-74)、HCV NS3蛋白酶(SEQ ID NO77和78)和其切割位点(SEQ ID NO79-84)、HSV-1蛋白酶(SEQ ID NO85和86)和其切割位点(SEQ ID NO87-90)、HTLV-1蛋白酶(SEQ ID NO91和92)和其切割位点(SEQ ID NO93-96)、HCMV蛋白酶(SEQ ID NO97和98)和其切割位点(SEQ ID NO99-102)、APPβ-分泌酶(SEQ ID NO103和104)和其切割位点(SEQ ID NO105和106)、天冬氨酸特异性半胱氨酸蛋白酶(caspase)3(SEQ ID NO107和108)和其切割位点(SEQID NO113和114)、天冬氨酸特异性半胱氨酸蛋白酶3大亚单位(SEQID NO109和110)、天冬氨酸特异性半胱氨酸蛋白酶3小亚单位(SEQID NO111和112)、人凝血因子II(SEQ ID NO115和116)和其切割位点(SEQ ID NO117和118),和人凝血因子XI(SEQ ID NO119和120)。
两种NIa蛋白酶底物蛋白质的核酸和蛋白质序列提供在SEQ IDNO51-54,HIV-1蛋白酶底物蛋白质的那些序列提供在SEQ ID NO55和56。
下面的论述涉及韩国申请No.10-2001-0048123,其中公开了本发明另外的用途和优点。
如其中所提供,本发明提供可用于筛选体内蛋白酶抑制剂的重要嵌合底物蛋白质。如其中特别公开的,本发明涉及筛选蛋白酶抑制剂的系统并且其提供(i)通过蛋白酶的特异功能引起荧光亚细胞定位和分布改变的构建的嵌合底物蛋白质、(ii)包含编码嵌合底物蛋白质核酸序列的重组基因,其可用于在细胞中表达嵌合底物蛋白质、(iii)在蛋白酶和嵌合底物蛋白质一起出现在一个细胞中,以便通过蛋白酶的蛋白酶剪切可在细胞中发生的情况下,通过检测荧光的亚细胞定位和分布鉴定蛋白酶活性的方法,和(iv)使用嵌合底物蛋白质和上述方法体内筛选蛋白酶抑制剂的方法。
更具体地,韩国申请No.10-2001-0048123公开了这种嵌合底物蛋白质可用在细胞中,其中当信号蛋白质在细胞中表达时,其可指导向亚细胞器的运输。更详细地,指向特定亚细胞器的运输信号(包括在信号蛋白质中),可通过在信号蛋白质的N或C末端连接信号掩蔽蛋白质而失活。在本发明中,信号蛋白质与带蛋白酶的蛋白酶剪切位点的信号掩蔽蛋白质连接,以便根据蛋白水解位点的切割活化或失活信号蛋白质的运输。换言之,嵌合底物蛋白质的运输(其中用蛋白水解位点连接信号蛋白质和信号掩蔽蛋白质)直到信号掩蔽蛋白质被蛋白酶切掉时才发生。这种切割诱导信号蛋白质的正常运输。在本发明中,用荧光蛋白质标记信号蛋白质和/或信号掩蔽蛋白质,以便可通过检测荧光信号定位和分布特征的变化确定蛋白酶活性。因此,在本发明中用作蛋白酶底物的嵌合蛋白质有以下特点(1)嵌合底物蛋白质包括至少一种信号蛋白质,其具有指导向特定亚细胞器转运的运输信号。
(2)嵌合底物蛋白质包括至少一种特定蛋白酶的蛋白酶剪切位点。
(3)通过蛋白酶剪切位点与信号蛋白质的连接,或通过蛋白酶剪切位点将信号掩蔽蛋白质与信号蛋白质连接,可失活(1)中阐明的信号蛋白质的运输信号。
(4)当蛋白酶在蛋白水解位点上的切割时,可活化信号蛋白质的失活的运输信号。
(5)至少用一种荧光蛋白质标记嵌合底物蛋白质,来自细胞的荧光信号随蛋白酶的蛋白酶剪切而变化。
如韩国申请No.10-2001-0048123中所述,本发明还提供使用此处描述的嵌合底物蛋白质体内检测蛋白酶活性的方法。还提供使用蛋白酶活性检测方法筛选蛋白酶抑制剂的方法。
如韩国申请No.10-2001-0048123中进一步公开的那样,为体内检测蛋白酶活性,蛋白酶和蛋白酶特异的嵌合底物蛋白质必需共存在一个细胞中。
另外,根据一个发明方面,在细胞中引入嵌合底物蛋白质的重组基因以在细胞中表达嵌合底物蛋白质。筛选蛋白酶抑制剂的靶蛋白酶可以是存在于细胞中的内源性蛋白酶,或通过重组基因转化或病毒感染表达的外源性蛋白酶。然而,当内源性蛋白酶是靶标时,例如,由于蛋白酶表达调节及低水平蛋白酶表达下的检测困难,可降低筛选的精度和效率。因此,本发明提供测定体内蛋白酶活性效率更高的系统,其中可通过用重组基因转化细胞或用病毒感染细胞以调节方式过表达或表达特定的蛋白酶。对于病毒蛋白酶可使用病毒感染。然而,由于不完全明白病毒蛋白酶的表达调节,因此更优选使用通过编码蛋白酶的重组基因转化细胞表达的蛋白酶。因为表达的蛋白酶定位在胞质溶胶中,所以需要使嵌合底物蛋白质也定位在胞质溶胶中。因此,根据本发明的第一部分,可通过使用嵌合底物蛋白质构建有效检测体内蛋白酶活性的系统,其中包括在嵌合底物蛋白质中的信号蛋白质的运输信号被掩蔽。
另外,可通过检测荧光信号定位和分布的变化选择蛋白酶抑制剂,这种变化是通过在蛋白酶和其嵌合底物蛋白质在细胞中表达之前、之后,或同时,用候选化合物处理细胞引起。
在许多酶促反应中,反应物不能完全转化成产物。在反应被抑制剂抑制的情况下,其也可被部分抑制而非完全抑制。而且,当观察多细胞时,每个细胞中的蛋白酶活性水平可相当大地改变。因此,如果用于测定蛋白酶活性的方法具有低灵敏度或低对比度,可能在测定蛋白酶抑制剂的抑制活性上有相当大地错读(ambiguity)。为避免这种错读,在嵌合底物蛋白质的构建中,选择可因为蛋白酶剪切而引起荧光信号细胞定位和分布可清楚辨别变化的信号蛋白质是重要的。另外,通过使用两种或多种不同荧光波长的荧光蛋白质可增加测定抑制活性的效率。在本发明的实施例2中,在嵌合底物蛋白质的构建中使用了GFP和RFP,以便它们可根据蛋白酶剪切定位在不同的亚细胞器中。
如上所述,根据本发明某些信号蛋白质是可选地掩蔽的。在这个实施方案中,由于与信号蛋白质连接的蛋白水解位点或信号掩蔽蛋白质的信号掩蔽,本发明提供的包括在嵌合底物蛋白质中的信号蛋白质是失活的,因此嵌合底物蛋白质存在于胞质溶胶中。蛋白酶剪切可活化信号蛋白质以指导其运输到亚细胞器。在选择运输信号在嵌合底物蛋白质中失活的信号蛋白质时,需要考虑信号蛋白质的不同性质。内体运输蛋白质在它们刚一合成时就包封在内质网中转运到高尔基体、溶解液泡、储存液泡,或细胞膜中。内体运输蛋白质的运输信号在翻译过程中被识别。因此,不可能通过简单地连接和切掉有或没有信号掩蔽蛋白质的蛋白水解位点,失活和活化内体运输蛋白质的运输信号。因此,这些内体运输蛋白质不适合作为运输信号被失活的信号蛋白质用于本发明。根据本发明,因为可掩蔽其运输信号,所以在胞质溶胶中表达并直接运输到亚细胞器的蛋白质可用作信号蛋白质。在后面的信号蛋白质中,有核定位信号(NLS)的信号蛋白质不依赖N或C末端,因此通过连接或切掉有或没有信号掩蔽蛋白质的蛋白水解位点控制这些信号蛋白质的运输是困难的。因此希望选择靶向有线粒体、叶绿体,或过氧化物酶体的运输信号的信号蛋白质。对于植物细胞,更优选使用叶绿体靶向的信号蛋白质,因为叶绿体比较大并更容易检测其形状和分布。
包括在本发明嵌合底物蛋白质中的信号掩蔽蛋白质,通过蛋白水解位点与信号蛋白质连接而失活信号蛋白质的运输信号。信号掩蔽蛋白质可是通过蛋白水解位点与信号蛋白质连接的氨基酸、肽或蛋白质。对于一些实例,可通过蛋白水解位点单独与信号蛋白质的连接失活信号蛋白质的运输信号。信号掩蔽蛋白质和蛋白水解位点必需不干扰底物与蛋白酶的结合。除简单信号掩蔽外,信号掩蔽蛋白质还可用于改变嵌合底物蛋白质的整体性质,或附加另外的运输信号或荧光标记。例如,如果另一信号蛋白质被选作信号掩蔽蛋白质,当被蛋白酶切掉时,该信号蛋白质将移动到其靶细胞器。在这种情况中,如果还用荧光蛋白质标记该信号蛋白质,可通过检测两种不同的荧光信号更清楚地鉴定底物蛋白质的切割。在另一实例中,可使用荧光蛋白质作为信号掩蔽蛋白质。在这个情况中,通过蛋白酶剪切形成的荧光蛋白质将停留在胞质溶胶中。因此可通过分别观察来自胞质溶胶和亚细胞器的荧光信号,提高测定蛋白酶活性或检测蛋白酶抑制剂抑制活性的效率,其中通过蛋白酶剪切形成的信号蛋白质被转运到亚细胞器中。
可使用一种标准重组方法或方法组合制备此处公开的嵌合底物蛋白质。即,嵌合底物蛋白质的构建方法的特征在于其可扩充性(expandability)。例如,如果在蛋白酶的嵌合底物蛋白质中包括至少两种蛋白水解位点,则可观察到两种或多种信号蛋白质的运输。如果引入两种或多种不同蛋白酶的蛋白水解位点,则可同时检测两种或多种蛋白酶的活性。
信号蛋白质和信号掩蔽蛋白质的选择及嵌合底物蛋白质构建的详细方法如下。标志-↓-代表蛋白酶的蛋白水解位点,M代表信号掩蔽蛋白质。
(1)在运输信号在信号蛋白质N末端(nS)的情况中,信号掩蔽蛋白质置于信号蛋白质N末端一边(M-↓-nS)。
(2)在运输信号在信号蛋白质C末端(Sc)的情况中,信号掩蔽蛋白质置于信号蛋白质C末端一侧(Sc-↓-M)。
(3)在另一信号蛋白质S’用作信号掩蔽蛋白质的情况中,可选择S’在与S相对的一侧保持运输信号。可通过构建两个信号蛋白质运输信号部分连接的嵌合底物蛋白质,同时掩蔽两个信号蛋白质的运输信号(Sc-↓-nS’或S’c-↓-nS)。
(4)在如(3)的构建中,如果引入两种蛋白水解位点,信号掩蔽蛋白质必需置于两种信号蛋白质之间(Sc-↓-M-↓-nS’或Sc’-↓-M-↓-nS)。
(5)如果信号蛋白质(S)和用作信号掩蔽蛋白质的另一信号蛋白质(S’)的运输信号在同一侧,则需要连接掩蔽S’运输信号的另一信号掩蔽蛋白质(M-↓-nS’-↓-nS或Sc-↓-Sc’-↓-M)。
通过扩展上述(1)到(5)的构建,可用三种或更多的蛋白水解位点构建嵌合底物蛋白质(Scm-↓-......-↓-Sc2-↓-Sc1-↓-M-↓-nS1-↓-nS2-↓-......-↓-nSn)。
上述构建方法是可能构建方法的代表实例。
除上述包括在嵌合底物蛋白质中的所有信号蛋白质的运输信号都被掩蔽的实例外,有可以提供蛋白酶剪切在胞质溶胶中发生的嵌合底物蛋白质的其他构建方法。如果只有一种包括在嵌合底物蛋白质中的信号蛋白质的运输信号保持活性,而其余信号蛋白质的所有运输信号都被掩蔽,则嵌合底物蛋白质将被易位到活性信号蛋白质靶标的亚细胞器。在这当中,如果易位嵌合底物蛋白质位于亚细胞器膜,可构建嵌合底物蛋白质,其中暴露至少一种蛋白水解位点和至少一种失活信号蛋白质于胞质溶胶中,以便达到与使用所有信号蛋白质的运输信号都被掩蔽的嵌合底物蛋白质同样效果。如果该只有一种信号蛋白质保持活性的嵌合底物蛋白质用作底物,因为蛋白水解位点暴露于胞质溶胶中,所以可通过存在于胞质溶胶中的蛋白酶发生蛋白水解反应,尽管嵌合底物蛋白质不是自由分散在胞质溶胶中。在这种情况中,暴露于胞质溶胶的失活信号蛋白质通过蛋白酶剪切被活化。因此,包括该活化信号蛋白质的蛋白质片段将易位到与嵌合底物蛋白质居留的亚细胞器不同的特定亚细胞器,这导致附着于活化信号蛋白质的荧光信号定位和分布的改变。
构建只有一种信号蛋白质运输信号保持活性的嵌合底物蛋白质的另一可能方法是,无运输信号的荧光蛋白质,例如GFP或RFP,与暴露于胞质溶胶的蛋白水解位点连接,而不是连接信号蛋白质。在这种情况中,因为由蛋白酶剪切产生的荧光蛋白质分散在胞质溶胶中,所以荧光信号的分布从特定细胞器变成胞质溶胶。然而,在这种情况中,由于酶反应的不完全,所以荧光信号是否定位在膜或胞质溶胶的分辨清晰度是低的。另外,在构建只有一种信号蛋白质保持活性的嵌合底物蛋白质中可能有相当大的困难,因为不仅需要信号蛋白质易位到的亚细胞器的详细信息,而且需要易位信号蛋白质定向和位置的详细信息。
靶向到线粒体、叶绿体,和细胞核外膜、过氧化物酶体膜和质膜的信号蛋白质,可用作在嵌合底物蛋白质中保持活性的信号蛋白质。还可使用可特异结合磷脂的信号蛋白质。实例包括,如图2(h)中所显示的与磷脂酰肌醇4,5-二磷酸(PI(4,5)P2)结合的Pleckstrin同源结构域(PH),和与磷脂酰肌醇4-磷酸(PI(4)P)结合的FAPP(家族A(磷酸肌醇特异结合)成员3)的Pleckstrin同源结构域。
在实施例2中,对根据本发明构建的表达蛋白酶和其嵌合底物蛋白质的转化细胞进行Western印迹分析,并证实正确地发生了蛋白酶反应。与进行细胞溶解和粗提物电泳及抗体鉴定的Western印迹分析相比,本发明提供的系统可通过简单地观察细胞本身进行鉴定,因此在时间和成本两方面都是更高效的。
在本发明实施例1中,构建了可直观确定细胞中蛋白质的运输和分布的系统。通过选择具有至亚细胞器的运输信号的信号蛋白质并用荧光蛋白质标记构建嵌合蛋白质以显示易位后的蛋白质定位。这表明通过观察用包括嵌合蛋白质重组基因的重组质粒转化细胞的荧光图像,可鉴定嵌合蛋白质的定位。
在这些嵌合蛋白质中,选择AtOEP7:GFP并连接蛋白酶的蛋白水解位点,以构建可用于体内蛋白酶抑制剂筛选的嵌合底物蛋白质。AtOEP7是靶向拟南芥属叶绿体外包膜的蛋白质,前已述及,对于植物细胞更希望选择叶绿体靶向的蛋白质。因为AtOEP7在N末端有运输信号,所以信号掩蔽蛋白质被连接到AtOEP7:GFP的N末端一侧。选择红色荧光蛋白质作为信号掩蔽蛋白质。因此,构建了嵌合底物蛋白质,在蛋白酶剪切后绿色荧光定位到叶绿体外包膜,而红色荧光分布在胞质溶胶中。
一般而言,本发明融合分子的制备包括常规重组步骤,涉及,例如,聚合酶链扩增反应(PCR)、质粒DNA制备、限制性内切酶切割DNA、寡聚核苷酸制备、DNA连接、mRNA分离、DNA引入到适当细胞,和细胞培养。另外,根据众所周知的技术,包括那些包含标准电泳、离心和层析操作的方法,可分离和纯化此处描述的嵌合蛋白质。对于涉及这些方法的内容,一般参见,Sambrook等人,见上文;和Ausubel等人,见上文。
可从多种公共来源,包括那些特别提到的来源获得此处描述的DNA和蛋白质序列。优选的来源是位于National Library of Medicine,38A,8N05,Rockville Pike,Bethesda,MD 20894的National Center forBiotechnology Information(NCBI)-Genetic Sequence Data Bank(GenBank)。也可使用互联网上的GenBank。有关GenBank的描述,一般参见Benson,D.A.等人,Nucl.Acids,Res.,251(1997)。
实施例中使用的其他试剂,例如抗体、细胞和病毒,可从公认的商业或公共来源获得,例如Linscott’s Directory(40 Glen Drive,Mill ValleyCalifornia 94941),和the American Type Culture Collection(ATCC)12301 Parklawn Drive,Rockville,MD 20852。
此处引用这里提及的所有文献作为参考。
通过下面的实施例进一步说明本发明。提供的这些实施例是帮助理解本发明的,不能作为其限制解释。
实施例1检测嵌合蛋白质和向亚细胞器运输(a)表达嵌合蛋白质重组质粒的构建拟南芥属外包膜蛋白质AtOEP7(是豌豆OEP14的同系物)的编码区,使用设计除去天然终止密码子的两条特异引物(5’-GACGACGACGCAGCGATG和5’-GGATCCCCAAACCCTCTTTGGATGT),从拟南芥属基因组DNA中通过聚合酶链反应(PCR)扩增。然后,其符合读框地连接到绿色或红色荧光蛋白质编码区的5’末端,以分别构建重组质粒AtOEP7:GFP和AtOEP7:RFP。重组质粒中连接基因由35S启动子调节。同样的方法用于此后描述的其他重组质粒的构建。
对于嵌合蛋白质Rubisco复合蛋白质的表达,使用两条特异引物(5’-CCTCAGTCACACAAAGAG和5’-ACTCGAGGGAATCGGTAAGGTCAG),从λZAPII cDNA文库PCR扩增Rubisco复合体小亚单位转运肽的编码区。获得的PCR产物亚克隆到pBluescript,然后符合读框地连接到GFP或RFP编码区的5’末端,以分别构建重组质粒RbcS:GFP和RbcS:RFP。
对于叶绿素a/b结合蛋白质的表达,使用两条特异引物(5’-TAGAGAGAAACGATGGCG和5’-GGATCCCGTTTGGGAGTGGAACTCC),从λZAPII cDNA文库PCR扩增对应的基因,以构建重组质粒Cab:GFP。
使用两条特异引物(5’-TCTAGAATGGCCGCCGCAGTTTCC和5’-GGATCCATCTGTCTCCATCGGTTTG),从λZAPII cDNA文库PCR扩增rubisco活化酶(RA)的转运肽编码区,并连接到GFP编码区的5’末端,构建重组质粒RA:GFP。
使用两条特异引物(5’-CTTTAATCAATGGCAATG和5’-CCATGGCCTGAACTGCTCTAAGCTT),从λZAPII cDNA文库PCR扩增F1-ATPase(登录号D88374)转运肽编码区,并连接到GFP编码区的5’末端,构建F1-ATPase:GFP。
过氧化物酶体靶向蛋白质重组质粒,GFP:SKL,通过使用两条特异引物(5’-CCGTATGTTACATCACC和5’-TTATAGCTTTGATTTGTATAGTTCATCCAT),以326GFP(Davis,S.J.和Viestra,R.D.,1998)为模版PCR扩增构建。
使用上述方法,以两条特异引物(5’-GAGATGTCGAGTCTCGAA和5’-CTCGAGCACAGTGTAGTGACTGG)扩增全长H+-ATPase(拟南芥属的AHA2),并连接到GFP编码区的5’末端,构建H+-ATPase:GFP的重组质粒。
PH结构域(Pleckstrin同源结构域)的嵌合蛋白质GFP:PH的重组质粒,根据Kost,B.等人(1998)描述的方法构建。
图1中显示从根据上述方法构建的重组质粒表达的嵌合蛋白质的结构图解。
(b)原生质体制备用新刀片,将生长在温室土壤上的3-4周龄的拟南芥属植物叶组织(5g)切成小方块(5-10mm2),并用50ml酶溶液(0.25%解析酶R-10、1.0%纤维素酶R-10、400mM甘露醇、8mM CaCl2、5mM Mes-KOH,pH5.6)于22℃轻轻搅拌(50-75rpm)温育。温育以后,100μm筛目过滤原生质体悬液,并于46xg离心5分钟收集原生质体。在5到10ml W5溶液(154mM NaCl、125mM CaCl2、5mM KCl、5mM葡萄糖、1.5mMMes-KOH,pH5.6)中重悬原生质体沉淀,在上面覆盖20ml 21%的蔗糖,并于78xg离心10分钟。转移界面上完整的原生质体到20ml W5溶液中。在55xg离心5分钟,再次沉淀原生质体,在20ml W5溶液中中重悬,然后在冰上温育30分钟。
(c)重组质粒DNA的分离和原生质体的转化根据产品说明书,使用Qiagen columns(Valencia,CA)纯化重组质粒。为了用DNA转化原生质体,46xg 5分钟再次沉淀原生质体,并以5×106原生质体/ml的密度重悬于MaMg溶液(400mM甘露醇、15mMMgCl2、5mM Mes-KOH,pH5.6)。通过PEG(聚乙二醇)介导的转化方法(Jin等人,2001)在拟南芥属原生质体中引入重组质粒构建体。约20-50μg浓度为2μg/μl的质粒DNA与300μl原生质体悬液混合,加入325μl PEG(聚乙二醇)溶液(400mM甘露醇、100mM Ca(NO3)2、40%PEG 4000)并轻轻混合。混合物室温温育30分钟。温育后,混合物用10ml W5溶液稀释。50xg离心5分钟重新收集原生质体,在3ml W5溶液中重悬,并在黑暗中于22℃温育。
(d)嵌合蛋白质的表达和其亚细胞定位的观察根据实施例1(c)中描述的方法,用实施例1(a)中构建的重组质粒DNA转化原生质体。使用带冷电荷耦合装置照相机(cooledcharge-coupled device camera)的荧光显微镜(Axioplan荧光显微镜,Zeiss,德国)捕捉图像,监测转化后嵌合蛋白质表达的时间函数。对于GFP、RFP,和叶绿素的自发荧光,分别使用的滤光设置为XF116(激光器474AF20、分色镜(dichroic)500DRLP、发射器510AF23)、XF33/E(激光器535DF35、分色镜570DRLP、发射器605DF50),和XF137(激光器540AF30、分色镜570DRLP、发射器585ALP)(Omega,Inc.,Brattleboro,VT)。然后用Adobe(Mountain View,CA)Photoshop软件处理数据并以伪彩色格式呈现。
在叶绿体外包膜上可观察到嵌合蛋白质AtOEP7:GFP的绿色荧光(图2(a))。这一结果表明包含叶绿体包膜靶向信号蛋白质和荧光蛋白质标记的嵌合蛋白质正确靶向到叶绿体包膜。
图2(b)、(c),和(d)分别表示来自嵌合蛋白质RbcS:GFP、Cab:GFP和RA:GFP的绿色荧光定位。如图中所显示,RbcS:GFP定位在叶绿体间质,及Cab:GFP和RA:GFP也在叶绿体中发射荧光。这些结果表明包含RbcS、Cab,或RA信号肽及荧光蛋白质标记的嵌合蛋白质靶向到叶绿体。
分别在线粒体、过氧化物酶体和质膜上观察到嵌合蛋白质F1-ATPase:GFP、GFP:SKL,和H+-ATPase:GFP的绿色荧光(图2(e)-(g))。这些结果中的红色荧光信号是叶绿体的自发荧光。
GFP:PH的绿色荧光信号,分布在磷脂酰肌醇4,5-二磷酸(PI(4,5)P2)存在的质膜上,其中GFP:PH包含与磷脂特异结合的PH结构域(Pleckstrin同源结构域)。
下面更详细的解释图7(a)-(j)。图中显示了用于表达图1所示融合蛋白质重组质粒质粒图谱。本实施例中描述构建这些重组质粒的方法。SEQ ID NO29-42中提供了包括在这些融合蛋白质中的信号蛋白质的核酸和蛋白质序列。另外,SEQ ID NO43和44中提供部分FAPP(家族A(特异结合磷酸肌醇)成员3)Pleckstrin同源结构域的核酸和蛋白质序列。
这些信号蛋白质是可用作本发明失活信号蛋白质或活性信号蛋白质的信号蛋白质的实例。AtOEP7、RbcS、Cab、RA、F1-ATPase和SKL(过氧化物酶体靶向序列)是嵌合底物蛋白质中可通过掩蔽失活的信号蛋白质的实例。AtOEP7、H+-ATPase:GFP、PH和FAPP是在嵌合底物蛋白质中保持活性的信号蛋白质的实例。
实施例2蛋白酶对嵌合底物蛋白质切割的检测(a)重组质粒的构建通过将NIa蛋白酶编码区置于pUC载体35S启动子的控制之下,构建NIa蛋白酶的重组质粒。
无终止密码子的AtOEP7编码区与326GFP载体(从ArabidopsisBiological Resource Center,Ohio University,美国,获得)中的绿色荧光蛋白质编码区5’末端连接,构建拟南芥属外包膜蛋白质绿色荧光蛋白质(AtOEP7:GFP)的重组质粒。通过用两条引物(5’引物5’-CCCGGGGTGTGCGCTTCCAGGGAAAAACTTCGGGAGCG和3’引物5’-GAGCTCTTATTTGTATAGTTCATC)PCR扩增该质粒,将蛋白酶切割位点VRFQ连接到AtOEP7:GFP的N末端。然后将PCR产物(SmaI和XhoI片段)与326RFP-nt载体的HindIII(补平)和XhoI位点连接,构建嵌合底物蛋白质RFP:VRFQ:AtOEP7:GFP的重组质粒(图3(a))。
(b)重组质粒转化如实施例1(b)和(c)进行转化。
(c)用荧光显微镜检测荧光蛋白质如实施例1(d)进行荧光蛋白质检测。将表达嵌合底物蛋白质RFP:VRFQ:AtOEP7:GFP的最终的重组质粒引入原生质体,并在转化后的24-36小时检测亚细胞运输。如图4中所示,嵌合底物蛋白质以大斑点或聚集体定位在原生质体中,但不进入叶绿体。在同一个斑点上可观察到红色和绿色两种荧光信号。
在下一个实验中,检测NIa蛋白酶是否能切割嵌合底物蛋白质中的切割位点。当用NIa蛋白酶的重组质粒共转化原生质体时,如图5所示,在叶绿体包膜上可观察到绿色荧光信号,而观察到红色荧光信号均匀地分散在胞质溶胶中。另外,红色和绿色荧光信号不再互相重叠,这强烈表明NIa蛋白酶体内切割了嵌合底物蛋白质。
(d)Western印迹分析收集转化原生质体,并在50μl细胞溶解缓冲液(50mM Tris-HCl,pH7.5、1mM DTT、1mM EDTA、50mM NaCl)中溶解。用抗GFP的单克隆抗体(Clontech,Inc)和ECL试剂盒(Amersham,Inc),通过Western印迹分析鉴定嵌合底物蛋白质RFP:VRFQ:AtOEP7:GFP的表达,和NIa蛋白酶将嵌合底物蛋白质切割成RFP和AtOEP7:GFP。
如图6所示,当NIa蛋白酶不被共转化时,以70kDa的预期大小检测到嵌合底物蛋白质RFP:VRFQ:AtOEP7:GFP。相反,当NIa蛋白酶共转化时,抗GFP的抗体在AtOEP7:GFP预期大小的35kDa检测到蛋白质。这一结果表明嵌合底物蛋白质RFP:VRFQ:AtOEP7:GFP被切割成两个蛋白质,RFP和AtOEP7:GFP。因此,这一结果清楚地表明NIa蛋白酶可在体内切割嵌合底物蛋白质,并通过检测绿色荧光信号在叶绿体包膜的定位和红色荧光信号在胞质溶胶中的分散分布,可轻易地测定切割反应。
图8(a)-(b)更详细的解释如下。此图分别显示本实施例中用于表达NIa蛋白酶和其嵌合底物蛋白质RFP:PS(NIa):AtOEP7:GFP重组质粒的质粒图谱。SEQ ID NO45-50中提供NIa蛋白酶和其切割位点的核酸和蛋白质序列。SEQ ID NO51和52中分别提供该嵌合底物蛋白质的完整核酸和蛋白质序列。
实施例3HIV-1蛋白酶抑制剂的体内筛选系统检测人免疫缺陷病毒(HIV-1)蛋白酶抑制剂的便利的体内筛选系统如下所示。
(a)表达HIV-1蛋白酶重组质粒的构建以pHX2BΔRT为模版,用两条引物(5’-TCTAGAATGCCTCAGGTCACTCTTTGG-3’和5’-CTCGAGTCAAAAATTTAAAGTGCAACC-3’)PCR扩增HIV-1蛋白酶编码区,构建HIV-1蛋白酶的重组质粒。PHX-2BΔRT是包含无逆转录酶编码区的HX2B(GenBank登录号K03455)的质粒克隆。扩增产物亚克隆到pBluescript-T载体,然后克隆到35S启动子控制下的pUC载体的XbaI和XhoI位点。
图9(a)中显示HIV-1蛋白酶的质粒图谱,SEQ ID NO55和56中分别提供核酸和蛋白质序列。
(b)表达HIV-1蛋白酶嵌合底物蛋白质的重组质粒构建共构建了9种嵌合底物蛋白质的重组质粒,使用的引物如下正向引物是 5’-CCCGGGTAGCCAAAATTACCCTATAGTGGGAAAAACTTCGGGAGCG-3’,5’-CCCGGGTGCAAGAGTTTTGGCTGAAGCAGGAAAAACTTCGGGAGCG-3’,5’-CCCGGGTGCTACCATAATGATGCAGAGAGGAAAAACTTCGGGAGCG-3’,5’-CCCGGGTAGACAGGCTAATTTTTTAGGGGGAAAAACTTCGGGAGCG-3’,5’-CCCGGGTCCAGGGAATTTTCTTCAGAGCGGAAAAACTTCGGGAGCG-3’5’-CCCGGGTAGCGTGCCTCAAATAGGAAAAACTTCGGGAGCG-3’,5’-CCCGGGTACTTTAAATTTTCCCATTAGCGGAAAAACTTCGGGAGCG-3’,5’-CCCGGGTGCAGAAACCTTCTATGTAGATGGAAAAACTTCGGGAGCG-3’,
和5’-CCCGGGTAGGAAAGTACTATTTTTAGATGGAAAAACTTCGGGAGCG-3’,使用的通用反向引物是5’-CTCGAGTTATTTGTATAGTTCATC-3’。这些引物设计包含HIV-1蛋白酶的蛋白水解位点。正向引物的下划线部分对应蛋白水解位点序列(SEQ ID NO57、59、61、63、65、67、69、71,和73)。以NIa蛋白酶底物蛋白质(SEQ ID NO51)的质粒为模版,用上述正向引物之一和通用引物进行PCR扩增。用SmaI和XhoI限制性消化PCR产物,并亚克隆到HindIII(补平)和XhoI消化的326RFP-nt载体。因此,9种所得质粒的每一种包含编码组成为RFP:PS(HIV-1):AtOEP7:GFP的嵌合底物蛋白质之一的DNA序列,其中PS(HIV-1)是HIV-1蛋白酶蛋白水解位点之一。SEQ ID NO75和76提供这些嵌合底物蛋白质之一的核酸和蛋白质序列。
(c)HIV-1蛋白酶抑制剂的体内筛选根据实施例1(b)和(c)描述的方法进行拟南芥属叶组织原生质体的制备和转化。如实施例1(d)中所描述(使用同类型的滤光片装置,但使用Nikon E800荧光显微镜),进行转化原生质体荧光图像的检测。
作为体内检测HIV-1蛋白酶抑制的工作实施例,用HIV-1蛋白酶底物蛋白质RFP:PS(HIV-1):AtOEP7:GFP的重组质粒转化原生质体。包括在嵌合底物蛋白质中的蛋白水解位点序列是RQANFLG(SEQ ID NO64)。转化原生质体在22℃于W5溶液中温育18-48小时以表达嵌合底物蛋白质,用荧光显微镜监测来自表达嵌合底物蛋白质的荧光信号的亚细胞定位。
如图11所示,在胞质溶胶的同一位置可观察到绿色和红色荧光两种信号都形成大斑点或聚集体,但不靶向到叶绿体。这一结果表明嵌合底物蛋白质未被切割,因此它们以未切割的形式存在于胞质溶胶中。这一数据对应于发生HIV-1蛋白酶完全抑制时的结果。
如下进行HIV-1蛋白水解活性的检测。用HIV-1蛋白酶的重组质粒和HIV-1蛋白酶底物蛋白质RFP:PS(HIV-1):AtOEP7:GFP的重组质粒共转化原生质体。包括在嵌合底物蛋白质中的蛋白水解位点序列是RQANFLG(SEQ ID NO64)。用荧光显微镜监测转化后18-48小时,来自表达嵌合底物蛋白质的荧光信号的亚细胞定位。如图12所示,观察到红色荧光信号均匀地分散在胞质溶胶中,而观察到大部分绿色荧光信号在叶绿体周围。这些结果表明嵌合底物蛋白质已被HIV-1蛋白酶切割。
该系统可用于检测那些减少分散的红色荧光信号和叶绿体靶向的绿色荧光信号,并因此在原生质体中封闭或抑制HIV-1蛋白酶活性的分子。
图9(a)和(b)更详细的解释如下。该图显示HIV-1蛋白酶和嵌合底物蛋白质RFP:PS(HIV-1):AtOEP7:GFP重组质粒的质粒图谱。这些重组质粒可用于在植物细胞例如鼠耳芥(Arabidopsis thaliana)、烟草等中表达HIV-1蛋白酶和嵌合底物蛋白质。SEQ ID NO55-74中提供HIV-1蛋白酶和其切割位点的核酸和蛋白质序列。SEQ ID NO75和76中分别提供实施例3中使用的嵌合底物蛋白质的完整核酸和蛋白质序列。
实施例4一种信号蛋白质保持活性的可选地掩蔽嵌合蛋白质的制备和使用如上所述,本发明的一个目的是提供重组嵌合蛋白质,其中至少一些信号蛋白质被至少一种适当的氨基酸序列掩蔽。例如,根据本发明,特定嵌合蛋白质的所有信号蛋白质可根据需要掩蔽或暴露。可替代地,可暴露嵌合蛋白质的部分信号成分,而其余信号被掩蔽。对于本发明,这种“可选地掩蔽”嵌合蛋白质提供了重要的灵活性并有广泛而重要的应用。
例如,这种嵌合蛋白质可用于根据嵌合蛋白质一或多种荧光信号亚细胞定位的变化,检测体内蛋白酶活性的筛选。这种筛选高度灵敏,就是因为其可显示嵌合蛋白质空间分布的微小变化。预期的发明应用将指导选择是否掩蔽或暴露包括在受试嵌合分子中的一种或一种以上的信号蛋白质。
图10提供一些说明性的“可选地掩蔽”嵌合蛋白质。更具体地,该图显示编码一种信号蛋白质的运输信号保持活性的嵌合底物蛋白质的重组基因的示意图。H+-ATPase用作活性信号蛋白质的实例,其在嵌合底物蛋白质中的运输信号不被掩蔽。可用作活性信号蛋白质的其他实例包括AtOEP7、PH和FAPP。AtOEP7用作失活信号蛋白质的实例,其运输信号通过连接蛋白酶剪切位点或通过蛋白酶剪切位点连接信号掩蔽蛋白质而被掩蔽。可用作失活信号蛋白质的其他实例包括RbcS、Cab、RA、F1-ATPase和SKL。这些嵌合底物蛋白质设计根据蛋白酶剪切诱导亚细胞荧光信号分布的改变。几乎此处公开的任何蛋白酶切割序列均可用于提供图10中举例说明的嵌合蛋白质的切割位点(PS)。因此,这种可选地掩蔽嵌合蛋白质可用于检测广泛的蛋白酶抑制剂分子。当然,几乎此处公开的任何蛋白酶切割序列均可用于提供图10中举例说明的嵌合蛋白质的切割位点(PS)。
图10更详细的解释如下。图10(a)显示构建体,其中荧光信号(FP-1)因蛋白酶剪切从质膜易位到胞质溶胶。在图10(b)的情况中,一种荧光信号(FP-2)以图10(a)情况中的同样方式易位,但另一种荧光信号(FP-1)仍留在质膜上。在图10(c)的情况中,荧光信号(FP-1)因蛋白酶剪切从质膜易位到叶绿体。在图10(d)的情况中,一种荧光信号(FP-2)以图10(c)情况中的同样方式易位,但另一种荧光信号(FP-1)仍留在质膜上。
(a)表达一种信号蛋白质保持活性的嵌合底物蛋白质的重组质粒的构建图10中描述的重组质粒的实例构建如下。
编码H+-ATPase:PS:GFP(图10(a))的两个重组质粒构建如下,其中蛋白酶剪切位点序列是VRFQ(SEQ ID NO48)和RQANFLG(SEQID NO64)。
正向引物5’-CTCGAG PS ATGAGTAAAGGAGAAGAA-3’(这里PS对于VRFQ NIa切割位点是GTGCGCTTCCAG,或对于RQANFLG HIV-1切割位点是AGACAGGCTAATTTTTTAGGG)和反向引物5’-GAGCTCTTATTTGTATAGTTCATC-3’用于326GFP载体的PCR扩增。这些PCR产物,其中包括NIa或HIV-1蛋白酶的蛋白酶剪切位点、亚克隆的限制性位点(XhoI和SacI),和GFP C末端的终止密码子,被亚克隆到pBluscript-T载体。这些亚克隆的XhoI/SacI片段连接到XhoI和SacI消化的pH+ATPase-G载体(图7(i))。
编码H+-ATPase:GFP:PS:RFP(图10(b))的两个重组质粒构建如下,其中蛋白酶剪切位点序列是VRFQ(SEQ ID NO48)和RQANFLG(SEQ ID NO64)。
为制备无终止密码子的GFP,用引物5’-CTCGAGATGAAAGGAGAAGAACTT-3’和5’-GAGCTCTTTGTATAGTTCATCCAT-3’进行PCR扩增。包含XhoI和SacI位点的PCR产物亚克隆到pBluscript-T载体,然后用XhoI和SacI限制性消化。该XhoI/SacI片段亚克隆到XhoI和SacI消化的pH+ATPase-G载体(图7(i))。
为将蛋白酶剪切位点置于RFP的上游,正向引物5’-GAGCTC PSATGGTGCGCTCCTCCAAG-3’(这里PS对于VRFQ NIa切割位点是GTGCGCTTCCAG,或对于RQANFLG HIV-1切割位点是AGACAGGCTAATTTTTTAGGG)和反向引物5’-GAGCTCCTACAGGAACAGGTGGTG-3’用于326GFP载体的PCR扩增。构建体包括PS:RFP,还包括SacI位点,其用SacI限制性消化,这些SacI片段亚克隆到如上所述制备的H+-ATPase:GFP(无终止密码子)亚克隆的SacI位点,产生H+-ATPase:GFP:PS:RFP的重组质粒。
编码H+-ATPase:PS:AtOEP7:GFP(图10(c))的两个重组质粒构建如下,其中蛋白酶剪切位点序列是VRFQ(SEQ ID NO48)和RQANFLG(SEQ ID NO64)。
用引物5’-CTCGAG PS GGAAAAACTTCGGGAGCG-3’(这里PS对于VRFQ NIa切割位点是GTGCGCTTCCAG,或对于RQANFLGHIV-1切割位点是AGACAGGCTAATTTTTTAGGG)和5’-GAGCTCTTATTTGTATAGTTCATC-3’PCR扩增pSub-NIa1载体(图8(b))。因此,PCR产物包括XhoI和SacI位点。这些亚克隆的XhoI/SacI片段连接到XhoI和SacI消化的pH+ATPase-G载体(图7(i)),产生H+-ATPase:PS:AtOEP7:GFP的重组质粒。
编码H+-ATPase:RFP:PS:AtOEP7:GFP(图10(d))的两个重组质粒构建如下,其中蛋白酶剪切位点序列是VRFQ(SEQ ID NO48)和RQANFLG(SEQ ID NO64)。
引物5’-CTCGAGATGGTGCGCTCCTCCAAG-3’和5’-GAGCTCTTATTTGTATAGTTCATC-3’用于PCR扩增pSub-NIa1载体(图8(b))和pSub-HIV4载体(图9(b))。因此,这些PCR产物包括XhoI和SacI位点。这些亚克隆的XhoI/SacI片段连接到XhoI和SacI消化的pH+ATPase-G载体(图7(i)),产生H+-ATPase:RFP:PS:AtOEP7:GFP的重组质粒。
(b)使用图10(a)中描述的重组质粒的工作实施例根据实施例1(b)和(c)描述的方法,进行拟南芥属叶组织原生质体的制备和转化。如实施例1(d)中所描述(使用同类型的滤光片装置,但使用Nikon E800荧光显微镜),进行转化原生质体荧光图像的检测。
作为检测NIa蛋白酶抑制的工作实施例,用如实施例4(a)所描述制备的编码嵌合底物蛋白质H+-ATPase:PS:GFP的重组质粒转化原生质体。包括在嵌合底物蛋白质中的蛋白水解位点序列是VRQF(SEQ IDNO48)。转化原生质体在22℃于W5溶液中温育18-48小时以表达嵌合底物蛋白质,用荧光显微镜监测来自表达嵌合底物蛋白质的荧光信号的亚细胞定位。如图13(a)所示,绿色荧光信号易位到质膜。这一结果表明嵌合底物蛋白质如预期的那样未被切割,因此附加的绿色荧光蛋白质通过H+-ATPase的运输信号靶向到质膜。这一数据对应于发生蛋白酶完全抑制时的结果。
如下进行NIa蛋白水解活性的检测。用NIa蛋白酶的重组质粒(SEQID NO45)和嵌合底物蛋白质H+-ATPase:PS:GFP的重组质粒(SEQ IDNO53)共转化原生质体。包括在嵌合底物蛋白质中的蛋白水解位点序列是VRQF(SEQ ID NO48)。用荧光显微镜监测转化后18-48小时,来自表达嵌合底物蛋白质的荧光信号的亚细胞定位。如图13(c)所示,观察到绿色荧光信号在胞质溶胶中,而不靶向到质膜。这一结果表明GFP被蛋白酶从嵌合底物蛋白质上切割掉。
引用此处公开的所有参考文献作为参考。特别引用以下参考文献作为参考。
Hook,V.Y.H.US 6,245,884(2001).
Kettner,C.A.and Korant,B.D.US 4,644,055(1987).
Cote,H.C.F.,Brumme,Z.L.,and Harrigan,P.R.(2001).J.Virol.75,589-594.
Davis,S.J.and Vierstra,R.D.(1998).Plant Physiol.112,833-844.
Ermolieff,J.,Loy,J.A.,Koelsch,G.,and Tang,J.(2000).Biochem.39,12450-12456.
Gillooly,D.J.,Morrow,I.C.,Lindsay,M.,Gould,R.,Bryant,N.J.,Gaullier,J.-M.,Parton,R.G.,and Stenmark,H.(2000).EMBO J.19,4577-4588.
Gutierrez-Campos,R.,Torress-Acosta,J.A.,Saucedo-Arias,L.et al.(1999).Nat.Biotechnol.17,1223-1226.
Jacobsen,H.,Hanggi,M.,Ott,M.,Duncan,I.B.,and Owen,S.(1996).J.Infect.Dis.173,1379-1387.
Kasai,N.,Tsumoto,K.,Niwa,S.,Misawa,S.,Ueno,T.,Hayashi,H.,and Kumagai,I.(2001).Biochem.Biophys.Res.Comm.281,416-424.
Kuhelj,R.,Rizzo,C.J.,Chang,C.-H.,Jadha,P.K.,Towler,E.M.,and Korant,B.D.(2001).J.Biol.Chem.276,16674-16682.
Kost,B.,Spielhofer,P.,and Chua,N.H.(1998).Plant J.16,383-401.
Mardis,K.L.,Luo,R.,and Gilson,M.K.(2001).J.Mol.Biol.309,507-517.
Miller,T.L.,Mawn,B.E.,Orav,E.J.,Wilk,D.,Weinberg,G.A.,Nicchitta,J.,Furuta,L.,Cutroni,R.,McIntosh,K.,Burchett,S.K.,and Gorbach,S.L.(2001).Pediat.107-5,1-6.
Morise,H.,Shimomura,O.,Johnson,F.H.,and Winant,J.(1974).Biochem.13,2656-2662.
Pih,K.T.,Yi,M.J.,Liang,Y.S.,Shin,B.J.,Cho,M.J.,Hwang,I.,and Son,D.(2000).Plant Physiol.123,51-58.
Rogers,J.D.,Lam,P.Y.,Johnson,B.L.,Wang,H.S.,Ko,S.S.,Seits,S.P.,Trainor,G.L.,Anderson,P.S.,Klabe,R.M.,Bachelor,L.T.,Cordova,B.,Garber,S.,Reid,C.,Wright,M.R.,Chang,C.H.,and Erickson-Biitanen,S.(1998).Chem.Biol.5,597-608.
Wlodawer,A.and Erickson,J.W.(1983).Annu.Rev.Biochem.61,543-585.
Yi,C.-F.,Gosiewska,A.,Burtis,D.,and Geesin,J.(2001).Anal.Biochem.291,27-33.
Yoon,H.Y.,Hwang,D.C.,Choi,K.Y.,and Song,B.D.(2000).Mol.Cell 10,213-219.
通过参考本发明优选的实施例,已对本发明进行了详细的描述。然而,应当理解,本领域的那些技术人员,通过参考本公开内容,可在本发明的精神和范围内进行变更和改进。
序列表<110>AHRAM BIOSYSTEMS INC.
HWANG,InhwanKIM,Dae HeonLEE,Yong Jik<120>蛋白酶检测系统<130>APB02_KR_PCT<150>KR10-2001-0048123<151>2001-08-10<160>120<170>PatentIn version 3.1<210>1<211>18<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(18)<223>部分AtOEP7编码序列的5’PCR引物<400>1gacgacgacg cagcgatg 18<210>2<211>25<212>DNA<213>人工序列
<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(15)<223>部分AtOEP7编码序列的3’PCR引物<400>2ggatccccaa accctctttg gatgt 25<210>3<211>18<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(18)<223>部分rubisco小亚基编码序列的5’PCR引物<400>3cctcagtcac acaaagag 18<210>4<211>24<212>DNA<213>人工序列<220>
<223>合成序列
<220>
<221>misc_特征<222>(1)..(24)<223>部分rubisco小亚基编码序列的3’PCR引物<400>4actcgaggga atcggtaagg tcag24<210>5<211>18<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(18)<223>部分叶绿素a/b结合蛋白质编码序列5¢PCR引物<400>5tagagagaaa cgatggcg 18<210>6<211>25<212>DNA<213>人工序列<220>
<223>合成序列
<220>
<221>misc_特征<222>(1)..(25)<223>部分叶绿素a/b结合蛋白质编码序列3¢PCR引物<400>6ggatcccgtt tgggagtgga actcc25<210>7<211>24<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(24)<223>部分rubisco活化酶编码序列的5’PCR引物<400>7tctagaatgg ccgccgcagt ttcc 24<210>8<211>25<212>DNA<213>人工序列<220>
<223>合成序列
<220>
<221>misc_特征<222>(1)..(25)<223>部分rubisco活化酶编码序列的3’PCR引物<400>8ggatccatct gtctccatcg gtttg25<210>9<211>18<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(18)<223>部分F1-ATPase编码序列的5’PCR引物<400>9ctttaatcaa tggcaatg18<210>10<211>25<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征
<222>(1)..(25)<223>部分F1-ATPase编码序列的3’PCR引物<400>10ccatggcctg aactgctcta agctt25<210>11<211>17<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(17)<223>过氧化物酶体靶向序列的5’PCR引物<400>11ccgtatgtta catcacc17<210>12<211>30<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(30)<223>过氧化物酶体靶向序列的3’PCR引物
<400>12ttatagcttt gatttgtata gttcatccat 30<210>13<211>18<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(18)<223>H+-ATPase编码序列的5’PCR引物<400>13gagatgtcga gtctcgaa 18<210>14<211>23<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(23)<223>H+-ATPase编码序列的3’PCR引物
<400>14ctcgagcaca gtgtagtgac tgg23<210>15<211>38<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(38)<223>NIa蛋白酶底物蛋白质编码序列的5′PCR引物<400>15cccggggtgt gcgcttccag ggaaaaactt cgggagcg 38<210>16<211>24<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(24)<223>NIa蛋白酶底物蛋白质编码序列的3′PCR引物<400>16gagctcttat ttgtatagtt catc24
<210>17<211>27<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(27)<223>HIV-1蛋白酶编码序列的5’PCR引物<400>17tctagaatgc ctcaggtcac tctttgg27<210>18<211>27<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc特征<222>(1)..(27)<223>HIV-1蛋白酶编码序列的3’PCR引物<400>18ctcgagtcaa aaatttaaag tgcaacc27
<210>19<211>46<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(46)<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物<400>19cccgggtagc caaaattacc ctatagtggg aaaaacttcg ggagcg 46<210>20<211>46<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(46)<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物<400>20cccgggtgca agagttttgg ctgaagcagg aaaaacttcg ggagcg 46
<210>21<211>46<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(46)<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物<400>21cccgggtgct accataatga tgcagagacc aaaaacttcg ggagcg46<210>22<211>46<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(46)<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物<400>22cccgggtaga caggctaatt ttttaggggg aaaaacttcg ggagcg46
<210>23<211>46<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(46)<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物<400>23cccgggtcca gggaattttc ttcagagcgg aaaaacttcg ggagcg 46<210>24<211>41<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(41)<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物<400>24cccgggtagc gtgcctcaaa taggaaaaaa cttcgggagc g41
<210>25<211>46<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(46)<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物<400>25cccgggtact ttaaattttc ccattagcgg aaaaacttcg ggagcg 46<210>26<211>46<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(46)<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物<400>26cccgggtgca gaaaccttct atgtagatgg aaaaacttcg ggagcg46
<210>27<211>46<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(46)<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物<400>27cccgggtagg aaagtactat ttttagatgg aaaaacttcg ggagcg46<210>28<211>24<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>misc_特征<222>(1)..(24)<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的3’PCR引物<400>28ctcgagttat ttgtatagtt catc 24
<210>29<211>192<212>DNA<213>鼠耳芥<220>
<221>CDS<222>(1)..(192)<223>包含叶绿体(外包膜)靶向序列的部分AtOEP7(豌豆DEP14的同系物)<300>
<308>GenBank/NM_115102<309>2002-01-10<400>29atg gga aaa act tcg gga gcg aaa cag gcg act gtg gtg gtc gca gcg48Met Gly Lys Thr Ser Gly Ala Lys Gln Ala Thr Val Val Val Ala Ala1 5 10 15atg gcg tta gga tgg tta gcc ata gag atc gct ttc aag cct ttc ctc96Met Ala Leu Gly Trp Leu Ala Ile Glu Ile Ala Phe Lys Pro Phe Leu20 25 30gat aaa ttc cgc tcc tca atc gac aaa tct gac cca acc aaa gac ccc144Asp Lys Phe Arg Ser Ser Ile Asp Lys Ser Asp Pro Thr Lys Asp Pro35 40 45gat gac ttc gac acc gcc gct act gca acc aca tcc aaa gag ggt ttg192Asp Asp Phe Asp Thr Ala Ala Thr Ala Thr Thr Ser Lys Glu Gly Leu50 55 60<210>30<211>64<212>PRT<213>鼠耳芥<400>30
Met Gly Lys Thr Ser Gly Ala Lys Gln Ala Thr Val Val Val Ala Ala1 5 10 15Met Ala Leu Gly Trp Leu Ala Ile Glu Ile Ala Phe Lys Pro Phe Leu20 25 30Asp Lys Phe Arg Ser Ser Ile Asp Lys Ser Asp Pro Thr Lys Asp Pro35 40 45Asp Asp Phe Asp Thr Ala Ala Thr Ala Thr Thr Ser Lys Glu Gly Leu50 55 60<210>31<211>237<212>DNA<213>鼠耳芥<220>
<221>CDS<222>(1)..(237)<223>包含叶绿体(基质)靶向序列的部分rubisco小亚基<300>
<308>GenBank/NM_105379<309>2002-01-10<400>31atg gct tcc tct atg ctc tct tcc gct act atg gtt gcc tct ccg gct48Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala1 5 10 15cag gcc act atg gtc gct cct ttc aac gga ctt aag tcc tcc gct gcc96Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala20 25 30
ttc cca gcc acc cgc aag gct aac aac gac att act tcc atc aca agc144Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser35 40 45aac ggc gga aga gtt aac tgc atg cag gtg tgg cct ccg att gga aag192Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Gly Lys50 55 60aag aag ttt gag act ctc tct tac ctt cct gac ctt acc gat tcc237Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser65 70 75<210>32<211>79<212>PRT<213>鼠耳芥<400>32Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala1 5 10 15Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala20 25 30Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser35 40 45Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Gly Lys50 55 60Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser65 70 75<210>33<211>105<212>DNA<213>鼠耳芥
<220>
<221>CDS<222>(1)..(105)<223>包含叶绿体(基质)靶向序列的部分叶绿素a/b结合蛋白质<300>
<308>GenBank/X56062<309>1992-10-12<400>33atg gcg tcg aac tcg ctt atg agc tgt ggc ata gcc gcc gtg tac cct48Met Ala Ser Asn Ser Leu Met Ser Cys Gly Ile Ala Ala Val Tyr Pro1 5 10 15tcg ctt ctc tct tct tcc aag tct aaa ttc gta tcc gcc gga gtt cca96Ser Leu Leu Ser Ser Ser Lys Ser Lys Phe Val Ser Ala Gly Val Pro20 25 30ctc cca aac105Leu Pro Asn35<210>34<211>35<212>PRT<213>鼠耳芥<400>34Met Ala Ser Asn Ser Leu Met Ser Cys Gly Ile Ala Ala Val Tyr Pro1 5 10 15Ser Leu Leu Ser Ser Ser Lys Ser Lys Phe Val Ser Ala Gly Val Pro20 25 30Leu Pro Asn35
<210>35<211>204<212>DNA<213>鼠耳芥<220>
<221>CDS<222>(1)..(204)<223>包含叶绿体(基质)靶向序列的部分rubisco活化酶<300>
<308>GenBank/X14212<309>1993-09-12<400>35atg gcc gcc gca gtt tcc acc gtc ggt gcc atc aac aga gct ccg ttg48Met Ala Ala Ala Val Ser Thr Val Gly Ala Ile Asn Arg Ala Pro Leu1 5 10 15agc ttg aac ggg tca gga tca gga gct gta tca gcc cca gct tca acc96Ser Leu Asn Gly Ser Gly Ser Gly Ala Val Ser Ala Pro Ala Ser Thr20 25 30ttc ttg gga aag aaa gtt gta act gtg tcg aga ttc gca cag agc aac144Phe Leu Gly Lys Lys Val Val Thr Val Ser Arg Phe Ala Gln Ser Asn35 40 45aag aag agc aac gga tca ttc aag gtg ttg gct gtg aaa gaa gac aaa192Lys Lys Ser Asn Gly Ser Phe Lys Val Leu Ala Val Lys Glu Asp Lys50 55 60caa acc gat gga204Gln Thr Asp Gly65<210>36
<211>68<212>PRT<213>鼠耳芥<400>36Met Ala Ala Ala Val Ser Thr Val Gly Ala Ile Asn Arg Ala Pro Leu1 5 10 15Ser Leu Asn Gly Ser Gly Ser Gly Ala Val Ser Ala Pro Ala Ser Thr20 25 30Phe Leu Gly Lys Lys Val Val Thr Val Ser Arg Phe Ala Gln Ser Asn35 40 45Lys Lys Ser Asn Gly Ser Phe Lys Val Leu Ala Val Lys Glu Asp Lys50 55 60Gln Thr Asp Gly65<210>37<211>234<212>DNA<213>鼠耳芥<220>
<221>CDS<222>(1)..(234)<223>包含线粒体靶向序列的部分线粒体F1-ATPaseg亚基<300>
<308>GenBank/D88374<309>1999-02-07<400>37atg gca atg gct gtt ttc cgt cgc gaa ggg agg cgt ctc ctc cct tca48Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser
1 5 10 15atc gcc gct cgc cea atc gct gct atc cga tct cct ctc tct tct gac96Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp20 25 30cag gag gaa gga ctt ctt gga gtt cga tct atc tca act caa gtg gtg144Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val35 40 45cgt aac cgc atg aag agt gtt aag aac atc caa aag atc aca aag gca192Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala50 55 60atg aag atg gtt gct gct tcc aag ctt aga gca gtt cag gcc234Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Ala65 70 75<210>38<211>78<212>PRT<213>鼠耳芥<400>38Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser1 5 10 15Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp20 25 30Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val35 40 45Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala50 55 60Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Ala65 70 75
<210>39<211>2847<212>DNA<213>鼠耳芥<220>
<221>基因<222>(1)..(2847)<223>包含质膜靶向序列的H+-ATPase基因<220>
<221>CDS<222>(1)..(2844)<223>包含质膜靶向序列的H+-ATPase<300>
<308>GenBank/J05570<309>1993-04-27<400>39atg tcg agt ctc gaa gat atc aag aac gag act gtt gat ctg gaa aaa48Met Ser Ser Leu Glu Asp Ile Lys Asn Glu Thr Val Asp Leu Glu Lys1 5 10 15att ccg att gag gaa gtt ttc cag cag cta aaa tgt tca agg gaa gga96Ile Pro Ile Glu Glu Val Phe Gln Gln Leu Lys Cys Ser Arg Glu Gly20 25 30ttg aca acg cag gaa ggg gag gac agg att cag atc ttt ggc ccc aac144Leu Thr Thr Gln Glu Gly Glu Asp Arg Ile Gln Ile Phe Gly Pro Asn35 40 45aag ctc gaa gag aaa aag gaa agc aaa ctt ctg aag ttt ttg ggg ttt192Lys Leu Glu Glu Lys Lys Glu Ser Lys Leu Leu Lys Phe Leu Gly Phe50 55 60
atg tgg aat cca ctt tca tgg gtc atg gaa atg gct gca atc atg gcc240Met Trp Asn Pro Leu Ser Trp Val Met Glu Met Ala Ala Ile Met Ala65 70 75 80att gct ttg gcc aac ggt gat ggt agg cct ccg gat tgg cag gat ttt288Ile Ala Leu Ala Asn Gly Asp Gly Arg Pro Pro Asp Trp Gln Asp Phe85 90 95gtt ggt att atc tgt ctg ttg gtt atc aac tct acc atc agt ttt atc336Val Gly Ile Ile Cys Leu Leu Val Ile Asn Ser Thr Ile Ser Phe Ile100 105 110gaa gaa aac aat gct ggt aat gct gct gct gct ctt atg gct ggt ctt384Glu Glu Asn Asn Ala Gly Asn Ala Ala Ala Ala Leu Met Ala Gly Leu115 120 125gct cct aaa acc aag gtt ctt agg gat gga aag tgg agt gaa caa gaa432Ala Pro Lys Thr Lys Val Leu Arg Asp Gly Lys Trp Ser Glu Gln Glu130 135 140gct gct att ctt gtc cca gga gat att gtt agc att aaa tta gga gac480Ala Ala Ile Leu Val Pro Gly Asp Ile Val Ser Ile Lys Leu Gly Asp145 150 155 160att atc cca gct gat gcc cgt cta ctt gaa ggt gat cct tta aag gtt528Ile Ile Pro Ala Asp Ala Arg Leu Leu Glu Gly Asp Pro Leu Lys Val165 170 175gac caa tct gct cta act gga gag tcc ctt cct gta acc aag cac ccg576Asp Gln Ser Ala Leu Thr Gly Glu Ser Leu Pro Val Thr Lys His Pro180 185 190ggt caa gaa gtt ttc tct ggt tca acc tgc aaa caa gga gaa atc gag624Gly Gln Glu Val Phe Ser Gly Ser Thr Cys Lys Gln Gly Glu Ile Glu195 200 205gcg gtt gtt att gcc act ggg gtt cat acc ttc ttc ggt aaa gct gct672Ala Val Val Ile Ala Thr Gly Val His Thr Phe Phe Gly Lys Ala Ala210 215 220
cac ctt gtg gac agc act aac caa gtt gga cat ttc cag aag gtt ctt720His Leu Val Asp Ser Thr Asn Gln Val Gly His Phe Gln Lys Val Leu225 230 235 240aca gcc att ggg aac ttc tgt atc tgt tcc att gct atc ggt atg gtg768Thr Ala Ile Gly Asn Phe Cys Ile Cys Ser Ile Ala Ile Gly Met Val245 250 255att gag atc atc gtc atg tat ccg atc caa cgc cga aag tac aga gat816Ile Glu Ile Ile Val Met Tyr Pro Ile Gln Arg Arg Lys Tyr Arg Asp260 265 270gga att gac aac ctt ttg gtc ctc ttg atc ggt ggt atc ccc att gct864Gly Ile Asp Asn Leu Leu Val Leu Leu Ile Gly Gly Ile Pro Ile Ala275 280 285atg cct aca gtc ttg tcc gtg acc atg gct att ggg tct cac agg ttg912Met Pro Thr Val Leu Ser Val Thr Met Ala Ile Gly Ser His Arg Leu290 295 300tct cag caa ggt gcc atc acc aag cgt atg act gcc att gaa gag atg960Ser Gln Gln Gly Ala Ile Thr Lys Arg Met Thr Ala Ile Glu Glu Met305 310 315 320gca gga atg gat gtc ctg tgc agt gac aaa acc ggg aca cta acc ctc1008Ala Gly Met Asp Val Leu Cys Ser Asp Lys Thr Gly Thr Leu Thr Leu325 330 335aac aaa ttg agt gtg gac aaa aac ttg gtc gag gtt ttc tgc aag ggt1056Asn Lys Leu Ser Val Asp Lys Asn Leu Val Glu Val Phe Cys Lys Gly340 345 350gtg gag aaa gat caa gtc cta tta ttt gca gct atg gct tcc agg gtt1104Val Glu Lys Asp Gln Val Leu Leu Phe Ala Ala Met Ala Ser Arg Val355 360 365gag aac cag gat gcc att gat gca gcc atg gtt ggg atg ctt gct gat1152Glu Asn Gln Asp Ala Ile Asp Ala Ala Met Val Gly Met Leu Ala Asp370 375 380
cca aag gag gct aga gct gga atc agg gaa gtt cac ttc ctt cca ttc1200Pro Lys Glu Ala Arg Ala Gly Ile Arg Glu Val His Phe Leu Pro Phe385 390 395 400aac cct gtg gat aag aga act gct ttg act tac att gac ggc agt ggt1248Asn Pro Val Asp Lys Arg Thr Ala Leu Thr Tyr Ile Asp Gly Ser Gly405 410415aac tgg cac aga gtc agt aaa ggt gct cct gag cag atc ctc gaa ctt1296Asn Trp His Arg Val Ser Lys Gly Ala Pro Glu Gln Ile Leu Glu Leu420 425 430gcc aaa gcc agc aat gat ctt agc aag aag gtg ctc tcc att att gac1344Ala Lys Ala Ser Asn Asp Leu Ser Lys Lys Val Leu Ser Ile Ile Asp435 440 445aag tat gct gag cgt ggt ctt agg tcg ttg gct gtt gct cgc cag gtg1392Lys Tyr Ala Glu Arg Gly Leu Arg Ser Leu Ala Val Ala Arg Gln Val450 455 460gtg cca gag aaa aca aag gaa agc cca ggt gcg cca tgg gaa ttt gtt1440Val Pro Glu Lys Thr Lys Glu Ser Pro Gly Ala Pro Trp Glu Phe Val465 470 475 480ggc ttg ttg cca ctt ttt gat ccc cca aga cat gac agt gct gaa aca1488Gly Leu Leu Pro Leu Phe Asp Pro Pro Arg His Asp Ser Ala Glu Thr485 490 495att cga cgg gct ttg aat ctt ggt gtt aac gtc aag atg atc act ggt1536Ile Arg Arg Ala Leu Asn Leu Gly Val Asn Val Lys Met Ile Thr Gly500 505 510gac caa ctt gct att ggt aag gaa act ggt cgc aga ctt gga atg gga1584Asp Gln Leu Ala Ile Gly Lys Glu Thr Gly Arg Arg Leu Gly Met Gly515 520 525aca aac atg tat cca tct tcg gct ctt ctt ggt aca cac aaa gac gca1632Thr Asn Met Tyr Pro Ser Ser Ala Leu Leu Gly Thr His Lys Asp Ala530 535 540
aac ctc gca tcc att cct gtt gag gag ttg att gaa aag gct gat gga1680Asn Leu Ala Ser Ile Pro Val Glu Glu Leu Ile Glu Lys Ala Asp Gly545 550 555 560ttt gcc gga gtc ttc cca gag cac aaa tac gaa att gtg aaa aag ttg1728Phe Ala Gly Val Phe Pro Glu His Lys Tyr Glu Ile Val Lys Lys Leu565 570 575cag gag agg aag cat att gtt gga atg act ggt gat ggt gtc aat gat1776Gln Glu Arg Lys His Ile Val Gly Met Thr Gly Asp Gly Val Asn Asp580 585 590gcc cct gct cta aag aaa gct gat atc ggt att gct gtt gct gat gct1824Ala Pro Ala Leu Lys Lys Ala Asp Ile Gly Ile Ala Val Ala Asp Ala595 600 605aca gat gct gct cgt ggt gct tca gat atc gtg ctc act gag cct gga1872Thr Asp Ala Ala Arg Gly Ala Ser Asp Ile Val Leu Thr Glu Pro Gly610 615 620ctc agc gtt att atc agt gct gtt ctc acc agc aga gct att ttc cag1920Leu Ser Val Ile Ile Ser Ala Val Leu Thr Ser Arg Ala Ile Phe Gln625 630 635 640aga atg aag aac tat act atc tat gca gtc tca atc acc atc cgt att1968Arg Met Lys Asn Tyr Thr Ile Tyr Ala Val Ser Ile Thr Ile Arg Ile645 650 655gtg ttt ggt ttc atg ctt att gct ttg ata tgg gaa ttt gac ttc tca2016Val Phe Gly Phe Met Leu Ile Ala Leu Ile Trp Glu Phe Asp Phe Ser660 665 670gcc ttc atg gtt ctg atc att gcc att ctt aac gac ggt acc atc atg2064Ala Phe Met Val Leu Ile Ile Ala Ile Leu Asn Asp Gly Thr Ile Met675 680 685aca atc tca aag gac aga gtt aag cca tct ccc aca cct gat agc tgg2112Thr Ile Ser Lys Asp Arg Val Lys Pro Ser Pro Thr Pro Asp Ser Trp690 695 700
aaa ctt aaa gaa att ttt gct act gga gtc gtt cta gga ggc tac cag2160Lys Leu Lys Glu Ile Phe Ala Thr Gly Val Val Leu Gly Gly Tyr Gln705 710 715 720gcc atc atg act gtt att ttc ttc tgg gcg gcg cac aag act gac ttt2208Ala Ile Met Thr Val Ile Phe Phe Trp Ala Ala His Lys Thr Asp Phe725 730 735ttc tcg gac aca ttc ggt gtg agg tcc att agg gac aat aac cac gag2256Phe Ser Asp Thr Phe Gly Val Arg Ser Ile Arg Asp Asn Asn His Glu740 745 750cta atg ggt gcg gtg tac tta caa gtt agt atc att agt caa gct ctg2304Leu Met Gly Ala Val Tyr Leu Gln Val Ser Ile Ile Ser Gln Ala Leu755 760 765atc ttc gtc aca aga tca agg agt tgg tct ttt gtt gaa cgt cct gga2352Ile Phe Val Thr Arg Ser Arg Ser Trp Ser Phe Val Glu Arg Pro Gly770 775 780gca ttg ctg atg att gct ttc ctc att gca caa ctg att gct act ttg2400Ala Leu Leu Met Ile Ala Phe Leu Ile Ala Gln Leu Ile Ala Thr Leu785 790 795 800att gcg gtt tac gcc aac tgg gaa ttt gca aag att agg ggt att gga2448Ile Ala Val Tyr Ala Asn Trp Glu Phe Ala Lys Ile Arg Gly Ile Gly805 810 815tgg gga tgg gct ggt gtg atc tgg cta tac agt att gtc aca tac ttc2496Trp Gly Trp Ala Gly Val Ile Trp Leu Tyr Ser Ile Val Thr Tyr Phe820 825 830cca ttg gac gtt ttc aag ttt gcc att cga tac atc ttg agc gga aag2544Pro Leu Asp Val Phe Lys Phe Ala Ile Arg Tyr Ile Leu Ser Gly Lys835 840 845gcg tgg ctc aac ttg ttt gag aac aag acg gct ttc acg atg aag aaa2592Ala Trp Leu Asn Leu Phe Glu Asn Lys Thr Ala Phe Thr Met Lys Lys850 855 860
gat tac gga aaa gaa gag aga gag gct caa tgg gca ctt gct caa agg2640Asp Tyr Gly Lys Glu Glu Arg Glu Ala Gln Trp Ala Leu Ala Gln Arg865 870 875 880aca ctt cac ggt tta cag cca aaa gaa gct gtt aac atc ttc cct gag2688Thr Leu His Gly Leu Gln Pro Lys Glu Ala Val Asn Ile Phe Pro Glu885 890 895aaa gga agt tac aga gaa ttg tct gag atc gct gag caa gct aag aga2736Lys Gly Ser Tyr Arg Glu Leu Ser Glu Ile Ala Glu Gln Ala Lys Arg900 905 910aga gct gag atc gct agg ctt agg gag ctg cac aca ctc aag gga cat2784Arg Ala Glu Ile Ala Arg Leu Arg Glu Leu His Thr Leu Lys Gly His915 920 925gtg gaa tca gtc gtg aag cta aag ggc ttg gac att gaa act ccc agt2832Val Glu Ser Val Val Lys Leu Lys Gly Leu Asp Ile Glu Thr Pro Ser930 935 940cac tac act gtg tag 2847His Tyr Thr Val945<210>40<211>948<212>PRT<213>鼠耳芥<400>40Met Ser Ser Leu Glu Asp Ile Lys Asn Glu Thr Val Asp Leu Glu Lys1 5 10 15Ile Pro Ile Glu Glu Val Phe Gln Gln Leu Lys Cys Ser Arg Glu Gly20 25 30Leu Thr Thr Gln Glu Gly Glu Asp Arg Ile Gln Ile Phe Gly Pro Asn35 40 45
Lys Leu Glu Glu Lys Lys Glu Ser Lys Leu Leu Lys Phe Leu Gly Phe50 55 60Met Trp Asn Pro Leu Ser Trp Val Met Glu Met Ala Ala Ile Met Ala65 70 75 80Ile Ala Leu Ala Asn Gly Asp Gly Arg Pro Pro Asp Trp Gln Asp Phe85 90 95Val Gly Ile Ile Cys Leu Leu Val Ile Asn Ser Thr Ile Ser Phe Ile100 105 110Glu Glu Asn Asn Ala Gly Asn Ala Ala Ala Ala Leu Met Ala Gly Leu115 120 125Ala Pro Lys Thr Lys Val Leu Arg Asp Gly Lys Trp Ser Glu Gln Glu130 135 140Ala Ala Ile Leu Val Pro Gly Asp Ile Val Ser Ile Lys Leu Gly Asp145 150 155 160Ile Ile Pro Ala Asp Ala Arg Leu Leu Glu Gly Asp Pro Leu Lys Val165 170 175Asp Gln Ser Ala Leu Thr Gly Glu Ser Leu Pro Val Thr Lys His Pro180 185 190Gly Gln Glu Val Phe Ser Gly Ser Thr Cys Lys Gln Gly Glu Ile Glu195 200 205Ala Val Val Ile Ala Thr Gly Val His Thr Phe Phe Gly Lys Ala Ala210 215 220His Leu Val Asp Ser Thr Asn Gln Val Gly His Phe Gln Lys Val Leu225 230 235 240Thr Ala Ile Gly Asn Phe Cys Ile Cys Ser Ile Ala Ile Gly Met Val245 250 255Ile Glu Ile Ile Val Met Tyr Pro Ile Gln Arg Arg Lys Tyr Arg Asp
260 265 270Gly Ile Asp Asn Leu Leu Val Leu Leu Ile Gly Gly Ile Pro Ile Ala275 280 285Met Pro Thr Val Leu Ser Val Thr Met Ala Ile Gly Ser His Arg Leu290 295 300Ser Gln Gln Gly Ala Ile Thr Lys Arg Met Thr Ala Ile Glu Glu Met305 310 315 320Ala Gly Met Asp Val Leu Cys Ser Asp Lys Thr Gly Thr Leu Thr Leu325 330 335Asn Lys Leu Ser Val Asp Lys Asn Leu Val Glu Val Phe Cys Lys Gly340 345 350Val Glu Lys Asp Gln Val Leu Leu Phe Ala Ala Met Ala Ser Arg Val355 360 365Glu Asn Gln Asp Ala Ile Asp Ala Ala Met Val Gly Met Leu Ala Asp370 375 380Pro Lys Glu Ala Arg Ala Gly Ile Arg Glu Val His Phe Leu Pro Phe385 390 395 400Asn Pro Val Asp Lys Arg Thr Ala Leu Thr Tyr Ile Asp Gly Ser Gly405 410 415Asn Trp His Arg Val Ser Lys Gly Ala Pro Glu Gln Ile Leu Glu Leu420 425 430Ala Lys Ala Ser Asn Asp Leu Ser Lys Lys Val Leu Ser Ile Ile Asp435 440 445Lys Tyr Ala Glu Arg Gly Leu Arg Ser Leu Ala Val Ala Arg Gln Val450 455 460Val Pro Glu Lys Thr Lys Glu Ser Pro Gly Ala Pro Trp Glu Phe Val465 470 475 480
Gly Leu Leu Pro Leu Phe Asp Pro Pro Arg His Asp Ser Ala Glu Thr485 490 495Ile Arg Arg Ala Leu Asn Leu Gly Val Asn Val Lys Met Ile Thr Gly500 505 510Asp Gln Leu Ala Ile Gly Lys Glu Thr Gly Arg Arg Leu Gly Met Gly515 520 525Thr Asn Met Tyr Pro Ser Ser Ala Leu Leu Gly Thr His Lys Asp Ala530 535 540Asn Leu Ala Ser Ile Pro Val Glu Glu Leu Ile Glu Lys Ala Asp Gly545 550 555 560Phe Ala Gly Val Phe Pro Glu His Lys Tyr Glu Ile Val Lys Lys Leu565 570 575Gln Glu Arg Lys His Ile Val Gly Met Thr Gly Asp Gly Val Asn Asp580 585 590Ala Pro Ala Leu Lys Lys Ala Asp Ile Gly Ile Ala Val Ala Asp Ala595 600 605Thr Asp Ala Ala Arg Gly Ala Ser Asp Ile Val Leu Thr Glu Pro Gly610 615 620Leu Ser Val Ile Ile Ser Ala Val Leu Thr Ser Arg Ala Ile Phe Gln625 630 635 640Arg Met Lys Asn Tyr Thr Ile Tyr Ala Val Ser Ile Thr Ile Arg Ile645 650 655Val Phe Gly Phe Met Leu Ile Ala Leu Ile Trp Glu Phe Asp Phe Ser660 665 670Ala Phe Met Val Leu Ile Ile Ala Ile Leu Asn Asp Gly Thr Ile Met675 680 685
Thr Ile Ser Lys Asp Arg Val Lys Pro Ser Pro Thr Pro Asp Ser Trp690 695 700Lys Leu Lys Glu Ile Phe Ala Thr Gly Val Val Leu Gly Gly Tyr Gln705 710 715 720Ala Ile Met Thr Val Ile Phe Phe Trp Ala Ala His Lys Thr Asp Phe725 730 735Phe Ser Asp Thr Phe Gly Val Arg Ser Ile Arg Asp Asn Asn His Glu740 745 750Leu Met Gly Ala Val Tyr Leu Gln Val Ser Ile Ile Ser Gln Ala Leu755 760 765Ile Phe Val Thr Arg Ser Arg Ser Trp Ser Phe Val Glu Arg Pro Gly770 775 780Ala Leu Leu Met Ile Ala Phe Leu Ile Ala Gln Leu Ile Ala Thr Leu785 790 795 800Ile Ala Val Tyr Ala Asn Trp Glu Phe Ala Lys Ile Arg Gly Ile Gly805 810 815Trp Gly Trp Ala Gly Val Ile Trp Leu Tyr Ser Ile Val Thr Tyr Phe820 825 830Pro Leu Asp Val Phe Lys Phe Ala Ile Arg Tyr Ile Leu Ser Gly Lys835 840 845Ala Trp Leu Asn Leu Phe Glu Asn Lys Thr Ala Phe Thr Met Lys Lys850 855 860Asp Tyr Gly Lys Glu Glu Arg Glu Ala Gln Trp Ala Leu Ala Gln Arg865 870 875 880Thr Leu His Gly Leu Gln Pro Lys Glu Ala Val Asn Ile Phe Pro Glu885 890 895Lys Gly Ser Tyr Arg Glu Leu Ser Glu Ile Ala Glu Gln Ala Lys Arg
900 905 910Arg Ala Glu Ile Ala Arg Leu Arg Glu Leu His Thr Leu Lys Gly His915 920 925Val Glu Ser Val Val Lys Leu Lys Gly Leu Asp Ile Glu Thr Pro Ser930 935 940His Tyr Thr Val945<210>41<211>525<212>DNA<213>褐家鼠<220>
<221>基因<222>(1)..(525)<223>包含磷脂酰肌醇4,5-二磷酸靶向序列的磷脂酶C-delta 1的部分pleckstrin同源结构域的<220>
<221>CDS<222>(1)..(522)<223>包含磷脂酰肌醇4,5-二磷酸靶向序列的磷脂酶C-delta 1的部分pleckstrin同源结构域<300>
<308>GenBank/NM_017035<309>2000-11-01<400>41gac tcg ggt agg gac ttc ctg acc ctg cac ggg ctc cag gat gac ccg48Asp Ser Gly Arg Asp Phe Leu Thr Leu His Gly Leu Gln Asp Asp Pro1 5 10 15
gac ctt cag gcc ctt ctg aag ggc agc cag ctt ctg aag gtg aag tcc96Asp Leu Gln Ala Leu Leu Lys Gly Ser Gln Leu Leu Lys Val Lys Ser20 25 30agc tcg tgg cgt agg gaa cgc ttc tac aag cta cag gag gac tgc aag144Ser Ser Trp Arg Arg Glu Arg Phe Tyr Lys Leu Gln Glu Asp Cys Lys35 40 45acc atc tgg cag gaa tct cga aag gtc atg agg tcc ccg gag tcg cag192Thr Ile Trp Gln Glu Ser Arg Lys Val Met Arg Ser Pro Glu Ser Gln50 55 60ctg ttc tcc atc gag gac att cag gag gta cgg atg gga cac cgc aca240Leu Phe Ser Ile Glu Asp Ile Gln Glu Val Arg Met Gly His Arg Thr65 70 75 80gaa ggc ctg gag aag ttt gcc cga gac atc ccc gag gat cga tgc ttc288Glu Gly Leu Glu Lys Phe Ala Arg Asp Ile Pro Glu Asp Arg Cys Phe85 90 95tcc att gtc ttc aag gac cag cgc aac acc cta gac ctc att gcc cca336Ser Ile Val Phe Lys Asp Gln Arg Asn Thr Leu Asp Leu Ile Ala Pro100 105 110tca cca gct gac gct cag cac tgg gtg cag ggc ctg cgc aag atc atc384Ser Pro Ala Asp Ala Gln His Trp Val Gln Gly Leu Arg Lys Ile Ile115 120 125cac cac tcc ggc tcc atg gac cag cgg cag aag ctg cag cac tgg att432His His Ser Gly Ser Met Asp Gln Arg Gln Lys Leu Gln His Trp Ile130 135 140cac tcc tgc ttg cga aag gct gat aaa aac aag gaG aac aag atg aac480His Ser Cys Leu Arg Lys Ala Asp Lys Asn Lys Asp Asn Lys Met Asn145 150 155 160ttc aag gag ctg aag gac ttc ctg aag gag ctc aac atc cag tga525Phe Lys Glu Leu Lys Asp Phe Leu Lys Glu Leu Asn Ile Gln165 170
<210>42<211>174<212>PRT<213>褐家鼠<400>42Asp Ser Gly Arg Asp Phe Leu Thr Leu His Gly Leu Gln Asp Asp Pro1 5 10 15Asp Leu Gln Ala Leu Leu Lys Gly Ser Gln Leu Leu Lys Val Lys Ser20 25 30Ser Ser Trp Arg Arg Glu Arg Phe Tyr Lys Leu Gln Glu Asp Cys Lys35 40 45Thr Ile Trp Gln Glu Ser Arg Lys Val Met Arg Ser Pro Glu Ser Gln50 55 60Leu Phe Ser Ile Glu Asp Ile Gln Glu Val Arg Met Gly His Arg Thr65 70 75 80Glu Gly Leu Glu Lys Phe Ala Arg Asp Ile Pro Glu Asp Arg Cys Phe85 90 95Ser Ile Val Phe Lys Asp Gln Arg Asn Thr Leu Asp Leu Ile Ala Pro100 105 110Ser Pro Ala Asp Ala Gln His Trp Val Gln Gly Leu Arg Lys Ile Ile115 120 125His His Ser Gly Ser Met Asp Gln Arg Gln Lys Leu Gln His Trp Ile130 135 140His Ser Cys Leu Arg Lys Ala Asp Lys Asn Lys Asp Asn Lys Met Asn145 150 155 160Phe Lys Glu Leu Lys Asp Phe Leu Lys Glu Leu Asn Ile Gln165 170
<210>43<211>282<212>DNA<213>小家鼠(Mus musculus)<220>
<221>CDS<222>(1)..(282)<223>包含磷脂酰肌醇4-磷酸靶向序列的FAPP(家族A(磷酸肌醇结合特异)成员3)的部分pleckstrin同源结构域<300>
<308>GenBank/BC031110<309>2002-06-13<400>43atg gag ggg gtt ctg tac aag tgg acc aac tat ctc aca ggt tgg cag48Met Glu Gly Val Leu Tyr Lys Trp Thr Asn Tyr Leu Thr Gly Trp Gln1 5 10 15cct cga tgg ttt gtt ctg gat aat gga atc ctg tcc tac tat gac tca96Pro Arg Trp Phe Val Leu Asp Asn Gly Ile Leu Ser Tyr Tyr Asp Ser20 25 30cag gat gat gtc tgc aaa ggg agc aaa ggg agt ata aag atg gcg gtc144Gln Asp Asp Val Cys Lys Gly Ser Lys Gly Ser Ile Lys Met Ala Val35 40 45tgt gag att aaa gtc cat ccc gca gac aac aca aga atg gag tta atc192Cys Glu Ile Lys Val His Pro Ala Asp Asn Thr Arg Met Glu Leu Ile50 55 60att cca gga gag cag cat ttc tac atg aag gca gta aat gcc gcc gag240Ile Pro Gly Glu Gln His Phe Tyr Met Lys Ala Val Asn Ala Ala Glu65 70 75 80
aga cag agg tgg ctg gtt gcc ctt ggg agc tcc aaa gcg tgc 282Arg Gln Arg Trp Leu Val Ala Leu Gly Ser Ser Lys Ala Cys85 90<210>44<211>94<212>PRT<213>小家鼠<400>44Met Glu Gly Val Leu Tyr Lys Trp Thr Asn Tyr Leu Thr Gly Trp Gln1 5 10 15Pro Arg Trp Phe Val Leu Asp Asn Gly Ile Leu Ser Tyr Tyr Asp Ser20 25 30Gln Asp Asp Val Cys Lys Gly Ser Lys Gly Ser Ile Lys Met Ala Val35 40 45Cys Glu Ile Lys Val His Pro Ala Asp Asn Thr Arg Met Glu Leu Ile50 55 60Ile Pro Gly Glu Gln His Phe Tyr Met Lys Ala Val Asn Ala Ala Glu65 70 75 80Arg Gln Arg Trp Leu Val Ala Leu Gly Ser Ser Lys Ala Cys85 90<210>45<211>741<212>DNA<213>烟草叶脉斑点病毒<220>
<221>基因<222>(1)..(741)<223>NIa蛋白酶基因
<220>
<221>CDS<222>(1)..(738)<223>NIa蛋白酶<300>
<308>GenBank/AF222050<309>2000-02-07<400>45atg tca aag gcg cta ctt aag gga gtg cga gat ttt aat cca atc tct48Met Ser Lys Ala Leu Leu Lys Gly Val Arg Asp Phe Asn Pro Ile Ser1 5 10 15gct tgc gta tgc ctc ctt gag aac tcc tcg gat ggg cat agt gag aga96Ala Cys Val Cys Leu Leu Glu Asn Ser Ser Asp Gly His Ser Glu Arg20 25 30ctg ttt ggc att ggt ttt ggc cca tat atc att gcc aac caa cat ctt144Leu Phe Gly Ile Gly Phe Gly Pro Tyr Ile Ile Ala Asn Gln His Leu35 40 45ttt aga agg aac aat gga gag ttg act atc aaa acc atg cat ggt gag192Phe Arg Arg Asn Asn Gly Glu Leu Thr Ile Lys Thr Met His Gly Glu50 55 60ttc aaa gtc aag aac tca aca caa ttg cag atg aaa cca gtt gag ggc240Phe Lys Val Lys Asn Ser Thr Gln Leu Gln Met Lys Pro Val Glu Gly65 70 75 80aga gac ata ata gtt atc aaa atg gct aag gac ttc cca cca ttc cct288Arg Asp Ile Ile Val Ile Lys Met Ala Lys Asp Phe Pro Pro Phe Pro85 90 95caa aaa cta aaa ttc aga cag cct acc atc aaa gat aga gtg tgc atg336Gln Lys Leu Lys Phe Arg Gln Pro Thr Ile Lys Asp Arg Val Cys Met100 105 110
gta tcc aca aat ttt cag cag aaa agt gtc tct agt cta gtg tct gag384Val Ser Thr Asn Phe Gln Gln Lys Ser Val Ser Ser Leu Val Ser Glu115 120 125tca tca cac att gtg cat aaa gag gac act tca ttc tgg caa cac tgg432Ser Ser His Ile Val His Lys Glu Asp Thr Ser Phe Trp Gln His Trp130 135 140ata aca aca aag gat gga caa tgt gga agt ccg ctg gtt tca atc att480Ile Thr Thr Lys Asp Gly Gln Cys Gly Ser Pro Leu Val Ser Ile Ile145 150 155 160gat gga aat att ttg ggg atc cac agc ctg acg cat acg acc aat ggt528Asp Gly Asn Ile Leu Gly Ile His Ser Leu Thr His Thr Thr Asn Gly165 170 175agc aat tac ttc gtg gaa ttt cct gag aag ttc gta gct aca tat ctt576Ser Asn Tyr Phe Val Glu Phe Pro Glu Lys Phe Val Ala Thr Tyr Leu180 185 190gat gcc gct gat ggt tgg tgc aag aat tgg aag ttc aat gct gat aag624Asp Ala Ala Asp Gly Trp Cys Lys Asn Trp Lys Phe Asn Ala Asp Lys195 200 205atc agt tgg ggt tcc ttt aca tta gtt gag gat gcg ccc gaa gat gac672Ile Ser Trp Gly Ser Phe Thr Leu Val Glu Asp Ala Pro Glu Asp Asp210 215 220ttc atg gcc aag aaa act gtt gcc gcc atc atg gac gat ttg gtc cgc720Phe Met Ala Lys Lys Thr Val Ala Ala Ile Met Asp Asp Leu Val Arg225 230 235 240act caa ggg gga gaa gcttga 741Thr Gln Gly Gly Glu Ala245<210>46<211>246<212>PRT
<213>烟草叶脉斑点病毒<400>46Met Ser Lys Ala Leu Leu Lys Gly Val Arg Asp Phe Asn Pro Ile Ser1 5 10 15Ala Cys Val Cys Leu Leu Glu Asn Ser Ser Asp Gly His Ser Glu Arg20 25 30Leu Phe Gly Ile Gly Phe Gly Pro Tyr Ile Ile Ala Asn Gln His Leu35 40 45Phe Arg Arg Asn Asn Gly Glu Leu Thr Ile Lys Thr Met His Gly Glu50 55 60Phe Lys Val Lys Asn Ser Thr Gln Leu Gln Met Lys Pro Val Glu Gly65 70 75 80Arg Asp Ile Ile Val Ile Lys Met Ala Lys Asp Phe Pro Pro Phe Pro85 90 95Gln Lys Leu Lys Phe Arg Gln Pro Thr Ile Lys Asp Arg Val Cys Met100 105 110Val Ser Thr Asn Phe Gln Gln Lys Ser Val Ser Ser Leu Val Ser Glu115 120 125Ser Ser His Ile Val His Lys Glu Asp Thr Ser Phe Trp Gln His Trp130 135 140Ile Thr Thr Lys Asp Gly Gln Cys Gly Ser Pro Leu Val Ser Ile Ile145 150 155 160Asp Gly Asn Ile Leu Gly Ile His Ser Leu Thr His Thr Thr Asn Gly165 170 175Ser Asn Tyr Phe Val Glu Phe Pro Glu Lys Phe Val Ala Thr Tyr Leu180 185 190Asp Ala Ala Asp Gly Trp Cys Lys Asn Trp Lys Phe Asn Ala Asp Lys
195 200 205Ile Ser Trp Gly Ser Phe Thr Leu Val Glu Asp Ala Pro Glu Asp Asp210 215 220Phe Met Ala Lys Lys Thr Val Ala Ala Ile Met Asp Asp Leu Val Arg225 230 235 240Thr Gln Gly Gly Glu Ala245<210>47<211>12<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(12)<223>NIa蛋白酶切割序列<400>47gtg cgc ttc cag 12Val Arg Phe Gln1<210>48<211>4<212>PRT<213>人工序列<400>48Val Arg Phe Gln
1<210>49<211>21<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(21)<223>NIa蛋白酶切割序列<300>
<308>GenBank/AX427722<309>2002-06-20<400>49gaa cca gtc tat ttc caa ggg21Glu Pro Val Tyr Phe Gln Gly1 5<210>50<211>7<212>PRT<213>人工序列<400>50Glu Pro Val Tyr Phe Gln Gly1 5<210>51<211>1638
<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>基因<222>(1)..(1638)<223>RFP:PS(NIa蛋白酶):AtOEP7:GEP基因<220>
<221>CDS<222>(1)..(1635)<223>RFP:PS(NIa蛋白酶):AtOEP7:GFP杂合蛋白<220>
<221>misc_特征<222>(1)..(1638)<223>CDS:RFP(1..678)+ADs-CDS:NIa蛋白酶水解位点(700..711)+ADs-CDS:AtOEP7(712..900)+ADs-CDS:GFP(922..1635)<400>51atg gtg cgc tcc tcc aag aac gtc atc aag gag ttc atg cgc ttc aag48Met Val Arg Ser Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys1 5 10 15gtg cgc atg gag ggc acc gtg aac ggc cac gag ttc gag atc gag ggc96Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly20 25 30gag ggc gag ggc cgc ccc tac gag ggc cac aac acc gtg aag ctg aag144Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys35 40 45gtg acc aag ggc ggc ccc ctg ccc ttc gcc tgg gac atc ctg tcc ccc192
Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro50 55 60cag ttc cag tac ggc tcc aag gtg tac gtg aag cac ccc gcc gac atc240Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile65 70 75 80ccc gac tac aag aag ctg tcc ttc ccc gag ggc ttc aag tgg gag cgc288Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg85 90 95gtg atg aac ttc gag gac ggc ggc gtg gtg acc gtg acc cag gac tcc336Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser100 105 110tcc ctg cag gac ggc tgc ttc atc tac aag gtg aag ttc atc ggc gtg384Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val115 120 125aac ttc ccc tcc gac ggc ccc gta atg cag aag aag acc atg ggc tgg432Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp130 135 140gag gcc tcc acc gag cgc ctg tac ccc cgc gac ggc gtg ctg aag ggc480Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly145 150 155 160gag atc cac aag gcc ctg aag ctg aag gac ggc ggc cac tac ctg gtg528Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val165 170 175gag ttc aag tcc atc tac atg gcc aag aag ccc gtg cag ctg ccc ggc576Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly180 185 190tac tac tac gtg gac tcc aag ctg gac atc acc tcc cac aac gag gac624Tyr Tyr Tyr Val Asp Ser Lya Leu Asp Ile Thr Ser His Asn Glu Asp195 200 205tac acc atc gtg gag cag tac gag cgc acc gag ggc cgc cac cac ctg672
Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu210 215 220ttc ctg ccc cgg gca atc aag ctg ggt gtg cgc ttc cag gga aaa act720Phe Leu Pro Arg Ala Ile Lys Leu Gly Val Arg Phe Gln Gly Lys Thr225 230 235 240tcg gga gcg aaa cag gcg act gtg gtg gtc gca gcg atg gcg tta gga768Ser Gly Ala Lys Gln Ala Thr Val Val Val Ala Ala Met Ala Leu Gly245 250 255tgg tta gcc ata gag atc gct ttc aag cct ttc ctc gat aaa ttc cgc816Trp Leu Ala Ile Glu Ile Ala Phe Lys Pro Phe Leu Asp Lys Phe Arg260 265 270tcc tca atc gac aaa tct gac cca acc aaa gac ccc gat gac ttc gac864Ser Ser Ile Asp Lys Ser Asp Pro Thr Lys Asp Pro Asp Asp Phe Asp275 280 285acc gcc gct act gca acc aca tcc aaa gag ggt ttg ggg atc caa gga912Thr Ala Ala Thr Ala Thr Thr Ser Lys Glu Gly Leu Gly Ile Gln Gly290 295 300gat ata aca atg agt aaa gga gaa gaa ctt ttc act gga gtt gtc cca960Asp Ile Thr Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro305 310 315 320att ctt gtt gaa tta gat ggt gat gtt aat ggg cac aaa ttt tct gtc1008Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val325 330 335agt gga gag ggt gaa ggt gat gca aca tac gga aaa ctt acc ctt aaa1056Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys340 345 350ttt att tgc act act gga aaa cta cct gtt cca tgg cca aca ctt gtc1104Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val355 360 365act act ttc tct tat ggt gtt caa tgc ttt tca aga tac cca gat cat1152
Thr Thr Phe Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His370 375 380atg aag cgg cac gac ttc ttc aag agc gcc atg cct gag gga tac gtg1200Met Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val385 390 395 400cag gag agg acc atc tct ttc aag gac gac ggg aac tac aag aca cgt1248Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg405 410 415gct gaa gtc aag ttt gag gga gac acc ctc gtc aac agg atc gag ctt1296Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu420 425 430aag gga atc gat ttc aag gag gac gga aac atc ctc ggc cac aag ttg1344Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu435 440 445gaa tac aac tac aac tcc cac aac gta tac atc acg gca gac aaa caa1392Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln450 455 460aag aat gga atc aaa gct aac ttc aaa att aga cac aac att gaa gat1440Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Ile Glu Asp465 470 475 480gga agc gtt caa cta gca gac cat tat caa caa aat act cca att ggc1488Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly485 490 495gat ggc cct gtc ctt tta cca gac aac cat tac ctg tcc aca caa tct1536Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser500 505 510gcc ctt tcg aaa gat ccc aac gaa aag aga gac cac atg gtc ctt ctt1584Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu515 520 525gag ttt gta aca gct gct ggg att aca cat ggc atg gat gaa cta tac1632
Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr530 535 540aaa taa 1638Lys545<210>52<211>545<212>PRT<213>人工序列<400>52Met Val Arg Ser Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys1 5 10 15Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly20 25 30Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys35 40 45Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro50 55 60Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile65 70 75 80Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg85 90 95Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser100 105 110Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val115 120 125Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp130 135 140
Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly145 150 155 160Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val165 170 175Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly180 185 190Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp195 200 205Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu210 215 220Phe Leu Pro Arg Ala Ile Lys Leu Gly Val Arg Phe Gln Gly Lys Thr225 230 235 240Ser Gly Ala Lys Gln Ala Thr Val Val Val Ala Ala Met Ala Leu Gly245 250 255Trp Leu Ala Ile Glu Ile Ala Phe Lys Pro Phe Leu Asp Lys Phe Arg260 265 270Ser Ser Ile Asp Lys Ser Asp Pro Thr Lys Asp Pro Asp Asp Phe Asp275 280 285Thr Ala Ala Thr Ala Thr Thr Ser Lys Glu Gly Leu Gly Ile Gln Gly290 295 300Asp Ile Thr Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro305 310 315 320Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val325 330 335Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys340 345 350
Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val355 360 365Thr Thr Phe Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His370 375 380Met Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val385 390 395 400Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg405 410 415Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu420 425 430Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu435 440 445Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln450 455 460Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Ile Glu Asp465 470 475 480Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly485 490 495Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser500 505 510Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu515 520 525Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr530 535 540Lys545
<210>53<211>3579<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>基因<222>(1)..(3579)<223>H+-ATPase:PS(NIa蛋白酶):GTP杂合蛋白基因<220>
<221>CDS<222>(1)..(3576)<223>H+-ATPase:PS(NIa蛋白酶):GFP杂合蛋白<220>
<221>misc_特征<222>(1)..(3579)<223>CDS:H+-ATPase(1..2844)+ADs-CDS:NIa蛋白酶切割序列(2851..
2862)+ADs-CDS:GFP(2863..3576)<400>53atg tcg agt ctc gaa gat atc aag aac gag act gtt gat ctg gaa aaa48Met Ser Ser Leu Glu Asp Ile Lys Asn Glu Thr Val Asp Leu Glu Lys1 5 10 15att ccg att gag gaa gtt ttc cag cag cta aaa tgt tca agg gaa gga96Ile Pro Ile Glu Glu Val Phe Gln Gln Leu Lys Cys Ser Arg Glu Gly20 25 30ttg aca acg cag gaa ggg gag gac agg att cag atc ttt ggc ccc aac144Leu Thr Thr Gln Glu Gly Glu Asp Arg Ile Gln Ile Phe Gly Pro Asn35 40 45
aag ctc gaa gag aaa aag gaa agc aaa ctt ctg aag ttt ttg ggg ttt192Lys Leu Glu Glu Lys Lys Glu Ser Lys Leu Leu Lys Phe Leu Gly Phe50 55 60atg tgg aat cca ctt tca tgg gtc atg gaa atg gct gca atc atg gcc240Met Trp Asn Pro Leu Ser Trp Val Met Glu Met Ala Ala Ile Met Ala65 70 75 80att gct ttg gcc aac ggt gat ggt agg cct ccg gat tgg cag gat ttt288Ile Ala Leu Ala Asn Gly Asp Gly Arg Pro Pro Asp Trp Gln Asp Phe85 90 95gtt ggt att atc tgt ctg ttg gtt atc aac tct acc atc agt ttt atc336Val Gly Ile Ile Cys Leu Leu Val Ile Asn Ser Thr Ile Ser Phe Ile100 105 110gaa gaa aac aat gct ggt aat gct gct gct gct ctt atg gct ggt ctt384Glu Glu Asn Asn Ala Gly Asn Ala Ala Ala Ala Leu Met Ala Gly Leu115 120 125gct cct aaa acc aag gtt ctt agg gat gga aag tgg agt gaa caa gaa432Ala Pro Lys Thr Lys Val Leu Arg Asp Gly Lys Trp Ser Glu Gln Glu130 135 140gct gct att ctt gtc cca gga gat att gtt agc att aaa tta gga gac480Ala Ala Ile Leu Val Pro Gly Asp Ile Val Ser Ile Lys Leu Gly Asp145 150 155 160att atc cca gct gat gcc cgt cta ctt gaa ggt gat cct tta aag gtt528Ile Ile Pro Ala Asp Ala Arg Leu Leu Glu Gly Asp Pro Leu Lys Val165 170 175gac caa tct gct cta act gga gag tcc ctt cct gta acc aag cac ccg576Asp Gln Ser Ala Leu Thr Gly Glu Ser Leu Pro Val Thr Lys His Pro180 185 190ggt caa gaa gtt ttc tct ggt tca acc tgc aaa caa gga gaa atc gag624Gly Gln Glu Val Phe Ser Gly Ser Thr Cys Lys Gln Gly Glu Ile Glu195 200 205
gcg gtt gtt att gcc act ggg gtt cat acc ttc ttc ggt aaa gct gct672Ala Val Val Ile Ala Thr Gly Val His Thr Phe Phe Gly Lys Ala Ala210 215 220cac ctt gtg gac agc act aac caa gtt gga cat ttc cag aag gtt ctt720His Leu Val Asp Ser Thr Asn Gln Val Gly His Phe Gln Lys Val Leu225 230 235 240aca gcc att ggg aac ttc tgt atc tgt tcc att gct atc ggt atg gtg768Thr Ala Ile Gly Asn Phe Cys Ile Cys Ser Ile Ala Ile Gly Met Val245 250 255att gag atc atc gtc atg tat ccg atc caa cgc cga aag tac aga gat816Ile Glu Ile Ile Val Met Tyr Pro Ile Gln Arg Arg Lys Tyr Arg Asp260 265 270gga att gac aac ctt ttg gtc ctc ttg atc ggt ggt atc ccc att gct864Gly Ile Asp Asn Leu Leu Val Leu Leu Ile Gly Gly Ile Pro Ile Ala275 280 285atg cct aca gtc ttg tcc gtg acc atg gct att ggg tct cac agg ttg912Met Pro Thr Val Leu Ser Val Thr Met Ala Ile Gly Ser His Arg Leu290 295 300tct cag caa ggt gcc atc acc aag cgt atg act gcc att gaa gag atg960Ser Gln Gln Gly Ala Ile Thr Lys Arg Met Thr Ala Ile Glu Glu Met305 310 315 320gca gga atg gat gtc ctg tgc agt gac aaa acc ggg aca cta acc ctc1008Ala Gly Met Asp Val Leu Cys Ser Asp Lys Thr Gly Thr Leu Thr Leu325 330 335aac aaa ttg agt gtg gac aaa aac ttg gtc gag gtt ttc tgc aag ggt1056Asn Lys Leu Ser Val Asp Lys Asn Leu Val Glu Val Phe Cys Lys Gly340 345 350gtg gag aaa gat caa gtc cta tta ttt gca gct atg gct tcc agg gtt1104Val Glu Lys Asp Gln Val Leu Leu Phe Ala Ala Met Ala Ser Arg Val355 360 365
gag aac cag gat gcc att gat gca gcc atg gtt ggg atg ctt gct gat1152Glu Asn Gln Asp Ala Ile Asp Ala Ala Met Val Gly Met Leu Ala Asp370 375 380cca aag gag gct aga gct gga atc agg gaa gtt cac ttc ctt cca ttc1200Pro Lys Glu Ala Arg Ala Gly Ile Arg Glu Val His Phe Leu Pro Phe385 390 395 400aac cct gtg gat aag aga act gct ttg act tac att gac ggc agt ggt1248Asn Pro Val Asp Lys Arg Thr Ala Leu Thr Tyr Ile Asp Gly Ser Gly405 410 415aac tgg cac aga gtc agt aaa ggt gct cct gag cag atc ctc gaa ctt1296Asn Trp His Arg Val Ser Lys Gly Ala Pro Glu Gln Ile Leu Glu Leu420 425 430gcc aaa gcc agc aat gat ctt agc aag aag gtg ctc tcc att att gac1344Ala Lys Ala Ser Asn Asp Leu Ser Lys Lys Val Leu Ser Ile Ile Asp435 440 445aag tat gct gag cgt ggt ctt agg tcg ttg gct gtt gct cgc cag gtg1392Lys Tyr Ala Glu Arg Gly Leu Arg Ser Leu Ala Val Ala Arg Gln Val450 455 460gtg cca gag aaa aca aag gaa agc cca ggt gcg cca tgg gaa ttt gtt1440Val Pro Glu Lys Thr Lys Glu Ser Pro Gly Ala Pro Trp Glu Phe Val465 470 475 480ggc ttg ttg cca ctt ttt gat ccc cca aga cat gac agt gct gaa aca1488Gly Leu Leu Pro Leu Phe Asp Pro Pro Arg His Asp Ser Ala Glu Thr485 490 495att cga cgg gct ttg aat ctt ggt gtt aac gtc aag atg atc act ggt1536Ile Arg Arg Ala Leu Asn Leu Gly Val Asn Val Lys Met Ile Thr Gly500 505 510gac caa ctt gct att ggt aag gaa act ggt cgc aga ctt gga atg gga1584Asp Gln Leu Ala Ile Gly Lys Glu Thr Gly Arg Arg Leu Gly Met Gly515 520 525
aca aac atg tat cca tct tcg gct ctt ctt ggt aca cac aaa gac gca1632Thr Asn Met Tyr Pro Ser Ser Ala Leu Leu Gly Thr His Lys Asp Ala530 535 540aac ctc gca tcc att cct gtt gag gag ttg att gaa aag gct gat gga1680Asn Leu Ala Ser Ile Pro Val Glu Glu Leu Ile Glu Lys Ala Asp Gly545 550 555 560ttt gcc gga gtc ttc cca gag cac aaa tac gaa att gtg aaa aag ttg1728Phe Ala Gly Val Phe Pro Glu His Lys Tyr Glu Ile Val Lys Lys Leu565 570 575cag gag agg aag cat att gtt gga atg act ggt gat ggt gtc aat gat1776Gln Glu Arg Lys His Ile Val Gly Met Thr Gly Asp Gly Val Asn Asp580 585 590gcc cct gct cta aag aaa gct gat atc ggt att gct gtt gct gat gct1824Ala Pro Ala Leu Lys Lys Ala Asp Ile Gly Ile Ala Val Ala Asp Ala595 600 605aca gat gct gct cgt ggt gct tca gat atc gtg ctc act gag cct gga1872Thr Asp Ala Ala Arg Gly Ala Ser Asp Ile Val Leu Thr Glu Pro Gly610 615 620ctc agc gtt att atc agt gct gtt ctc acc agc aga gct att ttc cag1920Leu Ser Val Ile Ile Ser Ala Val Leu Thr Ser Arg Ala Ile Phe Gln625 630 635 640aga atg aag aac tat act atc tat gca gtc tca atc acc atc cgt att1968Arg Met Lys Asn Tyr Thr Ile Tyr Ala Val Ser Ile Thr Ile Arg Ile645 650 655gtg ttt ggt ttc atg ctt att gct ttg ata tgg gaa ttt gac ttc tca2016Val Phe Gly Phe Met Leu Ile Ala Leu Ile Trp Glu Phe Asp Phe Ser660 665 670gcc ttc atg gtt ctg atc att gcc att ctt aac gac ggt acc atc atg2064Ala Phe Met Val Leu Ile Ile Ala Ile Leu Asn Asp Gly Thr Ile Met675 680 685
aca atc tca aag gac aga gtt aag cca tct ccc aca cct gat agc tgg2112Thr Ile Ser Lys Asp Arg Val Lys Pro Ser Pro Thr Pro Asp Ser Trp690 695 700aaa ctt aaa gaa att ttt gct act gga gtc gtt cta gga ggc tac cag2160Lys Leu Lys Glu Ile Phe Ala Thr Gly Val Val Leu Gly Gly Tyr Gln705 710 715 720gcc atc atg act gtt att ttc ttc tgg gcg gcg cac aag act gac ttt2208Ala Ile Met Thr Val Ile Phe Phe Trp Ala Ala His Lys Thr Asp Phe725 730 735ttc tcg gac aca ttc ggt gtg agg tcc att agg gac aat aac cac gag2256Phe Ser Asp Thr Phe Gly Val Arg Ser Ile Arg Asp Asn Asn His Glu740 745 750cta atg ggt gcg gtg tac tta caa gtt agt atc att agt caa gct ctg2304Leu Met Gly Ala Val Tyr Leu Gln Val Ser Ile Ile Ser Gln Ala Leu755 760 765atc ttc gtc aca aga tca agg agt tgg tct ttt gtt gaa cgt cct gga2352Ile Phe Val Thr Arg Ser Arg Ser Trp Ser Phe Val Glu Arg Pro Gly770 775 780gca ttg ctg atg att gct ttc ctc att gca caa ctg att gct act ttg2400Ala Leu Leu Met Ile Ala Phe Leu Ile Ala Gln Leu Ile Ala Thr Leu785 790 795 800att gcg gtt tac gcc aac tgg gaa ttt gca aag att agg ggt att gga2448Ile Ala Val Tyr Ala Asn Trp Glu Phe Ala Lys Ile Arg Gly Ile Gly805 810 815tgg gga tgg gct ggt gtg atc tgg cta tac agt att gtc aca tac ttc2496Trp Gly Trp Ala Gly Val Ile Trp Leu Tyr Ser Ile Val Thr Tyr Phe820 825 830cca ttg gac gtt ttc aag ttt gcc att cga tac atc ttg agc gga aag2544Pro Leu Asp Val Phe Lys Phe Ala Ile Arg Tyr Ile Leu Ser Gly Lys835 840 845
gcg tgg ctc aac ttg ttt gag aac aag acg gct ttc acg atg aag aaa2592Ala Trp Leu Asn Leu Phe Glu Asn Lys Thr Ala Phe Thr Met Lys Lys850 855 860gat tac gga aaa gaa gag aga gag gct caa tgg gca ctt gct caa agg2640Asp Tyr Gly Lys Glu Glu Arg Glu Ala Gln Trp Ala Leu Ala Gln Arg865 870 875 880aca ctt cac ggt tta cag cca aaa gaa gct gtt aac atc ttc cct gag2688Thr Leu His Gly Leu Gln Pro Lys Glu Ala Val Asn Ile Phe Pro Glu885 890 895aaa gga agt tac aga gaa ttg tct gag atc gct gag caa gct aag aga2736Lys Gly Ser Tyr Arg Glu Leu Ser Glu Ile Ala Glu Gln Ala Lys Arg900 905 910aga gct gag atc gct agg ctt agg gag ctg cac aca ctc aag gga cat2784Arg Ala Glu Ile Ala Arg Leu Arg Glu Leu His Thr Leu Lys Gly His915 920 925gtg gaa tca gtc gtg aag cta aag ggc ttg gac att gaa act ccc agt2832Val Glu Ser Val Val Lys Leu Lys Gly Leu Asp Ile Glu Thr Pro Ser930 935 940cac tac act gtg ctc gag gtg cgc ttc cag atg agt aaa gga gaa gaa2880His Tyr Thr Val Leu Glu Val Arg Phe Gln Met Ser Lys Gly Glu Glu945 950 955 960ctt ttc act gga gtt gtc cca att ctt gtt gaa tta gat ggt gat gtt2928Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val965 970 975aat ggg cac aaa ttt tct gtc agt gga gag ggt gaa ggt gat gca aca2976Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr980 985 990tac gga aaa ctt acc ctt aaa ttt att tgc act act gga aaa cta cct3024Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro99510001005
gtt cca tgg cca aca ctt gtc act act ttc tct tat ggt gtt caa tgc3072Val Pro Trp Pro Thr Leu Val Thr Thr Phe Ser Tyr Gly Val Gln Cys101010151020ttt tca aga tac cca gat cat atg aag cgg cac gac ttc ttc aag agc3120Phe Ser Arg Tyr Pro Asp His Met Lys Arg His Asp Phe Phe Lys Ser1025 103010351040gcc atg cct gag gga tac gtg cag gag agg acc atc tct ttc aag gac3168Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp104510501055gac ggg aac tac aag aca cgt gct gaa gtc aag ttt gag gga gac acc3216Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr106010651070ctc gtc aac agg atc gag ctt aag gga atc gat ttc aag gag gac gga3264Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly107510801085aac atc ctc ggc cac aag ttg gaa tac aac tac aac tcc cac aac gta3312Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val109010951100tac atc acg gca gac aaa caa aag aat gga atc aaa gct aac ttc aaa3360Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys1105 111011151120att aga cac aac att gaa gat gga agc gtt caa cta gca gac cat tat3408Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr112511301135caa caa aat act cca att ggc gat ggc cct gtc ctt tta cca gac aac3456Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn114011451150cat tac ctg tcc aca caa tct gcc ctt tcg aaa gat ccc aac gaa aag3504His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys115511601165
aga gac cac atg gtc ctt ctt gag ttt gta aca gct gct ggg att aca3552Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr117011751180cat ggc atg gat gaa cta tac aaataa 3579His Gly Met Asp Glu Leu Tyr Lys1185 1190<210>54<211>1192<212>PRT<213>人工序列<400>54Met Ser Ser Leu Glu Asp Ile Lys Asn Glu Thr Val Asp Leu Glu Lys1 5 10 15Ile Pro Ile Glu Glu Val Phe Gln Gln Leu Lys Cys Ser Arg Glu Gly20 25 30Leu Thr Thr Gln Glu Gly Glu Asp Arg Ile Gln Ile Phe Gly Pro Asn35 40 45Lys Leu Glu Glu Lys Lys Glu Ser Lys Leu Leu Lys Phe Leu Gly Phe50 55 60Met Trp Asn Pro Leu Ser Trp Val Met Glu Met Ala Ala Ile Met Ala65 70 75 80Ile Ala Leu Ala Asn Gly Asp Gly Arg Pro Pro Asp Trp Gln Asp Phe85 90 95Val Gly Ile Ile Cys Leu Leu Val Ile Asn Ser Thr Ile Ser Phe Ile100 105 110Glu Glu Asn Asn Ala Gly Asn Ala Ala Ala Ala Leu Met Ala Gly Leu115 120 125
Ala Pro Lys Thr Lys Val Leu Arg Asp Gly Lys Trp Ser Glu Gln Glu130 135 140Ala Ala Ile Leu Val Pro Gly Asp Ile Val Ser Ile Lys Leu Gly Asp145 150 155 160Ile Ile Pro Ala Asp Ala Arg Leu Leu Glu Gly Asp Pro Leu Lys Val165 170 175Asp Gln Ser Ala Leu Thr Gly Glu Ser Leu Pro Val Thr Lys His Pro180 185 190Gly Gln Glu Val Phe Ser Gly Ser Thr Cys Lys Gln Gly Glu Ile Glu195 200 205Ala Val Val Ile Ala Thr Gly Val His Thr Phe Phe Gly Lys Ala Ala210 215 220His Leu Val Asp Ser Thr Asn Gln Val Gly His Phe Gln Lys Val Leu225 230 235 240Thr Ala Ile Gly Asn Phe Cys Ile Cys Ser Ile Ala Ile Gly Met Val245 250 255Ile Glu Ile Ile Val Met Tyr Pro Ile Gln Arg Arg Lys Tyr Arg Asp260 265 270Gly Ile Asp Asn Leu Leu Val Leu Leu Ile Gly Gly Ile Pro Ile Ala275 280 285Met Pro Thr Val Leu Ser Val Thr Met Ala Ile Gly Ser His Arg Leu290 295 300Ser Gln Gln Gly Ala Ile Thr Lys Arg Met Thr Ala Ile Glu Glu Met305 310 315 320Ala Gly Met Asp Val Leu Cys Ser Asp Lys Thr Gly Thr Leu Thr Leu325 330 335Asn Lys Leu Ser Val Asp Lys Asn Leu Val Glu Val Phe Cys Lys Gly
340 345 350Val Glu Lys Asp Gln Val Leu Leu Phe Ala Ala Met Ala Ser Arg Val355 360 365Glu Asn Gln Asp Ala Ile Asp Ala Ala Met Val Gly Met Leu Ala Asp370 375 380Pro Lys Glu Ala Arg Ala Gly Ile Arg Glu Val His Phe Leu Pro Phe385 390 395 400Asn Pro Val Asp Lys Arg Thr Ala Leu Thr Tyr Ile Asp Gly Ser Gly405 410 415Asn Trp His Arg Val Ser Lys Gly Ala Pro Glu Gln Ile Leu Glu Leu420 425 430Ala Lys Ala Ser Asn Asp Leu Ser Lys Lys Val Leu Ser Ile Ile Asp435 440 445Lys Tyr Ala Glu Arg Gly Leu Arg Ser Leu Ala Val Ala Arg Gln Val450 455 460Val Pro Glu Lys Thr Lys Glu Ser Pro Gly Ala Pro Trp Glu Phe Val465 470 475 480Gly Leu Leu Pro Leu Phe Asp Pro Pro Arg His Asp Ser Ala Glu Thr485 490 495Ile Arg Arg Ala Leu Asn Leu Gly Val Asn Val Lys Met Ile Thr Gly500 505 510Asp Gln Leu Ala Ile Gly Lys Glu Thr Gly Arg Arg Leu Gly Met Gly515 520 525Thr Asn Met Tyr Pro Ser Ser Ala Leu Leu Gly Thr His Lys Asp Ala530 535 540Asn Leu Ala Ser Ile Pro Val Glu Glu Leu Ile Glu Lys Ala Asp Gly545 550 555 560
Phe Ala Gly Val Phe Pro Glu His Lys Tyr Glu Ile Val Lys Lys Leu565 570 575Gln Glu Arg Lys His Ile Val Gly Met Thr Gly Asp Gly Val Asn Asp580 585 590Ala Pro Ala Leu Lys Lys Ala Asp Ile Gly Ile Ala Val Ala Asp Ala595 600 605Thr Asp Ala Ala Arg Gly Ala Ser Asp Ile Val Leu Thr Glu Pro Gly610 615 620Leu Ser Val Ile Ile Ser Ala Val Leu Thr Ser Arg Ala Ile Phe Gln625 630 635 640Arg Met Lys Asn Tyr Thr Ile Tyr Ala Val Ser Ile Thr Ile Arg Ile645 650 655Val Phe Gly Phe Met Leu Ile Ala Leu Ile Trp Glu Phe Asp Phe Ser660 665 670Ala Phe Met Val Leu Ile Ile Ala Ile Leu Asn Asp Gly Thr Ile Met675 680 685Thr Ile Ser Lys Asp Arg Val Lys Pro Ser Pro Thr Pro Asp Ser Trp690 695 700Lys Leu Lys Glu Ile Phe Ala Thr Gly Val Val Leu Gly Gly Tyr Gln705 710 715 720Ala Ile Met Thr Val Ile Phe Phe Trp Ala Ala His Lys Thr Asp Phe725 730 735Pha Ser Asp Thr Phe Gly Val Arg Ser Ile Arg Asp Asn Asn His Glu740 745 750Leu Met Gly Ala Val Tyr Leu Gln Val Ser Ile Ile Ser Gln Ala Leu755 760 765
Ile Phe Val Thr Arg Ser Arg Ser Trp Ser Phe Val Glu Arg Pro Gly770 775 780Ala Leu Leu Met Ile Ala Phe Leu Ile Ala Gln Leu Ile Ala Thr Leu785 790 795 800Ile Ala Val Tyr Ala Asn Trp Glu Phe Ala Lys Ile Arg Gly Ile Gly805 810 815Trp Gly Trp Ala Gly Val Ile Trp Leu Tyr Ser Ile Val Thr Tyr Phe820 825 830Pro Leu Asp Val Phe Lys Phe Ala Ile Arg Tyr Ile Leu Ser Gly Lys835 840 845Ala Trp Leu Asn Leu Phe Glu Asn Lys Thr Ala Phe Thr Met Lys Lys850 855 860Asp Tyr Gly Lys Glu Glu Arg Glu Ala Gln Trp Ala Leu Ala Gln Arg865 870 875 880Thr Leu His Gly Leu Gln Pro Lys Glu Ala Val Asn Ile Phe Pro Glu885 890 895Lys Gly Ser Tyr Arg Glu Leu Ser Glu Ile Ala Glu Gln Ala Lys Arg900 905 910Arg Ala Glu Ile Ala Arg Leu Arg Glu Leu His Thr Leu Lys Gly His915 920 925Val Glu Ser Val Val Lys Leu Lys Gly Leu Asp Ile Glu Thr Pro Ser930 935 940His Tyr Thr Val Leu Glu Val Arg Phe Gln Met Ser Lys Gly Glu Glu945 950 955 960Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val965 970 975Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr
980 985 990Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro99510001005Val Pro Trp Pro Thr Leu Val Thr Thr Phe Ser Tyr Gly Val Gln Cys101010151020Phe Ser Arg Tyr Pro Asp His Met Lys Arg His Asp Phe Phe Lys Ser1025 103010351040Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp104510501055Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr106010651070Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly107510801085Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val109010951100Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys1105 111011151120Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr112511301135Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn114011451150His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys115511601165Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr117011751180His Gly Met Asp Glu Leu Tyr Lys1185 1190
<210>55<211>303<212>DNA<213>人类免疫缺陷病毒型1<220>
<221>基因<222>(1)..(303)<223>HIV蛋白基因<220>
<221>CDS<222>(1)..(300)<223>HIV-1蛋白酶<300>
<308>GenBank/U31398<309>1996-03-07<400>55atg cct cag gtc act ctt tgg caa cga ccc ctc gtc aca ata aag ata48Met Pro Gln Val Thr Leu Trp Gln Arg Pro Leu Val Thr Ile Lys Ile1 5 10 15ggg ggg caa cta aag gaa gct cta tta gat aca gga gca gat gat aca96Gly Gly Gln Leu Lys Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr20 25 30gta tta gaa gaa atg agt ttg cea gga aga tgg aaa cca aaa atg ata144Val Leu Glu Glu Met Ser Leu Pro Gly Arg Trp Lys Pro Lys Met Ile35 40 45ggg gga att gga ggt ttt atc aaa gta aga cag tat gat cag ata ctc192Gly Gly Ile Gly Gly Phe Ile Lys Val Arg Gln Tyr Asp Gln Ile Leu50 55 60
ata gaa atc tgt gga cat aaa gct ata ggt aca gta tta gta gga cct240Ile Glu Ile Cys Gly His Lys Ala Ile Gly Thr Val Leu Val Gly Pro65 70 75 80aca cct gtc aac ata att gga aga aat ctg ttg act cag att ggt tgc288Thr Pro Val Asn Ile Ile Gly Arg Asn Leu Leu Thr Gln Ile Gly Cys85 90 95act tta aat ttttga 303Thr Leu Asn Phe100<210>56<211>100<212>PRT<213>人类免疫缺陷病毒型1<400>56Met Pro Gln Val Thr Leu Trp Gln Arg Pro Leu Val Thr Ile Lys Ile1 5 10 15Gly Gly Gln Leu Lys Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr20 25 30Val Leu Glu Glu Met Ser Leu Pro Gly Arg Trp Lys Pro Lys Met Ile35 40 45Gly Gly Ile Gly Gly Phe Ile Lys Val Arg Gln Tyr Asp Gln Ile Leu50 55 60Ile Glu Ile Cys Gly His Lys Ala Ile Gly Thr Val Leu Val Gly Pro65 70 75 80Thr Pro Val Asn Ile Ile Gly Arg Asn Leu Leu Thr Gln Ile Gly Cys85 90 95Thr Leu Asn Phe100
<210>57<211>21<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(21)<223>HIV-1蛋白酶切割序列<400>57agc caa aat tac cct ata gtg21Ser Gln Asn Tyr Pro Ile Val1 5<210>58<211>7<212>PRT<213>人工序列<400>58Ser Gln Asn Tyr Pro Ile Val1 5<210>59<211>21<212>DNA<213>人工序列<220>
<223>合成序列
<220>
<221>CDS<222>(1)..(21)<223>HIV-1蛋白酶切割序列<400>59gca aga gtt ttg gct gaa gca21Ala Arg Val Leu Ala Glu Ala1 5<210>60<211>7<212>PRT<213>人工序列<400>60Ala Arg Val Leu Ala Glu Ala1 5<210>61<211>21<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(21)<223>HIV-1蛋白酶切割序列<400>61gct acc ata atg atg cag aga21
Ala Thr Ile Met Met Gln Arg1 5<210>62<211>7<212>PRT<213>人工序列<400>62Ala Thr Ile Met Met Gln Arg1 5<210>63<211>21<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(21)<223>HIV-1蛋白酶切割序列<400>63aga cag gct aat ttt tta ggg 21Arg Gln Ala Asn Phe Leu Gly1 5<210>64<211>7<212>PRT<213>人工序列
<400>64Arg Gln Ala Asn Phe Leu Gly1 5<210>65<211>21<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(21)<223>HIV-1蛋白酶切割序列<400>65cca ggg aat ttt ctt cag agc21Pro Gly Asn Phe Leu Gln Ser1 5<210>66<211>7<212>PRT<213>人工序列<400>66Pro Gly Asn Phe Leu Gln Ser1 5<210>67<211>15<212>DNA<213>人工序列
<220>
<223>合成序列<220>
<221>CDS<222>(1)..(15)<223>HIV-1蛋白酶切割序列<400>67agc gtg cct caa ata15Ser Val Pro Gln Ile1 5<210>68<211>5<212>PRT<213>人工序列<400>68Set Val Pro Gln Ile1 5<210>69<211>21<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(21)<223>HIV-1蛋白酶切割序列
<400>69act tta aat ttt ccc att agc21Thr Leu Asn Phe Pro Ile Ser1 5<210>70<211>7<212>PRT<213>人工序列<400>70Thr Leu Asn Phe Pro Ile Ser1 5<210>71<211>21<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(21)<223>HIV-1蛋白酶切割序列<400>71gca gaa acc ttc tat gta gat21Ala Glu Thr Phe Tyr Val Asp1 5<210>72
<211>7<212>PRT<213>人工序列<400>72Ala Glu Thr Phe Tyr Val Asp1 5<210>73<211>21<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(21)<223>HIV-1蛋白酶切割序列<400>73agg aaa gta cta ttt tta gat21Arg Lys Val Leu Phe Leu Asp1 5<210>74<211>7<212>PRT<213>人工序列<400>74Arg Lys Val Leu Phe Leu Asp1 5
<210>75<211>1647<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>基因<222>(1)..(1647)<223>RFP:PS(HIV-1蛋白酶):AtOEP7:GFP杂合蛋白基因<220>
<221>CDS<222>(1)..(1644)<223>RFP:PS(HIV-1蛋白酶):AtOEP7:GFP杂合蛋白<220>
<221>misc_特征<222>(1)..(1647)<223>CDS:RFP(1..678)+ADs-CDS:HIV-1蛋白酶水解位点(700..720)+ADs-CDS:AtOEP7(721..909)+ADs-CDS:GFP(931..1644)<400>75atg gtg cgc tcc tcc aag aac gtc atc aag gag ttc atg cgc ttc aag48Met Val Arg Ser Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys1 5 10 15gtg cgc atg gag ggc acc gtg aac ggc cac gag ttc gag atc gag ggc96Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly20 25 30gag ggc gag ggc cgc ccc tac gag ggc cac aac acc gtg aag ctg aag144Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys35 40 45
gtg acc aag ggc ggc ccc ctg ccc ttc gcc tgg gac atc ctg tcc ccc192Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro50 55 60cag ttc cag tac ggc tcc aag gtg tac gtg aag cac ccc gcc gac atc240Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile65 70 75 80ccc gac tac aag aag ctg tcc ttc ccc gag ggc ttc aag tgg gag cgc288Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg85 90 95gtg atg aac ttc gag gac ggc ggc gtg gtg acc gtg acc cag gac tcc336Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser100 105 110tcc ctg cag gac ggc tgc ttc atc tac aag gtg aag ttc atc ggc gtg384Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val115 120 125aac ttc ccc tcc gac ggc ccc gta atg cag aag aag acc atg ggc tgg432Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp130 135 140gag gcc tcc acc gag cgc ctg tac ccc cgc gac ggc gtg ctg aag ggc480Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly145 150 155 160gag atc cac aag gcc ctg aag ctg aag gac ggc ggc cac tac ctg gtg528Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val165 170 175gag ttc aag tcc atc tac atg gcc aag aag ccc gtg cag ctg ccc ggc576Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly180 185 190tac tac tac gtg gac tcc aag ctg gac atc acc tcc cac aac gag gac624Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp195 200 205
tac acc atc gtg gag cag tac gag cgc acc gag ggc cgc cac cac ctg672Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu210 215 220ttc ctg ccc cgg gca atc aag ctg ggt aga cag gct aat ttt tta ggg720Phe Leu Pro Arg Ala Ile Lys Leu Gly Arg Gln Ala Asn Phe Leu Gly225 230 235 240gga aaa act tcg gga gcg aaa cag gcg act gtg gtg gtc gca gcg atg768Gly Lys Thr Ser Gly Ala Lys Gln Ala Thr Val Val Val Ala Ala Met245 250 255gcg tta gga tgg tta gcc ata gag atc gct ttc aag cct ttc ctc gat816Ala Leu Gly Trp Leu Ala Ile Glu Ile Ala Phe Lys Pro Phe Leu Asp260 265 270aaa ttc cgc tcc tca atc gac aaa tct gac cca acc aaa gac ccc gat864Lys Phe Arg Ser Ser Ile Asp Lys Ser Aep Pro Thr Lys Asp Pro Asp275 280 285gac ttc gac acc gcc gct act gca acc aca tcc aaa gag ggt ttg ggg912Asp Phe Asp Thr Ala Ala Thr Ala Thr Thr Ser Lys Glu Gly Leu Gly290 295 300atc caa gga gat ata aca atg agt aaa gga gaa gaa ctt ttc act gga960Ile Gln Gly Asp Ile Thr Met Ser Lys Gly Glu Glu Leu Phe Thr Gly305 310 315 320gtt gtc cca att ctt gtt gaa tta gat ggt gat gtt aat ggg cac aaa1008Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys325 330 335ttt tct gtc agt gga gag ggt gaa ggt gat gca aca tac gga aaa ctt1056Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu340 345 350acc ctt aaa ttt att tgc act act gga aaa cta cct gtt cca tgg cca1104Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro355 360 365
aca ctt gtc act act ttc tct tat ggt gtt caa tgc ttt tca aga tac1152Thr Leu Val Thr Thr Phe Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr370 375 380cca gat cat atg aag cgg cac gac ttc ttc aag agc gcc atg cct gag1200Pro Asp His Met Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu385 390 395 400gga tac gtg cag gag agg acc atc tct ttc aag gac gac ggg aac tac1248Gly Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Asn Tyr405 410 415aag aca cgt gct gaa gtc aag ttt gag gga gac acc ctc gtc aac agg1296Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg420 425 430atc gag ctt aag gga atc gat ttc aag gag gac gga aac atc ctc ggc1344Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly435 440 445cac aag ttg gaa tac aac tac aac tcc cac aac gta tac atc acg gca1392His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Thr Ala450 455 460gac aaa caa aag aat gga atc aaa gct aac ttc aaa att aga cac aac1440Asp Lys Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn465 470 475 480att gaa gat gga agc gtt caa cta gca gac cat tat caa caa aat act1488Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr485 490 495cca att ggc gat ggc cct gtc ctt tta cca gac aac cat tac ctg tcc1536Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser500 505 510aca caa tct gcc ctt tcg aaa gat ccc aac gaa aag aga gac cac atg1584Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met515 520 525
gtc ctt ctt gag ttt gta aca gct gct ggg att aca cat ggc atg gat1632Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp530 535 540gaa cta tac aaa taa1647Glu Leu Tyr Lys545<210>76<211>548<212>PRT<213>人工序列<400>76Met Val Arg Ser Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys1 5 10 15Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly20 25 30Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys35 40 45Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro50 55 60Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile65 70 75 80Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg85 90 95Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser100 105 110Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val115 120 125
Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp130 135 140Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly145 150 155 160Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val165 170 175Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly180 185 190Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp195 200 205Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu210 215 220Phe Leu Pro Arg Ala Ile Lys Leu Gly Arg Gln Ala Asn Phe Leu Gly225 230 235 240Gly Lys Thr Ser Gly Ala Lys Gln Ala Thr Val Val Val Ala Ala Met245 250 255Ala Leu Gly Trp Leu Ala Ile Glu Ile Ala Phe Lys Pro Phe Leu Asp260 265 270Lys Phe Arg Ser Ser Ile Asp Lys Ser Asp Pro Thr Lys Asp Pro Asp275 280 285Asp Phe Asp Thr Ala Ala Thr Ala Thr Thr Ser Lys Glu Gly Leu Gly290 295 300Ile Gln Gly Asp Ile Thr Met Ser Lys Gly Glu Glu Leu Phe Thr Gly305 310 315 320Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys325 330 335Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu
340 345 350Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro355 360 365Thr Leu Val Thr Thr Phe Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr370 375 380Pro Asp His Met Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu385 390 395 400Gly Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Asn Tyr405 410 415Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg420 425 430Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly435 440 445His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Thr Ala450 455 460Asp Lys Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn465 470 475 480Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr485 490 495Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser500 505 510Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met515 520 525Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp530 535 540Glu Leu Tyr Lys545
<210>77<211>1893<212>DNA<213>丙肝病毒<220>
<221>CDS<222>(1)..(1893)<223>HCV NS3蛋白酶<300>
<308>GenBank/D16435<309>2000-02-01<400>77gcg cct atc acg gcc tat tcc caa caa acg cgg ggc ctg ctt ggc tgt48Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly Cys1 5 10 15atc atc act agc ctc aca ggt cgg gac aag aac cag gtc gat ggg gag96Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Asp Gly Glu20 25 30gtt cag gtg ctc tcc acc gca acg caa tct ttc ctg gcg acc tgc gtc144Val Gln Val Leu Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys Val35 40 45aat ggc gtg tgt tgg acc gtc tac cat ggt gcc ggc tcg aag acc ctg192Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr Leu50 55 60gcc ggc ccg aag ggt cca atc acc caa atg tac acc aat gta gac cag240Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp Gln65 70 75 80gac ctc gtc ggc tgg ccg gcg ccc ccc ggg gcg cgc tcc atg aca ccg288Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Ala Arg Ser Met Thr Pro
85 90 95tgc acc tgc ggc agc tcg gac ctt tac ttg gtc acg agg cat gcc gat336Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp100 105 110gtc att ccg gtg cgc cgg cga ggc gac agc agg ggg agt cta ctc tcc384Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser115 120 125cct agg ccc gtc tcc tac ctg aag ggc tcc tcg ggt gga cca ctg ctt432Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu130 135 140tgc cct tcg ggg cac gtt gta ggc atc ttc cgg gct gct gtg tgc acc480Cys Pro Ser Gly His Val Val Gly Ile Phe Arg Ala Ala Val Cys Thr145 150 155 160cgg ggg gtt gcg aag gcg gtg gac ttc ata ccc gtt gag tct atg gaa528Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Met Glu165 170 175act acc atg cgg tct ccg gtc ttc aca gac aac tca tcc cct ccg gcc576Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala180 185 190gta ccg caa aca ttc caa gtg gca cat tta cac gct ccc act ggc agc624Val Pro Gln Thr Phe Gln Val Ala His Leu His Ala Pro Thr Gly Ser195 200 205ggc aag agc acc aaa gtg ccg gct gca tat gca gcc caa ggg tac aag672Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr Lys210 215 220gtg ctc gtc cta aac ccg tcc gtt gct gcc aca ttg ggc ttt gga gcg720Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly Ala225 230 235 240tat atg tcc aag gca cat ggc atc gag cct aac atc aga act ggg gta768Tyr Met Ser Lys Ala His Gly Ile Glu Pro Asn Ile Arg Thr Gly Val
245 250 255agg acc atc acc acg ggc ggc ccc atc acg tac tcc acc tat ggc aag816Arg Thr Ile Thr Thr Gly Gly Pro Ile Thr Tyr Ser Thr Tyr Gly Lys260 265 270ttc ctt gcc gac ggt gga tgc tcc ggg ggc gcc tat gac atc ata ata864Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Arp Ile Ile Ile275 280 285tgt gac gaa tgc cac tca act gac tgg aca acc atc ttg ggc atc ggc912Cys Asp Glu Cys His Ser Thr Asp Trp Thr Thr Ile Leu Gly Ile Gly290 295 300aca gtc ctg gat cag gca gag acg gct gga gcg cgg ctc gtc gtg ctc960Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val Leu305 310 315 320gcc acc gcc acg cct ccg gga tcg atc acc gtg cca cac ccc aac atc1008Ala Thr Ala Thr Pro Pro Gly Ser Ile Thr Val Pro His Pro Asn Ile325 330 335gag gaa gtg gcc ctg tcc aac act ggg gag att ccc ttc tat ggc aaa1056Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly Lys340 345 350gcc atc ccc att gag gcc atc aag ggg gga agg cat ctc atc ttc tgc1104Ala Ile Pro Ile Glu Ala Ile Lys Gly Gly Arg His Leu Ile Phe Cys355 360 365cat tcc aag aag aag tgt gac gag ctc gcc gca aag ctg aca ggc ctc1152His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Thr Gly Leu370 375 380gga ctc aat gct gta gcg tat tac cgg ggt ctc gat gtg tcc gtc ata1200Gly Leu Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile385 390 395 400ccg act agc gga gac gtc gtt gtc gtg gca aca gac gct cta atg acg1248Pro Thr Ser Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met Thr
405 410 415ggc ttt acc ggc gac ttt gac tca gtg atc gac tgc aac aca tgt gtc1296Gly Phe Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys Val420 425 430acc cag aca gtc gat ttc agc ttg gat ccc acc ttc acc att gag acg1344Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu Thr435 440 445aca acc gtg ccc caa gac gcg gtg tcg cgc tcg cag cgg cga ggt agg1392Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly Arg450 455 460act ggc agg ggc agg agt ggc atc tac agg ttt gtg act cca gga gaa1440Thr Gly Arg Gly Arg Ser Gly Ile Tyr Arg Phe Val Thr Pro Gly Glu465 470 475 480cgg ccc tca ggc atg ttc gac tcc tcg gtc ctg tgt gag tgc tat gac1488Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr Asp485 490 495gca ggc tgc gct tgg tat gag ctc acg ccc gct gag act aca gtc agg1536Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Thr Val Arg500 505 510ttg cgg gct tac ctg aat aca cca ggg ttg ccc gtc tgc cag gac cat1584Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp His515 520 525ctg gag ttc tgg gaa agc gtc ttc aca ggc ctc acc cac ata gat gcc1632Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp Ala530 535 540cac ttc ctg tcc caa acc aag cag gca gga gac aac ttc ccc tac ctg1680His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr Leu545 550 555 560gtg gca tac caa gcc acg gtg tgc gcc agg gct cag gct cca cct cca1728Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro Pro
565 570 575tcg tgg gat caa atg tgg aag tgt ctc ata cgg ctt aaa cct acg ctg1776Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu580 585 590cac ggg cca aca ccc ctg ctg tat agg cta gga gcc gtt caa aat gag1824His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn Glu595 600 605atc acc ctc aca cat ccc ata acc aaa ttc gtc atg gca tgc atg tcg1872Ile Thr Leu Thr His Pro Ile Thr Lys Phe Val Met Ala Cys Met Ser610 615 620gcc gac ctg gag gtc gtc act1893Ala Asp Leu Glu Val Val Thr625 630<210>78<211>631<212>PRT<213>丙肝病毒<400>78Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly Cys1 5 10 15Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Asp Gly Glu20 25 30Val Gln Val Leu Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys Val35 40 45Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr Leu50 55 60Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp Gln65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Ala Arg Ser Met Thr Pro85 90 95Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp100 105 110Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser115 120 125Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu130 135 140Cys Pro Ser Gly His Val Val Gly Ile Phe Arg Ala Ala Val Cys Thr145 150 155 160Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Met Glu165 170 175Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala180 185 190Val Pro Gln Thr Phe Gln Val Ala His Leu His Ala Pro Thr Gly Ser195 200 205Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr Lys210 215 220Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly Ala225 230 235 240Tyr Met Ser Lys Ala His Gly Ile Glu Pro Asn Ile Arg Thr Gly Val245 250 255Arg Thr Ile Thr Thr Gly Gly Pro Ile Thr Tyr Ser Thr Tyr Gly Lys260 265 270Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile275 280 285Cys Asp Glu Cys His Ser Thr Asp Trp Thr Thr Ile Leu Gly Ile Gly
290 295 300Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val Leu305 310 315 320Ala Thr Ala Thr Pro Pro Gly Ser Ile Thr Val Pro His Pro Asn Ile325 330 335Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly Lys340 345 350Ala Ile Pro Ile Glu Ala Ile Lys Gly Gly Arg His Leu Ile Phe Cys355 360 365His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Thr Gly Leu370 375 380Gly Leu Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile385 390 395 400Pro Thr Ser Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met Thr405 410 415Gly Phe Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys Val420 425 430Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu Thr435 440 445Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly Arg450 455 460Thr Gly Arg Gly Arg Ser Gly Ile Tyr Arg Phe Val Thr Pro Gly Glu465 470 475 480Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr Asp485 490 495Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Thr Val Arg500 505 510
Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp His515 520 525Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp Ala530 535 540His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr Leu545 550 555 560Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro Pro565 570 575Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu580 585 590His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn Glu595 600 605Ile Thr Leu Thr His Pro Ile Thr Lys Phe Val Met Ala Cys Met Ser610 615 620Ala Asp Leu Glu Val Val Thr625 630<210>79<211>30<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(30)<223>HCV NS3蛋白酶切割序列
<400>79gat gaa atg gaa gag tgc gcc tca cac ctc 30Asp Glu Met Glu Glu Cys Ala Ser His Leu1 5 10<210>80<211>10<212>PRT<213>人工序列<400>80Asp Glu Met Glu Glu Cys Ala Ser His Leu1 5 10<210>81<211>30<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(30)<223>HCV NS3蛋白酶切割序列<400>81gac tgc tcc acg cca tgc tcc ggc tcg tgg 30Asp Cys Ser Thr Pro Cys Ser Gly Ser Trp1 5 10<210>82<211>10
<212>PRT<213>人工序列<400>82Asp Cys Ser Thr Pro Cys Ser Gly Ser Trp1 5 10<210>83<211>30<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(30)<223>HCV NS3蛋白酶切割序列<400>83gac gac atc gtc tgc tgc tca atg tcc tac 30Asp Asp Ile Val Cys Cys Ser Met Ser Tyr1 5 10<210>84<211>10<212>PRT<213>人工序列<400>84Asp Asp Ile Val Cys Cys Ser Met Ser Tyr1 5 10<210>85
<211>1908<212>DNA<213>人疱疹病毒1<220>
<221>基因<222>(1)..(1908)<223>HSV-1蛋白酶基因<220>
<221>CDS<222>(1)..(1905)<223>HSV-1蛋白酶<300>
<308>GenBank/X14112<309>1997-04-17<400>85atg gca gcc gat gcc ccg gga gac cgg atg gag gag ccc ctg ccc gac48Met Ala Ala Asp Ala Pro Gly Asp Arg Met Glu Glu Pro Leu Pro Asp1 5 10 15agg gcc gtg ccc att tac gtg gct ggg ttt ttg gcc ctg tat gac agc96Arg Ala Val Pro Ile Tyr Val Ala Gly Phe Leu Ala Leu Tyr Asp Ser20 25 30ggg gac tcg ggc gag ttg gca ttg gat ccg gat acg gtg cgg gcg gcc144Gly Asp Ser Gly Glu Leu Ala Leu Asp Pro Asp Thr Val Arg Ala Ala35 40 45ctg cct ccg gat aac cca ctc ccg att aac gtg gac cac cgc gct ggc192Leu Pro Pro Asp Asn Pro Leu Pro Ile Asn Val Asp His Arg Ala Gly50 55 60tgc gag gtg ggg cgg gtg ctg gcc gtg gtc gac gac ccc cgc ggg ccg240Cys Glu Val Gly Arg Val Leu Ala Val Val Asp Asp Pro Arg Gly Pro65 70 75 80
ttt ttt gtg ggg ctg atc gcc tgc gtg cag ctg gag cgc gtc ctc gag288Phe Phe Val Gly Leu Ile Ala Cys Val Gln Leu Glu Arg Val Leu Glu85 90 95acg gcc gcc agc gct gcg att ttc gag cgc cgc ggg ccg ccg ctc tcc336Thr Ala Ala Ser Ala Ala Ile Phe Glu Arg Arg Gly Pro Pro Leu Ser100 105 110cgg gag gag cgc ctg ttg tac ctg atc acc aac tac ctg ccc tcg gtc384Arg Glu Glu Arg Leu Leu Tyr Leu Ile Thr Asn Tyr Leu Pro Ser Val115 120 125tcc ctg gcc aca aaa cgc ctg ggg ggc gag gcg cac ccc gat cgc acg432Ser Leu Ala Thr Lys Arg Leu Gly Gly Glu Ala His Pro Asp Arg Thr130 135 140ctg ttc gcg cac gtc gcg ctg tgc gcg atc ggg cgg cgc ctc ggc act480Leu Phe Ala His Val Ala Leu Cys Ala Ile Gly Arg Arg Leu Gly Thr145 150 155 160atc gtc acc tac gac acc ggt ctc gac gcc gcc atc gcg ccc ttt cgc528Ile Val Thr Tyr Asp Thr Gly Leu Asp Ala Ala Ile Ala Pro Phe Arg165 170 175cac ctg tcg ccg gcg tct cgc gag ggg gcg cgg cga ctg gcc gcc gag576His Leu Ser Pro Ala Ser Arg Glu Gly Ala Arg Arg Leu Ala Ala Glu180 185 190gcc gag ctc gcg ctg tcc ggg cgc acc tgg gcg ccc ggc gtg gag gcg624Ala Glu Leu Ala Leu Ser Gly Arg Thr Trp Ala Pro Gly Val Glu Ala195 200 205ctg acc cac acg ctg ctt tcc acc gcc gtt aac aac atg atg ctg cgg672Leu Thr His Thr Leu Leu Ser Thr Ala Val Asn Asn Met Met Leu Arg210 215 220gac cgc tgg agc ctg gtg gcc gag cgg cgg cgg cag gcc ggg atc gcc720Asp Arg Trp Ser Leu Val Ala Glu Arg Arg Arg Gln Ala Gly Ile Ala225 230 235 240
gga cac acc tac ctc cag gcg agc gaa aaa ttc aaa atg tgg ggg gcg768Gly His Thr Tyr Leu Gln Ala Ser Glu Lys Phe Lys Met Trp Gly Ala245 250 255gag cct gtt tcc gcg ccg gcg cgc ggg tat aag aac ggg gcc ccg gag816Glu Pro Val Ser Ala Pro Ala Arg Gly Tyr Lys Asn Gly Ala Pro Glu260 265 270tcc acg gac ata ccg ccc ggc tcg atc gct gcc gcg ccg cag ggt gac864Ser Thr Asp Ile Pro Pro Gly Ser Ile Ala Ala Ala Pro Gln Gly Asp275 280 285cgg tgc cca atc gtc cgt cag cgc ggg gtc gcc ttg tcc ccg gta ctg912Arg Cys Pro Ile Val Arg Gln Arg Gly Val Ala Leu Ser Pro Val Leu290 295 300ccc ccc atg aac ccc gtt ccg aca tcg ggc acc ccg gcc ccc gcg ccg960Pro Pro Met Asn Pro Val Pro Thr Ser Gly Thr Pro Ala Pro Ala Pro305 310 315 320ccc ggc gac ggg agc tac ctg tgg atc ccg gcc tcc cat tac aac cag1008Pro Gly Asp Gly Ser Tyr Leu Trp Ile Pro Ala Ser His Tyr Asn Gln325 330 335ctc gtc gcc ggc cat gcc gcg ccc caa ccc cag ccg cat tcc gcg ttt1056Leu Val Ala Gly His Ala Ala Pro Gln Pro Gln Pro His Ser Ala Phe340 345 350ggt ttc ccg gct gcg gcg ggg tcc gtg gcc tat ggg cct cac ggt gcg1104Gly Phe Pro Ala Ala Ala Gly Ser Val Ala Tyr Gly Pro His Gly Ala355 360 365ggt ctt tcc cag cat tac cct ccc cac gtc gcc cat cag tat ccc ggg1152Gly Leu Ser Gln His Tyr Pro Pro His Val Ala His Gln Tyr Pro Gly370 375 380gtg ctg ttc tcg gga ccc agc cca ctc gag gcg cag ata gcc gcg ttg1200Val Leu Phe Ser Gly Pro Ser Pro Leu Glu Ala Gln Ile Ala Ala Leu385 390 395 400
gtg ggg gcc ata gcc gcg gac cgc cag gcg ggc ggt cag ccg gcc gcg1248Val Gly Ala Ile Ala Ala Asp Arg Gln Ala Gly Gly Gln Pro Ala Ala405 410 415gga gac cct ggg gtc cgg ggg tcg gga aag cgt cgc cgg tac gag gcg1296Gly Asp Pro Gly Val Arg Gly Ser Gly Lys Arg Arg Arg Tyr Glu Ala420 425 430ggg ccg tcg gag tcc tac tgc gac cag gac gaa ccg gac gcg gac tac1344Gly Pro Ser Glu Ser Tyr Cys Asp Gln Asp Glu Pro Asp Ala Asp Tyr435 440 445ccg tac tac ccc ggg gag gct cga ggc gcg ccg cgc ggg gtc gac tcc1392Pro Tyr Tyr Pro Gly Glu Ala Arg Gly Ala Pro Arg Gly Val Asp Ser450 455 460cgg cgc gcg gcc cgc cat tct ccc ggg acc aac gag acc atc acg gcg1440Arg Arg Ala Ala Arg His Ser Pro Gly Thr Asn Glu Thr Ile Thr Ala465 470 475 480ctg atg ggg gcg gtg acg tct ctg cag cag gaa ctg gcg cac atg cgg1488Leu Met Gly Ala Val Thr Ser Leu Gln Gln Glu Leu Ala His Met Arg485 490 495gct cgg acc agc gcc ccc tat gga atg tac acg ccg gtg gcg cac tat1536Ala Arg Thr Ser Ala Pro Tyr Gly Met ryr Thr Pro Val Ala His Tyr500 505 510cgc cct cag gtg ggg gag ccg gaa cca aca acg acc cac ccg gcc ctt1584Arg Pro Gln Val Gly Glu Pro Glu Pro Thr Thr Thr His Pro Ala Leu515 520 525tgt ccc ccg gag gcc gtg tat cgc ccc cca cca cac agc gcc ccc tac1632Cys Pro Pro Glu Ala Val Tyr Arg Pro Pro Pro His Ser Ala Pro Tyr530 535 540ggt cct ccc cag ggt ccg gcg tcc cat gcc ccc act ccc ccg tat gcc1680Gly Pro Ala Glu Gly Pro Ala Ser His Ala Pro Thr Pro Pro Tyr Ala545 550 555 560
cca gct gcc tgc cgg cca ggc ccg cca ccg ccc cca tgt cct tcc acc1728Pro Ala Ala Cys Pro Pro Gly Pro Pro Pro Pro Pro Cys Pro Ser Thr565 570 575cag acg cgc gcc cct cta ccg acg gag ccc gcg ttc ccc ccc gcc gcc1776Gln Thr Arg Ala Pro Leu Pro Thr Glu Pro Ala Phe Pro Pro Ala Ala580 585 590acc gga tcc caa ccg gag gca tcc aac gcg gag gcc ggg gcc ctt gtc1824Thr Gly Ser Gln Pro Glu Ala Ser Asn Ala Glu Ala Gly Ala Leu Val595 600 605aac gcc agc agc gca gca cac gtg gac gtt gac acg gcc cgc gcc gcc1872Asn Ala Ser Ser Ala Ala His Val Asp Val Asp Thr Ala Arg Ala Ala610 615 620gat ttg ttc gtc tct cag atg atg ggg gcc cgctga 1908Asp Leu Phe Val Ser Gln Met Met Gly Ala Arg625 630 635<210>86<211>635<212>PRT<213>人疱疹病毒1<400>86Met Ala Ala Asp Ala Pro Gly Asp Arg Met Glu Glu Pro Leu Pro Asp1 5 10 15Arg Ala Val Pro Ile Tyr Val Ala Gly Phe Leu Ala Leu Tyr Asp Ser20 25 30Gly Asp Ser Gly Glu Leu Ala Leu Asp Pro Asp Thr Val Arg Ala Ala35 40 45Leu Pro Pro Asp Asn Pro Leu Pro Ile Asn Val Asp His Arg Ala Gly50 55 60
Cys Glu Val Gly Arg Val Leu Ala Val Val Asp Asp Pro Arg Gly Pro65 70 75 80Phe Phe Val Gly Leu Ile Ala Cys Val Gln Leu Glu Arg Val Leu Glu85 90 95Thr Ala Ala Ser Ala Ala Ile Phe Glu Arg Arg Gly Pro Pro Leu Ser100 105 110Arg Glu Glu Arg Leu Leu Tyr Leu Ile Thr Asn Tyr Leu Pro Ser Val115 120 125Ser Leu Ala Thr Lys Arg Leu Gly Gly Glu Ala His Pro Asp Arg Thr130 135 140Leu Phe Ala His Val Ala Leu Cys Ala Ile Gly Arg Arg Leu Gly Thr145 150 155 160Ile Val Thr Tyr Asp Thr Gly Leu Asp Ala Ala Ile Ala Pro Phe Arg165 170 175His Leu Ser Pro Ala Ser Arg Glu Gly Ala Arg Arg Leu Ala Ala Glu180 185 190Ala Glu Leu Ala Leu Ser Gly Arg Thr Trp Ala Pro Gly Val Glu Ala195 200 205Leu Thr His Thr Leu Leu Ser Thr Ala Val Asn Asn Met Met Leu Arg210 215 220Asp Arg Trp Ser Leu Val Ala Glu Arg Arg Arg Gln Ala Gly Ile Ala225 230 235 240Gly His Thr Tyr Leu Gln Ala Ser Glu Lys Phe Lys Met Trp Gly Ala245 250 255Glu Pro Val Ser Ala Pro Ala Arg Gly Tyr Lys Asn Gly Ala Pro Glu260 265 270Ser Thr Asp Ile Pro Pro Gly Ser Ile Ala Ala Ala Pro Gln Gly Asp
275 280 285Arg Cys Pro Ile Val Arg Gln Arg Gly Val Ala Leu Ser Pro Val Leu290 295 300Pro Pro Met Asn Pro Val Pro Thr Ser Gly Thr Pro Ala Pro Ala Pro305 310 315 320Pro Gly Asp Gly Ser Tyr Leu Trp Ile Pro Ala Ser His Tyr Asn Gln325 330 335Leu Val Ala Gly His Ala Ala Pro Gln Pro Gln Pro His Ser Ala Phe340 345 350Gly Phe Pro Ala Ala Ala Gly Ser Val Ala Tyr Gly Pro His Gly Ala355 360 365Gly Leu Ser Gln His Tyr Pro Pro His Val Ala His Gln Tyr Pro Gly370 375 380Val Leu Phe Ser Gly Pro Ser Pro Leu Glu Ala Gln Ile Ala Ala Leu385 390 395 400Val Gly Ala Ile Ala Ala Asp Arg Gln Ala Gly Gly Gln Pro Ala Ala405 410 415Gly Asp Pro Gly Val Arg Gly Ser Gly Lys Arg Arg Arg Tyr Glu Ala420 425 430Gly Pro Ser Glu Ser Tyr Cys Asp Gln Asp Glu Pro Asp Ala Asp Tyr435 440 445Pro Tyr Tyr Pro Gly Glu Ala Arg Gly Ala Pro Arg Gly Val Asp Ser450 455 460Arg Arg Ala Ala Arg His Ser Pro Gly Thr Asn Glu Thr Ile Thr Ala465 470 475 480Leu Met Gly Ala Val Thr Ser Leu Gln Gln Glu Leu Ala His Met Arg485 490 495
Ala Arg Thr Ser Ala Pro Tyr Gly Met Tyr Thr Pro Val Ala His Tyr500 505 510Arg Pro Gln Val Gly Glu Pro Glu Pro Thr Thr Thr His Pro Ala Leu515 520 525Cys Pro Pro Glu Ala Val Tyr Arg Pro Pro Pro His Ser Ala Pro Tyr530 535 540Gly Pro Pro Gln Gly Pro Ala Ser His Ala Pro Thr Pro Pro Tyr Ala545 550 555 560Pro Ala Ala Cys Pro Pro Gly Pro Pro Pro Pro Pro Cys Pro Ser Thr565 570 575Gln Thr Arg Ala Pro Leu Pro Thr Glu Pro Ala Phe Pro Pro Ala Ala580 585 590Thr Gly Ser Gln Pro Glu Ala Ser Asn Ala Glu Ala Gly Ala Leu Val595 600 605Asn Ala Ser Ser Ala Ala His Val Asp Val Asp Thr Ala Arg Ala Ala610 615 620Asp Leu Phe Val Ser Gln Met Met Gly Ala Arg625 630 635<210>87<211>15<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS
<222>(1)..(15)<223>HSV-1蛋白酶切割序列<220>
<221>misc_特征<222>(1)..(15)<223>n=a,g,c,or t;r=a or g;y=c or t<400>87ctn gtn ctn gcn agy 15Xaa Xaa Xaa Xaa Xaa1 5<210>88<211>5<212>PRT<213>人工序列<400>88Xaa Xaa Xaa Xaa Xaa1 5<210>89<211>18<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(18)<223>HSV-1蛋白酶切割序列
<220>
<221>misc_特征<222>(1)..(18)<223>n+ADO-a,g,c,或t+ADs-y+ADO-c或t<400>89ctn gtn ctn gcn agy agy 18Xaa Xaa Xaa Xaa Xaa Xaa1 5<210>90<211>6<212>PRT<213>人工序列<400>90Xaa Xaa Xaa Xaa Xaa Xaa1 5<210>91<211>501<212>DNA<213>人嗜T淋巴细胞病毒1<220>
<221>基因<222>(1)..(501)<223>HTLV-1蛋白酶基因<220>
<221>CDS<222>(1)..(498)<223>HTLV-1蛋白酶
<300>
<308>GenBank/L36905<309>1996-01-18<400>91atg aca gtc ctt ccg ata gcc ttg ttc tca agt aat act ccc ctc aga48Met Thr Val Leu Pro Ile Ala Leu Phe Ser Ser Asn Thr Pro Leu Arg1 5 10 15aat aca tcc gta tta ggg gca ggg ggc caa acc caa gat cac ttt aag96Asn Thr Ser Val Leu Gly Ala Gly Gly Gln Thr Gln Asp His Phe Lys20 25 30ctc acc tcc ctt cct gta cta ata cgc ctc cct ttc cgg aca acg cct144Leu Thr Ser Leu Pro Val Leu Ile Arg Leu Pro Phe Arg Thr Thr Pro35 40 45att gtt tta aca tct tgc cta gtt gat acc aaa aac aac tgg gcc atc192Ile Val Leu Thr Ser Cys Leu Val Asp Thr Lys Asn Asn Trp Ala Ile50 55 60ata ggt cgt gat gcc tta caa caa tgc caa ggc gcc ctg tac ctc cct240Ile Gly Arg Asp Ala Leu Gln Gln Cys Gln Gly Ala Leu Tyr Leu Pro65 70 75 80gag gca aaa ggg ccg cct gta atc ttg cca ata cag gcg cca gcc gtc288Glu Ala Lys Gly Pro Pro Val Ile Leu Pro Ile Gln Ala Pro Ala Val85 90 95ctt ggg cta gaa cac ctc cca agg ccc ccc gaa atc agc cag ttc cct336Leu Gly Leu Glu His Leu Pro Arg Pro Pro Glu Ile Ser Gln Phe Pro100 105 110tta aac cag aac ggc tcc agg cct tgc aac act tgg tcc gga agg ccc384Leu Asn Gln Asn Gly Ser Arg Pro Cys Asn Thr Trp Ser Gly Arg Pro115 120 125tgg agg cag gcc ata tcg aac cct aca ccg ggc cag gaa ata acc cag432Trp Arg Gln Ala Ile Ser Asn Pro Thr Pro Gly Gln Glu Ile Thr Gln130 135 140
tat tcc cag tta aaa agg cca atg gaa cct ggc gat tca tcc acg acc480Tyr Ser Gln Leu Lys Arg Pro Met Glu Pro Gly Asp Ser Ser Thr Thr145 150 155 160tgc ggg cca cta act ctctaa 501Cys Gly Pro Leu Thr Leu165<210>92<211>166<212>PRT<213>人嗜T淋巴细胞病毒1<400>92Met Thr Val Leu Pro Ile Ala Leu Phe Ser Ser Asn Thr Pro Leu Arg1 5 10 15Asn Thr Ser Val Leu Gly Ala Gly Gly Gln Thr Gln Asp His Phe Lys20 25 30Leu Thr Ser Leu Pro Val Leu Ile Arg Leu Pro Phe Arg Thr Thr Pro35 40 45Ile Val Leu Thr Ser Cys Leu Val Asp Thr Lys Asn Asn Trp Ala Ile50 55 60Ile Gly Arg Asp Ala Leu Gln Gln Cys Gln Gly Ala Leu Tyr Leu Pro65 70 75 80Glu Ala Lys Gly Pro Pro Val Ile Leu Pro Ile Gln Ala Pro Ala Val85 90 95Leu Gly Leu Glu His Leu Pro Arg Pro Pro Glu Ile Ser Gln Phe Pro100 105 110Leu Asn Gln Asn Gly Ser Arg Pro Cys Asn Thr Trp Ser Gly Arg Pro115 120 125
Trp Arg Gln Ala Ile Ser Asn Pro Thr Pro Gly Gln Glu Ile Thr Gln130 135 140Tyr Ser Gln Leu Lys Arg Pro Met Glu Pro Gly Asp Ser Ser Thr Thr145 150 155 160Cys Gly Pro Leu Thr Leu165<210>93<211>36<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(36)<223>HTLV-1蛋白酶切割序列<220>
<221>misc_特征<222>(1)..(36)<223>n+ADO-a,g,c,或t+ADs-r+ADO-a或g+ADs-y+ADO-c或t<400>93tcn cgn ccn car gtn ctn ccn gtn atg cay ccn aay36Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Met Xaa Xaa Xaa1 5 10<210>94<211>12<212>PRT
<213>人工序列<400>94Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Met Xaa Xaa Xaa1 5 10<210>95<211>36<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(36)<223>HTLV-1蛋白酶切割序列<220>
<221>misc_特征<222>(1)..(36)<223>n+ADO-a,g,c,或t+ADs-r+ADO-a或g+ADs-y+ADO-c或t<400>95tcn aar acn aar gtn ctn gtn gtn car ccn aar aay 36Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa1 5 10<210>96<211>12<212>PRT<213>人工序列<400>96
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa1 5 10<210>97<211>768<212>DNA<213>人巨细胞病毒<220>
<221>CDS<222>(1)..(768)<223>包含于“UT80”中的HCMV次晶蛋白(蛋白酶)<300>
<308>GenBank/X17403,P167<309>1999-02-10<400>97atg acg atg gac gag cag cag tcg cag gct gtg gcg ccg gtc tac gtg48Met Thr Met Asp Glu Gln Gln ser Gln Ala Val Ala Pro Val Tyr Val1 5 10 15ggc ggc ttt ctc gcc cgc tac gac cag tct ccg gac gag gcc gaa ttg96Gly Gly Phe Leu Ala Arg Tyr Asp Gln Ser Pro Asp Glu Ala Glu Leu20 25 30ctg ttg ccg cgg gac gta gtg gag cac tgg ttg cac gcg cag ggc cag144Leu Leu Pro Arg Asp Val Val Glu His Trp Leu His Ala Gln Gly Gln35 40 45gga cag cct tcg ttg tcg gtc gcg ctc ccg ctc aac atc aac cac gac192Gly Gln Pro Ser Leu Ser Val Ala Leu Pro Leu Asn Ile Asn His Asp50 55 60gac acg gcc gtt gta gga cac gtt gcg gcg atg cag agc gtc cgc gac240Asp Thr Ala Val Val Gly His Val Ala Ala Met Gln Ser Val Arg Asp65 70 75 80
ggt ctt ttt tgc ctg ggc tgc gtc act tcg ccc agg ttt ctg gag att288Gly Leu Phe Cys Leu Gly Cys Val Thr Ser Pro Arg Phe Leu Glu Ile85 90 95gta cgc cgc gct tcg gaa aag tcc gag ctg gtt tcg cgc ggg ccc gtc336Val Arg Arg Ala Ser Glu Lys Ser Glu Leu Val Ser Arg Gly Pro Val100 105 110agt ccg ctg cag cca gac aag gtg gtg gag ttt ctc agc ggc agc tac384Ser Pro Leu Gln Pro Asp Lys Val Val Glu Phe Leu Ser Gly Ser Tyr115 120 125gcc ggc ctc tcg ctc tcc agc cgg cgc tgc gac gac gtg gag gcc gcg432Ala Gly Leu Ser Leu Ser Ser Arg Arg Cys Asp Asp Val Glu Ala Ala130 135 140acg tcg ctt tcg ggc tcg gaa acc acg ccg ttc aaa cac gtg gct ttg480Thr Ser Leu Ser Gly Ser Glu Thr Thr Pro Phe Lys His Val Ala Leu145 150 155 160tgc agc gtg ggt cgg cgt cgc ggt acg ttg gcc gtg tac ggg cgc gat528Cys Ser Val Gly Arg Arg Arg Gly Thr Leu Ala Val Tyr Gly Arg Asp165 170 175ccc gag tgg gtc aca cag cgg ttt cca gac ctc acg gcg gcc gac cgt576Pro Glu Trp Val Thr Gln Arg Phe Pro Asp Leu Thr Ala Ala Asp Arg180 185 190gac ggg cta cgt gca cag tgg cag cgc tgc ggc agc act gct gtc gac624Asp Gly Leu Arg Ala Gln Trp Gln Arg Cys Gly Ser Thr Ala Val Asp195 200 205gcg tcg ggc gat ccc ttt cgc tca gac agc tac ggc ctg ttg ggc aac672Ala Ser Gly Asp Pro Phe Arg Ser Asp Ser Tyr Gly Leu Leu Gly Asn210 215 220agc gtg gac gcg ctc tac atc cgt gag cga ctg ccc aag ctg cgc tac720Ser Val Asp Ala Leu Tyr Ile Arg Glu Arg Leu Pro Lys Leu Arg Tyr225 230 235 240
gac aag caa cta gtc ggc gtg acg gag cgc gag tca tac gtc aag gcg768Asp Lys Gln Leu Val Gly Val Thr Glu Arg Glu Ser Tyr Val Lys Ala245 250 255<210>98<211>256<212>PRT<213>人巨细胞病毒<400>98Met Thr Met Asp Glu Gln Gln Ser Gln Ala Val Ala Pro Val Tyr Val1 5 10 15Gly Gly Phe Leu Ala Arg Tyr Asp Gln Ser Pro Asp Glu Ala Glu Leu20 25 30Leu Leu Pro Arg Asp Val Val Glu His Trp Leu His Ala Gln Gly Gln35 40 45Gly Gln Pro Ser Leu Ser Val Ala Leu Pro Leu Asn Ile Asn His Asp50 55 60Asp Thr Ala Val Val Gly His Val Ala Ala Met Gln Ser Val Arg Asp65 70 75 80Gly Leu Phe Cys Leu Gly Cys Val Thr Ser Pro Arg Phe Leu Glu Ile85 90 95Val Arg Arg Ala Ser Glu Lys Ser Glu Leu Val Ser Arg Gly Pro Val100 105 110Ser Pro Leu Gln Pro Asp Lys Val Val Glu Phe Leu Ser Gly Ser Tyr115 120 125Ala Gly Leu Ser Leu Ser Ser Arg Arg Cys Asp Asp Val Glu Ala Ala130 135 140Thr Ser Leu Ser Gly Ser Glu Thr Thr Pro Phe Lys His Val Ala Leu145 150 155 160
Cys Ser Val Gly Arg Arg Arg Gly Thr Leu Ala Val Tyr Gly Arg Asp165 170 175Pro Glu Trp Val Thr Gln Arg Phe Pro Asp Leu Thr Ala Ala Asp Arg180 185 190Asp Gly Leu Arg Ala Gln Trp Gln Arg Cys Gly Ser Thr Ala Val Asp195 200 205Ala Ser Gly Asp Pro Phe Arg Ser Asp Ser Tyr Gly Leu Leu Gly Asn210 215 220Ser Val Asp Ala Leu Tyr Ile Arg Glu Arg Leu Pro Lys Leu Arg Tyr225 230 235 240Asp Lys Gln Leu Val Gly Val Thr Glu Arg Glu Ser Tyr Val Lys Ala245 250 255<210>99<211>15<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(15)<223>HCMV蛋白酶切割序列<400>99gtg gtg aac gcc agt 15Val Val Asn Ala Ser
1 5<210>100<211>5<212>PRT<213>人工序列<400>100Val Val Asn Ala Ser1 5<210>101<211>15<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(15)<223>HCMV蛋白酶切割序列<400>101tac gtc aag gcg agc 15Tyr Val Lys Ala Ser1 5<210>102<211>5<212>PRT<213>人工序列<400>102
Tyr Val Lys Ala Ser1 5<210>103<211>1506<212>DNA<213>人类<220>
<221>基因<222>(1)..(1506)<223>APP β-分泌酶基因<220>
<221>CDS<222>(1)..(1503)<223>APP β-分泌酶<300>
<308>GenBank/AF201468<309>1999-12-19<400>103atg gcc caa gcc ctg ccc tgg ctc ctg ctg tgg atg ggc gcg gga gtg48Met Ala Gln Ala Leu Pro Trp Leu Leu Leu Trp Met Gly Ala Gly Val1 5 10 15ctg cct gcc cac ggc acc cag cac ggc atc cgg ctg ccc ctg cgc agc96Leu Pro Ala His Gly Thr Gln His Gly Ile Arg Leu Pro Leu Arg Ser20 25 30ggc ctg ggg ggc gcc ccc ctg ggg ctg cgg ctg ccc cgg gag acc gac144Gly Leu Gly Gly Ala Pro Leu Gly Leu Arg Leu Pro Arg Glu Thr Asp35 40 45gaa gag ccc gag gag ccc ggc cgg agg ggc agc ttt gtg gag atg gtg192Glu Glu Pro Glu Glu Pro Gly Arg Arg Gly Ser Phe Val Glu Met Val
50 55 60gac aac ctg agg ggc aag tcg ggg cag ggc tac tac gtg gag atg acc240Asp Asn Leu Arg Gly Lys Ser Gly Gln Gly Tyr Tyr Val Glu Met Thr65 70 75 80gtg ggc agc ccc ccg cag acg ctc aac atc ctg gtg gat aca ggc agc288Val Gly Ser Pro Pro Gln Thr Leu Asn Ile Leu Val Asp Thr Gly Ser85 90 95agt aac ttt gca gtg ggt gct gcc ccc cac ccc ttc ctg cat cgc tac336Ser Asn Phe Ala Val Gly Ala Ala Pro His Pro Phe Leu His Arg Tyr100 105 110tac cag agg cag ctg tcc agc aca tac cgg gac ctc cgg aag ggt gtg384Tyr Gln Arg Gln Leu Ser Ser Thr Tyr Arg Asp Leu Arg Lys Gly Val115 120 125tat gtg ccc tac acc cag ggc aag tgg gaa ggg gag ctg ggc acc gac432Tyr Val Pro Tyr Thr Gln Gly Lys Trp Glu Gly Glu Leu Gly Thr Asp130 135 140ctg gta agc atc ccc cat ggc ccc aac gtc act gtg cgt gcc aac att480Leu Val Ser Ile Pro His Gly Pro Asn Val Thr Val Arg Ala Asn Ile145 150 155 160gct gcc atc act gaa tca gac aag ttc ttc atc aac ggc tcc aac tgg528Ala Ala Ile Thr Glu Ser Asp Lys Phe Phe Ile Asn Gly Ser Asn Trp165 170 175gaa ggc atc ctg ggg ctg gcc tat gct gag att gcc agg cct gac gac576Glu Gly Ile Leu Gly Leu Ala Tyr Ala Glu Ile Ala Arg Pro Asp Asp180 185 190tcc ctg gag cct ttc ttt gac tct ctg gta aag cag acc cac gtt ccc624Ser Leu Glu Pro Phe Phe Asp Ser Leu Val Lys Gln Thr His Val Pro195 200 205aac ctc ttc tcc ctg cag ctt tgt ggt gct ggc ttc ccc ctc aac cag672Asn Leu Phe Ser Leu Gln Leu Cys Gly Ala Gly Phe Pro Leu Asn Gln
210 215 220tct gaa gtg ctg gcc tct gtc gga ggg agc atg atc att gga ggt atc720Ser Glu Val Leu Ala Ser Val Gly Gly Ser Met Ile Ile Gly Gly Ile225 230 235 240gac cac tcg ctg tac aca ggc agt ctc tgg tat aca ccc atc cgg cgg768Asp His Ser Leu Tyr Thr Gly Ser Leu Trp Tyr Thr Pro Ile Arg Arg245 250 255gag tgg tat tat gag gtc atc att gtg cgg gtg gag atc aat gga cag816Glu Trp Tyr Tyr Glu Val Ile Ile Val Arg Val Glu Ile Asn Gly Gln260 265 270gat ctg aaa atg gac tgc aag gag tac aac tat gac aag agc att gtg864Asp Leu Lys Met Asp Cys Lys Glu Tyr Asn Tyr Asp Lys Ser Ile Val275 280 285gac agt ggc acc acc aac ctt cgt ttg ccc aag aaa gtg ttt gaa gct912Asp Ser Gly Thr Thr Asn Leu Arg Leu Pro Lys Lys Val Phe Glu Ala290 295 300gca gtc aaa tcc atc aag gca gcc tcc tcc acg gag aag ttc cct gat960Ala Val Lys Ser Ile Lys Ala Ala Ser Ser Thr Glu Lys Phe Pro Asp305 310 315 320ggt ttc tgg cta gga gag cag ctg gtg tgc tgg caa gca ggc acc acc1008Gly Phe Trp Leu Gly Glu Gln Leu Val CYs Trp Gln Ala Gly Thr Thr325 330 335cct tgg aac att ttc cca gtc atc tca ctc tac cta atg ggt gag gtt1056Pro Trp Asn Ile Phe Pro Val Ile Ser Leu Tyr Leu Met Gly Glu Val340 345 350acc aac cag tcc ttc cgc atc acc atc ctt ccg cag caa tac ctg cgg1104Thr Asn Gln Ser Phe Arg Ile Thr Ile Leu Pro Gln Gln Tyr Leu Arg355 360 365cca gtg gaa gat gtg gcc acg tcc caa gac gac tgt tac aag ttt gcc1152Pro Val Glu Asp Val Ala Thr Ser Gln Asp Asp Cys Tyr Lys Phe Ala
370 375 380atc tca cag tca tcc acg ggc act gtt atg gga gct gtt atc atg gag1200Ile Ser Gln Ser Ser Thr Gly Thr Val Met Gly Ala Val Ile Met Glu385 390 395 400ggc ttc tac gtt gtc ttt gat cgg gcc cga aaa cga att ggc ttt gct1248Gly Phe Tyr Val Val Phe Asp Arg Ala Arg Lys Arg Ile Gly Phe Ala405 410 415gtc agc gct tgc cat gtg cac gat gag ttc agg acg gca gcg gtg gaa1296Val Ser Ala Cys His Val His Asp Glu Phe Arg Thr Ala Ala Val Glu420 425 430ggc cct ttt gtc acc ttg gac atg gaa gac tgt ggc tac aac att cca1344Gly Pro Phe Val Thr Leu Asp Met Glu Asp Cys Gly Tyr Asn Ile Pro435 440 445cag aca gat gag tca acc ctc atg acc ata gcc tat gtc atg gct gcc1392Gln Thr Asp Glu Ser Thr Leu Met Thr Ile Ala Tyr Val Met Ala Ala450 455 460atc tgc gcc ctc ttc atg ctg cca ctc tgc ctc atg gtg tgt cag tgg1440Ile Cys Ala Leu Phe Met Leu Pro Leu Cys Leu Met Val Cys Gln Trp465 470 475 480cgc tgc ctc cgc tgc ctg cgc cag cag cat gat gac ttt gct gat gac1488Arg Cys Leu Arg Cys Leu Arg Gln Gln His Asp Asp Phe Ala Asp Asp485 490 495atc tcc ctg ctg aagtga 1506Ile Ser Leu Leu Lys500<210>104<211>501<212>PRT<213>人类
<400>104Met Ala Gln Ala Leu Pro Trp Leu Leu Leu Trp Met Gly Ala Gly Val1 5 10 15Leu Pro Ala His Gly Thr Gln His Gly Ile Arg Leu Pro Leu Arg Ser20 25 30Gly Leu Gly Gly Ala Pro Leu Gly Leu Arg Leu Pro Arg Glu Thr Asp35 40 45Glu Glu Pro Glu Glu Pro Gly Arg Arg Gly Ser Phe Val Glu Met Val50 55 60Asp Asn Leu Arg Gly Lys Ser Gly Gln Gly Tyr Tyr Val Glu Met Thr65 70 75 80Val Gly Ser Pro Pro Gln Thr Leu Asn Ile Leu Val Asp Thr Gly Ser85 90 95Ser Asn Phe Ala Val Gly Ala Ala Pro His Pro Phe Leu His Arg Tyr100 105 110Tyr Gln Arg Gln Leu Ser Ser Thr Tyr Arg Asp Leu Arg Lys Gly Val115 120 125Tyr Val Pro Tyr Thr Gln Gly Lys Trp Glu Gly Glu Leu Gly Thr Asp130 135 140Leu Val Ser Ile Pro His Gly Pro Asn Val Thr Val Arg Ala Asn Ile145 150 155 160Ala Ala Ile Thr Glu Ser Asp Lys Phe Phe Ile Asn Gly Ser Asn Trp165 170 175Glu Gly Ile Leu Gly Leu Ala Tyr Ala Glu Ile Ala Arg Pro Asp Asp180 185 190Ser Leu Glu Pro Phe Phe Asp Ser Leu Val Lys Gln Thr His Val Pro195 200 205
Asn Leu Phe Ser Leu Gln Leu Cys Gly Ala Gly Phe Pro Leu Asn Gln210 215 220Ser Glu Val Leu Ala Ser Val Gly Gly Ser Met Ile Ile Gly Gly Ile225 230 235 240Asp His Ser Leu Tyr Thr Gly Ser Leu Trp Tyr Thr Pro Ile Arg Arg245 250 255Glu Trp Tyr Tyr Glu Val Ile Ile Val Arg Val Glu Ile Asn Gly Gln260 265 270Asp Leu Lys Met Asp Cys Lys Glu Tyr Asn Tyr Asp Lys Ser Ile Val275 280 285Asp Ser Gly Thr Thr Asn Leu Arg Leu Pro Lys Lys Val Phe Glu Ala290 295 300Ala Val Lys Ser Ile Lys Ala Ala Ser Ser Thr Glu Lys Phe Pro Asp305 310 315 320Gly Phe Trp Leu Gly Glu Gln Leu Val Cys Trp Gln Ala Gly Thr Thr325 330 335Pro Trp Asn Ile Phe Pro Val Ile Ser Leu Tyr Leu Met Gly Glu Val340 345 350Thr Asn Gln Ser Phe Arg Ile Thr Ile Leu Pro Gln Gln Tyr Leu Arg355 360 365Pro Val Glu Asp Val Ala Thr Ser Gln Asp Asp Cys Tyr Lys Phe Ala370 375 380Ile Ser Gln Ser Ser Thr Gly Thr Val Met Gly Ala Val Ile Met Glu385 390 395 400Gly Phe Tyr Val Val Phe Asp Arg Ala Arg Lys Arg Ile Gly Phe Ala405 410 415Val Ser Ala Cys His Val His Asp Glu Phe Arg Thr Ala Ala Val Glu
420 425 430Gly Pro Phe Val Thr Leu Asp Met Glu Asp Cys Gly Tyr Asn Ile Pro435 440 445Gln Thr Asp Glu Ser Thr Leu Met Thr Ile Ala Tyr Val Met Ala Ala450 455 460Ile Cys Ala Leu Phe Met Leu Pro Leu Cys Leu Met Val Cys Gln Trp465 470 475 480Arg Cys Leu Arg Cys Leu Arg Gln Gln His Asp Asp Phe Ala Asp Asp485 490 495Ile Ser Leu Leu Lys500<210>105<211>18<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(18)<223>APPβ-分泌酶切割序列<400>105gaa gta aag atg gat gca 18Glu Val Lys Met Asp Ala1 5<210>106
<211>6<212>PRT<213>人工序列<400>106Glu Val Lys Met Asp Ala1 5<210>107<211>834<212>DNA<213>人类<220>
<221>基因<222>(1)..(834)<223>天冬氨酸特异性半胱氨酸蛋白酶3的基因<220>
<221>CDS<222>(1)..(831)<223>天冬氨酸特异性半胱氨酸蛋白酶3前原蛋白<220>
<221>misc_特征<222>(1)..(834)<223>CDS天冬氨酸特异性半胱氨酸蛋白酶3,信号肽(1..84)+ADs-CDS天冬酸特异性半胱氨酸蛋白酶3,大亚基(85..525)+ADs-CDS天冬氨酸特异性半胱氨酸蛋白酶3,小亚基(526..831)<300>
<308>GenBank/NM_004346<309>2001-07-13<400>107atg gag aac act gaa aac tca gtg gat tca aaa tcc att aaa aat ttg48Met Glu Asn Thr Glu Asn Ser Val Asp Ser Lys Ser Ile Lys Asn Leu
1 5 10 15gaa cca aag atc ata cat gga agc gaa tca atg gac tct gga ata tcc96Glu Pro Lys Ile Ile His Gly Ser Glu Ser Met Asp Ser Gly Ile Ser20 25 30ctg gac aac agt tat aaa atg gat tat cct gag atg ggt tta tgt ata144Leu Asp Asn Ser Tyr Lys Met Asp Tyr Pro Glu Met Gly Leu Cys Ile35 40 45ata att aat aat aag aat ttt cat aaa agc act gga atg aca tct cgg192Ile Ile Asn Asn Lys Asn Phe His Lys Ser Thr Gly Met Thr Ser Arg50 55 60tct ggt aca gat gtc gat gca gca aac ctc agg gaa aca ttc aga aac240Ser Gly Thr Asp Val Asp Ala Ala Asn Leu Arg Glu Thr Phe Arg Asn65 70 75 80ttg aaa tat gaa gtc agg aat aaa aat gat ctt aca cgt gaa gaa att288Leu Lys Tyr Glu Val Arg Asn Lys Asn Asp Leu Thr Arg Glu Glu Ile85 90 95gtg gaa ttg atg cgt gat gtt tct aaa gaa gat cac agc aaa agg agc336Val Glu Leu Met Arg Asp Val Ser Lys Glu Asp His Ser Lys Arg Ser100 105 110agt ttt gtt tgt gtg ctt ctg agc cat ggt gaa gaa gga ata att ttt384Ser Phe Val Cys Val Leu Leu Ser His Gly Glu Glu Gly Ile Ile Phe115 120 125gga aca aat gga cct gtt gac ctg aaa aaa ata aca aac ttt ttc aga432Gly Thr Asn Gly Pro Val Asp Leu Lys Lys Ile Thr Asn Phe Phe Arg130 135 140ggg gat cgt tgt aga agt cta act gga aaa ccc aaa ctt ttc att att480Gly Asp Arg Cys Arg Ser Leu Thr Gly Lys Pro Lys Leu Phe Ile Ile145 150 155 160cag gcc tgc cgt ggt aca gaa ctg gac tgt ggc att gag aca gac agt528Gln Ala Cys Arg Gly Thr Glu Leu Asp Cys Gly Ile Glu Thr Asp Ser
165 170 175ggt gtt gat gat gac atg gcg tgt cat aaa ata cca gtg gag gcc gac576Gly Val Asp Asp Asp Met Ala Cys His Lys Ile Pro Val Glu Ala Asp180 185 190ttc ttg tat gca tac tcc aca gca cct ggt tat tat tct tgg cga aat624Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly Tyr Tyr Ser Trp Arg Asn195 200 205tca aag gat ggc tcc tgg ttc atc cag tcg ctt tgt gcc atg ctg aaa672Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser Leu Cys Ala Met Leu Lys210 215 220cag tat gcc gac aag ctt gaa ttt atg cac att ctt acc cgg gtt aac720Gln Tyr Ala Asp Lys Leu Glu Phe Met His Ile Leu Thr Arg Val Asn225 230 235 240cga aag gtg gca aca gaa ttt gag tcc ttt tcc ttt gac gct act ttt768Arg Lys Val Ala Thr Glu Phe Glu Ser Phe Ser Phe Asp Ala Thr Phe245 250 255cat gca aag aaa cag att cca tgt att gtt tcc atg ctc aca aaa gaa816His Ala Lys Lys Gln Ile Pro Cys Ile Val Ser Met Leu Thr Lys Glu260 265 270ctc tat ttt tat cactaa 834Leu Tyr Phe Tyr His275<210>108<211>277<212>PRT<213>人类<400>108Met Glu Asn Thr Glu Asn Ser Val Asp Ser Lys Ser Ile Lys Asn Leu1 5 10 15
Glu Pro Lys Ile Ile His Gly Ser Glu Ser Met Asp Ser Gly Ile Ser20 25 30Leu Asp Asn Ser Tyr Lys Met Asp Tyr Pro Glu Met Gly Leu Cys Ile35 40 45Ile Ile Asn Asn Lys Asn Phe His Lys Ser Thr Gly Met Thr Ser Arg50 55 60Ser Gly Thr Asp Val Asp Ala Ala Asn Leu Arg Glu Thr Phe Arg Asn65 70 75 80Leu Lys Tyr Glu Val Arg Asn Lys Asn Asp Leu Thr Arg Glu Glu Ile85 90 95Val Glu Leu Met Arg Asp Val Ser Lys Glu Asp His Ser Lys Arg Ser100 105 110Ser Phe Val Cys Val Leu Leu Ser His Gly Glu Glu Gly Ile Ile Phe115 120 125Gly Thr Asn Gly Pro Val Asp Leu Lys Lys Ile Thr Asn Phe Phe Arg130 135 140Gly Asp Arg Cys Arg Ser Leu Thr Gly Lys Pro Lys Leu Phe Ile Ile145 150 155 160Gln Ala Cys Arg Gly Thr Glu Leu Asp Cys Gly Ile Glu Thr Asp Ser165 170 175Gly Val Asp Asp Asp Met Ala Cys His Lys Ile Pro Val Glu Ala Asp180 185 190Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly Tyr Tyr Ser Trp Arg Asn195 200 205Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser Leu Cys Ala Met Leu Lys210 215 220Gln Tyr Ala Asp Lys Leu Glu Phe Met His Ile Leu Thr Arg Val Asn
225 230 235 240Arg Lys Val Ala Thr Glu Phe Glu Ser Phe Ser Phe Asp Ala Thr Phe245 250 255His Ala Lys Lys Gln Ile Pro Cys Ile Val Ser Met Leu Thr Lys Glu260 265 270Leu Tyr Phe Tyr His275<210>109<211>441<212>DNA<213>人类<220>
<221>CDS<222>(1)..(441)<223>天冬氨酸特异性半胱氨酸蛋白酶3,大亚基<300>
<308>GenBank/XM_054686<309>2002-05-13<400>109tct gga ata tcc ctg gac aac agt tat aaa atg gat tat cct gag atg48Ser Gly Ile Ser Leu Asp Asn Ser Tyr Lys Met Asp Tyr Pro Glu Met1 5 10 15ggt tta tgt ata ata att aat aat aag aat ttt cat aaa agc act gga96Gly Leu Cys Ile Ile Ile Asn Asn Lys Asn Phe His Lys Ser Thr Gly20 25 30atg aca tct cgg tct ggt aca gat gtc gat gca gca aac ctc agg gaa144Met Thr Ser Arg Ser Gly Thr Asp Val Asp Ala Ala Asn Leu Arg Glu35 40 45
aca ttc aga aac ttg aaa tat gaa gtc agg aat aaa aat gat ctt aca192Thr Phe Arg Asn Leu Lys Tyr Glu Val Arg Asn Lys Asn Asp Leu Thr50 55 60cgt gaa gaa att gtg gaa ttg atg cgt gat gtt tct aaa gaa gat cac240Arg Glu Glu Ile Val Glu Leu Met Arg Asp Val Ser Lys Glu Asp His65 70 75 80agc aaa agg agc agt ttt gtt tgt gtg ctt ctg agc cat ggt gaa gaa288Ser Lys Arg Ser Ser Phe Val Cys Val Leu Leu Ser His Gly Glu Glu85 90 95gga ata att ttt gga aca aat gga cct gtt gac ctg aaa aaa ata aca336Gly Ile Ile Phe Gly Thr Asn Gly Pro Val Asp Leu Lys Lys Ile Thr100 105 110aac ttt ttc aga ggg gat cgt tgt aga agt cta act gga aaa ccc aaa384Asn Phe Phe Arg Gly Asp Arg Cys Arg Ser Leu Thr Gly Lys Pro Lys115 120 125ctt ttc att att cag gcc tgc cgt ggt aca gaa ctg gac tgt ggc att432Leu Phe Ile Ile Gln Ala Cys Arg Gly Thr Glu Leu Asp Cys Gly Ile130 135 140gag aca gac441Glu Thr Asp145<210>110<211>147<212>PRT<213>人类<400>110Ser Gly Ile Ser Leu Asp Asn Ser Tyr Lys Met Asp Tyr Pro Glu Met1 5 10 15Gly Leu Cys Ile Ile Ile Asn Asn Lys Asn Phe His Lys Ser Thr Gly20 25 30
Met Thr Ser Arg Ser Gly Thr Asp Val Asp Ala Ala Asn Leu Arg Glu35 40 45Thr Phe Arg Asn Leu Lys Tyr Glu Val Arg Asn Lys Asn Asp Leu Thr50 55 60Arg Glu Glu Ile Val Glu Leu Met Arg Asp Val Ser Lys Glu Asp His65 70 75 80Ser Lys Arg Ser Ser Phe Val Cys Val Leu Leu Ser His Gly Glu Glu85 90 95Gly Ile Ile Phe Gly Thr Asn Gly Pro Val Asp Leu Lys Lys Ile Thr100 105 110Asn Phe Phe Arg Gly Asp Arg Cys Arg Ser Leu Thr Gly Lys Pro Lys115 120 125Leu Phe Ile Ile Gln Ala Cys Arg Gly Thr Glu Leu Asp Cys Gly Ile130 135 140Glu Thr Asp145<210>111<211>306<212>DNA<213>人类<220>
<221>CDS<222>(1)..(306)<223>天冬氨酸特异性半胱氨酸蛋白酶3,小亚基<300>
<308>GenBank/XM_054686<309>2002-05-13
<400>111agt ggt gtt gat gat gac atg gcg tgt cat aaa ata cca gtg gag gcc48Ser Gly Val Asp Asp Asp Met Ala Cys His Lys Ile Pro Val Glu Ala1 5 10 15gac ttc ttg tat gca tac tcc aca gca cct ggt tat tat tct tgg cga96Asp Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly Tyr Tyr Ser Trp Arg20 25 30aat tca aag gat ggc tcc tgg ttc atc cag tcg ctt tgt gcc atg ctg144Asn Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser Leu Cys Ala Met Leu35 40 45aaa cag tat gcc gac aag ctt gaa ttt atg cac att ctt acc cgg gtt192Lys Gln Tyr Ala Asp Lys Leu Glu Phe Met His Ile Leu Thr Arg Val50 55 60aac cga aag gtg gca aca gaa ttt gag tcc ttt tcc ttt gac gct act240Asn Arg Lys Val Ala Thr Glu Phe Glu Ser Phe Ser Phe Asp Ala Thr65 70 75 80ttt cat gca aag aaa cag att cca tgt att gtt tcc atg ctc aca aaa288Phe His Ala Lys Lys Gln Ile Pro Cys Ile Val Ser Met Leu Thr Lys85 90 95gaa ctc tat ttt tat cac 306Glu Leu Tyr Phe Tyr His100<210>112<211>102<212>PRT<213>人类<400>112Ser Gly Val Asp Asp Asp Met Ala Cys His Lys Ile Pro Val Glu Ala1 5 10 15
Asp Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly Tyr Tyr Ser Trp Arg20 25 30Asn Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser Leu Cys Ala Met Leu35 40 45Lys Gln Tyr Ala Asp Lys Leu Glu Phe Met His Ile Leu Thr Arg Val50 55 60Asn Arg Lys Val Ala Thr Glu Phe Glu Ser Phe Ser Phe Asp Ala Thr65 70 75 80Phe His Ala Lys Lys Gln Ile Pro Cys Ile Val Ser Met Leu Thr Lys85 90 95Glu Leu Tyr Phe Tyr His100<210>113<211>12<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(12)<223>天冬氨酸特异性半胱氨酸蛋白酶3蛋白酶切割序列<220>
<221>misc_特征<222>(1)..(12)<223>r+ADO-a或g+ADs-y+ADO-c或t
<400>113gar agy atg gay12Xaa Xaa Met Xaa1<210>114<211>4<212>PRT<213>人工序列<400>114Xaa Xaa Met Xaa1<210>115<211>1869<212>DNA<213>人类<220>
<221>基因<222>(1)..(1869)<223>人凝血因子II(凝血酶)的基因<220>
<221>CDS<222>(1)..(1866)<223>凝血因子II前体<220>
<221>misc_特征<222>(1)..(1869)<223>CDS凝血因子II信号肽(1..129)+ADs-CDS凝血因子II(130..1866)
<300>
<308>GenBank/NM_00050<309>2000-10-31<400>115atg gcg cac gtc cga ggc ttg cag ctg cct ggc tgc ctg gcc ctg gct48Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Alal 5 10 15gcc ctg tgt agc ctt gtg cac agc cag cat gtg ttc ctg gct cct cag96Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln20 25 30caa gca cgg tcg ctg ctc cag cgg gtc cgg cga gcc aac acc ttc ttg144Gln Ala Arg Ser Leu Leu Gln Arg Val Arg Arg Ala Asn Thr Phe Leu35 40 45gag gag gtg cgc aag ggc aac cta gag cga gag tgc gtg gag gag acg192Glu Glu Val Arg Lys Gly Asn Leu Glu Arg Glu Cys Val Glu Glu Thr50 55 60tgc agc tac gag gag gcc ttc gag gct ctg gag tcc tcc acg gct acg240Cys Ser Tyr Glu Glu Ala Phe Glu Ala Leu Glu Ser Ser Thr Ala Thr65 70 75 80gat gtg ttc tgg gcc aag tac aca gct tgt gag aca gcg agg acg cct288Asp Val Phe Trp Ala Lys Tyr Thr Ala Cys Glu Thr Ala Arg Thr Pro85 90 95cga gat aag ctt gct gca tgt ctg gaa ggt aac tgt gct gag ggt ctg336Arg Asp Lys Leu Ala Ala Cys Leu Glu Gly Asn Cys Ala Glu Gly Leu100 105 110ggt acg aac tac cga ggg cat gtg aac atc acc cgg tca ggc att gag384Gly Thr Asn Tyr Arg Gly His Val Asn Ile Thr Arg Ser Gly Ile Glu115 120 125tgc cag cta tgg agg agt cgc tac cca cat aag cct gaa atc aac tcc432Cys Gln Leu Trp Arg Ser Arg Tyr Pro His Lys Pro Glu Ile Asn Ser130 135 140
act acc cat cct ggg gcc gac cta cag gag aat ttc tgc cgc aac ccc480Thr Thr His Pro Gly Ala Asp Leu Gln Glu Asn Phe Cys Arg Asn Pro145 150 155 160gac agc agc acc acg gga ccc tgg tgc tac act aca gac ccc acc gtg528Asp Ser Ser Thr Thr Gly Pro Trp Cys Tyr Thr Thr Asp Pro Thr Val165 170 175agg agg cag gaa tgc agc atc cct gtc tgt ggc cag gat caa gtc act576Arg Arg Gln Glu Cys Ser Ile Pro Val Cys Gly Gln Asp Gln Val Thr180 185 190gta gcg atg act cca cgc tcc gaa ggc tcc agt gtg aat ctg tca cct624Val Ala Met Thr Pro Arg Ser Glu Gly Ser Ser Val Asn Leu Ser Pro195 200 205cca ttg gag cag tgt gtc cct gat cgg ggg cag cag tac cag ggg cgc672Pro Leu Glu Gln Cys Val Pro Asp Arg Gly Gln Gln Tyr Gln Gly Arg210 215 220ctg gcg gtg acc aca cat ggg ctc ccc tgc ctg gcc tgg gcc agc gca720Leu Ala Val Thr Thr His Gly Leu Pro Cys Leu Ala Trp Ala Ser Ala225 230 235 240cag gcc aag gcc ctg agc aag cac cag gac ttc aac tca gct gtg cag768Gln Ala Lys Ala Leu Ser Lys His Gln Asp Phe Asn Ser Ala Val Gln245 250 255ctg gtg gag aac ttc tgc cgc aac cca gac ggg gat gag gag ggc gtg816Leu Val Glu Asn Phe Cys Arg Asn Pro Asp Gly Asp Glu Glu Gly Val260 265 270tgg tgc tat gtg gcc ggg aag cct ggc gac ttt ggg tac tgc gac ctc864Trp Cys Tyr Val Ala Gly Lys Pro Gly Asp Phe Gly Tyr Cys Asp Leu275 280 285aac tat tgt gag gag gcc gtg gag gag gag aca gga gat ggg ctg gat912Asn Tyr Cys Glu Glu Ala Val Glu Glu Glu Thr Gly Asp Gly Leu Asp290 295 300
gag gac tca gac agg gcc atc gaa ggg cgt acc gcc acc agt gag tac960Glu Asp Ser Asp Arg Ala Ile Glu Gly Arg Thr Ala Thr Ser Glu Tyr305 310 315 320cag act ttc ttc aat ccg agg acc ttt ggc tcg gga gag gca gac tgt1008Gln Thr Phe Phe Asn Pro Arg Thr Phe Gly Ser Gly Glu Ala Asp Cys325 330 335ggg ctg cga cct ctg ttc gag aag aag tcg ctg gag gac aaa acc gaa1056Gly Leu Arg Pro Leu Phe Glu Lys Lys Ser Leu Glu Asp Lys Thr Glu340 345 350aga gag ctc ctg gaa tcc tac atc gac ggg cgc att gtg gag ggc tcg1104Arg Glu Leu Leu Glu Ser Tyr Ile Asp Gly Arg Ile Val Glu Gly Ser355 360 365gat gca gag atc ggc atg tca cct tgg cag gtg atg ctt ttc cgg aag1152Asp Ala Glu Ile Gly Met Ser Pro Trp Gln Val Met Leu Phe Arg Lys370 375 380agt ccc cag gag ctg ctg tgt ggg gcc agc ctc atc agt gac cgc tgg1200Ser Pro Gln Glu Leu Leu Cys Gly Ala Ser Leu Ile Ser Asp Arg Trp385 390 395 400gtc ctc acc gcc gcc cac tgc ctc ctg tac ccg ccc tgg gac aag aac1248Val Leu Thr Ala Ala His Cys Leu Leu Tyr Pro Pro Trp Asp Lys Asn405 410 415ttc acc gag aat gac ctt ctg gtg cgc att ggc aag cac tcc cgc aca1296Phe Thr Glu Asn Asp Leu Leu Val Arg Ile Gly Lys His Ser Arg Thr420 425 430agg tac gag cga aac att gaa aag ata tcc atg ttg gaa aag atc tac1344Arg Tyr Glu Arg Asn Ile Glu Lys Ile Ser Met Leu Glu Lys Ile Tyr435 440 445atc cac ccc agg tac aac tgg cgg gag aac ctg gac cgg gac att gcc1392Ile His Pro Arg Tyr Asn Trp Arg Glu Asn Leu Asp Arg Asp Ile Ala450 455 460
ctg atg aag ctg aag aag cct gtt gcc ttc agt gac tac att cac cct1440Leu Met Lys Leu Lys Lys Pro Val Ala Phe Ser Asp Tyr Ile His Pro465 470 475 480gtg tgt ctg ccc gac agg gag acg gca gcc agc ttg ctc cag gct gga1488Val Cys Leu Pro Asp Arg Glu Thr Ala Ala Ser Leu Leu Gln Ala Gly485 490 495tac aag ggg cgg gtg aca ggc tgg ggc aac ctg aag gag acg tgg aca1536Tyr Lys Gly Arg Val Thr Gly Trp Gly Asn Leu Lys Glu Thr Trp Thr500 505 510gcc aac gtt ggt aag ggg cag ccc agt gtc ctg cag gtg gtg aac ctg1584Ala Asn Val Gly Lys Gly Gln Pro Ser Val Leu Gln Val Val Asn Leu515 520 525ccc att gtg gag cgg ccg gtc tgc aag gac tcc acc cgg atc cgc atc1632Pro Ile Val Glu Arg Pro Val Cys Lys Asp Ser Thr Arg Ile Arg Ile530 535 540act gac aac atg ttc tgt gct ggt tac aag cct gat gaa ggg aaa cga1680Thr Asp Asn Met Phe Cys Ala Gly Tyr Lys Pro Asp Glu Gly Lys Arg545 550 555 560ggg gat gcc tgt gaa ggt gac agt ggg gga ccc ttt gtc atg aag agc1728Gly Asp Ala Cys Glu Gly Asp Ser Gly Gly Pro Phe Val Met Lys Ser565 570 575ccc ttt aac aac cgc tgg tat caa atg ggc atc gtc tca tgg ggt gaa1776Pro Phe Asn Asn Arg Trp Tyr Gln Met Gly Ile Val Ser Trp Gly Glu580 585 590ggc tgt gac cgg gat ggg aaa tat ggc ttc tac aca cat gtg ttc cgc1824Gly Cys Asp Arg Asp Gly Lys Tyr Gly Phe Tyr Thr His Val Phe Arg595 600 605ctg aag aag tgg ata cag aag gtc att gat cag ttt gga gagtag 1869Leu Lys Lys Trp Ile Gln Lys Val Ile Asp Gln Phe Gly Glu610 615 620
<210>116<21l>622<212>PRT<213>人类<400>116Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala1 5 10 15Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln20 25 30Gln Ala Arg Ser Leu Leu Gln Arg Val Arg Arg Ala Asn Thr Phe Leu35 40 45Glu Glu Val Arg Lys Gly Asn Leu Glu Arg Glu Cys Val Glu Glu Thr50 55 60Cys Ser Tyr Glu Glu Ala Phe Glu Ala Leu Glu Ser Ser Thr Ala Thr65 70 75 80Asp Val Phe Trp Ala Lys Tyr Thr Ala Cys Glu Thr Ala Arg Thr Pro85 90 95Arg Asp Lys Leu Ala Ala Cys Leu Glu Gly Asn Cys Ala Glu Gly Leu100 105 110Gly Thr Asn Tyr Arg Gly His Val Asn Ile Thr Arg Ser Gly Ile Glu115 120 125Cys Gln Leu Trp Arg Ser Arg Tyr Pro His Lys Pro Glu Ile Asn Ser130 135 140Thr Thr His Pro Gly Ala Asp Leu Gln Glu Asr Phe Cys Arg Asn Pro145 150 155 160Asp Ser Ser Thr Thr Gly Pro Trp Cys Tyr Thr Thr Asp Pro Thr Val165 170 175
Arg Arg Gln Glu Cys Ser Ile Pro Val Cys Gly Gln Asp Gln Val Thr180 185 190Val Ala Met Thr Pro Arg Ser Glu Gly Ser Ser Val Asn Leu Ser Pro195 200 205Pro Leu Glu Gln Cys Val Pro Asp Arg Gly Gln Gln Tyr Gln Gly Arg210 215 220Leu Ala Val Thr Thr His Gly Leu Pro Cys Leu Ala Trp Ala Ser Ala225 230 235 240Gln Ala Lys Ala Leu Ser Lys His Gln Asp Phe Asn Ser Ala Val Gln245 250 255Leu Val Glu Asn Phe Cys Arg Asn Pro Asp Gly Asp Glu Glu Gly Val260 265 270Trp Cys Tyr Val Ala Gly Lys Pro Gly Asp Phe Gly Tyr Cys Asp Leu275 280 285Asn Tyr Cys Glu Glu Ala Val Glu Glu Glu Thr Gly Asp Gly Leu Asp290 295 300Glu Asp Ser Asp Arg Ala Ile Glu Gly Arg Thr Ala Thr Ser Glu Tyr305 310 315 320Gln Thr Phe Phe Asn Pro Arg Thr Phe Gly Ser Gly Glu Ala Asp Cys325 330 335Gly Leu Arg Pro Leu Phe Glu Lys Lys Ser Leu Glu Asp Lys Thr Glu340 345 350Arg Glu Leu Leu Glu Ser Tyr Ile Asp Gly Arg Ile Val Glu Gly Ser355 360 365Asp Ala Glu Ile Gly Met Ser Pro Trp Gln Val Met Leu Phe Arg Lys370 375 380
Ser Pro Gln Glu Leu Leu Cys Gly Ala Ser Leu Ile Ser Asp Arg Trp385 390 395 400Val Leu Thr Ala Ala His Cys Leu Leu Tyr Pro Pro Trp Asp Lys Asn405 410 415Phe Thr Glu Asn Asp Leu Leu Val Arg Ile Gly Lys His Ser Arg Thr420 425 430Arg Tyr Glu Arg Asn Ile Glu Lys Ile Ser Met Leu Glu Lys Ile Tyr435 440 445Ile His Pro Arg Tyr Asn Trp Arg Glu Asn Leu Asp Arg Asp Ile Ala450 455 460Leu Met Lys Leu Lys Lys Pro Val Ala Phe Ser Asp Tyr Ile His Pro465 470 475 480Val Cys Leu Pro Asp Arg Glu Thr Ala Ala Ser Leu Leu Gln Ala Gly485 490 495Tyr Lys Gly Arg Val Thr Gly Trp Gly Asn Leu Lys Glu Thr Trp Thr500 505 510Ala Asn Val Gly Lys Gly Gln Pro Ser Val Leu Gln Val Val Asn Leu515 520 525Pro Ile Val Glu Arg Pro Val Cys Lys Asp Ser Thr Arg Ile Arg Ile530 535 540Thr Asp Asn Met Phe Cys Ala Gly Tyr Lys Pro Asp Glu Gly Lys Arg545 550 555 560Gly Asp Ala Cys Glu Gly Asp Ser Gly Gly Pro Phe Val Met Lys Ser565 570 575Pro Phe Asn Asn Arg Trp Tyr Gln Met Gly Ile Val Ser Trp Gly Glu580 585 590Gly Cys Asp Arg Asp Gly Lys Tyr Gly Phe Tyr Thr His Val Phe Arg
595 600 605Leu Lys Lys Trp Ile Gln Lys Val Ile Asp Gln Phe Gly Glu610 615 620<210>117<211>21<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>CDS<222>(1)..(21)<223>血小板糖蛋白V凝血酶切割序列<400>117ccc ggg ccc cgg ggc ccg cct 21Pro Gly Pro Arg Gly Pro Pro1 5<210>118<211>7<212>PRT<213>人工序列<400>118Pro Gly Pro Arg Gly Pro Pro1 5<210>119
<211>1878<212>DNA<213>人类<220>
<221>基因<222>(1)..(1878)<223>人因子XI(血液凝固因子)的基因<220>
<221>CDS<222>(1)..(1875)<223>前原因子XI<220>
<221>misc_特征<222>(1)..(1878)<223>CDS因子XI信号肽(1..54)+ADs-CDS因子XI重链(55..1161)+ADs-CDS因子XI轻链(1162....1875)<300>
<308>GenBank/M13142<309>1994-11-08<400>119atg att ttc tta tat caa gtg gta cat ttc att tta ttt act tca gtt48Met Ile Phe Leu Tyr Gln Val Val His Phe Ile Leu Phe Thr Ser Val1 5 10 15tct ggt gaa tgt gtg act cag ttg ttg aag gac acc tgc ttt gaa gga96Ser Gly Glu Cys Val Thr Gln Leu Leu Lys Asp Thr Cys Phe Glu Gly20 25 30ggg gac att act acg gtc ttc aca cca agc gcc aag tac tgc cag gta144Gly Asp Ile Thr Thr Val Phe Thr Pro Ser Ala Lys Tyr Cys Gln Val35 40 45
gtc tgc act tac cac cca aga tgt tta ctc ttc act ttc acg gcg gaa192Val Cys Thr Tyr His Pro Arg Cys Leu Leu Phe Thr Phe Thr Ala Glu50 55 60tca cca tct gag gat ccc acc cga tgg ttt act tgt gtc ctg aaa gac240Ser Pro Ser Glu Asp Pro Thr Arg Trp Phe Thr Cys Val Leu Lys Asp65 70 75 80agt gtt aca gaa aca ctg cca aga gtg aat agg aca gca gcg att tct288Ser Val Thr Glu Thr Leu Pro Arg Val Asn Arg Thr Ala Ala Ile Ser85 90 95ggg tat tct ttc aag caa tgc tca cac caa ata agc gct tgc aac aaa336Gly Tyr Ser Phe Lys Gln Cys Ser His Gln Ile Ser Ala Cys Asn Lys100 105 110gac att tat gtg gac cta gac atg aag ggc ata aac tat aac agc tca384Asp Ile Tyr Val Asp Leu Asp Met Lys Gly Ile Asn Tyr Asn Ser Ser115 120 125gtt gcc aag agt gct caa gaa tgc caa gaa aga tgc acg gat gac gtc432Val Ala Lys Ser Ala Gln Glu Cys Gln Glu Arg Cys Thr Asp Asp Val130 135 140cac tgc cac ttt ttc acg tac gcc aca agg cag ttt ccc agc ctg gag480His Cys His Phe Phe Thr Tyr Ala Thr Arg Gln Phe Pro Ser Leu Glu145 150 155 160cat cgt aac att tgt cta ctg aag cac acc caa aca ggg aca cca acc528His Arg Asn Ile Cys Leu Leu Lys His Thr Gln Thr Gly Thr Pro Thr165 170 175aga ata acg aag ctc gat aaa gtg gtg tct gga ttt tca ctg aaa tcc576Arg Ile Thr Lys Leu Asp Lys Val Val Ser Gly Phe Ser Leu Lys Ser180 185 190tgt gca ctt tct aat ctg gct tgt att agg gac att ttc cct aat acg624Cys Ala Leu Ser Asn Leu Ala Cys Ile Arg Asp Ile Phe Pro Asn Thr195 200 205
gtg ttt gca gac agc aac atc gac agt gtc atg gct ccc gat gct ttt672Val Phe Ala Asp Ser Asn Ile Asp Ser Val Met Ala Pro Asp Ala Phe210 215 220gtc tgt ggc cga atc tgc act cat cat ccc ggt tgc ttg ttt ttt acc720Val Cys Gly Arg Ile Cys Thr His His Pro Gly Cys Leu Phe Phe Thr225 230 235 240ttc ttt tcc cag gaa tgg ccc aaa gaa tct caa aga aat ctt tgt ctc768Phe Phe Ser Gln Glu Trp Pro Lys Glu Ser Gln Arg Asn Leu Cys Leu245 250 255ctt aaa aca tct gag agt gga ttg ccc agt aca cgc att aaa aag agc816Leu Lys Thr Ser Glu Ser Gly Leu Pro Ser Thr Arg Ile Lys Lys Ser260 265 270aaa gct ctt tct ggt ttc agt cta caa agc tgc agg cac agc atc cca864Lys Ala Leu Ser Gly Phe Ser Leu Gln Ser Cys Arg His Ser Ile Pro275 280 285gtg ttc tgc cat tct tca ttt tac cat gac act gat ttc ttg gga gaa912Val Phe Cys His Ser Ser Phe Tyr His Asp Thr Asp Phe Leu Gly Glu290 295 300gaa ctg gat att gtt gct gca aaa agt cac gag gcc tgc cag aaa ctg960Glu Leu Asp Ile Val Ala Ala Lys Ser His Glu Ala Cys Gln Lys Leu305 310 315 320tgc acc aat gcc gtc cgc tgc cag ttt ttt acc tat acc cca gcc caa1008Cys Thr Asn Ala Val Arg Cys Gln Phe Phe Thr Tyr Thr Pro Ala Gln325 330 335gca tcc tgc aac gaa ggg aag ggc aag tgt tac tta aag ctt tct tca1056Ala Ser Cys Asn Glu Gly Lys Gly Lys Cys Tyr Leu Lys Leu Ser Ser340 345 350aac gga tct cca act aaa ata ctt cac ggg aga gga ggc atc tct gga1104Asn Gly Ser Pro Thr Lys Ile Leu His Gly Arg Gly Gly Ile Ser Gly355 360 365
tac aca tta agg ttg tgt aaa atg gat aat gag tgt acc acc aaa atc1152Tyr Thr Leu Arg Leu Cys Lys Met Asp Asn Glu Cys Thr Thr Lys Ile370 375 380aag ccc agg atc gtt gga gga act gcg tct gtt cgt ggt gag tgg ccg1200Lys Pro Arg Ile Val Gly Gly Thr Ala Ser Val Arg Gly Glu Trp Pro385 390 395 400tgg cag gtg acc ctg cac aca acc tca ccc act cag aga cac ctg tgt1248Trp Gln Val Thr Leu His Thr Thr Ser Pro Thr Gln Arg His Leu Cys405 410 415gga ggc tcc atc att gga aac cag tgg ata tta aca gcc gct cac tgt1296Gly Gly Ser Ile Ile Gly Asn Gln Trp Ile Leu Thr Ala Ala His Cys420 425 430ttc tat ggg gta gag tca cct aag att ttg cgt gtc tac agt ggc att1344Phe Tyr Gly Val Glu Ser Pro Lys Ile Leu Arg Val Tyr Ser Gly Ile435 440 445tta aat caa tct gaa ata aaa gag gac aca tct ttc ttt ggg gtt caa1392Leu Asn Gln Ser Glu Ile Lys Glu Asp Thr Ser Phe Phe Gly Val Gln450 455 460gaa ata ata atc cat gat cag tat aaa atg gca gaa agc ggg tat gat1440Glu Ile Ile Ile His Asp Gln Tyr Lys Met Ala Glu Ser Gly Tyr Asp465 470 475 480att gcc ttg ttg aaa ctg gaa acc aca gtg aat tac aca gat tct caa1488Ile Ala Leu Leu Lys Leu Glu Thr Thr Val Asn Tyr Thr Asp Ser Gln485 490 495cga ccc ata tgc ctg cct tcc aaa gga gat aga aat gta ata tac act1536Arg Pro Ile Cys Leu Pro Ser Lys Gly Asp Arg Asn Val Ile Tyr Thr500 505 510gat tgc tgg gtg act gga tgg ggg tac aga aaa cta aga gac aaa ata1584Asp Cys Trp Val Thr Gly Trp Gly Tyr Arg Lys Leu Arg Asp Lys Ile515 520 525
caa aat act ctc cag aaa gcc aag ata ccc tta gtg acc aac gaa gag1632Gln Asn Thr Leu Gln Lys Ala Lys Ile Pro Leu Val Thr Asn Glu Glu530 535 540tgc cag aag aga tac aga gga cat aaa ata acc cat aag atg atc tgt1680Cys Gln Lys Arg Tyr Arg Gly His Lys Ile Thr His Lys Met Ile Cys545 550 555 560gcc ggc tac agg gaa gga ggg aag gac gct tgc aag gga gat tcg gga1728Ala Gly Tyr Arg Glu Gly Gly Lys Asp Ala Cys Lys Gly Asp Ser Gly565 570 575ggc cct ctg tcc tgc aaa cac aat gag gtc tgg cat ctg gta ggc atc1776Gly Pro Leu Ser Cys Lys His Asn Glu Val Trp His Leu Val Gly Ile580 585 590acg agc tgg ggc gaa ggc tgt gct caa agg gag cgg cca ggt gtt tac1824Thr Ser Trp Gly Glu Gly Cys Ala Gln Arg Glu Arg Pro Gly Val Tyr595 600 605acc aac gtg gtc gag tac gtg gac tgg att ctg gag aaa act caa gca1872Thr Asn Val Val Glu Tyr Val Asp Trp Ile Leu Glu Lys Thr Gln Ala610 615 620gtg tga1878Val625<210>120<211>625<212>PRT<213>人类<400>120Met Ile Phe Leu Tyr Gln Val Val His Phe Ile Leu Phe Thr Ser Val1 5 10 15Ser Gly Glu Cys Val Thr Gln Leu Leu Lys Asp Thr Cys Phe Glu Gly20 25 30
Gly Asp Ile Thr Thr Val Phe Thr Pro Ser Ala Lys Tyr Cys Gln Val35 40 45Val Cys Thr Tyr His Pro Arg Cys Leu Leu Phe Thr Phe Thr Ala Glu50 55 60Ser Pro Ser Glu Asp Pro Thr Arg Trp Phe Thr Cys Val Leu Lys Asp65 70 75 80Ser Val Thr Glu Thr Leu Pro Arg Val Asn Arg Thr Ala Ala Ile Ser85 90 95Gly Tyr Ser Phe Lys Gln Cys Ser His Gln Ile Ser Ala Cys Asn Lys100 105 110Asp Ile Tyr Val Asp Leu Asp Met Lys Gly Ile Asn Tyr Asn Ser Ser115 120 125Val Ala Lys Ser Ala Gln Glu Cys Gln Glu Arg Cys Thr Asp Asp Val130 135 140His Cys His Phe Phe Thr Tyr Ala Thr Arg Gln Phe Pro Ser Leu Glu145 150 155 160His Arg Asn Ile Cys Leu Leu Lys His Thr Gln Thr Gly Thr Pro Thr165 170 175Arg Ile Thr Lys Leu Asp Lys Val Val Ser Gly Phe Ser Leu Lys Ser180 185 190Cys Ala Leu Ser Asn Leu Ala Cys Ile Arg Asp Ile Phe Pro Asn Thr195 200 205Val Phe Ala Asp Ser Asn Ile Asp Ser Val Met Ala Pro Asp Ala Phe210 215 220Val Cys Gly Arg Ile Cys Thr His His Pro Gly Cys Leu Phe Phe Thr225 230 235 240
Phe Phe Ser Gln Glu Trp Pro Lys Glu Ser Gln Arg Asn Leu Cys Leu245 250 255Leu Lys Thr Ser Glu Ser Gly Leu Pro Ser Thr Arg Ile Lys Lys Ser260 265 270Lys Ala Leu Ser Gly Phe Ser Leu Gln Ser Cys Arg His Ser Ile Pro275 280 285Val Phe Cys His Ser Ser Phe Tyr His Asp Thr Asp Phe Leu Gly Glu290 295 300Glu Leu Asp Ile Val Ala Ala Lys Ser His Glu Ala Cys Gln Lys Leu305 310 315 320Cys Thr Asn Ala Val Arg Cys Gln Phe Phe Thr Tyr Thr Pro Ala Gln325 330 335Ala Ser Cys Asn Glu Gly Lys Gly Lys Cys Tyr Leu Lys Leu Ser Ser340 345 350Asn Gly Ser Pro Thr Lys Ile Leu His Gly Arg Gly Gly Ile Ser Gly355 360 365Tyr Thr Leu Arg Leu Cys Lys Met Asp Asn Glu Cys Thr Thr Lys Ile370 375 380Lys Pro Arg Ile Val Gly Gly Thr Ala Ser Val Arg Gly Glu Trp Pro385 390 395 400Trp Gln Val Thr Leu His Thr Thr Ser Pro Thr Gln Arg His Leu Cys405 410 415Gly Gly Ser Ile Ile Gly Asn Gln Trp Ile Leu Thr Ala Ala His Cys420 425 430Phe Tyr Gly Val Glu Ser Pro Lys Ile Leu Arg Val Tyr Ser Gly Ile435 440 445Leu Asn Gln Ser Glu Ile Lys Glu Asp Thr Ser Phe Phe Gly Val Gln
450 455 460Glu Ile Ile Ile His Asp Gln Tyr Lys Met Ala Glu Ser Gly Tyr Asp465 470 475 480Ile Ala Leu Leu Lys Leu Glu Thr Thr Val Asn Tyr Thr Asp Ser Gln485 490 495Arg Pro Ile Cys Leu Pro Ser Lys Gly Asp Arg Asn Val Ile Tyr Thr500 505 510Asp Cys Trp Val Thr Gly Trp Gly Tyr Arg Lys Leu Arg Asp Lys Ile515 520 525Gln Asn Thr Leu Gln Lys Ala Lys Ile Pro Leu Val Thr Asn Glu Glu530 535 540Cys Gln Lys Arg Tyr Arg Gly His Lys Ile Thr His Lys Met Ile Cys545 550 555 560Ala Gly Tyr Arg Glu Gly Gly Lys Asp Ala Cys Lys Gly Asp Ser Gly565 570 575Gly Pro Leu Ser Cys Lys His Asn Glu Val Trp His Leu Val Gly Ile580 585 590Thr Ser Trp Gly Glu Gly Cys Ala Gln Arg Glu Arg Pro Gly Val Tyr595 600 605Thr Asn Val Val Glu Tyr Val Asp Trp Ile Leu Glu Lys Thr Gln Ala610 615 620Val62权利要求
1.嵌合蛋白质,其包含至少一种有靶向到亚细胞器的运输信号的信号蛋白质和至少一种蛋白酶的蛋白酶剪切位点,将其构建为(a)通过连接蛋白水解位点或通过蛋白水解位点连接信号掩蔽蛋白质至信号蛋白质的N或C末端,失活所有信号蛋白质的运输信号,因此嵌合蛋白质存在于胞质溶胶中;(b)当蛋白酶剪切位点被蛋白酶切割时,至少一种信号蛋白质的运输信号被活化,并导致至少一种包含活化信号蛋白质的片段蛋白质被转运到亚细胞器;和(c)用至少一种荧光蛋白质标记嵌合蛋白质,荧光标记信号在细胞中的位置和强度分布根据蛋白酶的切割而改变。
2.嵌合蛋白质,其包含至少两种有靶向到亚细胞器的运输信号的信号蛋白质和至少一种蛋白酶的蛋白酶剪切位点,将其构建为(a)一种信号蛋白质的运输信号保持活性,通过连接蛋白水解位点或通过蛋白水解位点连接信号掩蔽蛋白质至信号蛋白质的N或C末端,失活其余信号蛋白质的运输信号,因此嵌合蛋白质被转运到特定的通过活性信号蛋白质运输信号靶向的亚细胞器;(b)在嵌合蛋白质转运到亚细胞器后,至少一种蛋白水解位点和至少一种失活信号蛋白质暴露于胞质溶胶中;(c)当蛋白酶剪切位点被蛋白酶切割时,所述的至少一种暴露于胞质溶胶的失活信号蛋白质的运输信号被活化,并导致包含活化信号蛋白质的片段蛋白质被转运到与嵌合蛋白质被转运的亚细胞器不同的亚细胞器;和(d)用至少一种荧光蛋白质标记嵌合蛋白质,荧光信号在细胞中的位置和强度分布根据蛋白酶的切割而改变。
3.根据权利要求1和2任一权利要求的嵌合蛋白质,其中在蛋白酶剪切产生的片段蛋白质中,至少两种有不同的细胞定位特点的片段蛋白质,其各自包括一种荧光蛋白质,使用的荧光蛋白质由至少两种不同波长的荧光蛋白质组成。
4.根据权利要求1和2任一权利要求的嵌合蛋白质,其中在包含失活运输信号被蛋白酶剪切活化的信号蛋白质的片段蛋白质中,至少一种片段蛋白质包含荧光蛋白质。
5.嵌合蛋白质,其包含有靶向到亚细胞器的运输信号的信号蛋白质和通过蛋白酶的蛋白酶剪切位点与信号蛋白质连接的荧光蛋白质,将其构建为(a)由于嵌合蛋白质中信号蛋白质的运输信号保持活性,因此嵌合蛋白质被转运到亚细胞器;(b)在嵌合蛋白质转运到亚细胞器后,蛋白酶剪切位点和荧光蛋白质暴露于胞质溶胶中;和(c)因此,当暴露于胞质溶胶的蛋白酶剪切位点被蛋白酶切割时,暴露于胞质溶胶的荧光蛋白质被释放到胞质溶胶中。
6.权利要求5的嵌合蛋白质,其中保持活性的信号蛋白质用与暴露到胞质溶胶的荧光蛋白质荧光波长不同的荧光蛋白质进一步标记,且该另外的荧光蛋白质在蛋白酶剪切发生后仍附着在活性信号蛋白质上。
7.根据权利要求1和2任一权利要求的嵌合蛋白质,其中失活信号蛋白质的运输信号是靶向到选自线粒体、叶绿体和过氧化物酶体亚细胞器的信号。
8.根据权利要求1和2任一权利要求的嵌合蛋白质,其中失活信号蛋白质是选自拟南芥属外包膜蛋白质7(AtOEP7)、Rubisco小亚单位(RbcS)、叶绿素a/b结合蛋白质(Cab)、Rubisco活化酶(RA)、F1-ATPase和过氧化物酶体靶向基序(SKL)的全长蛋白质或其包含运输信号的片段。
9.根据权利要求2和5任一权利要求的嵌合蛋白质,其中保持活性的信号蛋白质的运输信号是靶向到选自线粒体、叶绿体和细胞核的外膜、过氧化物酶体膜和质膜之一的信号。
10.根据权利要求2和5任一权利要求的嵌合蛋白质,其中保持活性的信号蛋白质是与特定磷脂特异结合的蛋白质。
11.根据权利要求2和5任一权利要求的嵌合蛋白质,其中保持活性的信号蛋白质是选自拟南芥属外包膜蛋白质7(AtOEP7)、H+-ATPase、Pleckstrin同源结构域(PH)和FAPP(家族A(磷酸肌醇结合特异)成员3)的Pleckstrin同源结构域的全长蛋白质或其包含运输信号的片段。
12.根据权利要求1和2任一权利要求的嵌合蛋白质,其中信号掩蔽蛋白质选自氨基酸、肽和蛋白质。
13.根据权利要求1、2,和5任一权利要求的嵌合蛋白质,其中荧光蛋白质选自绿色荧光蛋白质(GFP)、红色荧光蛋白质(RFP)、其突变体和其衍生物。
14.包含编码权利要求1、2,和5任一权利要求的嵌合蛋白质的核酸序列的重组基因,其被构建以在细胞中表达该嵌合蛋白质。
15.用权利要求14的重组基因转化的细胞。
16.权利要求15的细胞,其中细胞是真核细胞。
17.权利要求16的细胞,其中真核细胞是植物细胞。
18.分析体内蛋白酶活性的方法,包括(a)用权利要求14的重组基因转化细胞;(b)在步骤(a)之前、之后或同时转化该细胞以表达蛋白酶;(c)温育转化细胞以表达蛋白质;(d)观察温育细胞中荧光信号分布的图像;和(e)通过步骤(d)中观察到的荧光图像与无步骤(b)制备的对照转化细胞的荧光图像对比,确定蛋白酶的活性。
19.筛选体内蛋白酶抑制剂的方法,包括(a)用权利要求14的重组基因转化细胞;(b)在步骤(a)之前、之后,或同时转化该细胞以表达蛋白酶;(c)在步骤(b)之前、之后,或同时用抑制蛋白酶的候选药物处理转化细胞;(d)温育转化细胞以表达蛋白质;(e)观察温育细胞中荧光信号分布的图像;和(f)通过步骤(e)中观察到的荧光图像与无步骤(b)制备的对照转化细胞、无步骤(c)制备的对照转化细胞、及无步骤(b)和(c)制备的对照转化细胞中至少一个的荧光图像对比,确定候选药物的蛋白酶抑制活性。
20.权利要求18和19任一权利要求的方法,其中转化细胞表达蛋白酶的步骤是插入表达蛋白酶的重组基因的步骤,或用能表达蛋白酶的病毒感染的步骤。
21.权利要求18和19任一权利要求的方法,其中被转化的细胞是真核细胞。
22.权利要求18和19任一权利要求的方法,其中被转化的细胞是植物细胞。
23.检测细胞中蛋白酶的系统,其中系统包含嵌合蛋白质,其包含共价连接成分1)至少一种可选地掩蔽的信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。
24.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的1)信号蛋白质;2)蛋白酶特异的切割位点;和3)可检测的氨基酸序列。
25.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的1)掩蔽序列;2)蛋白酶切割位点;3)信号蛋白质;和4)可检测的氨基酸序列。
26.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的1)信号蛋白质;2)蛋白酶切割位点;3)掩蔽序列;和4)可检测的氨基酸序列。
27.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的1)第一信号蛋白质;2)蛋白酶切割位点;和3)第二信号蛋白质;和4)可检测的氨基酸序列。
28.权利要求27的系统,其中嵌合蛋白质包含共价顺序连接的1)第一信号蛋白质;2)第一蛋白酶切割位点;3)掩蔽序列;4)第二信号蛋白质;和5)可检测的氨基酸序列。
29.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的1)掩蔽序列;2)第一蛋白酶切割位点;3)第一信号蛋白质;4)第二蛋白酶切割位点;5)第二信号蛋白质;和6)可检测的氨基酸序列。
30.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的1)第一信号蛋白质;2)第一蛋白酶切割位点;3)第二信号蛋白质;4)第二蛋白酶切割位点;5)掩蔽序列;和6)可检测的氨基酸序列。
31.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的1)蛋白酶特异的切割位点;2)信号蛋白质;和3)可检测的氨基酸序列。
32.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的1)第一信号蛋白质;2)第一可检测序列;3)蛋白酶切割位点;和4)第二可检测序列。
33.权利要求32的系统,其中嵌合蛋白质进一步包含共价连接在蛋白酶切割位点C末端和第二可检测序列N末端之间的第二信号蛋白质。
34.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的1)第一信号蛋白质;2)蛋白酶切割位点;3)第二信号蛋白质;和4)第二可检测序列。
35.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的1)第一可检测序列;2)蛋白酶切割位点;3)信号蛋白质;和4)第二可检测序列。
36.权利要求23的系统,其中任何一种成分构成嵌合蛋白质的N末端。
37.权利要求23的系统,其中任何一种成分构成嵌合蛋白质的C末端。
38.权利要求23的系统,其中信号蛋白质足以将嵌合蛋白质或至少一种其成分定位到植物或动物细胞的细胞器。
39.权利要求38的系统,其中信号蛋白质将嵌合蛋白质或至少一种其成分定位到植物细胞的细胞核、高尔基体、溶解液泡、储存液泡、过氧化物酶体、线粒体、内质网、质膜或叶绿体。
40.权利要求39的系统,其中信号蛋白质是AtOEP7;RbcS;Cab;RA;SKL;F1-ATPase;PH;FAPP;H+-ATPase之一;或其功能片段。
41.权利要求38的系统,其中信号蛋白质将嵌合蛋白质定位到动物细胞的细胞核、高尔基体、储存液泡、溶酶体、过氧化物酶体、内质网、质膜或线粒体。
42.权利要求41的系统,其中信号蛋白质是人肽蛋氨酸亚砜还原酶(MSRA)、细胞色素b2、11-β-羟基类固醇脱氢酶(11β-HSD)、G9-AKL、过氧化物酶体整合膜蛋白质47(PMP47)之一;或其功能片段。
43.权利要求23的系统,其中切割位点被哺乳动物或病毒蛋白酶特异切割。
44.权利要求43的系统,其中切割位点被人类病原体相关的蛋白酶特异切割。
45.权利要求44的系统,其中蛋白酶由巨细胞病毒(CMV);单纯疱疹病毒(HSV);肝炎病毒;疟原虫、人类免疫缺陷病毒(HIV)、卡波济肉瘤相关疱疹病毒(KSHV)、黄热病病毒、黄病毒或鼻病毒表达。
46.权利要求43的系统,其中蛋白酶是丝氨酸类型的蛋白酶。
47.权利要求45的系统,其中疟原虫是恶性疟原虫,蛋白酶是疟原虫天冬氨酸蛋白酶I和疟原虫天冬氨酸蛋白酶II之一。
48.权利要求45的系统,其中切割位点被HSV成熟蛋白酶特异切割。
49.权利要求45的系统,其中肝炎病毒是丙型。
50.权利要求44的系统,其中人类病原体是酵母、细菌、真菌、线虫、病毒或原生动物。
51.权利要求43的系统,其中切割位点被与血液凝固、凋亡或细胞外基质相关的哺乳动物蛋白酶特异切割。
52.权利要求23的系统,其中至少一种可检测的序列是荧光、磷光或化学发光的序列。
53.权利要求52的系统,其中一种可检测序列的发射波长与至少一种其它的可检测序列的发射波长不同。
54.权利要求52的系统,其中可检测序列是水母荧光蛋白质或其衍生物。
55.基本上纯的嵌合蛋白质,包含共价连接成分1)至少一种可选地掩蔽的信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。
56.包含编码用于检测细胞中蛋白酶活性的嵌合蛋白质的序列的核酸,其中嵌合蛋白质包含共价连接成分1)至少一种可选地掩蔽的信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。
57.包含权利要求56的核酸的载体。
58.用权利要求57的载体转化的细胞。
59.检测细胞内蛋白酶的试剂盒,该试剂盒包含至少下列之一a)嵌合蛋白质,其包含共价连接成分i)至少一种可选地掩蔽的信号蛋白质;ii)至少一种蛋白酶特异的切割位点;和iii)至少一种可检测的氨基酸序列;和b)包含核酸的载体,其中核酸包含编码嵌合蛋白质的序列。
60.检测细胞或组织内蛋白酶的方法,该方法包含a)将包含编码嵌合蛋白质的核酸的第一载体引入受试细胞或组织,其中嵌合蛋白质包含共价连接成分1)至少一种可选地掩蔽的信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列,b)在使第一载体编码的嵌合蛋白质表达的条件下温育细胞或组织;和c)检测嵌合蛋白质亚细胞定位的变化作为细胞内蛋白酶存在的指示。
61.权利要求60的方法,其中该方法还包含将包含编码蛋白酶的核酸序列的第二载体引入受试细胞或组织;并在细胞或组织中表达第二载体以在其中产生蛋白酶。
62.检测体内蛋白酶抑制剂的方法,该方法包含a)将包含编码嵌合蛋白质的核酸的第一载体引入受试细胞或组织,其中嵌合蛋白质包含共价连接成分1)至少一种可选地掩蔽的信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列,b)将编码受试蛋白酶的第二载体引入细胞或组织,c)细胞或组织与候选化合物接触,d)在使第一载体编码的嵌合蛋白质和第二载体编码的蛋白酶表达的条件下温育细胞或组织;和e)检测嵌合蛋白质亚细胞定位的变化作为蛋白酶抑制剂存在的指示。
63.权利要求62的方法,其中该方法还包含使用自动或半自动的设备检测嵌合蛋白质亚细胞定位的变化。
64.权利要求63的方法,其中自动或半自动的设备包含适于检测细胞或组织内可检测序列的光学系统。
全文摘要
本发明公开了细胞内蛋白酶检测系统。在一个实施方案中,该系统包括嵌合蛋白质,其包括共价连接成分1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。本发明有广谱的应用,包括用于细胞和组织内新蛋白酶抑制剂的检测。
文档编号C12Q1/37GK1553962SQ02817900
公开日2004年12月8日 申请日期2002年8月8日 优先权日2001年8月10日
发明者黄仁焕, 金旲宪, 李勇直 申请人:阿赫姆生物系统公司
文档序号 : 【 409857 】

技术研发人员:黄仁焕,金旲宪,李勇直
技术所有人:阿赫姆生物系统公司

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
黄仁焕金旲宪李勇直阿赫姆生物系统公司
单体的制备方法 调节免疫应答的组合物和方法
相关内容