本發(fā)明屬于基因工程領(lǐng)域。具體而言,本發(fā)明涉及一種可作用于dna的腺苷脫氨酶及其應(yīng)用。更具體而言,本發(fā)明提供了可以作用于dna腺嘌呤脫氧核糖核苷酸的腺苷脫氨酶,基于該腺苷脫氨酶的腺嘌呤堿基編輯系統(tǒng)及其應(yīng)用。使用該堿基編輯系統(tǒng)對(duì)生物體基因組中的靶序列進(jìn)行堿基編輯的方法,以及通過所述方法產(chǎn)生的經(jīng)遺傳修飾的生物體及其后代。
背景技術(shù):
1、堿基編輯(base?editing)是指通過基因工程手段對(duì)特定dna位點(diǎn)進(jìn)行核苷酸替換的過程,堿基編輯是基因編輯(genome?editing)技術(shù)的一種。在植物中,許多優(yōu)良的農(nóng)藝性狀是由單核苷酸變異(single?nucleotide?variation,snv)產(chǎn)生的;在人體和動(dòng)物中,許多遺傳疾病是由功能基因上的點(diǎn)突變引起的。堿基編輯技術(shù),可以對(duì)動(dòng)植物、微生物的基因組dna進(jìn)行靶向修飾和改造,以創(chuàng)制新的基因型并獲得有益于生產(chǎn)應(yīng)用的目標(biāo)性狀,也可在遺傳疾病治療中被用于糾正一些嚴(yán)重的先天性遺傳變異,因而堿基編輯在優(yōu)良種質(zhì)創(chuàng)制和疾病治療中具有重要的應(yīng)用前景。
2、腺嘌呤堿基編輯器(adenine?base?editor,abe)是最重要的堿基編輯系統(tǒng)之一。2017年,abe堿基編輯系統(tǒng)被首次報(bào)道并成功在哺乳動(dòng)物細(xì)胞中實(shí)現(xiàn)高效的堿基編輯(gaudelli,n.m.et?al.programmable?base?editing?of?a*t?to?g*c?in?genomic?dnawithout?dna?cleavage.nature?551,464-471(2017).)。該系統(tǒng)包含三種組分:1)核酸靶向結(jié)構(gòu)域,如cas9切口酶(ncas9,包含d10a氨基酸突變),2)腺苷脫氨酶及3)sgrna。abe堿基編輯的原理是,在腺苷脫氨酶的作用下,腺嘌呤脫氧核苷酸(a)脫氨轉(zhuǎn)換成中間產(chǎn)物次黃嘌呤脫氧核苷酸(i),在細(xì)胞修復(fù)和dna復(fù)制的過程中最終轉(zhuǎn)換為鳥嘌呤脫氧核苷酸(g),最終導(dǎo)致雙鏈dna上的a-t堿基對(duì)轉(zhuǎn)換為g-c堿基對(duì)從而實(shí)現(xiàn)堿基編輯。
3、abe堿基編輯的關(guān)鍵在于使用能夠作用于dna的腺苷脫氨酶。然而,天然的腺苷脫氨酶的作用底物是rna而非dna,因此無法對(duì)dna進(jìn)行脫氨。為了解決這個(gè)問題,研究人員以來源于大腸桿菌的trna腺苷脫氨酶tada為底盤蛋白,進(jìn)行多輪的蛋白質(zhì)進(jìn)化,最終獲得了能夠作用于dna的腺苷脫氨酶tada*7.10,并實(shí)現(xiàn)了a-t堿基對(duì)向g-c堿基對(duì)的轉(zhuǎn)換。雖然研究人員在tada*7.10基礎(chǔ)上又引入了一些新的氨基酸突變,獲得了一些新的有效突變體,如tada-8e,tada-8s等。但這些腺苷脫氨酶仍然是源于大腸桿菌的trna脫氨酶。
4、自2017年abe系統(tǒng)被首次報(bào)道以來,領(lǐng)域內(nèi)使用的腺苷脫氨酶均基于大腸桿菌tada,尚無其他可用的dna的腺苷脫氨酶底盤被報(bào)道。因此,尋找可以作用于dna的腺苷脫氨酶底盤,對(duì)于擴(kuò)充現(xiàn)有的腺苷堿基編輯系統(tǒng)、開發(fā)精確操作目標(biāo)dna序列的基因編輯工具具有極其重要的意義。
技術(shù)實(shí)現(xiàn)思路
1、為解決目前腺苷脫氨酶類型單一、應(yīng)用場(chǎng)景有限、編輯效率低等問題,本技術(shù)發(fā)明人經(jīng)過大量實(shí)驗(yàn)和探索,出人意料地發(fā)現(xiàn)了新型的腺苷脫氨酶,上述脫氨酶可作用于dna中的腺苷?;谶@一發(fā)現(xiàn),發(fā)明人開發(fā)出新型的腺嘌呤堿基編輯器,豐富了腺嘌呤堿基編輯器的應(yīng)用場(chǎng)景和選擇。
2、用于解決問題的方案
3、在本發(fā)明的第一方面中,提供了一種腺苷脫氨酶,所述腺苷脫氨酶能夠使dna中腺嘌呤堿基脫氨基,所述腺苷脫氨酶選自以下(i)~(iii)中的一種或多種:
4、(i)包含與seq?id?no:4所示的氨基酸序列具有至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的氨基酸序列,并且其保留如seqid?no:4所示的氨基酸序列的脫氨活性;
5、(ii)包含在seq?id?no:4所示的氨基酸序列的c端增加連續(xù)的氨基酸的氨基酸序列,并且其保留如seq?id?no:4所示的氨基酸序列的脫氨活性;或
6、(iii)包含任意兩個(gè)以上如(i)或(ii)中所述的氨基酸序列構(gòu)成的多聚體。
7、在一些實(shí)施方案中,在(ii)中,所述腺苷脫氨酶包含在seq?id?no:4的c端增加至少8個(gè)連續(xù)的氨基酸的氨基酸序列。
8、在一些實(shí)施方案中,在(ii)中,所述腺苷脫氨酶包含如seq?id?no:5所示的氨基酸序列。
9、在一些實(shí)施方案中,所述腺苷脫氨酶包含在seq?id?no:4或seq?id?no:5所示的氨基酸序列中添加、取代、缺失或插入1個(gè)或多個(gè)氨基酸殘基的氨基酸序列,并保留如seq?idno:4所示的氨基酸序列的脫氨活性。
10、在一些實(shí)施方案中,所述腺苷脫氨酶包含在seq?id?no:4或seq?id?no:5中具有w71x突變的氨基酸序列,其中x是除w(色氨酸)之外的任何氨基酸,優(yōu)選的,x是y(酪氨酸)。
11、在一些實(shí)施方案中,所述腺苷脫氨酶包含在seq?id?no:4或seq?id?no:5中具有a91x突變的氨基酸序列,其中x是除a(丙氨酸)之外的任何氨基酸。在一些具體的實(shí)施方案中,x是t(蘇氨酸)。
12、在一些實(shí)施方案中,所述腺苷脫氨酶包含在seq?id?no:4或seq?id?no:5中具有v80x突變的氨基酸序列,其中x是除v(纈氨酸)之外的任何氨基酸。在一些具體的實(shí)施方案中,x是t(蘇氨酸)。
13、在一些實(shí)施方案中,所述腺苷脫氨酶包含在seq?id?no:4或seq?id?no:5中具有s122x突變的氨基酸序列,其中x是除s(絲氨酸)之外的任何氨基酸。在一些具體的實(shí)施方案中,x是g(甘氨酸)。
14、在一些實(shí)施方案中,所述腺苷脫氨酶包含選自在seq?id?no:4或seq?id?no:5中具有w71y突變、a91t突變、v80t突變和s122t突變中的一個(gè)或多個(gè)突變的氨基酸序列。
15、在一些實(shí)施方案中,所述腺苷脫氨酶包含在seq?id?no:4或seq?id?no:5中具有w71y突變和另一種腺嘌呤脫氨酶的突變的氨基酸序列。
16、在一些具體的實(shí)施方案中,所述腺苷脫氨酶包含在seq?id?no:4或seq?id?no:5中具有w71y和a91t突變的氨基酸序列。
17、在一些具體的實(shí)施方案中,所述腺苷脫氨酶包含在seq?id?no:4或seq?id?no:5中具有w71y和v80t突變的氨基酸序列。
18、在一些具體的實(shí)施方案中,所述腺苷脫氨酶包含在seq?id?no:4或seq?id?no:5中具有w71y和s122t突變的氨基酸序列。
19、在一些實(shí)施方案中,在(iii)中,所述多聚體包含任意兩個(gè)如(i)和(ii)中所述的氨基酸序列構(gòu)成的二聚體,所述任意兩個(gè)如(i)和(ii)中所述的氨基酸序列通過接頭連接。
20、在一些具體的實(shí)施方案中,所述接頭包含如seq?id?no:30所示的氨基酸序列。
21、在本發(fā)明的第二方面中,提供了根據(jù)本發(fā)明的第一方面所述的腺苷脫氨酶用于在生物體或生物體細(xì)胞中進(jìn)行基因編輯中的用途,或者在制備用于在生物體或生物體細(xì)胞中進(jìn)行基因編輯的試劑中的用途。
22、在本發(fā)明的第三方面中,提供了一種融合蛋白,其包含:
23、(a)核酸靶向結(jié)構(gòu)域;和
24、(b)腺苷脫氨結(jié)構(gòu)域,其中所述腺苷脫氨結(jié)構(gòu)域包含至少一個(gè)本發(fā)明的第一方面所述的腺苷脫氨酶的多肽。
25、在一些實(shí)施方案中,所述核酸靶向結(jié)構(gòu)域?yàn)閠ale、zfp或crispr效應(yīng)蛋白結(jié)構(gòu)域。
26、在一些實(shí)施方案中,所述crispr效應(yīng)蛋白選自cas3、cas4、cas5、cas5e(或casd)、cas6、cas6e、cas6f、cas7、cas8a1、cas8a2、cas8b、cas8c、cas9、cas10、cast10d、cas12、cas13、cas14、casx、casf、casg、cash、csy1、csy2、csy3、cse1(或casa)、cse2(或casb)、cse3(或case)、cse4(或casc)、csc1、csc2、csa5、csn1、csn2、csm2、csm3、csm4、csm5、csm6、cmrl、cmr3、cmr4、cmr5、cmr6、cpf1、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csz1、csx15、csf1、csf2、csf3、csf4、cu1966、trac及其功能變體或任何組合。
27、在一些實(shí)施方案中,所述核酸靶向結(jié)構(gòu)域和所述腺苷脫氨結(jié)構(gòu)域通過接頭融合。
28、在一些實(shí)施方案中,所述融合蛋白還包含核定位序列(nls)。
29、在本發(fā)明的第四方面中,提供了一種用于對(duì)核酸分子靶區(qū)域進(jìn)行修飾的堿基編輯系統(tǒng),其包含:
30、i)本發(fā)明的第一方面所述的腺苷脫氨酶或本發(fā)明的第三方面所述的融合蛋白,和/或含有編碼所述腺苷脫氨酶或所述融合蛋白的核苷酸序列的表達(dá)構(gòu)建體。
31、在一些實(shí)施方案中,所述堿基編輯系統(tǒng)還包含:
32、ii)至少一種向?qū)na和/或至少一種含有編碼所述至少一種向?qū)na的核苷酸序列的表達(dá)構(gòu)建體;和/或
33、iii)核定位序列(nls)。
34、在一些實(shí)施方案中,所述至少一種向?qū)na與所述融合蛋白的核酸靶向結(jié)構(gòu)域結(jié)合,且所述向?qū)na針對(duì)所述核酸分子靶區(qū)域內(nèi)的至少一個(gè)靶序列。
35、在一些實(shí)施方案中,所述向?qū)na的長度為15-100個(gè)核苷酸,并且包含與靶序列互補(bǔ)的至少10個(gè)、至少15個(gè)或至少20個(gè)連續(xù)核苷酸的序列。
36、在一些實(shí)施方案中,所述向?qū)na包含與靶序列互補(bǔ)的15至40個(gè)連續(xù)核苷酸序列。
37、在一些實(shí)施方案中,所述向?qū)na的長度為15-50個(gè)核苷酸。
38、在一些實(shí)施方案中,所述核酸分子是dna。
39、在一些實(shí)施方案中,所述核酸分子在生物體的基因組中。
40、在一些實(shí)施方案中,所述生物體是原核生物如細(xì)菌;真核生物如植物、真菌或脊柱動(dòng)物。
41、在一些實(shí)施方案中,所述脊柱動(dòng)物是哺乳動(dòng)物如人、小鼠、大鼠、猴、犬、豬、羊、牛、貓。
42、在一些實(shí)施方案中,所述植物是作物植物,例如小麥、水稻、玉米、大豆、向日葵、高粱、油菜、苜蓿、棉花、大麥、粟、甘蔗、番茄、獼猴桃、生菜、煙草、木薯或馬鈴薯。
43、在本發(fā)明的第五方面中,提供了一種堿基編輯方法,其中,所述堿基編輯方法包括將本發(fā)明的第四方面所述的堿基編輯系統(tǒng)與核酸分子靶序列接觸。
44、在一些實(shí)施方案中,所述核酸分子為雙鏈dna分子或單鏈dna分子。
45、在一些實(shí)施方案中,所述核酸分子靶序列包含與植物性狀或表達(dá)相關(guān)的序列。
46、在一些實(shí)施方案中,所述核酸分子靶序列包含與疾病或病癥相關(guān)的序列或點(diǎn)突變。
47、在一些實(shí)施方案中,所述堿基編輯系統(tǒng)與核酸分子靶序列接觸發(fā)揮脫氨基作用,所述脫氨基作用導(dǎo)致靶序列的一個(gè)或多個(gè)核苷酸發(fā)生取代。
48、在一些實(shí)施方案中,所述靶序列包含dna序列5’-man-3’,其中m是a、t、c或g;n是a、t、c或g;其中在5’-man-3’序列中間的a被脫氨基。
49、在一些實(shí)施方案中,所述脫氨基作用導(dǎo)致剪接位點(diǎn)的引入或去除。
50、在一些實(shí)施方案中,所述脫氨基作用導(dǎo)致基因啟動(dòng)子中突變的引入,所述突變導(dǎo)致與所述基因啟動(dòng)子可操作連接的基因的轉(zhuǎn)錄增加或減少。
51、在一些實(shí)施方案中,所述脫氨基作用導(dǎo)致基因阻抑物中突變的引入,所述突變導(dǎo)致與所述基因阻抑物可操作連接的基因的轉(zhuǎn)錄增加或減少。
52、在一些實(shí)施方案中,所述接觸在生物體內(nèi)進(jìn)行或其中所述接觸在生物體外進(jìn)行。
53、在本發(fā)明的第五方面中,提供了一種產(chǎn)生至少一個(gè)經(jīng)遺傳修飾的細(xì)胞的方法,包括將本發(fā)明的第四方面所述的堿基編輯系統(tǒng)導(dǎo)入至少一個(gè)所述細(xì)胞,由此導(dǎo)致所述至少一個(gè)細(xì)胞中靶核酸區(qū)域內(nèi)的一個(gè)或多個(gè)核苷酸發(fā)生取代,所述一個(gè)或多個(gè)核苷酸取代是a至g取代。
54、在一些實(shí)施方案中,所述方法還包括從所述至少一個(gè)細(xì)胞篩選具有期望的一個(gè)或多個(gè)核苷酸取代的細(xì)胞的步驟。
55、在一些實(shí)施方案中,所述堿基編輯系統(tǒng)通過選自以下的方法導(dǎo)入細(xì)胞:磷酸鈣轉(zhuǎn)染、原生質(zhì)融合、電穿孔、脂質(zhì)體轉(zhuǎn)染、微注射、病毒感染(如桿狀病毒、痘苗病毒、腺病毒、腺相關(guān)病毒、慢病毒或其他病毒)、n-乙酰半乳糖胺(galnac)介導(dǎo)、基因槍法、peg介導(dǎo)的原生質(zhì)體轉(zhuǎn)化、土壤農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化。
56、在一些實(shí)施方案中,所述細(xì)胞來自哺乳動(dòng)物如人、小鼠、大鼠、猴、犬、豬、羊、牛、貓;家禽如雞、鴨、鵝;植物,優(yōu)選作物植物,例如小麥、水稻、玉米、大豆、向日葵、高粱、油菜、苜蓿、棉花、大麥、粟、甘蔗、番茄、獼猴桃、生菜、煙草、木薯和馬鈴薯。
57、發(fā)明的效果
58、本發(fā)明提供了可以作用于dna的腺苷脫氨酶,依據(jù)基于該脫氨酶的基因編輯系統(tǒng)及其應(yīng)用。豐富了腺嘌呤堿基編輯器的應(yīng)用場(chǎng)景和選擇,具有廣泛的應(yīng)用前景。