国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      使用祖先數(shù)據(jù)進行基因組分析的方法和系統(tǒng)的制作方法

      文檔序號:10506067閱讀:582來源:國知局
      使用祖先數(shù)據(jù)進行基因組分析的方法和系統(tǒng)的制作方法
      【專利摘要】本發(fā)明提供了通過分析個體的基因組譜(genomic profile)和使用祖先數(shù)據(jù)來確定基因型和表型之間的相關(guān)性而評估個體的基因型與表型之間的相關(guān)性的方法和系統(tǒng)。
      【專利說明】使用祖先數(shù)據(jù)進行基因組分析的方法和系統(tǒng)
      [0001 ] 本申請是申請日為2008年9月26日、申請?zhí)枮?00880114465.2、發(fā)明名稱為"使用 祖先數(shù)據(jù)進行基因組分析的方法和系統(tǒng)"的發(fā)明專利申請的分案申請。
      [醒]交叉引用
      [0003] 本申請要求于2007年9月26日提交的美國臨時申請60/975,495的優(yōu)先權(quán),其全部 內(nèi)容通過引用方式結(jié)合在此。
      【背景技術(shù)】
      [0004] 人類基因組測序和人類基因組學中的其它最新發(fā)展表明:任意兩個人之間的基因 組組成可具有超過99.9%的相似性。但是個體間存在的相對較小數(shù)量的DNA變異會導致表 型性狀的差異,并與許多人類疾病、對各種不同疾病的易感性和對疾病治療的響應相關(guān)。個 體間的DNA差異出現(xiàn)在編碼和非編碼區(qū),并包括在基因組DNA序列中的特定位點上的堿基改 變W及DNA的插入和缺失。出現(xiàn)在基因組單個堿基位置上的改變被稱為單核巧酸多態(tài)性或 "SNP"O
      [0005] 盡管SNP在人類基因組中相對罕見,但是它們占個體間DNA序列變異的大多數(shù),在 人類基因組中每1200個堿基對會出現(xiàn)大約1次(參見國際化pMap計劃,WWW. hapmap. org)。隨 著可獲得更多的人類遺傳信息,人們逐漸了解到SNP的復雜性。隨之,人們發(fā)現(xiàn)基因組中SNP 的出現(xiàn)與各種疾病和癥狀的存在和/或易感性相關(guān)。
      [0006] 隨著運些相關(guān)性的發(fā)現(xiàn)和人類遺傳學中的其它進展,醫(yī)學和個人保健總體上會朝 向個性化的途徑發(fā)展,其中患者特別地根據(jù)他或她的基因組信息來進行適當?shù)尼t(yī)療和其它 選擇。有可能影響考慮的一個重要因素為個體的祖先數(shù)據(jù)(家系)或種族。例如,由于各種可 能的原因例如重組率的差異、選擇壓力或種群瓶頸(bottleneck),不同的群體可具有不同 的連鎖不平衡模式。因此,如果已對群體A進行了研究而在該群體中獲得了與表型相關(guān)的遺 傳變異的特定優(yōu)勢比(odds ratio),并不能在群體B中也假定具有相同的優(yōu)勢比。因此,需 要向個體和他們的保健提供者(care-giver)提供個體特定的個人基因組信息(包括祖先數(shù) 據(jù))W最終提供個性化的醫(yī)療和其它決定。

      【發(fā)明內(nèi)容】

      [0007] 本發(fā)明提供了用于評估個體表型的基因型相關(guān)性的方法,包括:a)獲得所述個體 的遺傳樣品;b)產(chǎn)生所述個體的基因組譜;C)通過比較所述個體的基因組譜和目前的人類 基因型-表型相關(guān)性數(shù)據(jù)庫來確定所述個體的基因型與表型之間的相關(guān)性;d)向所述個體 或所述個體的醫(yī)療保健管理者報告來自步驟(C)的結(jié)果;e)在附加的人類基因型相關(guān)性已 知時,用該附加的人類基因型相關(guān)性來更新人類基因型相關(guān)性的數(shù)據(jù)庫;f)通過將步驟C) 的個體基因組譜或其部分與附加的人類基因型相關(guān)性相比較并確定個體的附加的基因型 相關(guān)性來更新個體的基因型相關(guān)性;和g)向個體或個體的醫(yī)療保健管理者報告步驟f)的結(jié) 果。
      [000引本發(fā)明進一步提供了評估個體的基因型相關(guān)性的商業(yè)方法,包括:a)獲得個體的 遺傳樣品;b)產(chǎn)生個體的基因組譜;c)通過將個體的基因組譜與人類基因型相關(guān)性的數(shù)據(jù) 庫相比較來確定個體的基因型相關(guān)性;d) W加密方式向個體提供確定個體的基因型相關(guān)性 的結(jié)果;e)在附加的人類基因型相關(guān)性已知時,用附加的人類基因型相關(guān)性來更新人類基 因型相關(guān)性的數(shù)據(jù)庫;f)通過將個體的基因組譜或其部分與附加的人類基因型相關(guān)性相比 較和確定個體的附加的基因型相關(guān)性來更新個體的基因型相關(guān)性;和g)向個體或個體的醫(yī) 療保健管理者提供更新個體的基因型相關(guān)性的結(jié)果。
      [0009] 本發(fā)明的另一方面為產(chǎn)生個體的表型譜的方法,包括:a)提供包括規(guī)則的規(guī)則集, 各規(guī)則表明至少一種基因型與至少一種表型之間的相關(guān)性;b)提供包括多個個體中的每一 個的基因組譜的數(shù)據(jù)集,其中各基因組譜包括多個基因型;C)定期地使用至少一條新的規(guī) 則來更新規(guī)則集,其中該至少一條新的規(guī)則表明之前未在規(guī)則集中相互關(guān)聯(lián)的基因型和表 型之間的相關(guān)性;d)將各新的規(guī)則應用于至少一個個體的基因組譜,因而對于該個體將至 少一種基因型與至少一種表型相關(guān)聯(lián);和任選地e)產(chǎn)生包括個體的表型譜的報告。
      [0010] 本發(fā)明還提供了一種系統(tǒng),包括:a)包括規(guī)則的規(guī)則集,各規(guī)則表明至少一種基因 型與至少一種表型之間的相關(guān)性;b)定期地使用至少一條新的規(guī)則來更新規(guī)則集的代碼, 其中該至少一條新的規(guī)則表明之前未在規(guī)則集中相互關(guān)聯(lián)的基因型與表型之間的相關(guān)性; C)包括多個個體的基因組譜的數(shù)據(jù)庫;d)將規(guī)則集應用于個體的基因組譜W確定個體的表 型譜的代碼;和e)產(chǎn)生各個體的報告的代碼。
      [0011] 本發(fā)明還進一步提供了用于評估個體的基因型相關(guān)性的方法,包括:(a)比較(i) 包括與表型相關(guān)的遺傳變異的第一連鎖不平衡化D)模式和(ii)包括該遺傳變異的第二LD 模式,其中第一 LD模式為第一個體群體的LD模式和第二LD模式為第二個體群體的LD模式; (b)由(a)的比較確定第二群體中遺傳變異與表型相關(guān)的概率;(C)包括使用步驟(b)的概 率,由個體的基因組譜評估所述表型的基因型相關(guān)性;和(d)向所述個體或所述個體的醫(yī)療 保健管理者報告包括步驟k)的基因型相關(guān)性的結(jié)果。在一些實施方式中,該方法還進一步 包括(e)使用附加的遺傳變異來更新所述結(jié)果。
      [0012] 該概率可為優(yōu)勢比(OR),其中OR可源自已知的OR。例如已知的OR可W為與第一群 體的表型相關(guān)的遺傳變異的0R,例如在科技期刊上公布的對于遺傳變異(例如SNP)的OR。在 一些實施方式中,第一群體和第二群體具有相似的LD模式。本發(fā)明還提供了評估個體的基 因型相關(guān)性的方法,包括:(a)確定第一個體群體中多個遺傳變異中的每一個的原因遺傳變 異概率;(b)確定作為第二個體群體中所述多個遺傳變異中的每一個的概率的步驟(a)中的 各所述概率;(C)包括使用步驟(b)的概率從個體的基因組譜評估基因型相關(guān)性;和(d)向個 體或個體的醫(yī)療保健管理者報告包括來自步驟(C)的基因型相關(guān)性的結(jié)果。在一些實施方 式中,該方法還進一步包括(e)使用附加的遺傳變異來更新所述結(jié)果。
      [001引已知的遺傳變異(例如SNP)可為具有在科技期刊中公布的OR的遺傳變異。該概率 可為優(yōu)勢比(OR),且步驟(a)的各遺傳變異可W接近于與第一群體中的表型相關(guān)的已知遺 傳變異。例如,各遺傳變異可與已知的遺傳變異連鎖不平衡。
      [0014] 在此公開的方法和系統(tǒng)的一些實施方式中,基因型相關(guān)性作為GCI評分報告。第二 群體通常具有不同于第一群體的家系,且所述個體具有第二群體的家系。在一些實施方式 中,原因遺傳變異是未知的。遺傳變異可為單核巧酸多態(tài)性(SNP)。
      [0015] 本發(fā)明的另一方面為W加密或非加密的方式在網(wǎng)絡(luò)上進行傳輸,上述的方法和系 統(tǒng)。報告可W通過在線入口、通過紙件或通過電子郵件進行。使用的基因組譜可被產(chǎn)生和來 自遺傳樣品。第=方可產(chǎn)生基因組譜、獲得遺傳樣品,或既獲得樣品也產(chǎn)生基因組譜。遺傳 樣品可為DNA或RNA,且從選自下述的生物樣品獲得:血液、頭發(fā)、皮膚、唾液、精液、尿液、糞 便、汗液和口腔樣品?;蚪M譜可存放在加密的數(shù)據(jù)庫或保險庫中。此外,基因組譜可為單 核巧酸多態(tài)性譜,且在一些實施方式中,基因組譜可包括截短、插入、缺失或重復?;蚪M譜 可通過使用高密度DNA微陣列、RT-PCR、DNA測序或多種技術(shù)的組合產(chǎn)生。
      [0016] 本發(fā)明的方法還包括包含任何化pMap群體(YRI、CEU、CHB、肝T、ASW、C皿、GIH、LWK、 16乂、1邸^51)的群體或任何其它的群體,例如但不限于非裔美國人、高加索人、德系猶太 人、西班牙系猶太人(Sepharadic Jewish)、印度人、太平洋島民、中東人、德魯茲人、貝都因 人、南歐人、斯堪的納維亞人、東歐人、北非人、己斯克人、西非人或東非人。
      [0017] 通過引用加入
      [0018] 本說明書中提到的所有出版物和專利申請均通過引用的方式結(jié)合在此,就好像每 篇出版物或?qū)@暾埦囟ǖ睾蛡€別地說明通過引入方式結(jié)合在此一樣。
      [0019] 附圖簡述
      [0020] 圖1為顯示本發(fā)明的方法方面的流程圖。
      [0021 ]圖2為基因組DNA質(zhì)量控制措施的例子。
      [0022] 圖3為雜交質(zhì)量控制措施的例子。
      [0023] 圖4為來自具有測試的SNP和效應評價的公開文獻的典型基因型相關(guān)性的表。A-I) 表示單個基因座的基因型相關(guān)性;J)表示兩個基因座的基因型相關(guān)性;K)表示=個基因座 的基因型相關(guān)性;L)為A-K中使用的種族和國家縮寫的索引 ;M)為A-K中的表型名稱縮寫 (Shod Genotype Name)縮略詞的索引、遺傳率和遺傳率的參考文獻。
      [0024] 圖5A-J為具有效應評價的典型基因型相關(guān)性的表。
      [0025] 圖6A-F為典型基因型相關(guān)性和估計的相對危險度的表。
      [00%]圖7為示例報告。
      [0027]圖8為用于分析和通過網(wǎng)絡(luò)傳送基因組譜和表型譜的系統(tǒng)的示意圖。
      [002引圖9為表明本發(fā)明的商業(yè)方法方面的流程圖。
      [0029] 圖10為示意圖,表明所公布的具有特定優(yōu)勢比的CElK高加索人家系/種族)的SNP 不能假定在具有不同的祖先背景的不同群體(YRI,約魯己人家系/種族,參見HapMap計劃 (http: /A曰pm曰P. org/h曰pm曰ppopul曰tions. html. en))中才晌 D
      【具體實施方式】
      [0030] 本發(fā)明提供了基于存儲的個體或個體組的基因組譜來產(chǎn)生表型譜的方法和系統(tǒng), W及基于存儲的基因組譜容易地產(chǎn)生原始的和更新的表型譜的方法和系統(tǒng)。通過從由個體 獲得的生物樣品確定基因型來產(chǎn)生基因組譜。得自個體的生物樣品可W是可從中獲得遺傳 樣品的任何樣品。樣品可來自口腔拭子、唾液、血液、頭發(fā)或任何其它類型的組織樣品。然后 可從生物樣品確定基因型?;蛐涂蒞是任何遺傳性變型或生物標志物,例如單核巧酸多 態(tài)性(SNP)、單倍體型或基因組序列?;蛐涂蒞是個體的完整基因組序列。基因型可由產(chǎn) 生成千或上百萬的數(shù)據(jù)點的高通量分析獲得,例如對于大多數(shù)或所有已知的SNP的微陣列 分析。在另一些實施方式中,還可W通過高通量測序來確定基因型。
      [0031] 基因型形成個體的基因組譜。基因組譜被數(shù)字化地存儲,且方便地在任何時間點 訪問W產(chǎn)生表型譜。通過應用使基因型與表型相關(guān)或關(guān)聯(lián)的規(guī)則來產(chǎn)生表型譜。可W基于 表明基因型與表型之間的相關(guān)性的科學研究來制定規(guī)則。該相關(guān)性可由一個或多個專家組 成的委員會評議(curated)或確定。通過將規(guī)則應用于個體的基因組譜,可W確定個體的基 因型與表型之間的相關(guān)性。個體的表型譜將具有運一確定性。該確定可為個體的基因型與 給定的表型之間的正相關(guān)性,從而個體具有給定的表型或?qū)a(chǎn)生該表型。或者,也可確定 為個體不會具有或不會產(chǎn)生給定的表型。在其它的實施方式中,該確定可W是危險因子、估 計值或者個體具有或?qū)a(chǎn)生表型的概率。
      [0032] 可W基于多種規(guī)則進行確定,例如,可W將多種規(guī)則應用于基因組譜W確定個體 基因型與特定表型的關(guān)聯(lián)。確定過程也可W包括特定于個體的因素,例如種族、性別、生活 方式、年齡、環(huán)境、家族病史、個人病史和其它已知表型。特定因素的并入可W通過修正現(xiàn)有 的規(guī)則來包括運些因素。或者,可由運些因素產(chǎn)生單獨的規(guī)則,且在已應用現(xiàn)有的規(guī)則之后 應用到個體的表型確定中。
      [0033] 表型可W包括任何可測定的性狀或者特性,例如對于某種疾病的易感性或者對于 藥物治療的反應??蒞包括的其它表型是軀體和精神性狀,例如,身高、體重、頭發(fā)顏色、眼 睛顏色、曬斑敏感性、尺碼、記憶力、智力、樂觀程度、整體性情。表型也可W包括與其他個體 或生物體的遺傳比較。例如,個體可能對他們的基因組譜與名人的基因組譜之間的相似性 感興趣。他們也可能使他們的基因組譜與其它生物體(例如細菌、植物或其它動物)進行比 較。
      [0034] 在本發(fā)明的另一方面中,組合并分析了關(guān)于多種遺傳標記與一種或多種疾病或狀 態(tài)的關(guān)聯(lián)的信息W獲得遺傳綜合指數(shù)(Genetic Composite Index、GCI)評分(例如PCT公布 NO.W02008/067551中描述的,其通過引用方式結(jié)合在此)。運一評分包括了已知的危險因子 W及其它信息和假設(shè),例如,等位基因頻率和疾病的流行度。GCI可W用于定量評估疾病或 者狀態(tài)與一系列遺傳標記的綜合效應的關(guān)聯(lián)。GCI評分可W用于基于現(xiàn)有科學研究向未受 過遺傳學訓練的人提供有關(guān)與相關(guān)群體相比其個體患病風險的可靠的(例如,穩(wěn)固的)、可 理解的和/或直觀的認識。GCI評分可W用于生成GCI Plus評分,如PCT公布No.W02008/ 067551中所述。GCI plus評分可包括所有的GCI假設(shè),包括狀態(tài)的風險(例如,終生風險)、年 齡限定的流行度和/或年齡限定的發(fā)病率。然后個體的終生風險可W計算為與個體GCI評分 除W平均GCI評分成比例的GCI Plus評分。平均GCI評分可W由具有相似家系背景的個體組 確定,例如一組高加索人、亞洲人、東印度人或者其他具有共同家系背景的組。所述組可W 由至少5、10、15、20、25、30、35、40、45、50、55或60個個體組成。在某些實施方式中,平均值可 W由至少75、80、95或100個個體確定。GCI Plus評分可W通過確定個體的GCI評分,用平均 相對風險去除該GCI評分,并乘W狀態(tài)或表型的終生風險來確定。例如,使用來自PCT公布 齡.胖02008/067551的數(shù)據(jù)(例如圖22和/或圖25^及圖24的信息)來計算6(:1?1113評分(例 如圖19)。
      [0035] 本發(fā)明包括使用此處描述的GCI評分,本領(lǐng)域普通技術(shù)人員將會容易地認識使用 GCI評分或其變化來代替在此描述的GCI評分。在一個實施方式中,對于各感興趣的疾病或 者狀態(tài)生成GCI評分??蒞集中運些GCI評分W形成個體的風險譜。GCI評分可被數(shù)字化存 儲,從而在任何時間點均可容易地使用它們來產(chǎn)生風險譜。風險譜可W按照大的疾病分類 進行分解,例如,癌癥、屯、臟病、代謝素亂、精神素亂、骨病或者老年病(age on-set disorder)。大的疾病分類可W進一步被分解成子類。例如,對于如癌癥的大的分類,可W例 如按類型(肉瘤、癌瘤或者白血病等)或者按組織特異性(神經(jīng)、乳腺、卵巢、睪丸、前列腺、 骨、淋己結(jié)、膜腺、食道、胃、肝、腦、肺、腎等巧U出癌癥的子類。
      [0036] 在另一個實施方式中,對個體產(chǎn)生GCI評分,向他們提供容易理解的關(guān)于個體獲得 至少一種疾病或狀態(tài)的風險或?qū)τ谥辽僖环N疾病或狀態(tài)的易感性的信息。在一個實施方式 中,對于不同的疾病或狀態(tài)生成多項GCI評分。在另一實施方式中,可W通過在線入口訪問 至少一項GCI評分?;蛘?,可W W紙件形式提供至少一項GCI評分,后續(xù)的更新也W紙件形式 提供。在一個實施方式中,向注冊用戶提供對于至少一項GCI評分的訪問,該注冊用戶是預 訂服務的個體。在一個替代的實施方式中,向非注冊用戶提供訪問權(quán)限,其中他們可W具有 訪問他們的GCI評分中的至少一項的受限的訪問權(quán)限,或者他們可W允許生成他們的GCI評 分中的至少一項的初始報告,但是僅通過付費訂制才生成更新的報告。在另一實施方式中, 醫(yī)療保健管理者和提供者,例如護理人員、醫(yī)生和遺傳顧問,也可W具有訪問個體GCI評分 中的至少一項的權(quán)限。。
      [0037] 總之,對于個體所確定的相關(guān)表型的集合組成該個體的表型譜。表型譜可W通過 在線入口訪問?;蛘?,表型譜可W按照在特定時間存在的形式W紙件形式提供,后續(xù)的更新 也W紙件形式提供。表型譜也可W通過在線入口提供。該在線入口可W任選地為加密的在 線入口。表型譜的訪問權(quán)可W提供給注冊用戶,該注冊用戶為訂制生成表型與基因型之間 的相關(guān)性的規(guī)則、確定個體的基因組圖譜、將規(guī)則應用于基因組圖譜和生成個體的表型譜 的服務的個體。訪問權(quán)也可W提供給非注冊用戶,其中他們可W具有訪問他們的表型譜和/ 或報告的有限權(quán)限,或者可W允許生成初始報告或表型譜,但是只有通過付費訂制才生成 更新的報告。醫(yī)療保健管理者和提供者,例如護理人員、醫(yī)生和遺傳顧問也可W具有表型譜 的訪問權(quán)。
      [0038] 在本發(fā)明的另一方面中,可W為注冊用戶和非注冊用戶生成基因組譜,并且進行 數(shù)字存儲,但是對于表型譜和報告的訪問可W限于注冊用戶。在另一變型中,注冊用戶和非 注冊用戶都可W訪問其基因型譜和表型譜,但是非注冊用戶具有受限制的訪問權(quán)限或者允 許生成有限的報告,然而注冊用戶具有完整的訪問權(quán)限并且可W允許生成完整報告。在另 一實施方式中,注冊用戶和非注冊用戶最初可W具有完全的訪問權(quán)限或者完整的初始報 告,但僅注冊用戶可W訪問基于其存儲的基因組譜更新的報告。
      [0039] 也可W有基本注冊模式?;咀钥蒞提供表型譜,其中注冊用戶可W選擇將所 有現(xiàn)有規(guī)則應用于他們的基因組譜,或者將現(xiàn)有規(guī)則的子集應用于他們的基因組譜。例如, 他們可W選擇僅應用可處置(actionable)的疾病表型的規(guī)則。基本注冊可W在注冊等級內(nèi) 具有不同水平。例如,不同的水平可W取決于注冊用戶想要與他們的基因組圖譜關(guān)聯(lián)的表 型數(shù)目,或者取決于可W訪問他們的表型譜的人員的數(shù)目。基本注冊的另一水平可W將特 定于個體的因素,例如早已知道的表型(如年齡、性別或者病史)并入他們的表型譜。
      [0040] 基本注冊的再另一個水平可W允許個體生成對于疾病或狀態(tài)的至少一項GCI評 分。如果由于用于生成至少一項GCI評分的分析中的變化而導致至少一項GCI評分的任何變 化,運一水平的變型形式可W進一步允許個體指定生成對于疾病或者狀態(tài)的至少一項GCI 評分的自動更新。在一些實施方式中,可W通過電子郵件、語音信息、文本信息、郵遞或傳真 向個體通告自動更新。
      [0041] 注冊用戶也可W生成具有他們的表型譜W及關(guān)于表型的信息(例如關(guān)于表型的遺 傳和醫(yī)療信息)的報告。例如,報告中可W包括群體中表型的流行度、用于相關(guān)的遺傳變異、 引起表型的分子機制、對于表型的治療方法、對于表型的治療選擇和預防性行動。在其它實 施方式中,報告還可W包括例如個體的基因型與其他個體(如名人或者其他知名人±)的基 因型之間的相似性的信息。關(guān)于相似性的信息可W是,但不限于同源性百分比、相同變異的 數(shù)目和可能相似的表型。運些報告可W進一步包括至少一項GCI評分。
      [0042] 如果在線訪問報告,則報告也可W提供連接到具有關(guān)于表型的進一步信息的其他 位置的鏈接、連接到具有相同表型或者一個或多個相似表型的人的在線支持小組和留言板 的鏈接、聯(lián)系在線遺傳顧問或醫(yī)生的鏈接或者連接到安排遺傳顧問或醫(yī)師的電話或現(xiàn)場預 約的鏈接。如果報告是紙件形式,則信息可W是上述鏈接的站點位置或者遺傳顧問或醫(yī)生 的電話號碼和地址。注冊用戶也可W選擇哪些表型包括在他們的表型譜中和哪些信息包括 在他們的報告中。表型譜和報告也可W被個體的醫(yī)療保健管理者或提供者取得,例如護理 人員、醫(yī)生、精神病醫(yī)生、屯、理學家、治療專家或者遺傳顧問。注冊用戶也能夠選擇是否表型 譜和報告或者其部分內(nèi)容由個體的醫(yī)療保健管理者或提供者得到。
      [0043] 本發(fā)明也可W包括注冊的高級水平。注冊的高級水平在生成初始表型譜和報告之 后數(shù)字化地保持其基因組譜,并且注冊用戶能夠利用由最近的研究得到的更新的相關(guān)性生 成表型譜和報告。在另一實施方式中,注冊用戶能夠利用由最近的研究得到的更新的相關(guān) 性生成風險譜和報告。由于研究掲示出基因型與表型、疾病或者狀態(tài)之間的新的相關(guān)性,基 于運些新的相關(guān)性將產(chǎn)生新的規(guī)則,并且新的規(guī)則能夠應用于已經(jīng)存儲和保持的基因組 譜。新的規(guī)則可W關(guān)聯(lián)先前未與任何表型關(guān)聯(lián)的基因型、使基因型與新的表型相關(guān)聯(lián)、修正 現(xiàn)有的相關(guān)性或者基于新發(fā)現(xiàn)的基因型與疾病或狀態(tài)之間的關(guān)聯(lián)提供調(diào)整GCI評分的基 礎(chǔ)。可W通過電子郵件或者其它電子方式告知注冊用戶新的相關(guān)性,并且如果是感興趣的 表型,他們可W選擇用新的相關(guān)性更新他們的表型譜。注冊用戶可W選擇為每次更新付費、 為在指定時間期限(例如,3個月、6個月或者1年)內(nèi)的多次更新或無限次更新付費的注冊方 式。另一注冊水平可W是,無論何時基于新的相關(guān)性產(chǎn)生了新的規(guī)則,注冊用戶使他們的表 型譜或者風險譜自動更新,而不是個體選擇何時更新他們的表型譜或風險譜。
      [0044] 在注冊的另一方面,注冊用戶可W向非注冊用戶介紹W下服務:生成表型與基因 型之間的相關(guān)性規(guī)則,確定個體的基因組譜,將規(guī)則應用于基因組譜,并且生成個體的表型 譜。注冊用戶通過介紹可W使注冊用戶得到優(yōu)惠的服務訂制價格或者使其現(xiàn)有的注冊升 級。被介紹的個體可W在有限時間內(nèi)免費訪問或者享受折扣注冊價格。
      [0045] 可W對于人類和非人類個體生成表型譜和報告W及風險譜和報告。例如,個體可 包括其它的哺乳動物,例如牛、馬、羊、犬或貓。如在此所使用的,注冊用戶是通過購買或支 付一項或多項服務而訂制服務的人類個體。服務可W包括,但不限于W下一種或者多種:確 定他們自己或另一個體(例如注冊用戶的孩子或?qū)櫸铮┑幕蚪M譜;獲得表型譜;更新表型 譜和獲得基于他們的基因組譜和表型譜的報告。。
      [0046] 在本發(fā)明的另一方面,可W從個體聚集得出"區(qū)域部署(field-deployed)"機制W 生成個體的表型譜。在優(yōu)選實施方式中,個體可W具有基于遺傳信息生成的初始表型譜。例 如,生成包括對于不同表型的危險因子W及建議的治療或預防措施的初始表型譜。例如,表 型譜可W包括對于關(guān)于某一狀態(tài)的可利用的藥物治療的信息和/或?qū)τ陲嬍匙兓蝈憻挿?案的建議。個體可W選擇去看醫(yī)生或遺傳顧問或者通過網(wǎng)絡(luò)入口或電話接觸醫(yī)生或遺傳顧 問W討論他們的表型譜。個體可W決定采取某種行動路線,例如,采用特定的藥物治療、改 變他們的飲食等。
      [0047] 而后,個體可W隨后提交生物樣品W評估其身體狀態(tài)的變化和危險因子的可能變 化。個體可W通過直接將生物樣品提交給生成基因組譜和表型譜的機構(gòu)(或者相關(guān)機構(gòu),例 如由生成遺傳分布圖和表型譜的實體定約的機構(gòu))確定該變化?;蛘?,個體可W利用"區(qū)域 部署"機制,其中個體可W將他們的唾液、血液或者其它生物樣品提交到其家庭處的檢測裝 置中,由第=方進行分析,且數(shù)據(jù)經(jīng)傳輸W包括在另一表型譜中。例如,個體可W接收基于 其遺傳數(shù)據(jù)的初始表型報告從而向具有增大的屯、肌梗死(MI)終生風險的個體報告。該報告 也可W具有預防措施的建議W降低MI的風險,例如降膽固醇藥物和飲食改變。個體可W選 擇接觸遺傳顧問或醫(yī)生W討論該報告和預防措施并且決定改變他們的飲食。在采用新的飲 食一段時間之后,個體可W去看他們的個人醫(yī)生W測量其膽固醇水平。可W將新的信息(膽 固醇水平)傳送(例如,通過Internet)給具有基因組信息的實體,并且新的信息用于生成具 有屯、肌梗死和/或其它狀態(tài)的新的危險因子的個體的新表型譜。
      [0048] 個體也可W使用"區(qū)域部署"機制或者直接機制W確定其對于具體藥物治療的個 體反應。例如,個體可W測量其對于藥物的反應,并且該信息可W用于確定更有效的治療。 可測定的信息包括,但不限于代謝產(chǎn)物水平、葡萄糖水平、離子水平(例如,巧、鋼、鐘、鐵)、 維生素、血細胞計數(shù)、體重指數(shù)(BMI)、蛋白質(zhì)水平、轉(zhuǎn)錄物水平、屯、率等,運些信息能夠通過 容易利用的方法確定并且能夠包括在算法中W與初始基因組譜結(jié)合來確定修正的整體風 險評估評分。
      [0049] 術(shù)語"生物樣品"是指可從中分離個體的遺傳樣品的任何生物樣品。
      [0050] 在此使用的"遺傳樣品"是指從個體獲得的或源自個體的DNA和/或RNA。
      [0051] 在此使用的術(shù)語"基因組"是指人類細胞核中發(fā)現(xiàn)的整套染色體DNA。術(shù)語"基因組 DNA"是指人類細胞核中天然存在的一個或多個染色體DNA分子,或染色DNA分子的部分。
      [0052] 術(shù)語"基因組譜"是指關(guān)于個體基因的一組信息,例如是否存在特定的SNP或突變。 基因組譜包括個體的基因型。基因組譜還可W是個體的基本上完整的基因組序列。在一些 實施方式中,基因組譜可為至少60%、80%或95%的完整的個體基因組序列?;蚪M譜可為 大約100%的完整的個體基因組序列。提到基因組譜時,"其一部分"是指完整基因組的基因 組譜的子集的基因組譜。
      [0053] 術(shù)語"基因型"是指個體DNA的特定的遺傳組成?;蛐涂砂▊€體的遺傳性變型 和遺傳標記。遺傳標記和遺傳性變型可包括核巧酸重復、核巧酸插入、核巧酸缺失、染色體 轉(zhuǎn)位、染色體復制或拷貝數(shù)變異??截悢?shù)變異可包括微衛(wèi)星重復、核巧酸重復、著絲粒重復 或端粒重復?;蛐瓦€可W是SNP、單倍體型或二倍體型(diplotype)。單倍體型可指基因座 或等位基因。單倍體型還被稱作統(tǒng)計學關(guān)聯(lián)的單個染色單體的一組單核巧酸多態(tài)性(SNP)。 二倍體型是一組單倍體型。
      [0054] 術(shù)語單核巧酸多態(tài)性或"SNP"是指在染色體上相對于存在于人類種群中一基因座 上的含氮堿基的同一性表現(xiàn)出變異(例如至少1個百分點(1%))的特定基因座。例如,在一 個個體在給定基因的特定核巧酸位置上可能具有腺巧(A)的情況下,另一個體可能在運一 位置上有胞喀晚(C)、鳥嚷嶺(G)或者胸腺喀晚(T),從而在運個特定位置上存在SNP。
      [0055] 此處使用的術(shù)語"SNP基因組譜"是指整個個體全基因組DNA序列的SNP位置上給定 的個體DNA的堿基含量。"SNP譜"可指整個基因組譜,或可指其部分,例如可與特定的基因或 特定的基因組相關(guān)的更局部的SNP譜。
      [0056] 術(shù)語"表型"用于描述個體的定量性狀或者特征。表型包括,但不限于醫(yī)學和非醫(yī) 學狀態(tài)。醫(yī)學狀態(tài)包括疾病和素亂。表型也可W包括身體性狀如發(fā)色、生理性狀如肺容量、 精神性狀如記憶保持、情緒性狀如憤怒控制能力、種族特征如種族背景、家系特征如個體出 身位置W及年齡特征如年齡期待或不同表型的發(fā)病年齡。表型也可W是單基因的,其中據(jù) 認為一個基因可能與表型相關(guān)聯(lián);或者是多基因的,其中一個W上的基因與表型相關(guān)聯(lián)。
      [0057] "規(guī)則"用于定義基因型與表型之間的相關(guān)性。規(guī)則可W通過數(shù)值定義相關(guān)性,例 如通過百分率、危險因子或者置信度評分。規(guī)則可W包括多個基因型與表型的相關(guān)性。"規(guī) 則集"包括一個W上的規(guī)則。"新規(guī)則"可W是表明其規(guī)則目前尚不存在的基因型與表型之 間的相關(guān)性的規(guī)則。新規(guī)則可W將未關(guān)聯(lián)的基因型與表型相關(guān)聯(lián)。新規(guī)則也可W將已經(jīng)與 表型相關(guān)聯(lián)的基因型與先前不關(guān)聯(lián)的表型相關(guān)聯(lián)。"新規(guī)則"也可W是由其它因素(包括另 一規(guī)則)修正的現(xiàn)有規(guī)則。現(xiàn)有規(guī)則可W由于個體的已知特征,例如種族、家系、地理、性別、 年齡、家族史或其它先前確定的表型,而進行修正。
      [0058] 如在此所使用的,"基因型相關(guān)性"指個體基因型(例如某一突變或多個突變的存 在)與傾向于發(fā)生一種表型(例如特定疾病、狀態(tài)、身體狀態(tài)和/或精神狀態(tài))的可能性之間 的統(tǒng)計相關(guān)性。在特定基因型存在下觀察到特定表型的頻率決定了基因型相關(guān)性的程度或 者出現(xiàn)特定的表型的可能性。例如,正如在此所詳述的,導致載脂蛋白E4同種型的SNP與傾 向于早發(fā)型阿爾茨海默氏病相關(guān)?;蛐拖嚓P(guān)性也可W指其中不傾向于產(chǎn)生表型的相關(guān)性 或者負相關(guān)性?;蛐拖嚓P(guān)性也可W表示個體具有表型或者傾向于發(fā)生表型的評估??蒞 由數(shù)值表示基因型相關(guān)性,例如百分數(shù)、相對風險因子、效應評價或者置信度評分。
      [0059] 術(shù)語"表型譜"是指與個體的一個基因型或者多個基因型相關(guān)的多個表型的集合。 表型譜可W包括通過將一條或多條規(guī)則應用于基因組譜所產(chǎn)生的信息或者有關(guān)應用于基 因組譜的基因型相關(guān)性的信息。可W通過應用將多個基因型與表型關(guān)聯(lián)的規(guī)則生成表型 譜。概率或評估可W表示為數(shù)值,例如百分數(shù)、數(shù)字的危險因子或者數(shù)字的置信區(qū)間。概率 也可W表示為高、中或低。表型譜也可W表明表型是否存在或者產(chǎn)生表型的風險。例如,表 型譜可W表明藍眼睛的存在或者發(fā)生糖尿病的高風險。表型譜也可W表明預測的預后、治 療效果或者對醫(yī)學狀態(tài)的治療的反應。
      [0060] 術(shù)語風險譜是指對于一種W上的疾病或狀態(tài)的GCI評分的集合。GCI評分基于對個 體基因型與一種或多種疾病或狀態(tài)之間的關(guān)聯(lián)的分析。風險譜可W顯示按疾病分類分組的 GCI評分。進一步,風險譜還可W顯示如何隨個體年齡或者多種危險因子的調(diào)整而預測GCI 評分的變化的信息。例如,對于特定疾病的GCI評分可W考慮飲食變化或者采取的預防措施 (停止吸煙、服藥、雙側(cè)根治性乳房切除術(shù)、子宮切除術(shù))的效應。GCI評分可W顯示為數(shù)值計 量、圖形顯示、聽覺反饋或者任何前述方式的組合。
      [0061] 在此使用的術(shù)語"在線入口"是指個體通過計算機和互聯(lián)網(wǎng)網(wǎng)站、電話或者允許對 信息進行類似訪問的其它方式方便地訪問的信息源。在線入口可W是加密網(wǎng)站。該網(wǎng)站可 W提供與其它加密和非加密網(wǎng)站的鏈接,例如連接具有個體的表型譜的加密網(wǎng)站的鏈接或 者連接非加密網(wǎng)站(如共有特定表型的個體的留言板)的鏈接。
      [0062] 除非特別表明,本發(fā)明的實施可W利用本領(lǐng)域技術(shù)人員能力范圍內(nèi)的分子生物 學、細胞生物學、生物化學和免疫學的常規(guī)技術(shù)和使用說明。運些常規(guī)技術(shù)包括核酸分離、 聚合物陣列合成、雜交、連接和使用標記物的雜交檢測。合適的技術(shù)的特定的例子在此例證 和作為參考。但是,也可W使用其它等效的常規(guī)方法。其它的常規(guī)的技術(shù)和描述可參見標準 實驗室手冊和教科書,例如Genome Analysis = A Laboratory Manual Series(VolsJ-IV), PCR Primer:A Laboratory Manual ,Molecular Cloning:A Laboratory Manual(均來自 Cold Spring Harbor Laboratory Press);Stryer,L.(1995)Biochemistry(4th Ed.) Freeman,New York;Gait, ('Oligonucleotide Synthesis:A Practical Approach"1984, IRL Press,London,Nelson和Cox(2000);Lehninger,Principles of Biochemistry 3rd Ed.,W.H.Freeman 化b.,New York,N.Y.;和 Berg 等人(2002)Biochemist;ry,5th Ed., W.H.化eeman化b.,New化rk,N.Y.,其全部通過引用方式結(jié)合在此。
      [0063] 本發(fā)明的方法包括分析個體基因組譜W向個體提供關(guān)于表型的分子信息。正如在 此所詳述的,個體提供生成個人基因組譜的遺傳樣品。通過使基因組譜與已確立和驗證的 人類基因型相關(guān)性的數(shù)據(jù)庫相比較,查詢個體基因組譜有關(guān)基因型相關(guān)性的數(shù)據(jù)。已確立 和驗證的基因型相關(guān)性的數(shù)據(jù)庫可W來自同行評議(peer-reviewed)的文獻,并且由本領(lǐng) 域中一個或多個專家(例如遺傳學家、流行病學家或者統(tǒng)計學家)的委員會進一步評判,并 進行驗證。在優(yōu)選實施方式中,規(guī)則基于經(jīng)驗證的基因型相關(guān)性制定,并應用于個體的基因 組譜W生成表型譜。個體基因組譜的分析結(jié)果(表型譜)W及解釋和支持性信息一起提供給 個體或個人的醫(yī)療保健管理者,從而給予對個體保健進行個性化選擇的能力。
      [0064] 本發(fā)明的方法在圖1中詳細描述,其中首先生成個體的基因組譜。個體基因組譜將 包括有關(guān)基于遺傳變異和遺傳標記的個體基因的信息。遺傳變異是基因型,其組成基因組 譜。運些遺傳變異或者遺傳標記包括,但不限于單核巧酸多態(tài)性、單和/或多核巧酸重復、單 和/或多核巧酸缺失、微衛(wèi)星重復(通常具有5~1,000重復單元的小量核巧酸重復)、二核巧 酸重復、=核巧酸重復、序列重排(包括易位和重復)、拷貝數(shù)變異(在特定基因座上的缺失 和增加)等。其它遺傳變異包括染色體重復和易位W及著絲粒重復和端粒重復。
      [00化]基因型還可包括單倍體型和二倍體型。在一些實施方式中,基因組譜可具有至少 100000、300000、500000或1000000個基因型。在一些實施方式中,基因組譜為個體的基本完 整的基因組序列。在其它的實施方式中,基因組譜為至少60%、80%或95%的個體的完整基 因組序列?;蚪M譜可為大約100%的個體的完整基因組序列。包含祀物質(zhì)的遺傳樣品包括 但不限于未擴增的基因組DNA或RNA樣品或擴增的DNA(或cDNA)。祀物質(zhì)可為包含特別感興 趣的遺傳標記的基因組DNA的特定區(qū)域。
      [0066]在圖1的102步驟中,個體的遺傳樣品從個體的生物樣品中分離出來。運樣的生物 樣品包括但不限于血液、頭發(fā)、皮膚、唾液、精液、尿液、糞便、汗液、口腔和不同身體組織。在 一些實施方式中,組織樣品可直接由個體收集,例如個體可使用拭子從他們的頰內(nèi)側(cè)獲得 口腔樣品。其它的樣品例如唾液、精液、尿液、糞便或汗液也可由個體自己提供。其它生物樣 品可W由保健專業(yè)人員(例如抽血者、護±或者醫(yī)生)提取。例如,血液樣品可W由護±從個 體抽取。組織活檢可W由保健專業(yè)人員進行,并且保健專業(yè)人員也可W利用試劑盒W有效 地獲得樣品??蒞移取小的柱面皮膚樣品或者使用針移取小的組織或流體樣品。
      [0067] 在一些實施方式中,向個體提供具有用于個體生物樣品的樣品采集容器的試劑 盒。試劑盒也可W提供個體直接采集其自身樣品的說明書,例如需提供多少頭發(fā)、尿、汗液 或者唾液。試劑盒也可W包括個體要求由保健專業(yè)人員提取組織樣品的說明書。試劑盒可 W包括可由第=方采集樣品的場所,例如可W將試劑盒提供給隨后從個體采集樣品的保健 機構(gòu)。試劑盒還可W提供用于將樣品遞送至樣品處理機構(gòu)的返回包裝,在該機構(gòu)中遺傳物 質(zhì)從生物樣品中分離(步驟104)。
      [0068] DNA或RNA的遺傳樣品可根據(jù)幾種已知的生化和分子生物學方法的任一種從生物 樣品中進行分離,例如參見Sambrook等人,Molecular Cloning = A Laboratory Manual (Cold Spring Harbor Laboratoir,New化rk)( 1989)。還存在幾種用于從生物樣品中分離 DNA或RNA的市售的試劑盒和試劑,例如可從DNA Genotek、Gentra Systems、Qiagen、Ambion 和其它供應商購買的那些??谇粯悠吩噭┖泻苋菀踪徺I到,例如從Epi centre BiotechnoIogies購買的MasterAmp?Buccal Swab DNA提取試劑盒,且從血樣中提取DNA的 試劑盒也容易購買到,例如從Sigma Al化ich購買的Extract-N-Amp???蒞通過使用蛋白酶 消化組織和加熱、離屯、樣品和使用酪一氯仿來提取不想要的物質(zhì)并使DNA留在水相中來從 其它的組織中獲得DNA??墒褂靡掖汲恋矸▉磉M一步分離DNA。
      [0069] 在一個優(yōu)選的實施方案中,從唾液中分離基因組DNA。例如,使用可從DNA Genotek 購買的DNA自收集試劑盒技術(shù),個體可采集用于臨床處理的唾液樣品。樣品可W便利地在室 溫下進行儲存和運輸。在將樣品轉(zhuǎn)移到用于處理的適合的實驗室之后,通過熱變性和蛋白 酶消化樣品(通常使用收集試劑盒供應商提供的試劑,在50°C下至少一個小時)來分離DNA。 然后離屯、樣品,使用乙醇沉淀上清液。DNA沉淀懸浮于適于后續(xù)分析的緩沖液中。
      [0070] 在另一個實施方式中,RNA可用作遺傳樣品。特別地,表達的遺傳變異可從mRNA中 識別。術(shù)語"信使RNA"或"mRNA"包括但不限于前mRNA轉(zhuǎn)錄物、轉(zhuǎn)錄物加工中間體、準備用于 一個基因或多個基因的翻譯和轉(zhuǎn)錄的成熟mRNA或者源自mRNA轉(zhuǎn)錄物的核酸。轉(zhuǎn)錄物加工可 W包括剪接、編輯和降解。如在此所使用的,源自mRNA轉(zhuǎn)錄物的核酸是指mRNA轉(zhuǎn)錄物或其子 序列最終充當其合成模板的核酸。因此,由mRNA反轉(zhuǎn)錄的CDNA、從CDNA擴增的DNA、從擴增的 DNA轉(zhuǎn)錄的RNA等都是源自mRNA轉(zhuǎn)錄物??蒞使用本領(lǐng)域已知的方法從幾種身體組織中的任 意一種分離RNA,例如使用從PreAnalytiX獲得的PAXgene?血液RNA系統(tǒng)從未分級的 (unfractionated)全血中分離RNA。典型地,mRNA將用于反轉(zhuǎn)錄cDNA,cDNA隨后被使用或進 行擴增W用于基因變異分析。
      [0071] 基因組譜分析之前,遺傳樣品通常會從DNA或從RNA反轉(zhuǎn)錄的CDNA進行擴增。可通 過一些方法來擴增DNA,其中許多方法使用PCR。參見例如PCR Technology = Principles and Applications for DNA Amplification(Ed.H.A.Erlich,Freeman Press,NY,N.Y.,1992); PCR Protocols : A Guide to Methods and Applications(Eds . Innis等人,Academic Press,San Diego,Calif.,1990);Mattila等人,Nucleic Acids Res.19,4967(1991); Ecke;rt 等人,PCR Methods and Applications 1,17(1991) ;PCR 化 ds.McPherson 等人,I 化 Press ,Oxford);和美國專利No. 4,683,202,4,683,195,4,800,159 4,965,188和5,333, 675,其全部通過引用方式結(jié)合在本文中。
      [0072] 其它合適的擴增方法包括連接酶鏈反應化CR)(例如Wu和Wallace ,Genomics 4, 560( 1989) ,Landegren等人,Science 241,1077( 1988)和Barringer等人.Gene 89 :117 (1990))、轉(zhuǎn)錄擴增化woh等人,Proc.化tl.Acad.Sci.USA 86:1173-1177(1989)和冊88/ 10315)、自主序列復制(Guatelli 等人,Proc. Nat. Acad. Sci. USA, 87 :1874-1878( 1990)和 W090/06995)、目標多聚核巧酸序列的選擇性擴增(美國專利No. 6,410,276)、共有序列引物 聚合酶鏈反應(CP-PCR)(美國專利No. 4,437,975)、任機引物聚合酶鏈反應(AP-PCR)(美國 專利齡.5,413,909,5,861,245)、基于核酸的序列擴增(魁854)、滾環(huán)擴增(亂4)、多重替換 擴增(MDA)(美國專利No. 6,124,120和6,323,009)和環(huán)對環(huán)擴增(C2CA)( Dahl等人 Proc.化tl .Acad. Sci 101:4548-4553(2004))。(參見美國專利No. 5,409,818,5,554,517, 和6,063,603,其全部通過引用方式結(jié)合在本文)。還可使用的其它的擴增方法描述在美國 專利No. 5,242,794,5,494,810,5,409,818,4,988,617,6,063,603和5,554,517 中和美國專 利申請序列號No. 09/854,317中,其全部通過引用方式結(jié)合在本文中。
      [0073] 使用幾種方法中的任意方法來進行步驟106中基因組譜的產(chǎn)生??蒞使用幾種方 法中的任一種來進行基因組譜的產(chǎn)生。本領(lǐng)域中已知幾種方法可識別遺傳變異,它們包括 但不限于通過幾種方法的任意一種的DNA測序、基于PCR的方法、片段長度多態(tài)性分析(限制 性片段長度多態(tài)性(RFLP)、分裂片段長度多態(tài)性(CFLP))、使用等位基因特異性的寡核巧酸 作為模板的雜交方法(例如TaqMan分析和微陣列,其進一步在此描述)、使用引物延伸反應 的方法、質(zhì)譜(例如MALDI-T0F/MS方法)等,例如Kwok,Pharmocogenomicsl :95-100(2000)中 描述的。其它的方法包括侵入物方法,例如單重(monoplex)和二重(biplex)侵入物分析(例 如可從Wave Technologies ,Madison,WI獲得的,且描述于OliVier等人,Nucl .Acids Res.30:e53(2002)中)。
      [0074] 在一個實施方式中,高密度DNA陣列被用于SNP識別和譜產(chǎn)生。運樣的陣列是可從 Affymetrix和I Ilumina獲得的(例如參見Affymetr i xGeneChip⑩500K測試手冊, Affymetrix, Santa Clara, CA(在此引入作為參考);S色ntrix⑧human化p650Y基因型微球 忍片,11 Iumina,San Die邑0,CA)。
      [00"7日]例如,可通過使用Affymetrix Genome Wide Human SNP陣列6.0對多于900000個 的SNP進行基因分型來產(chǎn)生SNP譜?;蛘?,可W通過使用Affymetrix Gene化ip Human Mapping 500K Array Set確定通過全基因組采樣分析的多于500000個SNP。在運些測定中, 人類基因組的子集使用限制性酶消化的、接頭連接的人類基因組DNA通過單引物擴增反應 來擴增。如圖2所示,然后可W確定連接的DNA的濃度。而后擴增的DNA斷裂,并且在繼續(xù)步驟 106前確定樣品的質(zhì)量。如果樣品符合PCR和片段化標準,則對樣品進行變性、標記和隨后與 涂覆的石英面上特定位置的小DNA探針組成的微陣列進行雜交。監(jiān)測隨擴增的DNA序列變化 的與各探針雜交的標記物的量,從而產(chǎn)生序列信息和最終的SNP基因分型。
      [0076]根據(jù)廠商的指導來使用Affymetrix Gene化ip 500K陣列。簡而言之,簡要地說,首 先用化Pl或5切1限制性內(nèi)切核酸酶消化分離的基因組DNA。然后消化的DNA與分別與化Pl或 5切1限制酶切DNA退火的化Pl或StW接頭寡核巧酸連接。然后連接后的包含接頭的DNA通過 PCR進行擴增W產(chǎn)生在約200至1100堿基對之間的擴增DNA片段,運由凝膠電泳所證實。符合 擴增標準的PCR產(chǎn)物進行純化和定量W進行片段化。PCR產(chǎn)物用D化Se I進行斷裂W達到最 佳的DNA忍片雜交。斷裂之后,DNA片段應小于250堿基對,并且平均為約180堿基對,運通過 凝膠電泳證實。然后使用末端脫氧核巧酸轉(zhuǎn)移酶W生物素化合物標記符合片段化標準的樣 品。接著將標記的片段變性,而后雜交到Gene化ip 250K陣列中。雜交之后,在掃描前按S步 的處理過程對陣列進行染色,所述的=部處理過程由下列步驟組成:抗生蛋白鏈菌素藻紅 蛋白(SAPE)染色,隨后是利用生物素化的抗抗生蛋白鏈菌素抗體(山羊)的抗體擴增步驟, 和用抗生蛋白鏈菌素藻紅蛋白(SAPE)的最終染色。在標記之后,陣列用陣列保持緩沖液覆 蓋,然后用例如Affymetrix GeneChip Scanner 3000的掃描儀進行掃描。
      [0077] 在Affymetrix GeneQiip Human Ma卵ing 500K Array Set掃描后,按照制造商的 指導進行數(shù)據(jù)分析,如圖3所示。簡要地說,使用Gene化ip操作軟件(GCOS)獲得原始數(shù)據(jù)。也 可W通過使用Affymehix Gene畑ip Command Console?獲得數(shù)據(jù)。獲得初始數(shù)據(jù)后用 Gene化ip基因分型分析軟件(GTYPE)進行分析。為了本發(fā)明的目的,排除GTY陽調(diào)用率(call rate)小于80 %的樣品。然后用BRLMM和/或SNiPer算法分析對樣品進行檢驗。排除BRLMM調(diào) 用率小于95 %或者SNiPer調(diào)用率小于98 %的樣品。最終,進行關(guān)聯(lián)分析,并且排除SNiPer質(zhì) 量指數(shù)小于0.45和/或哈迪-溫伯格(化rdy-Weinberg)p-值小于0.0 OOOl的樣品。
      [0078] 替代DNA微陣列分析或在DNA微陣列分析W外,可通過其它基于雜交的方法檢測遺 傳變異如SNP和突變,例如使用化qMan方法和其變型。TaqMan PCR、反復化qMan和實時PCR (RT-PCR)的其它變型(例如Livak等人,Nature Genet. ,9,:341-32( 1995)和Ranade等人 Genome Res.,11,1262-1268(2001)中描述的)也可用于在此公開的方法中。在一些實施方 式中,特定遺傳變異(例如SNP)的探針被標記形成化qMan探針。該探針通常為大約至少12、 15、18或20個堿基對長度。它們可為大約10-70、15-60、20-60或18-22個堿基對長度。探 針在5'末端標記有報告標記物,例如巧光團和在3'末端標記有該標記物的巧滅劑。報告標 記物可為當處于鄰近巧滅劑的位置(例如探針的長度)時其巧光被抑制或巧滅的任何巧光 分子。例如,報告標記物可為巧光團例如6-簇基巧光素(FAM)、四氯巧光素(TET)或其衍生 物,和巧滅劑四甲基若丹明(TAMRA)、二氨環(huán)化咯并嗎I噪S膚(MGB)或其衍生物。
      [0079] 當報告巧光團和巧滅劑處于鄰近位置(由探針長度分隔)時,巧光被巧滅。當探針 與目標序列(例如樣品中包含SNP的序列)退火時,具有5 '到3 '核酸外切酶活性的DNA聚合酶 (例如化q聚合物)可延長引物,核外切酶活性切除探針,從而將巧滅劑與報告巧光團分離, 因而報告巧光團可發(fā)巧光。該過程可W重復,例如在RT-PCR中。TaqMan探針通常與位于被設(shè) 計用于擴增序列的兩個引物之間的目標序列互補。因此,PCR產(chǎn)物的聚積可與釋放的巧光團 的聚積相關(guān),運是因為各探針可與新產(chǎn)生的PCR產(chǎn)物進行雜交。釋放的巧光團可被測量,因 而存在的目標序列的量可被確定。用于高通量基因分型的RT-PCR方法可被使用。
      [0080] 還可通過DNA測序來識別遺傳變異??蒞使用DNA測序?qū)€體基因組序列的主要部 分或者全部進行測序。通常,常用的DNA測序是基于聚丙締酷胺凝膠分級分離W解析鏈端片 段群(Sanger等人,Proc. Natl. Acad. Sci . USA 74:5463-5467(1977))。已經(jīng)開發(fā)出來的和繼 續(xù)進行開發(fā)的替代方法提高了 DNA測序的速度和簡便性。例如,高通量和單分子測序平臺可 從45化if e Sciences(化anford,CT) (Margulies等人,Nature 437 : 376-380(2005))、 Solexa(化yward,CA)、Helicos BioSciences Co;rporation(Camb;ridge ,MA)(美國申請序列 號齡.11/167046,于2005年6月23日提交)和^-(:〇'81〇3。1611。63化111。〇111,肥)(美國申請 序列號No. 11/118031,于2005年4月29日提交)商購得到,或者正由它們進行開發(fā)。
      [0081] 在步驟106中產(chǎn)生個體的基因組譜之后,該譜在步驟108中被數(shù)字化地存儲,該譜 可W加密的模式被數(shù)字化存儲。基因組譜被編碼成計算機可讀形式,W作為數(shù)據(jù)集的部分 進行存儲,并可作為數(shù)據(jù)庫進行存儲,其中基因組譜可"儲蓄(banked)",并可之后再次使 用。數(shù)據(jù)集包括多個數(shù)據(jù)點,其中各數(shù)據(jù)點設(shè)及個體。各數(shù)據(jù)點可W具有多個數(shù)據(jù)元素。一 個數(shù)據(jù)元素為一獨特的標識符,用于識別個體的基因組譜。它也可W是條形碼。另一數(shù)據(jù)元 素為基因型信息,例如SNP或個體基因組的核巧酸序列。對應基因型信息的數(shù)據(jù)元素也可包 括在數(shù)據(jù)點中。例如,如果基因型信息包括微陣列分析識別的SNP,那么其它的數(shù)據(jù)元素可 包括微陣列SNP識別號、SNP rs號和多態(tài)性核巧酸。其它的數(shù)據(jù)元素可為基因型信息的染色 體位置、數(shù)據(jù)的質(zhì)量量度、原始數(shù)據(jù)文檔、數(shù)據(jù)的圖像和提取強度得分。
      [0082] 個體的特異性因素,例如身體數(shù)據(jù)、醫(yī)學數(shù)據(jù)、種族、家系、地理、性別、年齡、家族 史、已知表型、人口數(shù)據(jù)、暴露數(shù)據(jù)(exposure data)、生活方式數(shù)據(jù)、行為數(shù)據(jù)和其它已知 表型,也可W被引入作為數(shù)據(jù)元素。例如,因素可包括但不限于個體的出生地、父母和/或祖 父母、親緣家系、居住地、祖先的居住地、環(huán)境條件、已知的健康狀況、已知的藥物相互作用、 家庭健康狀況、生活方式條件、飲食、運動習慣、婚姻狀態(tài)和身體測量數(shù)據(jù)(例如體重、身高、 膽固醇水平、屯、率、血壓、葡萄糖水平和本領(lǐng)域已知的其它測量)。個體的親戚或者祖先(例 如,父母和祖父母)的上述因素也可W加入作為數(shù)據(jù)元素,和用于確定個體的表型或癥狀的 風險。
      [0083] 特定因素可W從調(diào)查表或者從個體的醫(yī)療保健管理者處獲得。然后,可W訪問來 自"儲蓄"的譜的信息并且按所需要進行使用。例如,在個體的基因型相關(guān)性的初始評估中, 將分析個體的全部信息(通常在整個基因組上的或者從整個基因組取得的SNP或其它基因 組序列)用于確定基因型相關(guān)性。在后續(xù)的分析中,可W按需要或適當?shù)卦L問來自存儲的或 儲蓄的基因組譜的全部信息或者其一部分。
      [0084] 基因組譜與基因型相關(guān)性數(shù)據(jù)庫的比較
      [0085] 在步驟110中,基因型相關(guān)性是來自科技文獻的。遺傳變異的基因型相關(guān)性由已經(jīng) 對是否存在一種或多種感興趣的表型性狀和對基因型譜進行了測試的個體的群體所進行 的分析確定。然后對基因型譜中各遺傳變異或多態(tài)性的等位基因進行檢測W確定是否特定 的等位基因的存在與感興趣的性狀相關(guān)聯(lián)??蒞通過標準統(tǒng)計方法進行相關(guān)性分析,并記 錄遺傳變異與表型特征之間的統(tǒng)計學顯著的相關(guān)性。比如,可能確定,多態(tài)性A的等位基因 Al的存在與屯、臟病相關(guān)。作為進一步的例子,可能發(fā)現(xiàn)在多態(tài)性A的等位基因 Al和多態(tài)性B 的等位基因 Bl的組合存在與癌癥風險的增大相關(guān)。分析的結(jié)果可W在同行評議文獻中公 布,由其它研究組進行確認,和/或由專家委員會(例如,遺傳學家、統(tǒng)計學家、流行病學家和 醫(yī)生)進行分析,并且也可W進行驗證。
      [0086] 圖4、5和6中為基因型與表型之間的相關(guān)性的實例,其中應用于基因組譜的基因型 與表型之間的規(guī)則基于運些相關(guān)性。例如,圖4A和B中,各行對應于表型/基因座/種族,其中 圖4C至I包括運些行中各行的相關(guān)性的進一步的信息。作為例子,在圖4A中,如圖4M表型名 稱縮寫的索引中所注明的BC的"表型名稱縮寫"為乳腺癌的縮寫。在BC_4(其為基因座的類 名)運一行中,基因 LSPl與乳腺癌相關(guān)。如圖4C中所示,對于運一相關(guān)性確認的公開的或者 功能性的SNP為rs3817198,而公開的風險等位基因為C,非風險等位基因為T。公開的SNP和 等位基因通過出版物(例如,圖4E-G中的基本的公開文獻)確認。在圖4E的LSPl的實例中,基 本的公開文獻為化Ston等人,NaUire 447:713-720(2007)。
      [0087] 可選地,可從存儲的基因組譜中產(chǎn)生相關(guān)性。例如,具有存儲的基因組譜的個體可 同時具有存儲的已知的表型信息。存儲的基因組譜和已知的表型的分析可產(chǎn)生基因型相關(guān) 性。作為一個例子,具有儲存的基因組譜的250位個體還具有之前他們被診斷為患有糖尿病 的存儲信息。進行他們的基因組譜的分析,并與未患有糖尿病的個體對照組進行比較。然后 確定出:之前被診斷為患有糖尿病的個體比對照組具有更高的帶有特定遺傳性變型的比 率,且可在該特定的遺傳性變型和糖尿病之間確定基因型相關(guān)性。
      [0088] 在步驟112中,基于遺傳性變型與特定的表型之間的確立的相關(guān)性來形成規(guī)則。例 如,規(guī)則可W基于例如表1中所列的相關(guān)的基因型與表型產(chǎn)生?;谙嚓P(guān)性的規(guī)則可引入其 它的因素如性別(例如圖4)或種族(圖4和5)如圖4和5中的效應評價。由規(guī)則產(chǎn)生的其它量 度可W評估如圖6中的相對風險增加。效應評價和估計的相對風險增加可W來自公開的文 獻,或者由公開的文獻進行計算?;蛘?,規(guī)則可W基于由存儲的基因組譜和先前已知的表型 產(chǎn)生的相關(guān)性。
      [0089] 在一個優(yōu)選的實施方式中,遺傳性變型為SNP。盡管SNP出現(xiàn)在單個位點時,攜帶在 某一位點處的特定SNP等位基因的個體通??深A測在其它的位點處攜帶特定的SNP等位基 因。SNP與使個體易發(fā)疾病或狀態(tài)的等位基因的相關(guān)性通過連鎖不平衡產(chǎn)生,其中在群體中 兩個或多個基因座上的等位基因發(fā)生非隨機關(guān)聯(lián)的頻率大于或者小于預計通過重組隨機 形成而得到的頻率。
      [0090] 其它的遺傳標記或變異(例如核巧酸重復或插入)也可W與已經(jīng)顯示為與特定的 表型相關(guān)的遺傳標記發(fā)生連鎖不平衡。例如,核巧酸插入與表型相關(guān),并且SNP與核巧酸插 入發(fā)生連鎖不平衡?;赟NP與表型之間的相關(guān)性形成規(guī)則。也可W形成基于核巧酸插入與 表型之間的相關(guān)性的規(guī)則??蒞將任一規(guī)則或者兩個規(guī)則應用于基因組圖譜,因為一個SNP 的存在可W給出某一危險因子,另一規(guī)則可W給出另一危險因子,并且當它們結(jié)合時可W 增大風險。
      [0091] 通過連鎖不平衡,易發(fā)疾病的等位基因與SNP的特定等位基因或者SNP的特定等位 基因的組合共分離。沿著染色體的SNP等位基因的特定組合被稱為單倍體型,它們組合出現(xiàn) 的DNA區(qū)域被稱為單倍體區(qū)塊。盡管單倍體區(qū)塊可包括一個SNP,表示在個體之間表現(xiàn)出低 的單體型多樣性且通常具有低重組頻率的2個或多個鄰近的SNP的系列??蒞通過鑒定位于 單倍體型區(qū)塊中的一個或多個SNP進行單體體型的鑒定。因此,SNP譜通??捎糜谧R別單倍 體區(qū)塊,而不是必須識別在特定的單倍體區(qū)塊中的所有SNP。
      [0092] SNP單倍體模式和疾病、狀態(tài)或身體狀態(tài)之間的基因型相關(guān)性逐漸成為已知。對于 特定的疾病而言,將已知具有該疾病的一組人的單倍體型模式與無該疾病的一組人相比 較。通過分析許多個體,可W確定在群體中多態(tài)性的頻率,并且隨后運些頻率或基因型可W 與特定的表型(例如疾病或者狀態(tài))相關(guān)聯(lián)。已知的SNP-疾病相關(guān)性的實例包括在與年齡相 關(guān)性黃斑變性中補體因子H的多態(tài)性化Iein等人,Science: 308:385-389,(2005))和鄰近與 肥胖相關(guān)的INSIG2基因的變異化erbed等人,Science:312: 279-283(2006))。其它已知的 SNP相關(guān)性包括含CDKN2A和B的化21區(qū)中的多態(tài)性,例如與屯、肌梗塞相關(guān)的rsl0757274、 rs2383206、rsl3333040、rs2383207和rslOl 16277化elgadottir等人,Science 316:1491-1493(2007) ;McPherson等人,Science 316:1488-1491(2007))。
      [0093] SNP可為功能性的或非功能性的。例如,功能性的SNP對細胞功能有效,因此會產(chǎn)生 表型,而非功能性的SNP不具有功能,但可W與功能性SNP發(fā)生連鎖不平衡。SNP也可W是同 義的或者非同義的。同義的SNP是其中不同形式導致相同多膚序列的SNP,且為非功能性 SNP。如果SNP導致不同多膚,那么SNP是非同義的并且可W是或不是功能性的。用于識別二 倍體型(其2個或多個單倍體型)中的單倍體型的SNP或其它的遺傳標記可用于使表型和二 倍體型相關(guān)。有關(guān)個體的單倍體型、二倍體型和SNP譜的信息可為個體的基因組譜。
      [0094] 在優(yōu)選的實施方式中,對于基于與表型關(guān)聯(lián)的另一遺傳標記形成連鎖不平衡的遺 傳標記產(chǎn)生的規(guī)則,該遺傳標記可W具有大于0.5的r 2或D'得分,該得分通常在本領(lǐng)域中用 于確定連鎖不平衡。在優(yōu)選的實施方式中,得分大于0.6、0.7、0.8、0.90、0.95或0.99。結(jié)果, 在本發(fā)明中,用于將表型與個體的基因組譜關(guān)聯(lián)的遺傳標記可W相同或者不同于與表型相 關(guān)的功能性的或公開的SNP。例如,使用BC_4,現(xiàn)聯(lián)SNP和公開的SNP是相同的,正如測試的風 險和非風險等位基因與公開的風險和非風險等位基因是相同的(圖4A和C)。但是,對于BC_ 5,CASP8及其與乳腺癌的相關(guān)性,測試SNP與其功能性的或公開的SNP不同,正如測試的風險 和非風險等位基因?qū)τ诠_的風險和非風險等位基因一樣。測試的和公開的等位基因相對 于基因組的正鏈定向,并且從運些列中可W推斷純合型風險或非風險基因型,運可W生成 用于例如注冊用戶的個體的基因組譜的規(guī)則。
      [0095] 測試SNP可W為"直接(DIRECT r或"標簽(TAG r SNP (圖4E-G,圖5)。直接SNP為與公 開的或功能性SNP相同的測試SNP,例如對于BC_4。使用歐洲人和亞洲人的SNP rS1073640, 直接SNP也可W用于乳腺癌的FGFR2相關(guān)性,其中次要等位基因為A且另一等位基因為G 化aston等人,Nature 447:1087-1093(2007))。也是在歐洲人和亞洲人中的乳腺癌的FGFR2 相關(guān)性的另一公開的或功能性的SNP為rsl219648(Hunter等人,Nat. Genet. 39:870-874 (2007))。標簽SNP為測試SNP與功能性或公開的SNP不同的SNP,如對于BC_5。標簽SNP還可用 于其它的遺傳性變型,例如CAMTAl (rs4908449)、9p2 Urs 10757274、rs2383206、 rsl3333040、rs2383207、rs10116277)、C0LlAl(rs1800012)、F化(rs6025)、HLA-DQAl 片34988889^32588331)、6^5片31799983)、]\〇'邸1?片31801133)和4口(:片328933380)的5^。
      [0096] SNP的數(shù)據(jù)庫可從例如International 化pMap計劃(參見WW.hapmap.org,The International HapMap Consortium,Nature 426:789-796(2003),和The International HapMap Consortium,化ture 437:1299-1320(2005))'Human Gene Mutation Database (HGMD)公開數(shù)據(jù)庫(參見WWW.hgmd.org)和單核巧酸多態(tài)性數(shù)據(jù)庫(dbSNP)(參見 WWW.ncbi .nlm.nih.gov/SNP/)中公開獲得。運些數(shù)據(jù)庫提供了SNP單倍體型,或使得能夠確 定SNP單倍體模式。因此,運些SNP數(shù)據(jù)庫使得能夠檢測作為大范圍的疾病和狀態(tài)(例如癌 癥、炎性疾病、屯、血管病、神經(jīng)變性疾病和傳染病)的基礎(chǔ)的遺傳危險因子。運些疾病或狀態(tài) 可W是可處置的,其中當前存在其處理和治療方法。處理可W包括預防處理和改善癥狀和 狀態(tài)的處理,包括改變生活方式。
      [0097] 還可W研究許多其它的表型,例如身體性狀、生理性狀、精神性狀、情緒性狀、種 族、家系和年齡。身體性狀可W包括身高、發(fā)色、眼睛顏色、軀體或者例如精力、耐力和敏捷 性的性狀。精神性狀可W包括智力、記憶能力或者學習能力。種族和家系可W包括家系或種 族的鑒定,或者個體的祖先源于哪里。年齡可W是確定個體的實際年齡,或者是個體的遺傳 學特征使其相對于總的群體所處的年齡。例如,個體的實際年齡為38歲,但是其遺傳學特征 可W確定其記憶能力或身體健康狀態(tài)可能為平均28歲。另外的年齡性狀可W是個體的預計 壽命。
      [0098] 其它的表型還可包括非醫(yī)學狀態(tài),例如"娛樂"表型。運些表型可W包括與知名個 體的對比,例如,外國貴族、政治家、名人、發(fā)明家、運動員、音樂家、藝術(shù)家、商業(yè)人±和聲名 狼藉的個體(例如罪犯)。其它"娛樂"表型可W包括與其它生物體的對比,例如,細菌、昆蟲、 植物或者非人類的動物。例如,個體可能感興趣看看其基因組譜與其寵物狗或前任總統(tǒng)的 基因組譜對比會如何。
      [0099] 在步驟114中,規(guī)則被應用到存儲的基因組譜W產(chǎn)生步驟116的表型譜。例如,圖4、 5或6中的信息可能形成規(guī)則或測試的基礎(chǔ),W應用于個體的基因組譜。規(guī)則可W包括圖4中 關(guān)于測試SNP和等位基因 W及效應評價的信息,其中,效應評價的UOTTS為效應評價的單位, 例如0R,或優(yōu)勢比(95%置信區(qū)間)或者平均值。在優(yōu)選實施方式中效應評價可W是基因型 風險(圖4C-G),例如對于純合子的風險化omoz或RR)、風險雜合子化eteroz或RN)和非風險 純合子化omoz或NN)。在其它實施方式中,效應評價可W為攜帶者風險,其為RR或RN對NN。在 再其它的實施方式中,效應評價可W基于等位基因、等位基因風險,例如R對N。運里也存在 兩個基因座(圖4J)或S個基因座(圖4K)的基因型效應評價(例如,對于兩個基因座效應評 價的9種可能的基因型組合:RRRR、RR順等)。在圖4H和I中還記錄了公共化pMap中的測試SNP 頻率。
      [0100] 對于狀態(tài)的估計風險可基于美國專利公布No. 20080131887和PCT公布No.W02008/ 067551中列舉的SNP。在一些實施方式中,對于狀態(tài)的風險可基于至少1個SNP。例如,對個體 患阿爾茨海默病(AD)、結(jié)腸直腸癌(CRC)、骨關(guān)節(jié)炎(OA)或脫落性青光眼(XFG)的風險的評 估可基于1個SNP (例如rs4420638用于AD,rs6983267用于〔3(:^34911178用于0八和 rs2165241用于XFG)。對于其它的狀態(tài)而言,例如肥胖(BMIOB)、格雷夫斯病(GD)或血色素沉 著癥化EM),個體的估計風險可W基于至少1或2個SNP(例如rs9939609和/或rs9291171用于 BMI0B;DRB1*0301DQA1*0501 和/或rs3087243 用于 GD;rsl800562 和/或rsl29128 用于肥 M)。 對于如但不限于屯、肌梗塞(MI)、多發(fā)性硬化(MS)或牛皮癖(PS)的狀態(tài),1、2或3個SNP可用于 評估個體對于該狀態(tài)的風險(例如rs 1866389、rs 1333049和/或rs6922269用于MI ; rs6897932、rsl2722489 和/或DRB1*1501 用于 MS;rs6859018、rsll209026 和/或 HLA00602 用 于PS)。對于評估個體患多動腿綜合征(化S)或乳糜瀉(CelD)的風險,可使用1、2、3或4個SNP (例如 rs6904723、rs2300478、rsl026732 和/或rs9296249 用于化 S;rs6840978、rsll571315、 rs2187668和/或DQA1*0301DQB1*0302用于CelD)。對于前列腺癌(PC)或狼瘡(SLE)而言,可 使用1、2、3、4或5個SNP來評估個體患PC或SLE的風險(例如rs4242384、rs6983267、 rsl6901979、rsl7765344 和/或 rs4430796 用于PC;rsl2531711、rsl0954213、rs2004640、 DRB1*0301和/或DRB1*1501用于SLE)。對于評估個體患黃斑變性(AMD)或風濕性關(guān)節(jié)炎(RA) 的終生風險而言,可使用 1、2、3、4、5或6個SNP(例如rsl0737680、rsl0490924、rs541862、 rs2230199、rsl061170和/或rs9332739用于AMD;rs6679677、rsll203367、rs6457617、DRB* 0101、DRB1*0401和/或DRB1*0404用于RA)。對于估計個體患乳腺癌(BC)的個體終生風險而 言,可使用1、2、3、4、5、6或 7個SNP(例如rs3803662、rs2981582、rs4700485、rs3817198、 rsl7468277、rs6721996和/或rs3803662)。對于估計個體患克羅恩氏?。–D)或2型糖尿病 (T2D)的終生風險而言,可使用1、2、3、4、5、6、7、8、9、10或11個5師(例如'32066845、 rs5743293、rsl0883365、rsl7234657、rsl0210302、rs9858542、rsl1805303jslOOOl13、 rsl7221417、rs2542151 和/或rsl0761659 用于CD;rsl3266634、rs4506565、rs100 12946、 甘37756992^310811661^312288738^38050136^31111875^34402960^35215和/或 rsl801282用于T2D)。在一些實施方式中,作為用于確定風險的基礎(chǔ)的SNP可與上述SNP或其 它SNP(例如美國專利公布No. 20080131887和PCT公布No.W02008/067551中的)發(fā)生連鎖不 平衡。
      [0101] 個體的表型譜可包括多種表型。特別地,無論在有癥狀、癥狀前或無癥狀的個體 (包括一種或多種疾病/狀態(tài)的易感等位基因的攜帶者)中,通過本發(fā)明的方法評估病人患 疾病或其它狀態(tài)(例如,可能的藥物反應,包括代謝、功效和/或安全性)的風險使得能夠?qū)?多種不相關(guān)的疾病和狀態(tài)的易感性進行預后或者診斷分析。因此,運些方法提供了對于疾 病或狀態(tài)的個體易感性的總體評價而不需要預先設(shè)想任何特定疾病或狀態(tài)的測試。例如, 本發(fā)明的方法使得能夠基于個體基因組譜對表1、圖4、5或6中所列的多種狀態(tài)中的任何一 種的個體易感性進行評估。評估優(yōu)選提供了有關(guān)運些狀態(tài)中的巧巾或多種的信息,并且更優(yōu) 選運些狀態(tài)中的3、4、5、10、20、50、100或者甚至更多種狀態(tài)的信息。在優(yōu)選實施方式中,將 至少20條規(guī)則應用于個體的基因組譜而得到表型譜。在其它的實施方式中,將至少50條規(guī) 則應用于個體的基因組譜。表型的單一的規(guī)則可W應用于單基因的表型。多于一條的規(guī)則 也可W用于單一表型,例如多基因的表型或單一基因中的多個遺傳性變型會影響具有表型 的概率。
      [0102] 個體患者的基因組譜的最初篩選之后,當知道附加的核巧酸變型時,通過與運些 附加的核巧酸變型(例如,SNP)的比較進行(或采用)個體基因型相關(guān)性的更新。例如,步驟 110可W由捜索科學文獻W尋找新基因型相關(guān)性的遺傳學領(lǐng)域的一名或多名普通技術(shù)人員 定期地進行,如,每天、每周或每月進行。然后,新基因型相關(guān)性可W進一步由本領(lǐng)域中的一 位或多位專家的委員會確認。而后,步驟112可W W基于新的確認有效的相關(guān)性使用新規(guī)則 定期地更新。
      [0103] 新規(guī)則可W包括在現(xiàn)有規(guī)則之外的基因型或者表型。例如,未與任何表型關(guān)聯(lián)的 基因型被發(fā)現(xiàn)與新的或現(xiàn)有的表型相關(guān)。新規(guī)則也可W用于先前無基因型與其關(guān)聯(lián)的表型 間的相關(guān)性。新規(guī)則也可W確定用于已具有現(xiàn)有規(guī)則的基因型和表型。例如,現(xiàn)有基于基因 型A與表型A之間的相關(guān)性的規(guī)則。新的研究掲示了基因型B與表型A相關(guān),因而產(chǎn)生基于運 一相關(guān)性的新規(guī)則。另一個例子為發(fā)現(xiàn)表型B與基因型A相關(guān),并因此制定新規(guī)則。
      [0104] 可W在發(fā)現(xiàn)基于已知的但沒有在公開的科學文獻中進行初始確認的相關(guān)性時制 定規(guī)則。例如,可能有人報道,基因型C與表型C相關(guān)。另外的出版物報道,基因型D與表型時目 關(guān)。表型C和D是相關(guān)的癥狀,例如表型C可W是呼吸急促,而表型D是較小的肺容量。利用現(xiàn) 有存儲的具有基因型C和DW及表型C和D的個體的基因組譜通過統(tǒng)計學方法,或者通過進一 步的研究可W發(fā)現(xiàn)和確認基因型C與表型D或者基因型D與表型C之間的相關(guān)性。然后,可W 基于新發(fā)現(xiàn)的和確認的相關(guān)性生成新規(guī)則。在另一實施方式中,可W研究存儲的具有特定 或相關(guān)表型的多個個體的基因型譜來確定運些個體共有的基因型,并且可W確定相關(guān)性。 基于運一相關(guān)性可W生成新規(guī)則。
      [0105] 也可W制定規(guī)則W修正現(xiàn)有規(guī)則。例如,基因型與表型之間的相關(guān)性可能部分地 由已知個體特征確定,例如,種族、家系、地理、性別、年齡、家族史或者個體的任何其它已知 表型。可W制定基于運些已知個體特征的規(guī)則并且引入現(xiàn)有規(guī)則中W提供修正的規(guī)則。選 擇應用修正的規(guī)則將取決于個體的特定個體因素。例如,規(guī)則可能基于當個體具有基因型E 時個體具有表型E的概率為35%。但是,如果個體為特定的種族,所述概率是5%。新規(guī)則可 W基于運一結(jié)果制定并且應用于具有該特定種族特性的個體?;蛘撸蒞應用確定值為 35%的現(xiàn)有規(guī)則,然后應用基于該表型的種族特征的另一規(guī)則?;谝阎獋€體特征的規(guī)則 可W由科技文獻確定或者基于對存儲的基因組譜的研究確定。在產(chǎn)生了新規(guī)則時,可W在 步驟114中添加新的規(guī)則并將其應用于基因組譜,或者可W定期地應用它們,例如一年至少 一次。
      [0106] 疾病的個體風險的信息也可W隨著更高分辨率SNP基因組譜的技術(shù)進步得到擴 展。如上所述,使用用于掃描500,000個SNP的微陣列技術(shù)可W很容易地生成初始SNP基因組 譜。考慮到單倍體區(qū)塊的特性,運一數(shù)字可用于個體基因組中所有SNP的典型譜。但是,在人 類基因組中估計通常發(fā)生大約1000萬個SNP(Inte;rnational HapMap計劃; ww.hapmap.org)。隨著能夠W更高細節(jié)水平對SNP進行實用和經(jīng)濟的解析(例如1,000, 000、1,500,000、2,000,000、3,000,000或更多SNP的微陣列)的或者全基因組測序方面的技 術(shù)進步,可W生成更詳細的SNP基因組譜。同樣,計算機分析方法學方面的進展使得能夠獲 得更精細的SNP基因組譜的經(jīng)濟分析和SNP-疾病相關(guān)性主數(shù)據(jù)庫的更新。
      [0107] 在步驟116生成表型譜之后,注冊用戶或者其醫(yī)療保健管理者可W如步驟118中通 過在線入口或網(wǎng)站訪問他們的基因組譜或表型譜。也可W將包括表型譜和其它關(guān)于表型譜 和基因組譜的信息的報告提供給注冊用戶或其醫(yī)療保健管理者,如步驟120和122中所述。 可W將報告打印出來、存儲在注冊用戶的電腦里或者在線察看。
      [0108] 圖7示出了示例的在線報告。注冊用戶可W選擇顯示單一表型或者多于一個的表 型。注冊用戶也可W具有不同的察看選項,例如,如圖7中所示"快速查看(Quick View)"選 項。表型可W是醫(yī)學狀態(tài)并且在快速報告中的不同處理和癥狀可W鏈接至其它包含有關(guān)處 理的進一步信息的網(wǎng)頁。例如,通過點擊藥物,會導向包括關(guān)于劑量、費用、副作用和功效的 信息的網(wǎng)站。也可W將藥物與其它治療進行比較。網(wǎng)站也可W包括導向藥物制造商的網(wǎng)站 的鏈接。另一鏈接可W向注冊用戶提供生成藥物性基因組學(pharmacogenomi C)譜的選項, 運將包括基于其基因組譜的信息如他們對于藥物的可能反應。也可W提供對于藥物的替代 方案的鏈接,例如預防性行為(如康體和減輕體重);并且也可W提供對于飲食補充、飲食計 劃的鏈接及對于附近的健身俱樂部、健康診所、保健及康復提供者、都市型spa(day spa)等 的鏈接。也可W提供教育和情報視頻、可利用的治療的概要、可能的療法和一般性建議。
      [0109] 在線報告也可W提供安排個人醫(yī)生或遺傳咨詢預約的鏈接或者訪問在線遺傳顧 問或醫(yī)生的鏈接,從而為注冊用戶提供詢問更多關(guān)于其表型譜的信息的機會。在線報告上 也可W提供在線遺傳咨詢和醫(yī)師詢問的鏈接。
      [0110] 也可W W其它形式查看報告,例如對于單一表型的綜合觀察,其中提供了對于各 個類別的更多詳情。例如,可W存在關(guān)于注冊用戶出現(xiàn)表型的可能性的更詳細的統(tǒng)計;關(guān)于 典型癥狀或表型的更多信息,例如醫(yī)學狀態(tài)的代表癥狀或者身體非醫(yī)學狀態(tài)(如身高)的范 圍;或者關(guān)于基因和遺傳性變型的更多信息,例如群體流行度,如在世界上或者在不同國家 中,或者在不同年齡范圍或性別中的群體流行度。在另一實施方式中,報告可W是"娛樂"表 型的報告,例如,個體基因組譜與知名個體(如阿爾伯特?愛因斯坦)的基因組譜的相似性。 報告可W顯示個體基因組譜與愛因斯坦的個體基因組譜之間的百分比相似性,并且可W進 一步顯示愛因斯坦的預測IQ和該個體的預測IQ。進一步的信息可W包括總?cè)后w的基因組譜 和其IQ與該個體和愛因斯坦的基因組譜和IQ比較的情況。
      [0111] 在另一實施方式中,報告可W顯示已與注冊用戶的基因組譜相關(guān)聯(lián)的所有表型。 在其它的實施方式中,報告可W僅顯示確定與個體的基因組譜正相關(guān)的表型。個體可W選 擇W其它形式顯示表型的特定亞類,例如僅醫(yī)學表型或者僅可處置的醫(yī)學表型。例如,可處 置的表型及其相關(guān)的基因型可W包括克羅恩氏?。ㄅcIL23R和CARD15相關(guān))、1型糖尿?。ㄅc 化八-03/09相關(guān))、狼瘡(與化4-01犯1相關(guān))、牛皮癖化1^\-〇、多發(fā)性硬化癥化1^\-0941)、格雷 夫斯病化LA-DRBl)、風濕性關(guān)節(jié)炎化LA-DRBl)、2型糖尿病(TCF7L2)、乳腺癌(BRCA2)、結(jié)腸 癌(APC)、情景記憶化IBRA)和骨質(zhì)疏松癥(O)LlAl)。個體還可選擇在他們的報告中顯示表 型的子類,例如,僅醫(yī)學狀態(tài)的炎性疾病或僅非醫(yī)學狀態(tài)的身體性狀。
      [0112] 交付并傳送至個體的信息可W是加密的和保密的,并且可W控制個體對運些信息 的訪問。由復雜基因組譜得到的信息可W作為管理部口批準的、可理解的、醫(yī)療相關(guān)的和/ 或具有高度影響的數(shù)據(jù)提供給個體。信息也可W是具有一般的意義,而與醫(yī)療無關(guān)??蒞通 過幾種方式向個體加密地傳送信息,所述方式包括,但不限于入口界面和/或郵寄。更優(yōu)選 地,信息通過入口界面加密地(如果個體如此選擇)向個體提供,其中個體對該入口界面具 有安全和保密的訪問權(quán)限。運一界面優(yōu)選通過在線的、互聯(lián)網(wǎng)站入口提供,或者可選擇地, 通過電話或允許提供私密、安全和易于使用的訪問的其它方式?;蚪M譜、表型譜和報告通 過網(wǎng)絡(luò)的數(shù)據(jù)傳輸向個體或其醫(yī)療保健管理者提供。
      [0113] 因此,圖8為顯示了可W通過其生成表型譜和報告的代表性示例邏輯設(shè)備的框圖。 圖8顯示了計算機系統(tǒng)(或者數(shù)字設(shè)備)800,其用于接收和存儲基因組譜、分析基因型相關(guān) 性、基于基因型相關(guān)性生成規(guī)則、將規(guī)則應用于基因組譜和產(chǎn)生表型譜和報告。計算機系統(tǒng) 800可W理解為能夠從介質(zhì)811和/或網(wǎng)絡(luò)端口 805讀取指令的邏輯設(shè)備,該網(wǎng)絡(luò)端口 805能 夠任選地與具有固定介質(zhì)812的服務器809相連。圖8中顯示的系統(tǒng)包括CPU 801、磁盤驅(qū)動 器803、任選的輸入設(shè)備(例如鍵盤815和/或鼠標816) W及任選的監(jiān)視器807。與本地或遠方 位置的服務器809的數(shù)據(jù)通信可W通過所示的通信媒介完成。通信媒介可W包括傳送和/或 接收數(shù)據(jù)的任何手段。例如,通信媒介可W是網(wǎng)絡(luò)連接、無線連接或者互聯(lián)網(wǎng)連接。該連接 可在環(huán)球網(wǎng)中提供通訊。可W想到,與本發(fā)明相關(guān)的數(shù)據(jù)可在該網(wǎng)絡(luò)或連接中傳送W由某 一方822接收和/或查看。接收方822可W為個體、注冊用戶、醫(yī)療保健提供者或醫(yī)療保健管 理者,但不限于此。在一個實施方式中,計算機可讀的介質(zhì)包括適于傳送生物樣品或基因型 相關(guān)性的分析結(jié)果的介質(zhì)。所述介質(zhì)可W包括關(guān)于個體對象的表型譜的結(jié)果,其中使用在 此所描述的方法得到運一結(jié)果。
      [0114] 個人入口將優(yōu)選用作個體接收和評價基因組數(shù)據(jù)的基本界面。入口將使個體能夠 跟蹤其樣品從收集到測試的過程并能夠跟蹤結(jié)果。通過入口訪問,基于其基因組譜向個體 介紹常見遺傳病的相對風險。注冊用戶可W通過入口選擇將哪些規(guī)則應用于其基因組譜。
      [0115] 在一個實施方式中,一個或多個網(wǎng)頁將具有表型的列表和靠近每個表型有一個方 框,注冊用戶可W選擇方框W將其包括在他們的表型譜中。表型可W鏈接至與該表型有關(guān) 的信息,W幫助注冊用戶明智地選擇關(guān)于他們希望包括在其表型譜中的表型。網(wǎng)頁也可W 具有按疾病分組(例如可處置的疾病或不可處置的疾病)組織的表型。例如,注冊用戶可W 僅選擇可處置的表型,例如HLA-DQAl和乳糜瀉。注冊用戶也可W選擇顯示表型的癥狀前或 癥狀后治療。例如,個體可W選擇具有癥狀前治療的可處置表型(在進一步篩查W外),對于 乳糜瀉為無谷蛋白飲食的癥狀前治療。另一實例可W是阿爾茨海默氏病,癥狀前治療為他 汀類藥物、鍛煉、維生素和精神作用。血栓形成是另一實例,癥狀前治療是避免口服避孕藥 和避免長時間久坐。具有經(jīng)批準的癥狀后治療的表型的實例為與CFH有關(guān)的濕性AMD,其中 個體可W進行對其狀態(tài)的激光治療。
      [0116] 表型也可W按疾病或狀態(tài)的類型或種類進行組織,例如神經(jīng)學、屯、血管、內(nèi)分泌、 免疫等等。表型也可W分組為醫(yī)學和非醫(yī)學表型。在網(wǎng)頁上的表型的其它分類可W按照身 體性狀、生理性狀、精神性狀或情緒性狀進行。網(wǎng)頁可W進一步提供通過選擇一個方框而選 擇一組表型的分區(qū)。例如,選擇所有表型、僅與醫(yī)學相關(guān)的表型、僅非醫(yī)學相關(guān)的表型、僅可 處置的表型、僅不可處置的表型、不同的疾病組或者"娛樂"表型。"娛樂"表型可W包括與名 人或其他知名個體的對比,或者與其它動物或甚至其它生物體的對比??捎糜趯Ρ鹊幕?組譜的列表也可W在網(wǎng)頁上提供W用于由注冊用戶選擇而與注冊用戶的基因組譜對比。
      [0117] 在線入口也可W提供捜索引擎,W幫助注冊用戶瀏覽入口、檢索特定表型或者檢 索由其表型譜或報告所掲示的特定術(shù)語或信息。也可W由入口提供訪問搭配的服務和提供 的產(chǎn)品的鏈接。也可W提供連接到支持小組、留言板和具有共同或相似表型的個體的聊天 室的另外的鏈接。在線入口也可W提供連接到具有更多與注冊用戶表型譜中的表型有關(guān)的 信息的其它地址的鏈接。在線入口也可W提供允許注冊用戶與朋友、家人或醫(yī)療保健管理 者分享其表型譜和報告的服務。注冊用戶可W選擇在表型譜中顯示他們希望與其朋友、家 人或醫(yī)療保健管理者分享的表型。
      [0118] 表型譜和報告向個體提供了個人化基因型相關(guān)性。向個體提供的基因型相關(guān)性能 夠用于確定個人保健和生活方式選擇。如果發(fā)現(xiàn)了在遺傳性變型與可進行治療的疾病之間 的強相關(guān)性,遺傳性變型的檢查有助于確定開始治療疾病和/或個體監(jiān)測。在存在統(tǒng)計學上 顯著的相關(guān)性但不認為是強相關(guān)性的情況下,個體可W與個人醫(yī)生討論該信息并決定適 當、有益的行動方案。就特定基因型相關(guān)性而言可能有益于個體的潛在行動方案包括進行 治療處理、監(jiān)測潛在的治療需要或治療效果或者在飲食、鍛煉和其它個人習慣/活動等方面 改變生活方式。例如,可處置表型(如乳糜瀉)可W進行無谷蛋白飲食的癥狀治療。同樣,通 過藥物基因組學,基因型相關(guān)性信息可應用于預測必須用特定藥物或藥物療程進行治療的 個體的可能反應,例如特定藥物治療的可能的效力或安全性。
      [0119] 注冊用戶可W選擇將基因組譜和表型譜提供給其醫(yī)療保健管理者,例如醫(yī)生或遺 傳顧問?;蚪M譜和表型譜可W由醫(yī)療保健管理者直接訪問,由注冊用戶打印出一份W交 給醫(yī)療保健管理者,或者通過在線入口(例如通過在線報告上的鏈接)將其直接發(fā)送給醫(yī)療 保健管理者。
      [0120] 運一相關(guān)信息的傳遞將使患者能夠與其醫(yī)生協(xié)調(diào)行動。特別是,在患者與其醫(yī)生 間的討論可W通過個人入口和連接到醫(yī)學信息的鏈接W及使患者的基因組信息結(jié)合到其 醫(yī)學記錄中的能力而成為可能。醫(yī)學信息可W包括預防和健康信息。通過本發(fā)明提供給個 體患者的信息將能夠使患者做出對于其醫(yī)療保健的明智選擇。在運一方式中,患者能夠選 擇可W幫助他們避免和/或延遲其個體基因組譜(遺傳的DNA)具有較高可能導致的疾病。另 夕h患者將能夠采用適合其個人本身的特定醫(yī)療需要的治療方案。個體也將具有訪問其基 因型數(shù)據(jù)的能力,如果他們發(fā)生疾病并需要運一信息幫助其醫(yī)生形成治療對策。
      [0121] 基因型相關(guān)性信息也可與遺傳咨詢結(jié)合W用于向考慮生育的夫婦提出建議,W及 提出對于母親、父親和/或孩子的潛在遺傳關(guān)注。遺傳顧問可W向具有顯示特定狀態(tài)或疾病 的較高風險的表型譜的注冊用戶提供信息和支持。他們可W解釋關(guān)于該病癥的信息、分析 遺傳模式和復發(fā)風險并與注冊用戶討論可用選擇。遺傳顧問也可W提供支持性咨詢W向注 冊用戶推薦社區(qū)或國家支持服務。遺傳咨詢可W包括特定注冊計劃。在一些實施方式中,遺 傳咨詢可W安排在所請求的24小時內(nèi)且可在如晚上、星期六、星期日和/或假日的時間內(nèi)提 供。
      [0122] 個體的入口也將便于傳遞初始篩查W外的附加信息。個體將被告知有關(guān)其個人遺 傳圖譜的新的科學發(fā)現(xiàn),例如關(guān)于其目前或潛在狀態(tài)的新的治療或預防對策的信息。新發(fā) 現(xiàn)也可W傳遞給其保健管理者。在優(yōu)選實施方式中,通過電子郵件向注冊用戶或其保健提 供者通告關(guān)于注冊用戶的表型譜中的表型的新基因型相關(guān)性和新研究。在其它實施方式 中,將"娛樂"表型的電子郵件發(fā)送給注冊用戶,例如電子信件可W告知他們其基因組譜的 77%與阿伯拉罕?林肯的基因組譜相同W及進一步的信息通過在線入口提供。
      [0123] 本發(fā)明也提供了一種用于生成新規(guī)則、修正規(guī)則、組合規(guī)則、定期用新規(guī)則更新規(guī) 則集、安全地維持基因組譜數(shù)據(jù)庫、將規(guī)則應用于基因組譜W確定表型譜和用于生成報告 的計算機代碼系統(tǒng)。計算機代碼告知注冊用戶新的或者修正的相關(guān)性和新的或者修正的報 告,例如具有新的預防和健康信息、關(guān)于開發(fā)中的新治療方法的信息或可獲得的新治療的 報告。
      [0124] 商業(yè)方法
      [0125] 本發(fā)明提供了基于比較患者的基因組譜和建立的醫(yī)學相關(guān)核巧酸變異的臨床來 源數(shù)據(jù)庫來評估個體的基因型相關(guān)性的商業(yè)方法。本發(fā)明還提供了使用存儲的個體基因組 譜來評估最初未知的新的相關(guān)性W產(chǎn)生個體的更新的表型譜的方法,其中無需個體再提交 另一份生物樣品。圖9為表明商業(yè)方法的流程圖。
      [0126] 在個體因為多種常見人類疾病、狀態(tài)和身體狀態(tài)的基因型相關(guān)性而最初請求和購 買個人基因組譜時,在步驟101中部分地產(chǎn)生本發(fā)明的商業(yè)方法的收入流。請求和購買可W 通過許多來源進行,包括但不限于在線網(wǎng)絡(luò)入口、在線健康服務和個體的個人醫(yī)生或者類 似的個人醫(yī)療關(guān)注的來源。在替代的實施方式中,基因組譜可W免費提供,并且可W在隨后 的步驟(例如步驟103)中生成收入流。
      [0127] 注冊用戶或者消費者做出購買表型譜的請求。響應于需求和購買向消費者提供采 集試劑盒W用于采集在步驟103中進行遺傳樣品分離的生物樣品。當在線、通過電話或其它 消費者不易于親身獲得采集試劑盒的來源做出請求時,通過快遞提供采集試劑盒,例如提 供當日或隔夜交付的速遞服務。采集試劑盒中包括的是樣品的容器W及用于將樣品快速遞 送至生成基因組譜的實驗室的包裝材料。試劑盒也可W包括將樣品送至樣品處理機構(gòu)或?qū)?驗室的說明和(可W通過在線入口)訪問其基因組譜和表型譜的說明。
      [0128] 正如W上所詳細說明的,可W從多種類型的生物樣品中的任何一種類型獲得基因 組DNA。優(yōu)選地,使用商購的采集試劑盒(例如從DNA Genotek購得的試劑盒)從唾液中分離 基因組DNA。唾液和運一試劑盒的使用使得能夠進行無損傷樣品采集,因為消費者很方便在 來自采集試劑盒的容器中提供唾液樣品,然后密封該容器。另外,唾液樣品可W在室溫下儲 存和運輸。
      [0129] 在將生物樣品存放在采集或標本容器中后,在步驟105中消費者把樣品遞送至進 行處理的實驗室。典型地,消費者可W使用在采集試劑盒中提供的包裝材料通過例如同日 或隔夜快遞服務的快速遞送將樣品遞送/寄送至實驗室。
      [0130] 處理樣品并生成基因組圖譜的實驗室可W遵循適當?shù)恼畽C構(gòu)指導和規(guī)定。例 如,在美國,處理實驗室可W被例如食品與藥品管理局(FDA)或醫(yī)療保險和醫(yī)療補助服務中 屯、(Centers for Medicare and Medicaid Services)(CMS)的一個或多個聯(lián)邦機構(gòu)和/或 一個或多個州立機構(gòu)管理。在美國,可W依照1988年的Clinical Laboratory Improvement Amen血ents (化IA)授權(quán)或批準臨床實驗室。
      [0131] 在步驟107中,如先前描述的實驗室對樣品進行處理W分離DNA或RNA的遺傳樣品。 然后,在步驟109中,對分離的遺傳樣品進行分析和生成基因組譜。優(yōu)選地,生成基因組SNP 譜。如上所述,可使用幾種方法來產(chǎn)生SNP譜。優(yōu)選地,高密度陣列(例如可從Affymehi^g Illumina購買的平臺)被用于SNP的識別和譜的產(chǎn)生。例如,如W上更詳細地描述的,使用 Affymetrix Gene化ip assay生成SNP譜。隨著科技的發(fā)展,可能存在可產(chǎn)生高密度SNP譜的 其它的技術(shù)供應商。在另一個實施方式中,注冊用戶的基因組譜是注冊用戶的基因組序列。
      [0132] 產(chǎn)生個體的基因組譜之后,優(yōu)選在步驟111中將基因型數(shù)據(jù)加密和輸入,并在步驟 113中存儲到加密的數(shù)據(jù)庫或保險庫中,其中信息被存儲用于將來參考?;蚪M譜和相關(guān)的 信息可為保密的,按照個體和/或者他或她的個人醫(yī)生的指令對訪問運一私有信息和基因 組圖譜進行限制。其他人(例如個體的家人和遺傳顧問)也可W由注冊用戶許可訪問。
      [0133] 數(shù)據(jù)庫或保險庫可W就地位于處理實驗室處。或者,數(shù)據(jù)庫可W位于獨立的場所。 在運一情況下,在步驟111中可W將由處理實驗室生成的基因組譜數(shù)據(jù)輸送到包括數(shù)據(jù)庫 的單獨的機構(gòu)。
      [0134] 在生成個體的基因組譜之后,隨后在步驟115中將個體的遺傳變異與已確定的醫(yī) 學上相關(guān)的遺傳性變型的臨床數(shù)據(jù)庫相對比?;蛘撸蛐拖嚓P(guān)性可W不是醫(yī)學相關(guān)的但 仍包括在基因型相關(guān)性數(shù)據(jù)庫中,例如,如眼睛顏色的身體性狀,或者如與名人基因組譜的 相似性的"娛樂'表型。
      [0135] 醫(yī)療相關(guān)的SNP可W通過科技文獻和相關(guān)的來源建立。非SNP遺傳變異也可與表型 建立相關(guān)性。一般而言,SNP與特定疾病的相關(guān)性是通過將已知患有疾病的人們的組的單倍 體模式與未患疾病的人們的組相比較而建立的。通過分析許多個體,可W確定群體中的多 態(tài)性頻率,反過來運些基因型頻率可與特定的表型相關(guān)聯(lián),例如疾病或狀態(tài)??蛇x地,表型 可為非醫(yī)學狀態(tài)。
      [0136] 相關(guān)的SNP和非SNP遺傳性變型還可通過分析存儲的個體基因譜而不是通過可得 到的公開文獻而確定。具有存儲的基因組圖譜的個體可W掲示先前已經(jīng)確定的表型??蒞 將對個體的基因型和掲示的表型的分析與沒有該表型的個體相對比W確定而后可W應用 于其它基因組譜的相關(guān)性。確定其基因組譜的個體可W填寫關(guān)于先前已經(jīng)確定的表型的調(diào) 查表。調(diào)查表可W包括有關(guān)醫(yī)學和非醫(yī)學狀態(tài)的問題,例如先前診斷的疾病、醫(yī)學狀態(tài)的家 族史、生活方式、身體性狀、精神性狀、年齡、社會生活、環(huán)境等。
      [0137] 在一個實施方式中,如果個體填寫了調(diào)查表,他們就可W免費確定其基因組譜。在 一些實施方式中,個體定期填寫調(diào)查表W免費訪問其表型譜和報告。在其它實施方式中,填 寫了調(diào)查表的個體可W給予注冊升級,W便他們具有比其先前的注冊水平更高的訪問權(quán) 限,或者他們可W W較低的價格購買或更新注冊。
      [0138] 為了保證科學精確性和重要性,在步驟121中存放在醫(yī)學相關(guān)的遺傳性變型數(shù)據(jù) 庫中的所有信息首先由研究/臨床顧問組核準,同時如果在步驟119中被授權(quán)的話,由適當 的政府機構(gòu)檢查和監(jiān)督。例如在美國,F(xiàn)DA可W通過核準用于確認遺傳性變型(通常為SNP、 轉(zhuǎn)錄物水平或突變)相關(guān)數(shù)據(jù)的算法進行監(jiān)督。在步驟123中,為了附加的遺傳性變型-疾病 或者狀態(tài)相關(guān)性,對科學文獻和其它相關(guān)來源進行監(jiān)控,并且在確認它們的精確性和重要 性后,W及經(jīng)過政府機構(gòu)的檢查和批準后,運些附加的基因型相關(guān)性在步驟125中加入主數(shù) 據(jù)庫中。
      [0139] 經(jīng)核準和驗證的醫(yī)學相關(guān)遺傳性變型的數(shù)據(jù)庫與個體全基因組譜相結(jié)合將有利 地允許對大量疾病或狀態(tài)進行遺傳風險評估。在匯編個體的基因組譜之后,可W通過將個 體的核巧酸(遺傳)變型或遺傳標記與已經(jīng)與特定表型(例如疾病、狀態(tài)或身體狀態(tài))相關(guān)聯(lián) 的人類核巧酸變型的數(shù)據(jù)庫相比較而確定個體基因型相關(guān)性。通過將個體基因組譜與基因 型相關(guān)性的主數(shù)據(jù)庫相比較,可W告知個體是否發(fā)現(xiàn)他們對于遺傳危險因子是陽性或陰性 的W及程度如何。個體將收到有關(guān)大范圍的經(jīng)科學驗證的疾病狀態(tài)(例如,阿爾茨海默氏 病、屯、血管病、凝血)的相對風險和/或患病體質(zhì)數(shù)據(jù)。例如,可W包括表1中的基因型相關(guān) 性。另外,數(shù)據(jù)庫中的SNP疾病相關(guān)性可W包括,但不限于圖4中所示的那些相關(guān)性。也可W 包括圖5和6中的其它相關(guān)性。本發(fā)明的商業(yè)方法因此提供了對于大量疾病和狀態(tài)的風險分 析而無需預先了解那些疾病和狀態(tài)可能導致什么風險。
      [0140] 在其它實施方式中,與全基因組個體圖譜相結(jié)合的基因型相關(guān)性為非醫(yī)學相關(guān)表 型,例如"娛樂"表型或例如發(fā)色的身體性狀。在優(yōu)選的實施方式中,如上所述,將規(guī)則或規(guī) 則集應用于個體的基因組譜或SNP譜。將規(guī)則應用到基因組譜產(chǎn)生了個體的表型譜。
      [0141] 因此,當發(fā)現(xiàn)和驗證新的相關(guān)性時,用附加的基因型相關(guān)性擴展人類基因型相關(guān) 性的主數(shù)據(jù)庫。在需要時或適當時,可W通過訪問來自存儲在數(shù)據(jù)庫中的個體基因組譜中 的相關(guān)信息進行更新。例如,獲知的新基因型相關(guān)性可W基于特定的基因變型。然后,可W 通過僅僅獲取和比較個體的完整基因組譜中僅該基因的部分而確定個體是否可能受該新 的基因型相關(guān)性的影響。
      [0142] 優(yōu)選對基因組查詢的結(jié)果進行分析和解釋W便W可W理解的形式呈遞給個體。然 后,在步驟117中,如上面詳細描述的通過郵寄或通過在線入口界面W安全、機密的方式向 患者提供初始篩查的結(jié)果。
      [0143] 報告可W包括表型譜W及關(guān)于表型譜中表型的基因組信息,例如,關(guān)于所設(shè)及的 基因的基本遺傳學信息或者遺傳性變型在不同群體中的統(tǒng)計學信息。可W包括在報告中的 基于表型譜的其它信息是預防對策、健康信息、治療方法、癥狀認識、早期檢測方案、介入方 案W及表型的進一步鑒定和分類。在個體基因組圖譜的初始篩查之后,進行或可W進行可 控的、適度的更新。
      [0144] 當新的基因型相關(guān)性出現(xiàn)并且被驗證和核準時,結(jié)合主數(shù)據(jù)庫的更新,對個體基 因組圖譜進行更新或者可獲得更新?;谛碌幕蛐拖嚓P(guān)性的新規(guī)則可W應用于初始基因 組圖譜W提供更新的表型譜。在步驟127中通過將個體的基因組圖譜的相關(guān)部分與新的基 因型相關(guān)性相比較,可W生成更新的基因型相關(guān)性譜。例如,如果基于特定基因中的變異發(fā) 現(xiàn)新的基因型相關(guān)性,則可W就新的基因型相關(guān)性對個體基因組圖譜的該基因部分進行分 析。在運一情況下,一種或多種新的規(guī)則可被應用來產(chǎn)生更新的表型譜,而不是具有已經(jīng)應 用的規(guī)則的整個規(guī)則集。個體的更新的基因型相關(guān)性的結(jié)果在步驟129中W加密的方式提 供。
      [0145] 初始的和更新的表型譜可W是提供給注冊用戶或消費者的服務。可W提供基因組 圖譜分析的不同注冊水平及其組合。同樣地,注冊水平可W發(fā)生變化W向個體提供他們希 望接受的具有其基因型相關(guān)性的服務量的選擇。運樣,提供的服務等級將隨著個體購買的 服務注冊水平發(fā)生改變。
      [0146] 注冊用戶的入口級注冊可W包括基因組譜和初始表型譜。運可W是基礎(chǔ)注冊水 平。在基礎(chǔ)注冊水平內(nèi)可W有不同的服務等級。例如,特定的注冊水平可W提供對于遺傳咨 詢、在治療或預防特定疾病方面具有特別專業(yè)知識的醫(yī)生和其它服務選項的介紹??蒞在 線或通過電話獲得遺傳咨詢。在另一實施方式中,注冊的價格可能取決于個體選擇用于其 表型譜的表型的數(shù)量。另一選項可能為是否注冊用戶選擇訪問在線遺傳咨詢。
      [0147] 在另一情況中,注冊可W提供初始的全基因組的基因型相關(guān)性,同時在數(shù)據(jù)庫中 維持個體的基因組譜;如果個體如此選擇的話,運一數(shù)據(jù)庫可W是加密的。在運一初始分析 之后,后續(xù)分析和附加的結(jié)果可W在個體請求和另外付款時完成。運可W是高級注冊水平。
      [0148] 在本發(fā)明商業(yè)方法的一個實施方式中,進行個體風險的更新并且在注冊基礎(chǔ)上可 W向個體提供相應信息。購買高級注冊的注冊用戶可W獲得更新。對于基因型相關(guān)性分析 的注冊可W根據(jù)個體偏好提供新基因型相關(guān)性的特定類型或亞類的更新。例如,個體可能 僅希望獲悉存在已知治療或預防過程的基因型相關(guān)性。為了幫助個體決定是否進行另外的 分析,可W向個體提供關(guān)于已可利用的另外的基因型相關(guān)性的信息。運一信息可W方便地 郵寄或發(fā)送電子郵件給注冊用戶。
      [0149] 在高級注冊中,可W存在更多的服務等級,例如在基礎(chǔ)注冊中所提及的那些??蒞 在高等級中提供其它的注冊模式。例如,最高等級可W向注冊用戶提供無限制的更新和報 告。當確定新的相關(guān)性和規(guī)則時,可W更新注冊用戶的譜。在運一等級中,注冊用戶也可W 允許無限制數(shù)目的個體進行訪問,例如家庭成員和醫(yī)療保健管理者。注冊用戶也可W無限 制地訪問在線遺傳顧問和醫(yī)生。
      [0150] 在高等級內(nèi)的下一注冊水平可W提供更多限制的方面,例如有限次數(shù)的更新。注 冊用戶可W在注冊期間內(nèi)對其基因組譜進行有限次數(shù)的更新,例如,一年4次。在另一注冊 水平中,注冊用戶可W-周一次、一月一次或一年一次對其存儲的基因組譜進行更新。在另 一實施方式中,注冊用戶僅可W具有可W選擇更新其基因組譜的有限數(shù)目的表型。
      [0151] 個人入口也將方便地使個體能夠維持對于風險或相關(guān)性更新和/或信息更新的注 冊,或者請求更新的風險評估和信息。如上所述,可W提供不同的注冊水平W使個體能夠選 擇各種水平的基因型相關(guān)性結(jié)果和更新,并且注冊用戶可W通過其個人入口選擇不同注冊 水平。
      [0152] 運些注冊選項中的任一項將對本發(fā)明商業(yè)方法的收入流作出貢獻。本發(fā)明商業(yè)方 法的收入流也通過添加新的消費者和注冊用戶而增加,其中新的基因組譜加入到數(shù)據(jù)庫 中。
      [0153] 表1:具有與表型相關(guān)的遺傳性變型的代表性基因。

































      [0189] LOI90 J 引入化先數(shù)據(jù)
      [0191] 本發(fā)明還提供了通過引入祖先數(shù)據(jù)使用基因組譜使表型相關(guān)的方法和系統(tǒng),例如 在此描述的方法和系統(tǒng)。因此,評估個體的基因型相關(guān)性可被表達或報告為GCI評分,并可 在產(chǎn)生GCI評分中引入祖先數(shù)據(jù)。例如,用于確定GCI評分的OR可W基于個體的家系或種族 被改變。
      [0192] 個體發(fā)生某些狀態(tài)的風險通常取決于個體的遺傳和環(huán)境。當試圖基于遺傳學估計 該風險時,目前的研究可能受到僅所有遺傳學標記或變異(例如SNP)中的一部分可被測量 的事實的限制。特別地,對于復雜的疾病而言,許多遺傳和環(huán)境因素的復雜相互作用會導致 狀態(tài)的發(fā)生,因此可能存在多種邊緣性地影響風險的遺傳變異,例如SNP。目前的全基因組 關(guān)聯(lián)(Whole-Genome-Association,WGA)研究通常獨立地考慮基因組中的各區(qū)域,并試圖在 所有其它的遺傳因素和環(huán)境因素保持為未知時回答:該區(qū)域中特定的SNP中的突變是如何 影響該狀態(tài)的風險的。從算術(shù)上,運些研究主要估計了隨SNP變化的風險概率的邊緣分布 (運些分布在此稱為SNP的效應)。
      [0193] 發(fā)生狀態(tài)的風險可能不僅受一種遺傳變異或SNP的影響,而是會受多種SNP或其它 遺傳變異和環(huán)境因素的影響。因此,如果兩個群體在基因組中具有不同的等位基因分布并 處于影響他們的環(huán)境因素之中的話,那么各群體中特定的遺傳變異(例如SNP)的效應可能 存在潛在的差異。當該SNP民另一 SNP、其它的遺傳變異或環(huán)境因素之間存在基因一基因或 基因一環(huán)境相互作用時,尤其會出現(xiàn)運種情況。但是,即使當不存在相互作用時,其它的遺 傳和環(huán)境因素的不同"背景分布"也可能影響遺傳變異例如SNP的效應。因此,不局限于理 論,不同的群體對于相同的遺傳性變型(例如SNP)可具有不同的效應大小。但是事實上,在 其SNP效應大小已在多于一個群體中測量過的幾乎所有已知的狀態(tài)中,測量的效應或者相 互非常接近,或者彼此處于至少95%的CI內(nèi)。因此,在一些實施方式中,可W在本發(fā)明中使 用的簡化的假設(shè)是:遺傳變異(例如原因 SNP)的效應大小事實上在所有的群體中是相同的。
      [0194] 不幸的是,即使假設(shè)效應大小在群種中相同,仍然存在原因遺傳變異可能未知的 限制,例如原因 SNP不能被或未被基因分型。幸運的是,基因組中很接近的SNP或其它遺傳變 異可能是相關(guān)的,例如在LD中,因此即使原因 SNP未進行測量,標簽SNP也可用作原因的代替 (參見例如圖10)。但是,由于各種可能的原因(例如重組率的變化、選擇壓力或種群瓶頸), 不同的群體可能會具有不同的連鎖不平衡模式。因此,在一些實施方式中,如果已對群體A 中進行了研究,從而在該群體中獲得了特定的優(yōu)勢比,不能假定群體B中也具有相同的優(yōu)勢 比。運個可由下面的例子說明(參見圖10)。例如,已在高加索人(CEU)群體中進行了研究,并 且已報道了SNP中的一個("公布的SNP")具有大的效應大小。在該例子中,公布的SNP屬于與 原因 SNP共同的LD區(qū)塊,因此,原因 SNP和公布的SNP之間的r2(相關(guān)系數(shù)的平方)為1;盡管布 置不同,公布的SNP和原因 SNP優(yōu)選在CEU群中是相關(guān)的。但是,在另一群體(在運種情況中為 YRI,約魯己人)中,有可能公布的SNP和原因 SNP處于不同的LD區(qū)塊中。在極端的情況中,他 們具有r2 = 0,其中他們在該群體中相互獨立。在運種情況下,如果在YRI群中進行了相同的 研究,不會對公布的SNP中檢測到效應。因此,忽略消費者優(yōu)先的群體和最初研究的群體中 的LD模式來評估YRI個體的風險是錯誤的。圖10中的例子為一個極端的例子,但是在現(xiàn)實 中,可能W較低極端性的結(jié)果存在相似的模式。
      [01M]因此,在一些實施方式中,本發(fā)明提供了評估個體基因型相關(guān)性的方法,包括比較 具有不同家系的群體之間的基因座。例如,取決于如LD模式的因素,第一群體中出現(xiàn)的優(yōu)勢 比可W應用在第二群體中,或在第二群體中發(fā)生變化。例如,由于YRI具有比CKJ低的LD,對 于AS(亞洲人)而言,使用的優(yōu)勢比可按W下列順序為AS、YRI(約魯己人)、CEU(高加索人/歐 洲人)家系/種族研究中的優(yōu)勢比。在一些實施方式中,基因座特異性的家系可用于混合的 群體。
      [0196]在一些實施方式中,第一和第二群體的群體可包括但不限于任何其它的群體,例 如非裔美國人、高加索人、德系猶太人、西班牙系猶太人、印度人、太平洋島民、中東人、德魯 茲人、貝都因人、南歐人、斯堪的納維亞人、東歐人、北非人、己斯克人、西非人、東非人。除非 特別說明,第一和第二群體的群體可包括但不限于任何化PMap群體(YRI、C抓、C皿、JPT、 ASW、畑D、GIH、LWK、MEX、MKK、TSI KlIapMap 群體的描述可參見 http://hapmap.org/ hapmappopulations html en和附件中。
      [0197]
      [0198] 在一些實施方式中,用于評估個體的基因型與表型之間的相關(guān)性的方法可包括: 比較與表型相關(guān)的包括遺傳變異(例如SNP)的第一連鎖不平衡化D)模式和包括遺傳變異 (例如SNP)的第二LD模式,其中第一 LD模式為第一個體群體的LD模式和第二LD模式為第二 個體群體的LD模式;通過比較,確定第二群體中與表型相關(guān)的遺傳變異的概率;和從個體的 基因組譜,通過使用概率來評估表型的基因型相關(guān)性;和向所述個體或所述個體的醫(yī)療保 健管理者報告包括所述基因型相關(guān)性的結(jié)果。
      [0199] 例如,假定已針對第一群體A報告了公布的SNP P,其具有優(yōu)勢比0R[P,A],且原因 SNP是未知的。同樣在該例子中,假定對于第二群體B,如果樣本大小足夠大的話,優(yōu)勢比C在 A和B中是相同的,也就是0即(:,4]=0即(:,8]。因此,如果(:的位置是已知的,且0即(:,4]是已 知的,那么B中的LD模式可用于估計最佳的標簽SNP,W在群體中捕獲C。但是,在一些實施方 式中,C的位置是未知的,且C的優(yōu)勢比也是未知的。但是,對于每個SNP S和值X而言,概率可 W計算為:假定群體A中S和P之間的相關(guān)系數(shù)W及P為具有優(yōu)勢比0R[P,A]的公布的SNP, Prob[S = C,0R[C,A]=)(] |r2(P,S),在A,P,0R[P,A]]中,即S是優(yōu)勢比為X(假定無限的樣本 大?。┑脑?SNP的概率。為了計算該概率,在實際的研究中,利用優(yōu)勢比S比優(yōu)勢比C小的事 實,并可W回答假定對于足夠大的樣本大小0即S,A]應該接近別寸,發(fā)生此現(xiàn)象的概率是多 少的問題。給定原因 SNP的分布和他們的效應大小,標簽SNP的預期效應大小可通過計算由 不同的SNP作為原因得到的效應大小的期待值(加權(quán)平均值)來確定。
      [0200] 在圖10給出的例子中,既然LD區(qū)塊為完美的LD,C抓區(qū)塊中的所有SNP具有作為原 因的相同概率W及具有相同的效應大小分布(即log優(yōu)勢比為正常分布,其中置信區(qū)間確定 其標準差)。但是,當YRI中公布的SNP意在標記原因時,該SNP的預期優(yōu)勢比為公布的優(yōu)勢比 和1之間的加權(quán)平均值,其中權(quán)重對應設(shè)及的LD區(qū)塊的長度。
      [0201] 因此,在一些實施方式中,OR的改變可由下述方法確定:包括但不限于在第一個體 群體或參照群體(例如上述例子中描述的CEU)中對多個遺傳變異中的每一個確定原因遺傳 變異概率(例如OR)。然后OR可被用于從另一個體群體或參照組(例如YRI)的個體基因組譜 評估基因型相關(guān)性,從而向所述個體或所述個體的醫(yī)療保健管理者報告包括來自步驟(C) 的所述基因型相關(guān)性的結(jié)果。因此,用于計算其作為原因遺傳變異(例如原因 SNP)的概率的 各遺傳變異通常與第一群體中表型相關(guān)的已知遺傳變異(例如公布的遺傳變異,例如公布 的SNP)接近。在一些實施方式中,用于計算其作為原因遺傳變異(例如原因 SNP)的概率的各 遺傳變異與已知的或公布的遺傳變異發(fā)生連鎖不平衡。
      [0202] 例如,再次假定已在第一群體A中報告了公布的SNP P,其具有優(yōu)勢比0R[P,A],且 原因 SNP C是未知的,并假定對于第二群體B,如果樣本大小足夠大,A和B中的優(yōu)勢比C是相 同的,即0即(:,4]=0即(:,8]。例子中的另一假設(shè)為:對于研究的群體和個體群體而言,〇)模 式已知的。例如,盡管該例子可擴展到其它群體,但假定已對CKJ群體(第一群體)進行了研 究,且所述個體屬于YRI群體(第二群體)。在每個位置上,假定存在風險等位基因 R和非風險 等位基因 N。給定的SNP中S種可能的基因型為RR、RN和順。對于給定的SNP S,基因型G(可為 RR、RN或順)和個體組I,組I中在SNP S處具有基因型G的個體數(shù)目表示為F(S,I,G)。因此,公 布的SNP P中對C抓群體測量的優(yōu)勢比巧
      廷中CA和 CT代表病例和對照群體。類似地,使用f (S,I,G)來表示群體I中基因型G的頻率。對于SNP Si 和S2對而言,假定個體在S2處具有G2 (在C抓中),使用Pgeu( Si,Gi I S2,G2)表示個體在SNP Si處 具有基因型Gi的概率。使用相似的符號來表示第二群體YRI。
      [0203] 在一些實施方式中,算法被用于確定第二群體的0R,因此用于評估個體的基因型 與表型之間的相關(guān)性,例如通過使用GCI評分。例如,此處公開的算法的輸入和輸出可包括 下面提供的信息:
      [0204] 1)SNP(例如化pMap中公開的那些)和另一特定的SNP P(其為公布的SNP)的列表。
      [0205] 2)來自上述SNP的在研究中測定的SNP的列表。
      [0206] 3)對于公布的SNP P,假定已知下述之一:
      [0207] (a)來自病例和對照研究的基因型計數(shù),也就是每個基因型G的F(P,CA,G)值和F (P,CT,G)值是已知的。
      [020引(b)或者,假定對于SNP P,基因型的優(yōu)勢比、它們的置信區(qū)間、病例和對照的總數(shù) 是已知的。
      [0209] 4)對于每對SNP Si,S2和每對基因型Gi,G2而言,為算法提供Pceu(Si,Gi I S2,G2)和Pyri (Si,Gi I S2,G2)(該信息可從化pMap或其它參考數(shù)據(jù)集中獲得)。
      [0210] 然后在假定研究中的個體數(shù)非常大(接近無窮多)的情況下,算法可W對鄰近P的 每個SNP S輸出SNP的預期優(yōu)勢比。當樣本大小接近無窮的時候,算法會假定CEU(即第一群 體)和YRI(即第二群體)的原因 C的優(yōu)勢比接近相同的數(shù)目。
      [0211] 因此,此處公開的算法可包括下面的主要步驟(同時參見實施例5):
      [0212] 1)基于參考數(shù)據(jù)集得到LD概率。
      [0213] 2)如果它們不是作為輸入(可選的1-b),得到計數(shù)F(P,CA,G)、F(P,CT,G)。
      [0214] 3)在CKJ中,對于P處病例和對照的基因型頻率,采集n(n非常大,例如>>1000000) 個樣品。取樣是基于給出計數(shù)的f (P,CA,G)、f (P,CT,G)的后驗分布。
      [0215] 4)對于頻率的各種情況和對于各SNP S:
      [0216] (a)基于 P 的頻率和基于 Pceu 計算 f(S,CA,GWPf(S,CT,G)。
      [0217] (b)基于S中采樣的等位基因頻率產(chǎn)生。(5,〔4,6)、。(8,(:1',6)的情況。
      [0218] (C)基于F(S)和基于f(S)(后者為漸近意義上的P值)計算S的P值。
      [0219] (d)基于所有測量的SNP S來得到最小P值。如果其不是P,則拒絕該情況。
      [0220] (e)如果不拒絕該情況,那么該情況與基于f (S)的最小P值一起被保留;運將會是 該情況的原因 SNP。
      [0221] 5)之前的階段產(chǎn)生了一組原因 SNPsCi,…,Cn和它們相應的優(yōu)勢比。對于各該原因, 假定YRI群具有相同的優(yōu)勢比。
      [0222] (a)該信息與Cl處YRI中的基因型頻率一起被用于估計每一基因型G的頻率fYRi(Ci, CA,G)〇
      [0223] (b)LD信息被用于估計每一SNP S的'丫1?(5,〔4,6)兩1?(5,(:1',6),并基于運些頻率 來計算漸近的優(yōu)勢比。
      [0224] (C)對于各SNP S,漸近的優(yōu)勢比在所有情況中平均,從而產(chǎn)生預期的漸近優(yōu)勢比。
      [0225] 在一些實施方式中,祖先數(shù)據(jù)可用于評估個體他們的亞組,例如本發(fā)明提供了用 于評估個體的參考亞組的方法,包括:獲得個體的遺傳樣品;產(chǎn)生個體的基因組譜;通過比 較個體的基因組譜與當前的種族、地理來源或家系的人類基因型相關(guān)性數(shù)據(jù)庫來確定個體 的一個或多個參考亞組;和向個體或個體的醫(yī)療保健管理者報告步驟C)中得到的結(jié)果。
      [0226] 在一方面,參考數(shù)據(jù)集包括來自個體的多組基因分型數(shù)據(jù),其中基本上整個基因 組被用于本發(fā)明中。在一個實施方式中,參考數(shù)據(jù)包括來自多個個體的基本上完整基因組 的基因分型數(shù)據(jù)。其中在一個實施方式中,基本上完整的基因組是指在覆蓋至少80%的個 體基因組中的遺傳標記被檢測到,包括但不限于至少81 %、82%、83%、84%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或 100% 基因組 覆蓋。在另一個實施方式中,來自參考數(shù)據(jù)中包括的個體的至少75%的基因分型數(shù)據(jù)集包 括來自覆蓋各個體的基因組的至少80%的遺傳標記的信息。在進一步的實施方式中,來自 對照數(shù)據(jù)中包括的個體的大于75% (包括但不限于大于76%、77%、78%、79%、80%、81 %、 82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、 97 %、98 %、99 %或100 % )的基因分型數(shù)據(jù)集包括來自覆蓋各個體的基因組的至少80 %的 遺傳標記的信息。
      [0227] 在一個實施方式中,參考數(shù)據(jù)集包括多個遺傳標記的信息,該遺傳標記包括但不 限于核巧酸重復、核巧酸插入、核巧酸缺失、染色體轉(zhuǎn)位、染色體復制、拷貝數(shù)變異、微衛(wèi)星 重復、核巧酸重復、著絲粒重復或端粒重復或者SNP。在另一個實施方式中,參考數(shù)據(jù)集包括 基本上限于單個遺傳標記(例如SNPS或微衛(wèi)星)的信息。其中,參考集中包括的遺傳標記的 至少80%為相同類型的,包括但不限于至少81%、82%、83%、84%、85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或 100% 的遺傳標記。
      [0228] 在另一個實施方式中,參考數(shù)據(jù)集基本上由整個基因組SNP基因分型數(shù)據(jù)組成。在 一些實施方式中,通過使用用于SNP的識別和譜產(chǎn)生的高密度DNA陣列的個體基因組的分析 得到SNP數(shù)據(jù)。運種陣列包括但不限于那些可從Affyme化ix和I Ilumina購買的陣列(參見 AffymetrixGeneChip⑥500K Assay Manual,Affymetrix,Santa Clara,CA(在此引入作 為參考);.Senl;rix'⑧human化p650Y基因分型微球忍片,Illumina, San Diego ,CA)。在一些 實施方式中,參考集基本由使用Affymehix Genome Wide Human SNP Array 6.0對多于 900000個SNP進行基因分型而產(chǎn)生的SNP數(shù)據(jù)組成。在替代的實施方式中,通過完整基因組 采樣分析的多于500000個SNP可使用Affymehix Gene化ip Human Ma卵ing 500K Array Set確定。
      [0229] 在另一個實施方式中,參考數(shù)據(jù)集包括有關(guān)各個體的種族、地理起源和/或家系的 信息,包括其基因型數(shù)據(jù)。在一個實施方式中,所述信息存在于參考數(shù)據(jù)集中,例如化PMap 或Genographic Pro ject化ttps: //www3 .nationalgeographic. com/genographic/)。在另 一個實施方式中,所述信息是自我報告的,例如由注冊用戶或非注冊用戶報告。在另一個實 施方式中,注冊用戶可收到自我報告有關(guān)他們的種族、地理起源和/或家系的信息的獎勵。 在另一個實施方式中,注冊用戶可收到自我報告有關(guān)他們的疾病狀態(tài)的信息(例如有關(guān)他 們可能顯示出癥狀或具有遺傳的預傾向的任何疾病或狀況的信息)的獎勵。在另一個實施 方式中,個體收到允許使用運一信息和在至少一個參考數(shù)據(jù)集中的個體基因型的獎勵。在 一些實施方式中,獎勵可W是金錢獎勵、提供服務的折扣、提供免費服務、提供服務升級(例 如提高注冊用戶狀態(tài),從基礎(chǔ)類別升到高級會員類別)、對相關(guān)人提供免費或打折服務,或 向第S方供應商(例如Amazon、Starbucks、WebMD)提供打折、免費或信用服務。在相關(guān)的實 施方式中,公開設(shè)及他們的種族、地理起源和/或家系或者疾病狀態(tài)的注冊用戶或非注冊用 戶可被告知該公開信息的可能用途和給予提供或撤回他們的告知同意的機會。
      [0230] 在一個實施方式中,參考數(shù)據(jù)集包括來自具有不同的種族、地理起源和/或家系的 多個個體的信息。在另一個實施方式中,參考數(shù)據(jù)集包括來自所述參考數(shù)據(jù)集中代表的各 種族、地理起源和/或家系的類的一個W上的個體。在另一個實施方式中,參考數(shù)據(jù)集包括 來自所述參考數(shù)據(jù)集中代表的各種族、地理起源和/或家系的類的5個W上的個體。在另一 個實施方式中,參考數(shù)據(jù)集包括來自所述參考數(shù)據(jù)集中代表的各種族、地理起源和/或家系 的類的10個W上的個體。在另一個實施方式中,參考數(shù)據(jù)集包括來自所述參考數(shù)據(jù)集中代 表的各種族、地理起源和/或家系的類的20個W上的個體。
      [0231] 在另一個實施方式中,分析參考集中的組合數(shù)據(jù)W使種族、地理起源和/或家系與 至少一種疾病或狀態(tài)和遺傳標記關(guān)聯(lián)性相聯(lián)系。在另一個實施方式中,自我報告的種族、地 理起源和/或家系可用于標記特定的疾病或狀態(tài)用于風險分析。在另一個實施方式中,個體 的種族、地理起源和/或家系與他們的基因型相關(guān),W用于具有相似或共有的種族、地理起 源和/或家系的個體的亞組內(nèi)遺傳標記與疾病或狀態(tài)之間的關(guān)聯(lián)的進一步分析(例如計算 機上的(in Silico)群體遺傳研究)。例如,已知具有共同的種族、地理起源和/或家系的個 體(例如德系猶太人)的某些組,他們的孩子患有例如泰-薩克斯病的幾率要高很多。對自己 確認為德系猶太人的個體的分析可W在分析個體的遺傳標記時考慮該信息W進行修正。
      [0232] 在另一個實施方式中,參考數(shù)據(jù)集中的數(shù)據(jù)可分層為參考數(shù)據(jù)亞組。當作為整體 考慮時,群體可包括可能具有不同的等位基因頻率的多個亞組。群體中存在具有不同的等 位基因頻率的多個亞組可使關(guān)聯(lián)研究提供較少信息。在采樣的亞組中不同的基本等位基因 頻率可能與各組內(nèi)的疾病或狀態(tài)無關(guān),且它們可能導致連鎖不平衡或疾病相關(guān)性的錯誤結(jié) 論。將個體的基因型與參考數(shù)據(jù)亞組而不是整個參考數(shù)據(jù)集進行比較,可降低由假的等位 基因關(guān)聯(lián)造成的錯誤的幾率。各參考數(shù)據(jù)亞組中的數(shù)據(jù)可根據(jù)至少一種共有的特征(例如 共有的種族、地理起源和/或家系)進行組織。其數(shù)據(jù)包括在各亞組中的個體的基因型可被 進一步分析W確定指示特定的種族、地理起源和/或家系的共同遺傳標記。在替代的實施方 式中,參考集中組合的數(shù)據(jù)可用于與至少一種疾病或狀態(tài)相關(guān)的且還與至少一種種族、地 理起源和/或家系相關(guān)的遺傳標記。
      [0233] 在一個實施方式中,個體的至少一種自我報告的種族、地理起源和/或祖先特征被 用于修正個體基因型的分析。修正的分析可集中在與疾病或狀態(tài)相關(guān)的遺傳標記上,其同 時也是至少一個自我識別的種族、地理起源和/或祖先亞組共有的。在替代的實施方式中, 基于個體的基因型來確定與個體的種族、地理起源和/或家系相關(guān)的信息。例如,個體的基 因型與至少一種參考數(shù)據(jù)集相比較,并用于確定有關(guān)個體的種族、地理起源和/或家系的信 息。然后將該信息引入個體基因型的分析,W用于與至少一種疾病或狀態(tài)相關(guān)聯(lián)。該分析可 W集中在與至少一種疾病或狀態(tài)相關(guān)聯(lián)的遺傳標記上,其也可W是至少一種種族、地理起 源和/或家系共有的。
      [0234] 在另一個實施方式中,有關(guān)個體的種族、地理起源和/或家系的信息和來自個體遺 傳標記的分析的信息兩者都被用于確定個體共有特定的種族、地理起源和/或家系的幾率。 通過結(jié)合兩種類型的信息,從基因型分析獲得的信息可用于驗證個體的自我報告的種族、 地理起源和/或家系,和用于糾正任何錯誤。在一個實施方式中,有關(guān)個體的種族、地理起源 和/或家系的信息是自我報告的。在替代的一個實施方式中,有關(guān)個體的種族、地理起源和/ 或家系的信息是評估得到的。評估個體的種族、地理起源和/或家系可提供連續(xù)的手段W在 復雜疾病或狀態(tài)的研究中評估群體的結(jié)構(gòu)。基于個體自我報告的信息,可能在種族、地理起 源和/或祖先分組中存在相當數(shù)量的異質(zhì)性。例如,可W基于公布的等位基因頻率來估計個 體種族、地理起源和/或祖先比例(例如歐洲、北非、±著居民等)。估計的種族、地理起源和/ 或祖先比例的例子可用于代替自我報告的信息來研究至少一種遺傳標記與至少一種疾病 或狀態(tài)之間的關(guān)聯(lián)。然后遺傳風險模型可用于確定是否調(diào)節(jié)估計的個體種族、地理起源和/ 或祖先比例比不調(diào)節(jié)種族、地理起源和/或祖先的模型或基于自我報告的信息的模型能夠 更好地擬合數(shù)據(jù)。然后提供最好的擬合的模型可用于確定個體獲得至少一種疾病或狀態(tài)的 風險。
      [0235] 在另一個實施方式中,根據(jù)對個體完整基因組的貢獻,基于來自基因型和/或自我 報告的數(shù)據(jù)的個體的種族、地理起源和/或家系信息可用于算術(shù)地確定與個體最接近的一 個或多個參考亞組。例如,如果可W確定個體的基因型表明他/她共有表示多于一種種族、 地理起源和/或家系的遺傳標記。運種確定可包括可能性和任選地置信區(qū)間(例如存在X% ± Y),至少個體的親戚中的一個是來自特定的種族、地理和/或祖先起源。然后該確定可用 于告知個體在共有相似的種族、地理和/或祖先起源的個體中通常與至少一種疾病或狀態(tài) 相關(guān)的遺傳標記W及他們獲得所述至少一種疾病或狀態(tài)的風險。在另一個實施方式中,可 W產(chǎn)生包括有關(guān)各種不同的種族來源、地理起源和/或祖先來源對個體整個基因組的貢獻 的信息的報告。例如,報告可WW百分比描述在個體的整個基因組中聚積的祖先來源,例如 20 %來自非洲,30 %來自亞洲,50 %來自歐洲。在進一步的實施方式中,運種報告可任選地 包括置信區(qū)間(例如20 % ± 3來自非洲,30 % ± 5來自亞洲,50 % ± 2來自歐洲)。
      [0236] 在另一個實施方式中,個體的確定的種族、地理起源和/或家系可用于基于特定的 基因座的分析確定個體獲得至少一種疾病或狀態(tài)的風險。在一個相關(guān)的實施方式中,可W 對表征個體從具有特定的種族、地理起源和/或家系的親屬遺傳所述基因座的可能性W及 在所述基因座的等位基因與至少一種疾病或狀態(tài)之間的關(guān)聯(lián)性的至少一個基因座產(chǎn)生報 告。在另一個實施方式中,可集合至少兩個基因座特異性的關(guān)聯(lián)結(jié)果來確定個體獲得至少 一種疾病或狀態(tài)的組合風險。
      [0237] 在另一個實施方式中,可確定與之前的關(guān)聯(lián)研究中報告的那些個體具有不同的種 族、地理起源和/或家系的個體獲得至少一種疾病或狀態(tài)的風險。在另一個實施方式中,可 確定具有獨特或罕見的種族、地理起源和/或家系而使其難于或不可能發(fā)現(xiàn)用來比較個體 的基因型的參考數(shù)據(jù)亞組的個體獲得至少一種疾病或狀態(tài)的風險。例如,個體可能想知道 他/她獲得與他的種族、地理起源和/或家系直接相關(guān)的遺傳疾病的風險。一些尤其罕見的 疾病,例如眼咽肌肉萎縮癥,僅在群體中小的局部的組中被發(fā)現(xiàn)。具有運一特性的疾病通常 可追溯到單個發(fā)作者或有限數(shù)目的之前的疾病攜帶者。對于具有運一特性的疾病而言,如 果可W確定個體與最初的發(fā)作者或疾病攜帶者無關(guān),那么該個體通??蓮娘L險組中排除出 去。在一個實施方式中,對具有共同的遺傳背景或共同的種族、地理起源和/或家系的其它 個體進行一個或多個關(guān)聯(lián)研究是有利的。其中,個體的種族、地理起源和/或家系通過評估 或通過自我報告信息確定。運些研究可結(jié)合個體的基因型、種族、地理起源和/或家系W及 至少一種疾病或狀態(tài)的情況的信息??蒞比較來自至少兩個研究的結(jié)果W確定是否在遺傳 標記的等位基因與至少一種疾病或狀態(tài)之間觀察到相似的關(guān)聯(lián)。結(jié)果可取決于研究的各群 體中的相關(guān)結(jié)構(gòu)和等位基因頻率W及它們之間的關(guān)系。此外,所述研究可用于識別與對所 述至少一種疾病或狀態(tài)的易感性相關(guān)的遺傳標記。在一個實施方式中,缺乏至少一個遺傳 標記的至少一個等位基因可用于排除個體患至少一種疾病或狀態(tài)的風險。在替代的實施方 式中,對于至少一個遺傳標記存在至少一個等位基因可用于將個體劃分為具有患至少一種 疾病或狀態(tài)的風險。
      [0238] 下面的實施例用于闡明和解釋本發(fā)明。本發(fā)明的范圍不受運些實施例的限制。 [OZ39] 實施例
      [0240] 實施例1: SNP譜的產(chǎn)生和分析
      [0241] 向個體提供試劑盒(例如從DNA Genotek購買的)中的樣品管,個體將唾液樣品(大 約4ml)置于該管中,其中基因組DNA將會從唾液樣品中提取。唾液樣品被送至化IA授權(quán)的實 驗室用于加工和分析。樣品通常置于易于向個體提供的收集試劑盒的運輸容器中通過隔夜 郵寄方式被送至機構(gòu)。
      [0242] 在一個優(yōu)選的實施方式中,基因組DNA從唾液中分離出來。例如,使用來自DNA Genotek的DNA自我收集試劑盒技術(shù),個體收集用于臨床處理的大約4ml唾液的樣本。將樣品 送至合適的實驗室用于處理之后,通過熱變性和蛋白酶消化樣品來分離DNA,通常使用收集 試劑盒廠商提供的試劑,在50°C下進行至少一個小時處理。然后離屯、樣品,使用乙醇沉淀上 清液。DNA沉淀懸浮于適于后續(xù)分析的緩沖液中。
      [0243] 根據(jù)公知的方法和/或收集試劑盒廠商提供的那些方法,個體的基因組DNA從唾液 樣品中分離出來。一般而言,樣品首先被熱變性和蛋白酶消化。然后,離屯、樣品,保留上清 液。然后使用乙醇來沉淀上清液,得到含大約5-16yg的基因組DNA的沉淀。將DNA沉淀懸浮在 IOmM IYis pH 7.6,lmM抓TA(TE)中。使用陣列廠商提供的儀器和說明,通過將基因組DNA 和市售的高密度SNP陣列(例如可從Affymetrix或Illumina購買的)進行雜交來產(chǎn)生SNP譜。 個體的SNP譜被存放加密的數(shù)據(jù)庫或保險庫中。
      [0244] 通過與建立的、醫(yī)療相關(guān)的SNP(其在基因組中的存在與特定的疾病或狀態(tài)相關(guān)) 的臨床得到的數(shù)據(jù)庫進行比較,查詢患者的數(shù)據(jù)結(jié)構(gòu)的風險給予SNP。數(shù)據(jù)庫包括特定的 SNP或SNP單倍體型與特定的疾病或狀態(tài)之間的統(tǒng)計學相關(guān)性的信息。例如,如實施例1II所 示,載脂蛋白E基因中的多態(tài)性產(chǎn)生了該蛋白質(zhì)的不同同型體,其反過來與發(fā)生阿爾茨海默 病的統(tǒng)計學相關(guān)性相關(guān)。另一個例子是,具有凝血蛋白因子V(被稱為因子V Leiden)變型的 個體具有增加的凝血傾向。表1示出了其中與疾病或狀態(tài)表型相關(guān)的SNP的許多基因。數(shù)據(jù) 庫中信息的科學精確性和重要性已被研究/臨床咨詢委員會認可,并可由政府機構(gòu)監(jiān)督。隨 著科學界出現(xiàn)更多的SNP疾病相關(guān)性,數(shù)據(jù)庫被不斷更新。
      [0245] 通過在線入口或郵件安全地向患者提供個體的SNP譜的分析結(jié)果。向患者提供解 釋和支持性信息,例如對于實施例1V中的因子V Leiden顯示的信息。對個體的SNP譜信息的 安全訪問(例如通過在線入口)將有助于與患者的醫(yī)生進行討論,并給予個體個性化醫(yī)療的 選擇。 隣]實施例2:基因型相關(guān)性的更新
      [0247] 響應于初始確定個體基因型相關(guān)性的的請求,產(chǎn)生了基因組譜,建立了基因型相 關(guān)性,并向個體提供了結(jié)果,如實施例1所示。初始確定個體的基因型相關(guān)性之后,在另外的 基因型相關(guān)性已知時,后續(xù)的更新的相關(guān)性被確定或可被確定。注冊用戶享有高級水平的 注冊且他們的基因型譜被保留在加密的數(shù)據(jù)庫中。更新的相關(guān)性是在存儲的基因型譜上進 行的。
      [0248] 例如,最初的基因型相關(guān)性(例如上述實施例1中描述的)可能已經(jīng)確定:特定的個 體不具有ApoE4,因此不具有早發(fā)性阿爾茨海默病的傾向,和該個體不具有因子V Leiden。 在該初始確定之后,新的相關(guān)性可能成為已知的和確立的,從而在特定基因(假設(shè)基因 XYZ) 中的多態(tài)性與特定的狀態(tài)(假定狀態(tài)321)相關(guān)。運一新的基因型相關(guān)性被添加到人類基因 型相關(guān)性的主數(shù)據(jù)庫中。然后通過首先從加密的數(shù)據(jù)庫中存儲的特定個體的基因組譜中找 到相關(guān)的基因 XYZ數(shù)據(jù)來向特定的個體提供更新。特定個體的相關(guān)基因 XYZ數(shù)據(jù)與基因 XYZ 的更新的主數(shù)據(jù)庫信息相比較。特定個體對狀態(tài)321的易感性或遺傳傾向從該比較中確定。 該確定的結(jié)果被添加到特定個體的基因型相關(guān)性。向特定個體提供有關(guān)特定個體是否對狀 態(tài)321具有易感性或遺傳傾向的更新的結(jié)果,同時提供解釋和支持性信息。
      [0249] 實施例3:ApoE4基因座和阿爾茨海默病的相關(guān)性
      [0250] 已經(jīng)表明,阿爾茨海默病(AD)的風險與載脂蛋白E(APOE)基因中的多態(tài)性有關(guān),該 多態(tài)性產(chǎn)生了 S種APOE的同種型,被稱為ApoE2、ApoES和ApoE4。同種型之間在在APOE蛋白 質(zhì)中的殘基112和158位置上的1或2個氨基酸不同。ApoE2包含112/158cys/cys;ApoE3包含 112/158巧s/arg;和ApoE4包含112/158a巧/arg。如表2所示,阿爾茨海默病在較早年齡的發(fā) 作的風險隨著AP0EE4基因拷貝數(shù)而增加。同樣,如表3所示,AD的相對風險隨著AP0Ee4基因 拷貝數(shù)而增加。
      [0巧1 ] 表2: AD風險等位基因的流行度(Corder等人,Science: 261:921-3,1993) 「0巧71
      …誠」 買砸例4:巧于V Leiden陽性忠吞的信思
      [0256] W下信息是可能提供給具有顯示出存在因子V Leiden基因的基因組SNP分布圖的 個體的信息的示例。該個體可具有在初始報告中可W提供信息的基礎(chǔ)注冊。
      [0巧7] 什么是因子Y Leiden?
      [0258] 其是指存在由一個人的父母遺傳的特定基因。因子V Leiden是凝血需要的蛋白質(zhì) 因子W5)的變型。具有因子V缺失的人更可能嚴重流血,而具有因子V Leiden的人的血液凝 血傾向增加。
      [0259] 攜帶因子V Leiden基因的人們形成血凝(血栓形成)的風險比群體中的其它人高5 倍。但是許多具有該基因的人從不出現(xiàn)血凝塊。在英國和美國,群體的5%攜帶一個或多個 因子V Leiden基因,運遠多于將實際患血栓癥的人的數(shù)量。
      [0260] 你如何會有因子Y Leiden?
      [0%1]因子V的基因是從一個人的父母遺傳的。正如所有遺傳性特征,一個基因遺傳自母 親而一個遺傳自父親。由此,可能遺傳:兩個正?;蚧蛘咭粋€因子V Leiden基因和一個正 ?;蚧蛘邇蓚€因子V Leiden基因。具有一個因子V Leiden基因?qū)е律愿叩陌l(fā)生血栓癥 的風險,但是具有兩個基因?qū)е麓蟮枚嗟娘L險。
      [026。因子Y Leiden的癥狀是什么?
      [0263] 除非你出現(xiàn)凝血(血栓形成),否則沒有任何癥狀。
      [0264] 什么是危險信號?
      [0265] 最常見的問題是在腿部的血凝塊。腿部腫脹、疼痛和發(fā)紅顯示出運一問題。在更稀 有的病例中,可能出現(xiàn)肺部血凝塊(肺血栓癥),其導致呼吸困難。根據(jù)血凝塊的尺寸,運一 病癥的嚴重程度從幾乎不能被察覺到患者發(fā)生嚴重的呼吸困難。在甚至更稀有的病例中, 血凝塊可能發(fā)生在手臂或其它身體部位。由于運些凝塊形成在輸送血液至屯、臟的靜脈而不 是形成在動脈(其從屯、臟輸出血液)中,因子V Leiden不會使冠狀動脈血栓形成的風險增 大。
      [026引什么可W避免血凝塊?
      [0267]因子V Leiden僅輕微增大導致血凝塊的風險,并且許多具有運一狀態(tài)的人永不會 發(fā)生血栓癥。一個人可W做許多事情來避免導致血凝塊。避免W同一姿勢久站或久坐。當長 途旅行時,重要的是有規(guī)律地鍛煉一一必須使血液不"靜置不動"。熬夜或吸煙將極大地增 大出現(xiàn)血凝塊的風險。攜帶因子V Leiden基因的婦女不應該服避孕丸,因為運將顯著增大 患血栓癥的機會。攜帶因子V Leiden基因的婦女也應該在妊娠前咨詢其醫(yī)生,因為運也會 增大血栓形成的風險。
      [02側(cè) 醫(yī)生如何發(fā)現(xiàn)你具有因子Y Leiden?
      [0269] 因子V Leiden的基因可在血液樣品中發(fā)現(xiàn)。
      [0270] 腿部或胳膊的凝血可通常通過超聲檢查進行檢測。
      [0271] 在將一種物質(zhì)注入血液中W使血凝塊顯現(xiàn)后,血凝塊也可由X射線檢測。在肺里的 血塊更難于找到,但是通常醫(yī)生將使用放射性物質(zhì)去測試肺內(nèi)血流的分布和流至肺內(nèi)的空 氣的分布。運兩種分布模式應該相匹配一一不匹配表示存在血凝塊。 腳。如何處理因子V Leiden?
      [0273] 具有因子V Leiden的人們不需要進行治療,除非他們的血液開始凝結(jié),在運種情 況下,醫(yī)生將開出稀釋血液(抗凝血的)藥物,例如華法林(例如,節(jié)丙酬香豆素鋼)或者肝素 W防止進一步的血凝塊。治療通常將持續(xù)S至六個月,但是如果存在幾個血凝塊,則可能需 要更長時間。在重癥的情況下,藥物治療的過程可能無限期地持續(xù);在極稀有的情況下,血 凝塊可能需要手術(shù)移除。
      [0274] 在孕其月女日何處理因子V Leiden?
      [0275] 攜帶2個因子V Leiden基因的女性在孕期需要接受肝素促凝藥物的治療。相同的 治療適用于本身先前有血凝塊或者有血凝家族史的僅攜帶一個因子V Leiden基因的婦女。
      [0276] 所有攜帶因子V Leiden基因的女性在孕期的后半段中可能需要穿著特殊的長筒 襪W防止血凝塊。產(chǎn)后,她們可開抗凝藥物肝素。
      [0277] 題垣
      [0278] 出現(xiàn)血凝塊的風險隨年齡增大,但是在對100名攜帶該基因的人進行的隨年齡的 調(diào)查中,發(fā)現(xiàn)僅少數(shù)曾患過血栓癥。國家遺傳顧問學會(The化tional Society for Genetic Counselors(NSGC))可W提供你所在地區(qū)中遺傳顧問的列表W及關(guān)于建立家族史 的信息。在WWW. nsgc. org/cons皿er上捜尋他們的在線數(shù)據(jù)庫。
      [0279] 實施例5:產(chǎn)生具有不同家系的個體的優(yōu)勢比
      [0280] 1.基于參考數(shù)據(jù)集得到LD概率。
      [0281] 計算在SNP Si,S2處具有基因型對(Gi,G2)的化pMap個體的數(shù)目,W產(chǎn)生兩個SNP的 聯(lián)合分布。使用Bayes法則合并各SNP的邊緣分布來估計PcEU(Si,Gi I S2瓜)(C抓為公布的或 第一群體)和Pyri (Si,Gi I S2,G2) (YRI為第二群體,個體的祖先)。
      [0巧。2.如果它們不作為輸入給出(可選的1-b),得到計數(shù)F(P,CA,G),F(xiàn)(P,CT,G)。
      [0283]如果計數(shù)不作為輸入給出,下述方程組用于得到它們:
      [0286]
      [0284] F(P,CA,^)+F(P,CA,NR)+F(P,CA,RR)=N [02 化]F(P,CT,^)+F(P,CT,NR)+F(P,CT,RR)=M
      [0287]
      [028引
      [0289]
      [0290] 在上述方程中,UB(P,CEU,G)為公布SNP P的基因型G的優(yōu)勢比的置信區(qū)間上限。M 和N分別為研究中對照和病例的數(shù)目。
      [0291] 存在具有6個變量的6個方程。列舉所有的F(P,CA,順)和F(P,CA,RN)值。對于各對 值而言,確定其它變量的2-4方程是通過解一組線性方程得到的,最后兩個方程用于確認。 運行時間由N 2決定。
      [0巧。3.在CEU中采集在P處的病例和對照的基因型頻率的n個(n非常大,例如〉〉 1000000)情況。采樣是基于給定計數(shù)的f (P,CA,G),f (P,CT,G)的后驗分布。
      [0293] 假定f(P)(看到F(P)的幾率)可在多項分布的假定下進行計算。通過假定在可能的 ^口)值上的均勻先驗,已知概率?'〇6^。)巾。))〇?'〇6(。。)|^?))。版孤:方法被用于使用 Gibbs采樣器從該分布中采樣。
      [0294] 4.對于頻率的各種情況和各SNP S:
      [0巧引 a)基于P的頻率和Pc抓來計算f(S,CA,GWPf(S,CT,G)
      [0296] 公式
      目于估計該情況中的S處的頻率。 相似的公式可用作對照。
      [0297] b)基于S的采樣等位基因頻率來產(chǎn)生。(5,〔4,6),。(5,圳,6)的情況。運是通過假定 代表S處的基因型的多項隨機變量進行的。
      [0298] C)基于F(S)和基于f (S)來計算S的P值(后者為漸近意義上的P值)。
      [0299] 基于F(S) ,Armitage-化end檢驗被用于計算P值。為了計算漸近的P值,假定N個病 例和N個對照的樣本大小,具有與預期匹配的計數(shù),例如F(S,CA,G)假定為Nf(S,CA,G)。
      [0300] d)基于所有測量的SNP S的F(S)得到最小P值。如果運不是P,那么該情況被拒絕。
      [0301] e)如果該情況不被拒絕,那么基于f (S)保持該情況和最小P值;運是該情況的原因 SNP。
      [0302] 5.之前的階段產(chǎn)生了一組原因 SNPsCi,…,Cn和它們相應的優(yōu)勢比。對于各該原因 而言,假定YRI群體具有相同的優(yōu)勢比。 陶]a)該信息和Cl處YRI中的基因型頻率一起被用于估計每一基因型G的頻率fYRi(Ci, CA,G)〇
      [0304]為此,解下述方程:
      [0305]
      [0306] 因為fYRi(S,CT,G)被假定從對照群體化apMap)中已知,所W在該方程中存在立個 缺失的變量。因此上組方程組為一組線性方程,且可被有效地解出。
      [0307] b)LD信息被用于估計每一SNP S的'丫1?1(5,〔4,6)由1?1(5,口',6),并基于運些頻率來 計算漸近的優(yōu)勢比。運是通過與步驟4(a)相似的方式進行的。
      [0308] C)對于各SNP S而言,漸近的優(yōu)勢比為所有情況的平均值,產(chǎn)生了預期的漸近優(yōu)勢 比。
      [0309] 然后該優(yōu)勢比可用于確定個體的基因型相關(guān)性。
      [0310] 盡管在此顯示和描述了本發(fā)明的一些優(yōu)選實施方式,本領(lǐng)域普通技術(shù)人員明白運 些實施方式僅在于提供一些例子。在不偏離本發(fā)明的情況下,本領(lǐng)域技術(shù)人員可W做出一 些變化、改變和替換??蒞明白的是,對本發(fā)明實施方式的各種不同的替換可用于實施本發(fā) 明。下面的權(quán)利要求限定了本發(fā)明的范圍,運些權(quán)利要求和它們的等同物的范圍內(nèi)的方法 和結(jié)構(gòu)包括在此。
      【主權(quán)項】
      1. 一種建立用于評估個體的基因型與表型之間的相關(guān)性的數(shù)據(jù)庫的方法,包括: (a) 比較: (i)包含與表型相關(guān)的遺傳變異的第一連鎖不平衡(LD)模式,其中所述第一 LD模式為 第一個體群體的模式;和 (i i)包含所述遺傳變異的第二LD模式,其中所述第二LD模式為第二個體群體的模式; (b) 在包含代碼的計算機系統(tǒng)上由所述個體的基因組譜評估基因型與表型之間的相關(guān) 性,其中所述計算機系統(tǒng)通過(a)中的所述比較確定在所述第二群體中所述遺傳變異與所 述表型相關(guān)的概率來進行所述評估,其中所述代碼包含規(guī)則集,各規(guī)則表明至少一種基因 型與至少一種表型之間的相關(guān)性,且所述計算機系統(tǒng)將所述規(guī)則應用于所述個體的基因組 譜,所述概率為等位基因或基因型優(yōu)勢比(OR); (c) 包括使用步驟(b)中的所述概率由所述個體的基因組譜來評估所述表型的基因型 相關(guān)性,其中所述基因型與表型的相關(guān)性作為GCI評分報告;和 (d) 將所述基因組譜和所述相關(guān)性存放在數(shù)據(jù)庫中; 其中所述遺傳變異為單核苷酸多態(tài)性(SNP ),且其中所述OR源自已知的OR,其中所述已 知的OR用于與所述第一群體的所述表型相關(guān)的所述遺傳變異。2. 根據(jù)權(quán)利要求1所述的方法,其中所述第一群體和所述第二群體具有相似的LD模式。3. -種建立用于評估個體的基因型與表型之間的相關(guān)性的數(shù)據(jù)庫的方法,包括: (a) 在第一個體群體中確定多個遺傳變異中每一個的原因遺傳變異概率; (b) 確定作為第二個體群體中所述多個遺傳變異中的每一個的概率的步驟(a)中的各 所述概率,所述概率為等位基因或基因型優(yōu)勢比(OR); (c) 包括使用步驟(b)中的所述概率由所述個體的基因組譜來評估基因型與表型之間 的相關(guān)性,其中所述基因型與表型的相關(guān)性作為GCI評分報告;和 (d) 將所述基因組譜和所述相關(guān)性存放在數(shù)據(jù)庫中; 其中所述遺傳變異為單核苷酸多態(tài)性(SNP)。4. 根據(jù)權(quán)利要求3所述的方法,其中步驟(a)的各所述遺傳變異接近于與所述第一群體 中的表型相關(guān)的已知遺傳變異。5. 根據(jù)權(quán)利要求4所述的方法,其中步驟(a)的各所述遺傳變異與所述已知遺傳變異連 鎖不平衡。6. 根據(jù)權(quán)利要求1或3所述的方法,其中所述第二群體與所述第一群體的家系不同。7. 根據(jù)權(quán)利要求1或3所述的方法,其中所述個體屬于所述第二群體的家系。8. 根據(jù)權(quán)利要求1或3所述的方法,其中所述原因遺傳變異為未知的。9. 根據(jù)權(quán)利要求1或3所述的方法,其中所述報告包括通過網(wǎng)絡(luò)傳輸所述結(jié)果。10. 根據(jù)權(quán)利要求1或3所述的方法,其中所述報告通過在線入口進行。11. 根據(jù)權(quán)利要求1或3所述的方法,其中所述報告通過紙件或電子郵件進行。12. 根據(jù)權(quán)利要求1或3所述的方法,其中所述報告包括加密形式報告。13. 根據(jù)權(quán)利要求1或3所述的方法,其中所述報告包括非加密形式報告。14. 根據(jù)權(quán)利要求1或3所述的方法,其中產(chǎn)生所述基因組譜是通過第三方進行的。15. 根據(jù)權(quán)利要求1或3所述的方法,其中所述基因組譜是從遺傳樣品產(chǎn)生的。16. 根據(jù)權(quán)利要求15所述的方法,其中第三方獲得所述遺傳樣品。17. 根據(jù)權(quán)利要求15所述的方法,其中所述遺傳樣品為DNA。18. 根據(jù)權(quán)利要求15所述的方法,其中所述遺傳樣品為RNA。19. 根據(jù)權(quán)利要求15所述的方法,其中遺傳樣品從選自血液、頭發(fā)、皮膚、唾液、精液、尿 液、糞便、汗液和口腔樣品的生物樣品獲得。20. 根據(jù)權(quán)利要求1或3所述的方法,其中所述基因組譜為單核苷酸多態(tài)性譜。21. 根據(jù)權(quán)利要求1或3所述的方法,其中所述基因族譜包括截短、插入、缺失或重復。22. 根據(jù)權(quán)利要求1或3所述的方法,其中所述基因組譜使用高密度DNA微陣列產(chǎn)生。23. 根據(jù)權(quán)利要求1或3所述的方法,其中所述基因組譜使用RT - PCR產(chǎn)生。24. 根據(jù)權(quán)利要求1或3所述的方法,其中所述基因組譜使用DNA測序產(chǎn)生。25. 根據(jù)權(quán)利要求1或3所述的方法,進一步包括(e)使用附加的遺傳變異更新所述結(jié) 果。26. 根據(jù)權(quán)利要求1或3所述的方法,其中權(quán)利要求1所述的群體包括任意的HapMap群體 (YRI、CEU、CHB、JPT、ASW、CHD、GIH、LWK、MEX、MKK、TSI),或任意其它的群體,例如但不限于非 裔美國人、高加索人、德系猶太人、西班牙系猶太人、印度人、太平洋島民、中東人、德魯茲 人、貝都因人、南歐人、斯堪的納維亞人、東歐人、北非人、巴斯克人、西非人或東非人。
      【文檔編號】C12Q1/68GK105861664SQ201610237029
      【公開日】2016年8月17日
      【申請日】2008年9月26日
      【發(fā)明人】D·A·斯特普漢, J·韋塞爾, M·卡爾吉爾, E·哈爾珀林
      【申請人】生命科技臨床服務實驗室公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1