2016年2月24日 星期三

用電腦操控基因的修改模式

Software Helps Gene Editing Tool CRISPR Live Up to Its Hype

22 Feb 2016 | 17:00 GMT

detail: original story, essay


生物技術學家對於可以使用革命性的基因修改工具-CRISPR-感到亢奮。這分子工具可以被設定去剪開任意有機生命的 DNA,但是,這顯然需要一個軟體演算法來加速這個過程。很多研究小組嘗試去發明這種演算法,但是他們同樣都面臨到一日千里的科學演變及日趨飽和的研發環境。



常間回文重複序列叢集的縮寫 CRISPR 是一個在微生物發現的現象,並被科學家運用於關閉基因或附加 DNA 至所希望的位置。雖然說 CRISPR 不是目前唯一的基因修改技術卻是最便宜且最簡單的。因為技術發展四年多了,CRISPR 目前已經被推廣到世界的各端了,研究員可以用這個技術取出再動物的基因來研究其作用、給予作物新的性質、合成可以生產藥物的微生物、使用基因療法來對抗病症及可能可以修改人類胚胎細胞不好或生病的基因。

麻省總醫院心血管研究中心的生物學家 Jing-Ruey Joanna Yeh -CRISPR 的發明者-說道:「CRISPR 已經使全球的實驗室改變,因為這項技術太方便太有效率了,每個人都可以做。傳統的方法使 DNA 進入細胞卻不知道會被放到哪裡;反觀 CRISPR,就好像楚瑜兩的音文字母之間的游標看你要 "delete" 還是 "ctrl+v",這一切的一切只需要不到美金 50 元。隨然說也有另外一項基因修改技術可以達成相同的準確度,但相較而言,花的錢實在是太多了。」


加州大學柏克萊分校 Innovative Genomics Initiative 的負責人 Jacob Corn 提及:「雖然說 CRISPR 很好,但是他不一定每一次都有效,我們也不太知道背後的原因,但這就是軟體演算法可以幫忙的地方。演算法幫忙研究者設計他們自己的 CRISPR 工具,讓他們至少在統計學的角度而言,更容易成功。」
Illustration: Emily Cooper

CRISPR 系統有兩項重要的特徵。一是可程式化的小段基因-嚮導 RNA-,另一則是個蛋白質-一種名為 Cas9 的酶-,兩個東西加起來就是一把分子剪刀。當複合物一進到細胞內,嚮導 RNA 就指引 Cas9 到精確的 DNA 或基因位置且像魔鬼氈一樣黏上去,讓 Cas9 盡情地去鍘開 DNA。然後細胞內部的機制會自動修補這個缺口,不管是用掉一些或增加一些 DNA,研究者也可以刻意地加上一段基因。至於嚮導 RNA 則是藉由尋找與自己互補的 DNA 片段做結合,這片段是由 A(腺嘌呤)、T(胸腺嘧啶)、C(胞嘧啶) 和 G(鳥嘌呤) 組成。

科學家通常會找尋一段有意義有作用的 DNA 也就是基因-通常會有成千上百個核苷酸-然而,嚮導 RNA 通常就由 20 來個核苷酸組成,而這就衍伸出兩個重點需要考慮。一是這需要位於分子剪刀可辨識的 DNA 順序附近;這 20 來個核苷酸順序不可以到處都有。分子剪刀可辨識的 DNA 順序又稱為 PAM,在 DNA 上,PAM 出現的頻率可以跟 "the" 在英文書的頻率相比任何一段鄰近 PAM 20單元的片段,其互補段可為嚮導 RNA。

然而,確定一個獨一無二的嚮導 RNA 片段不太容易。因為基因密碼元素只有四種,而且物種的基因序列數一億上下,其序列常常重複,而且嚮導 RNA 有時會被指相差一、兩個核苷酸但卻是錯誤的片段吸引過去。巴斯德研究院的資訊學家也是 CRISPR 軟體 Protospacer 的共同製造者 Cameron Ross McPherson 說,我們可以嘗試使用肉眼尋找該片段,這將花上一輩子。

演算法可以用使用者少少的輸入來進行快速的運算。哈佛大學研發的 CHOPCHOP 就只較使用者輸入生物、基因及其他選擇輸入的參數。在幾秒內,他們就找到許多鄰近PAM的 20 個核苷酸序列,他們還以他們的特殊程度及其他參數來排序,甚至還給使用者推薦使用的嚮導 RNA。舉斑馬魚為例,spaw gene 就可以得出 55 個嚮導 RNA,且互相大致都相差兩個核苷酸。

近兩年,這種類似的軟體如雨後春筍般地冒出。大部分都是免費給外界使用,而有些公司如舊金山的 Benchling 給出了更友善的使用介面,縱使如此,E-CRISPR 的共同研發者也同是德國癌症研究中心的 Michael Boutros 說道,目前沒有人能在這個領域成為領頭羊的地位,且還有許多事要做。

上面提到的 55 個嚮導 RNA 理論上都是可行的,但是研究學者還要不斷的嘗試及修正才能決定說誰較好。為了達成真正決定那最佳嚮導 RNA 的目標,許多生物統計學家正檢視歷來的實驗數據,希望找出成功嚮導 RNA 的特性來告訴機器學習的系統。但是眾多的研究室分散的、零碎的及規模較小的,加州大學柏克萊分校 Jacob Corn 提及:「如果將眾數據整合在一起,這就會是個強大的資料庫。」這也暗示著電腦工程師的參與重要性。目前位於麻州劍橋的博德研究所就已經將經過 2000 筆嚮導 RNA 淬鍊所得出的新規則發表出去,這將會是改革演算法重要的原則。

同時,科學家們正在修改 Cas9 及其他剪 DNA 的蛋白來給出更多選項給 CRISPR 的使用者。有些蛋白則是使嚮導 RNA 的準確度提高,到時這種要求最佳嚮導 RNA 的軟體可能就不必要了至少他們可能演變成其他形式。