06 Broad institute(世界著名智庫有哪些?)

时间:2024-05-05 13:37:36 编辑: 来源:

9 19428-19433)。

歷史的來看,在好多人類基因組里的基因都是經過了長期,廣泛和細致的研究的,有很多是非常著名的,比如P53基因,P53基因能夠編碼一種分子量為53kDa的蛋白質,命名為P53。p53基因的失活對腫瘤形成起重要作用。P53基因與人類50%的腫瘤有關,目前發現的有肝癌、乳腺癌、膀胱癌、胃癌、結

腸癌、前列腺癌、軟組織肉瘤、卵巢癌、腦瘤、淋巴細胞腫瘤、食道癌、肺癌、成骨

肉瘤等等。P53基因是迄今發現與人類腫瘤相關性最高的基因,人們對P53基因的認識經歷了癌蛋白抗原,癌基因到抑癌基因的三個認識轉變,現已認識到,引起腫瘤形成或細胞轉化的P53蛋白是P53基因突變的產物,是一種腫瘤促進因子,它可以消除正常P53的功能,而野生型P53基因是一種抑癌基因,它的失活對腫瘤形成起重要作用.

其他很重要的基因比如轉化生長子(TGF-beta)基因,這也是個廣泛研究并發現是有一系列基因組成的超級家族,它是一個涉及包括發育、傷口愈合及細胞增殖和存活等諸多生物學過程的細胞外配體的大家族。由于這些蛋白質可以兼具促進生長和抑制生長的作用,因此人們認為它們既參與腫瘤的發生和轉移的過程又參與防止這些病理表現型出現的過程。

刺猬(Hedgehog)基因家族也是個非常重要的超級家族,刺猬基因家族的表達異常影響到生長發育,造成前腦無裂畸形等發育缺陷性疾病,對面部和神經系統的中線產生影響。表現為耳低位,雙側唇裂及腭裂、單中央門齒、缺陷性中央神經系統分隔,小頭、眼異常、眼間距縮短、智力發育遲緩、耳聾、驚厥及室間隔缺損,一些嚴重的病例甚至有單眼癥。此外,刺猬基因家族通路中某一部分發生突變,可以發生癌變。已知刺猬基因家族的病變能夠造成基底細胞癌綜合征、單發基底細胞癌、髓母細胞瘤、腦膜瘤、神經外胚瘤,乳腺癌、食管癌、鱗狀細胞癌和毛發上皮瘤等等。

很多基因對機體的影響不僅具有正反雙向功能,而且還不止作用于一個系統,有的基因參與機體的好幾個系統的病變,像Runx基因家族,Runx-1基因與兒童最常見的癌癥—急性淋巴細胞性白血病有關;Runx-2則參與調控成骨細胞分化和骨質形成及自身免疫病;Runx-3與胃癌和直腸癌細胞的形成有關。

從功能方面,基因可以分類為很多基因家族,例如 腫瘤基因家族:p53, Rb, mTor, TGF-beta, WNT,

Hedgehog,,Runx,C-myc, Ras 等等。發育基因家族: FGF,TGF-beta, Wnt, Hedgehog,Notch1

等等。免疫基因家族: Ig家族,TNF,IFN, Foc-P3,PTPN22, IL家族,Th1,Th2和Th17細胞基因等等;炎癥基因家族:, TNF,

PTPN22,TGF-beta等等;干細胞基因家族: Oct-3/4, SOX2, c-Myc, and Klf4等等. 細胞調亡基因家族:

Caspase1-8,Bcl。。。等等 。

美國《時代》雜志在2007年評出了當年十大科學發現, 其中的發現之一就是兩本權威期刊

《Cell》及《Science》在2007年11月20日同時刊出來自美國及日本兩個研究團隊的一項報告,證實皮膚細胞經過“基因直接重組(direct

reprogramming

)”后可以轉化成為具有胚胎干細胞特性的細胞。這項發現一方面解決了利用胚胎進行干細胞研究的道德爭議,另一方面也使得干細胞研究的來源更不受限。這兩個研究團對分屬于日本京都大學及美國威斯康辛大學麥迪遜分校的兩個團隊雖然獨立研究,但使用的方法幾乎完全相同,更巧合的是竟然同時分別被兩本期刊審核通過,證明基因直接重組技術的確有效。他們所使用的方式都是利用病毒將四個基因送入皮膚細胞,促使普通的皮膚細胞產生變化,最后成為帶有胚胎干細胞性質的細胞,稱為誘導式多能性干細胞

(iPS)。

在這兩個研究團隊中,日本京都大學山中伸彌(Shinya Yamanaka)發現只需要將四個基因 Oct3/4, Sox2, c-Myc, Klf4

送入已分化完全的小鼠纖維母細胞,即可以把纖維母細胞重新設定變回具分會全能性的類胚胎干細胞”誘導式多能性干細胞” (inced pluripotent

stem cells, iPS cells)。而美國威斯康辛大學的湯姆森(James Thomson)研究團隊則利用了OCT4, SOX2, NANOG,

and LIN28四個核心基因,同樣也可以將人類體細胞重新設定變回干細胞,成為Ips 細胞。

既然生命體最初是從一個干細胞發育而成,干細胞的萬能分化和再生特又使干細胞具有特殊的重要意義,那么干細胞基因家族可是說是生物機體里最重要的基因家族了,因為干細胞具有再生和驚人的分化能力,是很多組織,器官和細胞的根源和起始。根據山中伸彌教授和湯姆森教授團隊的研究最初需要四個誘導式多能性干細胞核心基因Oct3/4,

Sox2, c-Myc, Klf4或者OCT4, SOX2, NANOG, LIN28。但是最近德國馬普研究所舒樂教授(Hans R.

Schöler)團隊發表在《Cell》上的文章把這項工作推向了更進一步,他們只用了一個基因OCT-4就成功的在體細胞中誘導出了多能性干細胞iPS!他們的論文摘要是這樣的:

The four transcription factors Oct4, Sox2, Klf4, and c-Myc can ince

pluripotency in mouse and human fibroblasts. We previously described direct

reprogramming of alt mouse neural stem cells (NSCs) by Oct4 and either Klf4 or

c-Myc. NSCs endogenously express Sox2, c-Myc, and Klf4 as well as several

intermediate reprogramming markers. Here we report that exogenous expression of

the germline-specific transcription factor Oct4 is sufficient to generate

pluripotent stem cells from alt mouse NSCs. These one-factor inced

pluripotent stem cells (1F iPS) are similar to embryonic stem cells in vitro and

in vivo. Not only can these cells can be efficiently differentiated into NSCs,

cardiomyocytes, and germ cells in vitro, but they are also capable of teratoma

formation and germline transmission in vivo. Our results demonstrate that Oct4

is required and sufficient to directly reprogram NSCs to pluripotency.

值得指出的是舒樂教授是在神經細胞中只用一個OCT4基因就誘導出了多能性干細胞,而神經細胞的分化和發育是所有組織細胞中很難的一類,這也從另一個方面說明了OCT4基因的重要性!OCT4是參與調控胚胎干細胞自我更新和維持其全能性的最為重要的轉錄因子之一,同時也是體外建立誘導多功能干細胞(iPS)的關鍵基因。

OCT4基因在干細胞的增殖、分化、應激反應、凋亡過程等多個生物學過程中發揮著重要作用。OCT4基因含有一種叫POU的功能區域,POU的意思是(Pit

Oct

GATK:HaplotypeCaller變異檢測

本文是閱讀一個做算法的文章,有些收獲和想法,作為一種記錄

我們在使用gatk call snp的時候,常常使用HaplotypeCaller這個參數,這個參數的目的是檢測出用來進行snp及小indel變異

一般在重測序變異檢測中,需要測一定深度的reads,那么gatk HaplotypeCaller首先根據參考基因組過一遍,找到那些高變異的區間,然后對區間內的數據及基因組進行組裝并且預估單倍型,再就是根據該單倍型計算似然值,最后判定

這一過程類似于序列比對:

也就是說在第一步檢測高變異區間以后,gatk會根據測序reads的情況重組單倍型,當然根據位點的不同變異會組裝出許多單倍型,那么重組好的單倍型相互之間進行比對,從而篩選出它們之間的變異snp

最后,將這一些單倍型和參考基因組比對,這樣就篩選出單倍型之間以及單倍型和參考基因組的snp變異信息了(圖中黃色表格)

上一步我們說到根據不同reads的變異信息組裝出許多的單倍型,那么我們就要將這些reads重新比對會這些單倍型,并且構成單倍型矩陣(某個位點的單倍型矩陣)

利用馬爾可夫模型進行序列比對

對高突變區的重組單倍型完成后,接下來需要進行分型檢驗,即檢測所測物種突變成什么類型的堿基,以及突變為一個堿基還是兩個堿基

確定該物種突變所得的類型以后,與參考基因組對比,看看突變情況

上圖表示:

根據上述計算,我們可以得到突變基因矩陣,并且定義如下關系式子:

接下來我們根據等位基因矩陣計算每一種突變類型的概率值,其中G(C/C)為突變基因矩陣第一列的每個元素和自己相加再除以2,最后結果相乘;而G(C/A)為突變基因矩陣每一行的前后兩個元素相加,再除以2,最后結果相乘,以此類推,最后將這些基因型的似然值相加,得到0.00

搜索关键词: