單細胞轉錄組測序和單細胞ONT全長轉錄組揭示聽覺和耳聾生物學見解

本期小編為各位介紹最新ONT全長轉錄組測序應用于聽覺相關細胞isoform分析案例。

材料方法

單細胞RNA測序是一種強有力的工具,通過它可以表征低豐度細胞類型的轉錄特征,但它在內耳的應用受到了骨迷路、感覺細胞在組織分布稀疏和難以分離膜性耳蝸超稀少細胞的困難。

1、從p15、p30、p70和p228雄性和雌性C3-Heb/FeJ小鼠(Mus?musculus)收獲耳蝸組織,倒置顯微鏡下鑒定并使用顯微操作吸管法分離目的細胞:IHCs、OHCs和Deiters細胞(Deiters’?cells,DCs)。(內毛細胞(inner?hair?cells,IHCs)和外毛細胞(outlier?hair?cells,OHCs);Deiters細胞是哺乳動物耳蝸內的一種支持細胞,與外毛細胞(OHC)的關系非常密切。)

2、SmartSeq2單細胞擴增,IHC?(n?=?42),?OHC?(n?=?127),?and?DC?(n?=?39)進行二代Illumina平臺轉錄組測序;12個p15小鼠OHCs進行ONT全長轉錄組測序。

研究結果

1、耳蝸非感覺細胞豐度估計與單細胞分離

與哺乳動物耳蝸中的各種支持細胞類型相比,聽覺HC的豐度較低。為了估計小鼠耳蝸膜迷路中可用于單細胞分離的HC數量,據報道在成熟的小鼠耳蝸中約765個IHCs,通過對小鼠顳骨中心切片,細胞核計數,估計小鼠膜性迷路中的細胞數為415,395,其中IHC和OHC比例僅為0.19%和0.59%。

為了研究占比極低的目的細胞,作者進行了細胞分離,詳細方法見文章。本研究主要關注具有明顯不同形態特征的IHC?(n?=?42),?OHC?(n?=?127),?and?DC?(n?=?39),同時他們來自于不同發育時期:p15(過濾后n=132)、p30(n=6)、p70(n=54)和p228(n=6)。該設計有利于時間和tono-topic差異表達分析。(聽覺系統對語音的基本表達方式是“音調拓撲的”(tono-topic),即基底膜及毛細胞都具有頻率選擇及分解作用,可以把進入耳蝸的聲波分解為一組不同的頻率成分,或者說用這組頻率成分來表達原聲波信號。)

2、質控、無偏聚類及表達譜分析

去除有表達的基因(count值>0的)少于2000個的細胞,接下來進行主成分分析PCA分析和tSNE聚類分析。由于在所有細胞類型中Top?100高表達基因表達水平不一致,去除了7個細胞數據;由于未與形態學分組聚類到一起,去除3個細胞數據。剩余的一組高質量細胞數據,在每個細胞轉錄組的總reads中含有低百分比的線粒體轉錄本,這是值得注意的,因為每個細胞線粒體reads數百分比增加表明細胞死亡增加。

使用Seurat進行基于主成分1和2的無偏差聚類(圖1E)。得到的tSNE?clusters顯示IHC、OHC和DC分離明顯,形成與其形態學分組一致的無偏細胞特異性組(圖1F)。為了鑒定每種細胞類型的特征性表達模式,在AUC分類器下為每種細胞類型提取了前100個cluster定義基因(圖1G)。

為了比較細胞類型之間表達譜,計算各cluster內所有細胞中每個基因平均表達水平。通過維恩圖對平均表達譜比較,每種細胞類型約表達700個特異基因(OHC-753;?IHC-655;?DC-713;歸一化后counts>10)。且發現IHCs和DC具有高比例重疊(共享750個基因,與OHC和DC共享564個基因相比),但是IHC和OHC共享771個基因表達(圖2A)。為了更嚴格地測試每種細胞類型的轉錄相似性,使用所有基因進行Pearson相關和R2回歸分析?;毓櫸治?,所有3組間比較中發現了強相關性,OHCs和IHC之間的相關性最高,OHCs和DC之間的相關性最低。OHC和DC表達譜最不相似可能反映了OHC高水平特化(圖2B)。

為了定義每種細胞類型的特征性表達譜,通過cluster內各個細胞的標準化表達水平對所有基因進行排序。每種細胞類型的表達譜通過少量高表達基因(對數平均表達水平在2和7之間)和大量低表達基因(對數平均表達水平<2)來表征(圖2C,2E和2G)。在按細胞類型排名前50的最高表達基因中,一些基因,如Fbxo2和Skpa1,在所有3種細胞類型中高度表達;而其他基因,如Ocm和Fgfr3,主要僅在一種細胞類型中表達。使用AUC排序,提取每組的cluster定義基因以鑒定特定細胞類型特異性marker基因(圖2D,2F和2H)。前10個cluter定義基因的小提琴圖揭示了眾所周知的marker基因OHC(Ocm和Slc26a5)、IHC(Otof和Atp2a3)和DC(Bace2和Ceacam16)??梢醞ü齭cRNA-Seq瀏覽器工具(Web資源:https://morlscrnaseq.org/)訪問小提琴圖對應的完整基因列表。

3、差異表達分析

已知細胞類型marker基因高度差異表達,例如prestin(Slc26a5),其在OHCs中穩健且差異表達。與公布的OHC和IHC轉錄組數據進行比較,搜索具有不一致排名的基因,假設通過AUC而不是表達水平對基因進行排序將在更廣泛的表達水平上鑒定細胞類型定義基因。按AUC分類排名時,兩個鈣相關基因Ocm和Sri在OHC定義基因列表中排名第一,甚至超過Slc26a5,排名第三(上圖2F)。先前已在OHC中報道了Ocm的表達。編碼蛋白質oncomodulin(癌調蛋白)是鈣結合蛋白家族成員之一,它是耳蝸聽力擴增所必需的。Sri編碼sorcin(可溶性耐藥相關鈣結合蛋白),一種在心肌細胞中表達的蛋白質,是鈣介導的興奮-收縮偶聯所必需的,通過抑制Ryr通道(Ca2+釋放通道/RyR受體)進行鈣離子介導的鈣離子釋放?(CICR)。在肌細胞中,Ryr通道介導CICR,能夠從肌質網中快速釋放Ca2+離子,從而產生對于肌肉收縮必不可少的時空限制性鈣火花。

免疫熒光僅將sorcin僅定位于OHC(圖3A,3B),假設類似的機制可以調節基于prestin的運動(圖3C和3D,動力蛋白?Prestin是一種高度專業化的蛋白質,可以起到驅動耳蝸中外部毛細胞的作用,使耳蝸可以讓人們和動物聽到聲音)。與此可能性一致,作者確定了在OHCs中表達sorcin介導的興奮-收縮途徑的基本組分,包括(1)電壓門控鈣釋放通道,(2)促進CICR的通道,(3)終止CICR的機制(sorcin),和(4)鈣泵使釋放的Ca2+返回Ca2+儲庫(圖3E)。本數據集和他人數據集中檢測到的第一個組分是耳聾基因Cacna1d,一種在OHCs中高表達的電壓門控鈣釋放通道,參與心動過緩有關的綜合征性耳聾;第二個組分,即促進CICR的通道,包括Ryr1、Ryr2和Ryr3。在通過Ryr通道誘導CICR后,sorcin的作用可能是通過在Ca2+存在下阻斷Ryr受體來快速終止CICR,這是先前在心肌細胞中報道的途徑。已知定位于OHC表面下池的Ca2+?ATP酶泵可從細胞溶質中除去Ca2+。附著蛋白質(Ocm)等結合并緩沖Ca2?+的輔助蛋白質可能有助于這一過程。

4、轉錄本結構分析

大多數耳聾相關基因在IHC和OHC中表達,但它們在這些細胞中的isoform結構仍未得到很好的解析。SmartSeq2單細胞轉錄組測序,可克服細胞異質性和低豐度表達,以定義聽覺HC中的基因產物結構,比如可變剪切。小鼠Myo15中檢測到已報道的3個事件:(1)可變轉錄起始位點TSS事件:mm10?chr11:60,480,418-60,480,621;(2)位于chr11的6bp外顯子:60,486,893-60,486,898;(3)剪接受體位點導致在位置chr11:60,497,434-60,497,576的提前終止。另外,檢測到3個新的未報道注釋的features:包括未報道的OHC特異性可變剪接受體位點(chr11:60,483,616-60,483,806),其中包含移碼和提前終止,表明可能的功能作為調控元件,與報道位于chr11位置的剪接受體位點:60,497,434-60,497,576類似,以及位于chr11的剪接位點:3’UTR中的剪切位點:60,527,450-60,527,710。

鑒定孟德爾耳聾的基因中未注釋的feature,在12個聽力喪失基因中鑒定出20個高度保守的未注釋外顯子(表1;圖4和5)。鑒定的編碼和非UTR含有外顯子的平均大小為55bp,這些外顯子位于小鼠外顯子的最小十分位數中(33%的小鼠外顯子<100bp;?6.9%<50bp)。

5、全長isoform鑒定

為了解決全長isoform結構,進行了ONT全長轉錄組測序,并使用Illumina短reads序列數據作為確認的scaffold,用于nonopore長讀長數據比對。與150-800bp片段大小的Illumina?reads不同,Nanopore測序不需要片段化文庫,并且可以產生跨越mRNA轉錄本長度的單一reads(圖6A和6B)。對p15時間點的12個OHC細胞加barcaod以在4個MinION?R9.4?flow?cell上測序所有樣品,同時保持單細胞分辨率(圖6A)。因為OHCs是最多和最差異的Illumina數據集,這有助于跨平臺比較以驗證長reads和isoform定量。

長讀長ONT全長數據顯示出驚人的isoform異質性。例如,檢測到445個reads比對到耳聾相關基因Cabp2。通過Mandalorion?pipeline鑒定了14種不同isoform。但當高度相似的isoform?configurations(構型)組合去冗余時,該數量下降至5(圖6B)。通過量化每種isoform的豐度,在每個單獨的細胞和更廣泛的OHC組中鑒定了主要的isoform configurations(構型)(圖6C-6E)。最常檢測到和大量表達的configurations是isoform1。查詢了公開可用的鼠注釋數據庫(RefSeq,GenBank,GENCODE和UCSC基因)和數據集(來自GenBank和UCSC基因組瀏覽器的mRNA),但未發現該isoform的注釋。除了它在小鼠中的缺失外,還無法在RefSeq,GenBank,GENCODE和UCSC人類數據庫中鑒定出與isoform1結構上直系同源的轉錄本。

小結

Highlight

  • 單細胞RNA-seq可鑒定內毛細胞(inner?hair?cells,IHCs)和外毛細胞(outlier?hair?cells,OHCs)定義基因;

  • Sorcin是心臟興奮-收縮的關鍵因子,是OHCs的top?marker基因;

  • 對耳聾相關基因的分析鑒定了迄今未被識別的外顯子;

  • Nanopore長讀長RNA-seq(全長轉錄組測序)揭示剪接多樣性和isoform豐度。

參考文獻:Ranum?P?T,?Goodwin?A?T,?Yoshimura?H,? et?al.?Insights?into?the?Biology?of?Hearing?and?Deafness?Revealed?by? Single-Cell?RNA?Sequencing[J].?Cell?reports,?2019,?26(11):?3160-3171.? e3.

 

如果您的科研項目有問題,歡迎點擊下方按鈕聯系我們

最近文章