246
回編集
Masahitoyamagata (トーク | 投稿記録) 細 (→組織からの細胞、細胞核の分離) |
Masahitoyamagata (トーク | 投稿記録) 細編集の要約なし |
||
9行目: | 9行目: | ||
{{box|text= | {{box|text= | ||
シングルセルRNAシーケンシング(single cell RNA sequencing, 以下scRNA-seq)は、次世代シーケンシング (next generation | シングルセルRNAシーケンシング(single cell RNA sequencing, 以下scRNA-seq)は、次世代シーケンシング (next generation sequencing、以下NGS)技術を使用して個々の細胞が発現しているmRNA全体、つまりトランスクリプトームを質的、量的に網羅的に調べ、細胞ごとの違いを高解像度で検出、分類することで、細胞の分類を行うことができる分子生物学的、コンピュータ生物学的技術である。また、刺激、発生など細胞の状況に応じて、個々の細胞のトランスクリプトームの情報を得ることで、病態や細胞系譜などの解析も可能である。特に多様なニューロンが存在する神経系では、この方法により、神経細胞や非神経細胞の分類や状態についての知見が深まり、更に新しいバイオマーカー(biomarker)の発見などが系統的かつ網羅的に行われるようになった}} | ||
==scRNA-seqとその開発史== | ==scRNA-seqとその開発史== | ||
15行目: | 15行目: | ||
トランスクリプトーム(transcriptome)は、細胞中に存在する全ての転写産物(タンパク質をコードするmRNA、タンパク質をコードしないノンコーディングRNA、マイクロRNAなど)の総体である<ref><pubmed>19015660</pubmed></ref><ref><pubmed>31341269 </pubmed></ref>。トランスクリプトームは、ゲノムとは異なり、同一の個体でも、組織ごとに、更には発生段階や細胞外環境や刺激によって変化する。トランスクリプトームは、同質あるいは異質の多数の細胞集団(組織、培養細胞)からRNA抽出後、cDNAに変換し、それを1990年代に出現したDNAマイクロアレイのように数多くの既知mRNAを識別する技術によって解析されるようになった。その後、NGSの利用により、希少mRNAやノンコーディングRNAを含めた未知の転写産物の高感度検出が可能になるとともに、スプライシングで成熟していく過程のmRNAなど、転写産物の種類だけでなく、転写産物の構造的な違い(スプライシングバリアント、SNPs、変異など)の解析もできるようになった。また、NGSは、ヒトやモデル実験生物(マウス、ゼブラフィッシュ、ショウジョウバエ、センチュウなど)だけでなく、多種多様な生物のトランスクリプトームの把握も可能になった。本稿では、このような多数の細胞集団、つまり個体や特定の組織全体ではなく、細胞1つの持つトランスクリプトームを解析する方法(scRNA-seq)とそのscRNA-seqデータを利用することで得られる知見について概説する。 | トランスクリプトーム(transcriptome)は、細胞中に存在する全ての転写産物(タンパク質をコードするmRNA、タンパク質をコードしないノンコーディングRNA、マイクロRNAなど)の総体である<ref><pubmed>19015660</pubmed></ref><ref><pubmed>31341269 </pubmed></ref>。トランスクリプトームは、ゲノムとは異なり、同一の個体でも、組織ごとに、更には発生段階や細胞外環境や刺激によって変化する。トランスクリプトームは、同質あるいは異質の多数の細胞集団(組織、培養細胞)からRNA抽出後、cDNAに変換し、それを1990年代に出現したDNAマイクロアレイのように数多くの既知mRNAを識別する技術によって解析されるようになった。その後、NGSの利用により、希少mRNAやノンコーディングRNAを含めた未知の転写産物の高感度検出が可能になるとともに、スプライシングで成熟していく過程のmRNAなど、転写産物の種類だけでなく、転写産物の構造的な違い(スプライシングバリアント、SNPs、変異など)の解析もできるようになった。また、NGSは、ヒトやモデル実験生物(マウス、ゼブラフィッシュ、ショウジョウバエ、センチュウなど)だけでなく、多種多様な生物のトランスクリプトームの把握も可能になった。本稿では、このような多数の細胞集団、つまり個体や特定の組織全体ではなく、細胞1つの持つトランスクリプトームを解析する方法(scRNA-seq)とそのscRNA-seqデータを利用することで得られる知見について概説する。 | ||
===scRNA- | ===scRNA-seqの背景と開始=== | ||
1つの細胞の持つ生体物質を解明し、定量しようとする試みは古くからあった。1960年代になると、フローサイトメトリーを利用した蛍光活性化セルソーティング(Fluorescence-activated cell sorting, FACS)が発明され、標識抗体などのプローブと組み合わせることで、多数の細胞集団の中で1つの細胞が持っている分子の種類や量についての断片的な研究が可能になり、この方法は現在でも利用されている<ref><pubmed>22271369 </pubmed></ref>。その後、免疫組織化学やin situ hybridizationなどにより、タンパク質やmRNAの種類や量が観察できるようになり、組織中に存在するそれぞれの細胞の同定などに活用されてきている。最近では、それぞれの細胞の発現する抗原を、種々の金属イオンで標識した抗体とフローサイトメトリーを組み合わせた方法で検出するマスサイトメトリー(CyTOFなど)も利用されている<ref><pubmed>27153492</pubmed></ref>。 | 1つの細胞の持つ生体物質を解明し、定量しようとする試みは古くからあった。1960年代になると、フローサイトメトリーを利用した蛍光活性化セルソーティング(Fluorescence-activated cell sorting, FACS)が発明され、標識抗体などのプローブと組み合わせることで、多数の細胞集団の中で1つの細胞が持っている分子の種類や量についての断片的な研究が可能になり、この方法は現在でも利用されている<ref><pubmed>22271369 </pubmed></ref>。その後、免疫組織化学やin situ hybridizationなどにより、タンパク質やmRNAの種類や量が観察できるようになり、組織中に存在するそれぞれの細胞の同定などに活用されてきている。最近では、それぞれの細胞の発現する抗原を、種々の金属イオンで標識した抗体とフローサイトメトリーを組み合わせた方法で検出するマスサイトメトリー(CyTOFなど)も利用されている<ref><pubmed>27153492</pubmed></ref>。 | ||
21行目: | 21行目: | ||
一方で多くの種類のmRNAを1細胞レベルで観察する単細胞トランスクリプトームには技術的なブレークスルーが待たれた。第一の問題はPCRなどの増幅に伴うcDNAごとのバイアスなどのアーティファクトが頻繁に観察されること、そしてもう一つの問題は多種類のcDNAを簡便に識別することを可能にする方法の開発であった。これを可能にしたのが、cDNA増幅法の改良とマイクロアレイの利用であった<ref><pubmed>16547197</pubmed></ref>。しかしながら、増幅に伴うアーティファクトの解決は依然として不十分で、また1つの細胞ごとに高価なマイクロアレイを使用することは、多数の細胞のトランスクリプトームを観察するのには限界があった。2009年になると、これらの問題を解決できる可能性として、High-throughput sequencing (HTS)を利用するscRNA-seqプロトコルがAzim Suraniのグループによって報告された<ref><pubmed>19349980</pubmed></ref>。しかしながら、この論文でもたった8個の細胞の解析に留まっており、この方法でも一つの細胞ごとに処理を行うという操作が必要で、多数の細胞についてのトランスクリプームを一挙に理解することはできなかった。 | 一方で多くの種類のmRNAを1細胞レベルで観察する単細胞トランスクリプトームには技術的なブレークスルーが待たれた。第一の問題はPCRなどの増幅に伴うcDNAごとのバイアスなどのアーティファクトが頻繁に観察されること、そしてもう一つの問題は多種類のcDNAを簡便に識別することを可能にする方法の開発であった。これを可能にしたのが、cDNA増幅法の改良とマイクロアレイの利用であった<ref><pubmed>16547197</pubmed></ref>。しかしながら、増幅に伴うアーティファクトの解決は依然として不十分で、また1つの細胞ごとに高価なマイクロアレイを使用することは、多数の細胞のトランスクリプトームを観察するのには限界があった。2009年になると、これらの問題を解決できる可能性として、High-throughput sequencing (HTS)を利用するscRNA-seqプロトコルがAzim Suraniのグループによって報告された<ref><pubmed>19349980</pubmed></ref>。しかしながら、この論文でもたった8個の細胞の解析に留まっており、この方法でも一つの細胞ごとに処理を行うという操作が必要で、多数の細胞についてのトランスクリプームを一挙に理解することはできなかった。 | ||
===scRNA-seqの現状=== | ===scRNA-seqの現状=== | ||
それ以来、完全長cDNAを増幅したり、細胞ごとに異なる分子識別子(unique molecular identifiers: UMI)を持つcDNAを増幅させるscRNA-seqが考案され始め、2013年には、このような1細胞のシーケンシング技術が、Nature Methods誌のMethod of the Year に選ばれた | それ以来、完全長cDNAを増幅したり、細胞ごとに異なる分子識別子(unique molecular identifiers: UMI)を持つcDNAを増幅させるscRNA-seqが考案され始め、2013年には、このような1細胞のシーケンシング技術が、Nature Methods誌のMethod of the Year に選ばれた<ref> https://www.nature.com/collections/mysbdwgfll<ref>。たとえば、SMART-seq(Switch mechanism at the 5' End of RNA Templates)<ref><pubmed>22820318</pubmed></ref>およびその改良されたプロトコルであるSMART-seq2 <ref><pubmed> 24056875 </pubmed></ref> <ref><pubmed>24385147</pubmed></ref>は、完全長cDNA合成のためのプロトコルである(既に、SMART-seq3という改良プロトコールもあるhttps://doi.org/10.1101/817924)。また、MARS-seq(Massively parallel single-cell RNA-seq)<ref><pubmed> 24531970 </pubmed></ref>、STRT(single-cell tagged reverse transcription)<ref><pubmed>21543516</pubmed></ref> <ref><pubmed>24363023</pubmed></ref>、CEL-seq(Cell Expression by Linear amplification and Sequencing)<ref><pubmed>22939981</pubmed></ref>、CEL-seq2<ref><pubmed> 27121950 </pubmed></ref>、Seq-Well <ref><pubmed> 28192419</pubmed></ref>、Microwell-seq<ref><pubmed>29474909</pubmed></ref>などが報告されてきた。最近になって、sci-RNA-seq (single-cell combinatorial indexing RNA sequencing) <ref><pubmed> 28818938 </pubmed></ref>, SPLiT-seq(split-pool ligation-based transcriptome sequencing)<ref><pubmed>29545511</pubmed></ref>のように特殊な機器を利用せずに細胞特異的UMIを保持するcDNAを作製する方法も報告されている。 | ||
などが報告されてきた。最近になって、sci-RNA-seq (single-cell combinatorial indexing RNA sequencing) <ref><pubmed> 28818938 </pubmed></ref>, SPLiT-seq(split-pool ligation-based transcriptome sequencing)<ref><pubmed>29545511</pubmed></ref>のように特殊な機器を利用せずに細胞特異的UMIを保持するcDNAを作製する方法も報告されている。 | |||
これらの方法のうち、SMART-seq、その改良法であるSMART-seq2は、微小ピペットによるマニュアル捕獲、セルソーター、レーザー捕獲法などを用いる多穴プレート法、更に半導体集積回路製作技術で作った流体集積回路を利用するFluidigm C1の装置[https://jp.fluidigm.com]と組み合わせることで利用される機会が多い<ref><pubmed>30405621</pubmed></ref>。このSMART-seq2プロトコールの特徴は、mRNAの全領域を読むことで、全長トランスクリプトームを得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、アリルごとの発現情報が得られるSNPs、変異の検出にも利用できる。また、それぞれ細胞ごとの反応を独立した場所で行うため、別の細胞の反応と混じる可能性がない。これらの点が、次に説明するDropletを使用して3’末端のみを標的にしたscRNA-seqに比べた場合の長所であるが、その高コスト(1細胞あたり数十ドル)と処理可能な細胞数の少なさが短所である。 | |||
===Droplet使用の3’エンドリード法=== | ===Droplet使用の3’エンドリード法=== | ||
しかしながら、もっとも重要なscRNA-seqの方法論についての進歩は、2015年、Harvard Medical Schoolの独立した2つのグループが、inDropそしてDrop-seqという類似した2つの高スループットな方法を開発したことであろう<ref><pubmed>26000487</pubmed></ref> <ref><pubmed>26000488 </pubmed></ref>。これらの方法では、マイクロ流体力学 (Microfluidics) 、 Cell BarcodeとUMIとしてDNAバーコーディング (DNA barcoding) 、そしてNGSを利用することで、自動化とサンプル調製の容易さから、1つの細胞あたりに要するコストを大幅に低下させることに成功した(Drop- | しかしながら、もっとも重要なscRNA-seqの方法論についての進歩は、2015年、Harvard Medical Schoolの独立した2つのグループが、inDropそしてDrop-seqという類似した2つの高スループットな方法を開発したことであろう<ref><pubmed>26000487</pubmed></ref> <ref><pubmed>26000488 </pubmed></ref>。これらの方法では、マイクロ流体力学 (Microfluidics) 、 Cell BarcodeとUMIとしてDNAバーコーディング (DNA barcoding) 、そしてNGSを利用することで、自動化とサンプル調製の容易さから、1つの細胞あたりに要するコストを大幅に低下させることに成功した(Drop-seqは発表時で、1細胞あたり約5セント)。つまり、細胞1つずつをマイクロ流体力学によるエマルジョン技術を利用した装置に流入させ、その1細胞を1つのDroplet(油中水滴)に自動的に閉じ込める。そのDroplet中には、DropletごとにCell barcode/UMIとして異なったDNAバーコードを持つゲルビーズ(Gel Beads in Emulsion, GEMs)が入っており、それを足場に3’末端のみを標的にしたcDNA合成反応を実施することで、同じ細胞に含まれていたmRNAが同じUMIを持つcDNAとして合成され、そのmRNA/cDNAが由来した細胞を識別できるということを利用している(図1)。このようにして3’末端のみを増幅したバーコード付きcDNAをNGSで配列決定することによりscRNA-seqが可能になる。なお、DropSeqはコストが低いが、細胞の取得率と検出感度が低い弱点がある。inDropはDropSeqより細胞取得率が高く、パラメータを調整することで低レベルで発現される遺伝子の検出にも有利である<ref><pubmed>30472192</pubmed></ref>。 | ||
http://www.youtube.com/watch?v=fHq9ewdYEWM | |||
DropSeqのセットアップはDolomite Bio ([https://www.dolomite-bio.com])、inDropは1 Cellbio社から販売されている[https://1cell-bio.com]。しかし、特に重要なのは10xGenomics社が同様の原理を用いた「Chromium」と命名された機器と試薬のシステムを市販することで、多くの研究者に利用できることになったことである[https://www.10xgenomics.com/jp/]。Svenssonらによる最近のデータベース[https://www.biorxiv.org/content/10.1101/742304v2], [http://www.nxn.se/single-cell-studies/gui]では、scRNA-seqを用いた論文で用いられた方法について調査しているが、この数年、10xGenomics社Chromiumを用いた論文が飛躍的に増加し、scRNA-seqの方法として、最も一般的になりつつあることがわかる(現在、10XGenomics社とBioRad社の間で関連特許をめぐる係争がある。)。このシステムは市販であるので導入が容易であり、DropSeqやinDropに比べ、多くの転写産物の高感度検出が可能であるが、ランニングコストは高い<ref><pubmed>30472192</pubmed></ref>。 | DropSeqのセットアップはDolomite Bio ([https://www.dolomite-bio.com])、inDropは1 Cellbio社から販売されている[https://1cell-bio.com]。しかし、特に重要なのは10xGenomics社が同様の原理を用いた「Chromium」と命名された機器と試薬のシステムを市販することで、多くの研究者に利用できることになったことである[https://www.10xgenomics.com/jp/]。Svenssonらによる最近のデータベース[https://www.biorxiv.org/content/10.1101/742304v2], [http://www.nxn.se/single-cell-studies/gui]では、scRNA-seqを用いた論文で用いられた方法について調査しているが、この数年、10xGenomics社Chromiumを用いた論文が飛躍的に増加し、scRNA-seqの方法として、最も一般的になりつつあることがわかる(現在、10XGenomics社とBioRad社の間で関連特許をめぐる係争がある。)。このシステムは市販であるので導入が容易であり、DropSeqやinDropに比べ、多くの転写産物の高感度検出が可能であるが、ランニングコストは高い<ref><pubmed>30472192</pubmed></ref>。 | ||
==scRNA-seqの実際== | ==scRNA-seqの実際== | ||
ここでは主流になっている10xGenomics社のChromiumを用いた方法とSMART- | ここでは主流になっている10xGenomics社のChromiumを用いた方法とSMART-seq2などを用いた方法に共通する方法の実際について俯瞰する。scRNA-seqの利用には、4つのステップがある(図2)<ref><pubmed>30089861</pubmed></ref>。1)個体や組織を採集し、そこから細胞あるいは細胞核を個別にすること。2)ChromiumやSMART-seq2などによる個々の細胞からのライブラリーの作製とNGSシーケンシング。3)前処理(preprocessing、得られた配列の整理)。4)ダウンストリーム解析(生物学的な情報を得る)。これらのうち、2)の段階については、上に記述したように市販の機器や試薬を利用する機会が多くなっているので、そのためのマニュアル等を参考にするのが現実的である。 | ||
===組織からの細胞、細胞核の分離=== | ===組織からの細胞、細胞核の分離=== | ||
血液細胞のように浮遊した細胞ではない場合、物理的あるいは酵素処理などによって解離することで、生組織から状態の良いバラバラになった細胞を調製する必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている。ここで、しばしば問題となるのが、酵素処理のため短時間加温することで、発現量が変化する遺伝子が存在することである<ref><pubmed>27090946</pubmed></ref>。例えば、脳のミクログリアの解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった<ref><pubmed>30471926</pubmed></ref>。また、このような現象を抑制するために、酵素処理時に転写阻害剤であるアクチノマイシンで処理したり<ref><pubmed>29024657</pubmed></ref>、ヒマラヤ氷河から得られた細菌Bacillus licheniformisから得られた低温プロテアーゼを用いる方法も報告されている<ref><pubmed>28851704</pubmed></ref>。また、細胞解離後に、メタノールで固定しscRNA-seqに使用することも可能である<ref><pubmed>28526029</pubmed></ref>。 | |||
単離した細胞は、そのまま10xGenomicsのChromiumのプラットフォームに導入することができるが、抗体や蛍光タンパク質レポーターなどを用いたFACS、パニング、MACS(磁気ビーズカラム)などによる特定のマーカーを細胞表面などに発現する細胞の選択的濃縮や除去を行う場合もある。更に、抗体にUMIをカップリングさせるCITE-seqについては、下記のマルチモーダルなオミクスの項目で述べる。 | |||
なお、ヒト組織や希少生物などから生細胞を得ることは困難なことが多い。この場合、scRNA-seqの変法として、凍結した組織から、各細胞由来の核を調製し、核内のmRNAを分析するsnRNA-seq (single-nucleus RNA-seq)が利用されている。ただ、この場合、FACSなどによる特定細胞集団の同定が難しく、細胞質を持つ生細胞を利用した場合と同等な結果が必ずしも得られない<ref><pubmed>24248345</pubmed></ref><ref><pubmed>26890679</pubmed></ref> <ref><pubmed>27471252</pubmed></ref><ref><pubmed>28846088</pubmed></ref><<ref><pubmed>29220646</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>30586455</pubmed></ref><ref><pubmed>28729663</pubmed></ref><ref><pubmed>31728515</pubmed></ref> [https://www.biorxiv.org/content/10.1101/630087v1] 。snRNA-seqでは、組織をそのまま凍結することから開始するので、上述したscRNA-seqの問題である酵素処理や加温などを避けることができる。こうしたプロトコールの一部は、protocols.ioのHuman Cell Atlasのグループ[https://www.protocols.io/groups/hca]で公開されている。 | |||
更に、RNAを分析するscRNA-seqではないが、single cell genome-seqの変法として、シングルセルの遺伝子発現を推定する方法として、トランスポゾンを用いることでゲノムのオープンクロマチン領域を選択的に検出し、ライブラリーを作製しシーケンスするsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin)<ref><pubmed>26083756</pubmed></ref>, <ref><pubmed>29434377</pubmed></ref><ref><pubmed>25953818</pubmed></ref>, single cell THS-seq (transposome hypersensitive-site) <ref><pubmed>29227469</pubmed></ref>がある。またDNAメチル化をシングルセルレベルで観察する方法も報告されている<ref><pubmed>28798132</pubmed></ref>。 | 更に、RNAを分析するscRNA-seqではないが、single cell genome-seqの変法として、シングルセルの遺伝子発現を推定する方法として、トランスポゾンを用いることでゲノムのオープンクロマチン領域を選択的に検出し、ライブラリーを作製しシーケンスするsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin)<ref><pubmed>26083756</pubmed></ref>, <ref><pubmed>29434377</pubmed></ref><ref><pubmed>25953818</pubmed></ref>, single cell THS-seq (transposome hypersensitive-site) <ref><pubmed>29227469</pubmed></ref>がある。またDNAメチル化をシングルセルレベルで観察する方法も報告されている<ref><pubmed>28798132</pubmed></ref>。 | ||
===scRNA-seqデータの前処理=== | ===scRNA-seqデータの前処理=== | ||
10x Genomics社のChromium、IlluminaのNGSを利用した場合、Cell Ranger(Linux上で作動) | 10x Genomics社のChromium、IlluminaのNGSを利用した場合、Cell Ranger(Linux上で作動)を用いて、各生物種ごとのレファレンス配列リスト([https://www.ncbi.nlm.nih.gov/grc])やEggNOG ([http://eggnogdb.embl.de])などを利用し、細胞とトランスクリプトーム(各遺伝子の発現)の対応マトリックスを作製する。その後のデータの処理についても、10xGenomics社がソフトウェアLoupeを提供している。しかしながら、その後のダウンストリーム解析を考慮して、R言語, Python, MATLABなどのデータ解析のための汎用プログラミング言語やコードで扱えるオブジェクトに変換するのが通常である。ここでは、scRNA-seqデータ解析のために最もよく利用されているR言語を用いたパッケージ「Seurat」<ref><pubmed> 29608179 </pubmed></ref> <ref><pubmed> 31178118 </pubmed></ref>を中心に紹介したい。なお、Pythonを利用したものでは、ドイツ・ミュンヘンInstitute of Computational Biologyの Fabian J. Theisらが開発しているScanpyが有名である<ref><pubmed> 29409532</pubmed></ref>。 | ||
New York UniversityのRahul Satija研究室が開発しているSeuratは、scRNA-seq解析のために広く利用されているRのパッケージであり、2019年8月現在、その最新バージョンはSeurat 3.1である。論文の正式発表前から、サポート情報提供やコード修正なども頻繁に行っており、Satija研究室のウェッブサイト(satijalab.org/Seurat, [http://satijalab.org/Seurat])、Github([https://github.com/satijalab/Seurat])、更にTwitterアカウント(@satijalab)などで最新情報を得ることできる。 | |||
最初に行うのは、scRNA-seqデータの品質管理である。ここでは、質の低い細胞のデータ(転写産物の種類が少ない、ミトコンドリア由来の転写産物が多い)を取り除く。また、複数の試料を組み合わせる場合には、バッチごとの違いについて検討する。特にDropletを使用するscRNA-seqの多くのケースで問題になるのが、Dropletに2つ以上の細胞が封じ込められ、それらが同じCell barcodeを持つために生じるアーティファクトである。通常Doubletsと呼ばれるこの問題はダウンストリーム解析を混乱させるので、細胞単離の段階から注意する必要があるが、明確なマーカー遺伝子が知られていればscRNA-seqデータ取得後にある程度のデータ処理で検討することは可能である。また、この問題を解決する新たなアプローチも試みられている<ref><pubmed>30954476</pubmed></ref> <ref><pubmed>31836005</pubmed></ref><ref><pubmed>31856883</pubmed></ref> [https://doi.org/10.1101/2019.12.17.879304][https://doi.org/10.1101/699637]。 | |||
このようなノーマライゼーションの過程を経て、scRNA-seqのデータ解析において、最初に行うのが、次元圧縮 (dimensionality reduction)である<ref><pubmed>30617341</pubmed></ref><ref><pubmed>31780648</pubmed></ref> | |||
。PCA (Principal component analysis, 主成分分析)、UMAP(Uniform Manifold Approximation and Projection, 均一マニフォールド近似と投影)、Diffusion maps, t-SNE(t-distributed Stochastic Neighbor Embedding , t分布型確率的近傍埋込み)などの手法が用いられる。 特に、t-SNE[http://www.jmlr.org/papers/v9/vandermaaten08a.html](ティースニーと読むのが通常)は、高次元データを低次元の点の集合として可視化することで、それぞれの細胞の持つトランスクリプトームの類似度についての直観的な表示が可能でありしばしば用いられる(図3)。次に、Louvainアルゴリズムなどでクラスタリング(コミュニティ分割)を行い、tSNEグラフ上に表示できる。こうして、違ったタイプの細胞の集合が別のクラスターとして表示される。しかし、データによっては、tSNEだけでなく、他の方法でパラメータの調節を行うことで違ったデータ解釈(別の細胞クラスターの同定)ができるケースもあり、いくつかの方法を試してみることが推奨される。 | |||
==ダウンストリーム解析== | ==ダウンストリーム解析== | ||
===細胞クラスターの解釈とマーカー遺伝子候補の発見=== | ===細胞クラスターの解釈とマーカー遺伝子候補の発見=== | ||
scRNA- | scRNA-seqデータから得られる生物学的知見には、内在的に存在する細胞の種類、外部刺激や環境で変化した細胞の状態、そして種類や変化により特徴的に発現するマーカー遺伝子候補の発見がある<ref><pubmed>27824854</pubmed></ref><ref><pubmed>32033589</pubmed></ref> | ||
など)を用いることができる。scRNA-seqの解析に必要なコードは、scRNA-tools [https://www.scrna-tools.org], Awesome single cell [https://github.com/seandavi/awesome-single-cell], Bioconductor[https://www.bioconductor.org]で紹介されており、ほとんどがダウンロード可能である。また、最新の情報については、bioRxivなどのプレプリントサーバで公開されていることが多く、scRNA- | 。クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスターに特徴的に発現している遺伝子を具体的に探索し、細胞集団の持つバイオマーカーによって、そのクラスターの同定が可能になる。例えば、既にニューロンとグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、ニューロンのタイプごとに区別されるマーカーや神経活動により変化したニューロンの状態は、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子(差次的発現遺伝子)を見つけるためには(Differential expression analysis, DE analysis)、SeuratのFindMarkersコマンドでも利用可能である目的別の解析のための専用コード(MAST <ref><pubmed>26653891</pubmed></ref>、DESeq2 <ref><pubmed>25516281</pubmed></ref> | ||
など)を用いることができる。scRNA-seqの解析に必要なコードは、scRNA-tools [https://www.scrna-tools.org], Awesome single cell [https://github.com/seandavi/awesome-single-cell], Bioconductor[https://www.bioconductor.org]で紹介されており、ほとんどがダウンロード可能である。また、最新の情報については、bioRxivなどのプレプリントサーバで公開されていることが多く、scRNA-seqのデータ(下記参考)とともに、オープンサイエンス実践の好例となっている。細胞ごとの差次的発現遺伝子の可視化には、ドットプロット、ヴァイオリンプロット、次元圧縮の可視化図に重ねる布置プロットなどが頻繁に用いられる(図4)。 | |||
=== | ===偽時系列解析、遺伝子制御ネットワーク、パスウェイ解析=== | ||
実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、細胞周期、概日リズム、破裂型プロモーターの作動などの理由で変動が見られるものもある<ref><pubmed> 31217225 </pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上の細胞系譜や細胞分化といった細胞の遷移状態の解析(偽時系列解析Pseudo-time analysis )には、scRNA-seqデータを用いることが極めて効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref> | 実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、細胞周期、概日リズム、破裂型プロモーターの作動などの理由で変動が見られるものもある<ref><pubmed> 31217225 </pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上の細胞系譜や細胞分化といった細胞の遷移状態の解析(偽時系列解析Pseudo-time analysis )には、scRNA-seqデータを用いることが極めて効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref> | ||
。これらの分析のためには軌道推定(Trajectory inference)の解析手法が用いられる。しばしば用いられるMonocle3 <ref><pubmed>30787437</pubmed></ref>など、多くのコードを収集しているGithubのサイトがある [https://github.com/dynverse/dynmethods][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといった、転写産物のスプライシングの状態から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref>。しかし、これらの方法は、あくまで発生途上の細胞系譜や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNA-seqを行うことで、細胞タイプの系統関係を調べる方法として、CRISPR-Cas9を用いたゲノム編集による記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>がある。 | 。これらの分析のためには軌道推定(Trajectory inference)の解析手法が用いられる。しばしば用いられるMonocle3 <ref><pubmed>30787437</pubmed></ref>など、多くのコードを収集しているGithubのサイトがある [https://github.com/dynverse/dynmethods][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといった、転写産物のスプライシングの状態から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref>。しかし、これらの方法は、あくまで発生途上の細胞系譜や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNA-seqを行うことで、細胞タイプの系統関係を調べる方法として、CRISPR-Cas9を用いたゲノム編集による記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>がある。 | ||
64行目: | 72行目: | ||
また変化している遺伝子発現を解釈するために、制御ネットワーク(例、SCENIC<ref><pubmed>28991892</pubmed></ref>, [https://github.com/aertslab/SCENIC])やパスウェイ解析(例、Metascape<ref><pubmed>30944313</pubmed></ref>, [http://metascape.org])といったシステム生物学で用いられてきた手法も適用できる。 | また変化している遺伝子発現を解釈するために、制御ネットワーク(例、SCENIC<ref><pubmed>28991892</pubmed></ref>, [https://github.com/aertslab/SCENIC])やパスウェイ解析(例、Metascape<ref><pubmed>30944313</pubmed></ref>, [http://metascape.org])といったシステム生物学で用いられてきた手法も適用できる。 | ||
== | ==scRNA-seqの神経科学研究への適用== | ||
=== | ===神経細胞多様性の新たな根拠=== | ||
様々な神経・精神疾患について理解しその診断や治療に役立てるためには、神経細胞、グリア細胞を中心にした神経系にある細胞の「タイプ」を識別し、それぞれの細胞における分子的な変化を観察することが重要である <ref><pubmed>28775344</pubmed></ref><ref><pubmed>29738987</pubmed></ref>。近年、中枢神経系のグリア細胞にも、多様なアストロサイト、オリゴデンドロサイト、ミクログリアの存在が報告されてきている。一方で、神経細胞は著しく多様であり、この多様性が神経系を特徴づけており、その多彩で複雑な機能の発現に必須であることは疑う余地がない。解剖学的な視点から言えば、すべての神経細胞の存在する位置は異なるので、すべての神経細胞は異なるという見方もできる。しかし、従来の神経科学では、神経細胞の多様性は、それぞれの神経細胞の解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきている。こうした神経細胞の多様性を便宜的に記述するのに、タイプ(type)、クラス(class)、サブクラス(subclass)、サブタイプ(subtype) というような用語が用いられてきた。しかし、本稿では混乱を防ぐため、Masland(2004)<ref><pubmed>15242626</pubmed></ref>が提唱し、広く受けいれられている「クラス」と「タイプ」という単語を用いることとする。タイプは、これ以上分類することができないとされる階層である。例えば、大脳皮質の錐体細胞、網膜神経節細胞といった大雑把な識別は「クラス」と呼ぶ。大脳皮質の錐体細胞というクラスは、層や領野によって「タイプ」が異なるし、網膜神経節細胞には視覚情報によって応答が異なる「タイプ」が存在する。この分類は、免疫組織化学、形態、電気生理学などの技術により識別可能である暫定的なものに過ぎない。本項目で解説してきたscRNA-seqの技術は、その網羅性からそれぞれの神経細胞についてこれまでにないビッグデータを提供することで、この神経細胞のタイプの理解に新たな根拠を与えつつある。 | |||
===神経細胞へのscRNA-seqの適用=== | |||
大脳皮質には、錐体細胞や非錐体細胞などの神経細胞、更に種々のグリア細胞などが見られる。マウスを用いた初期のscRNA-seqを使った小規模な細胞数を分類した研究で、既に、これまで知られていた主要な細胞タイプを超えるタイプが見つかった<ref><pubmed>25700174</pubmed></ref>。その後のDroplet使用の3’エンドリード法を利用した多数の細胞数の解析で、更に多数の神経細胞のタイプが見つかっている<ref><pubmed>30096299</pubmed></ref><ref><pubmed>30096314</pubmed></ref><ref><pubmed>30382198</pubmed></ref><ref><pubmed>29320739</pubmed></ref><ref><pubmed>28846088</pubmed></ref>。特に、GABA作動性介在神経細胞タイプの多様性<ref><pubmed>28942923</pubmed></ref><ref><pubmed>29472441</pubmed></ref><ref><pubmed>28134272</pubmed></ref><ref><pubmed>29513653</pubmed></ref> や発生過程<ref><pubmed>31073041</pubmed></ref><ref><pubmed>230635555</pubmed></ref><ref><pubmed>29539641</pubmed></ref><ref><pubmed>30485812</pubmed></ref><ref><pubmed>26940868</pubmed></ref>の理解が、scRNA-Seq技術を利用することで進んでいる。更に、神経活動によって変化するトランスクリプトームの変化も細胞ごとに調査され興味深い<ref><pubmed>29230054</pubmed></ref> 。 | |||
ヒトを含めた霊長類の大脳についても発達段階を含めてscRNA-seqが適用されてきている<ref><pubmed>28846088</pubmed></ref><ref><pubmed>26060301</pubmed></ref> <ref><pubmed>27339989</pubmed></ref><ref><pubmed>29539641</pubmed></ref> <ref><pubmed>31303374</pubmed></ref> <ref><pubmed>29227469</pubmed></ref> <ref><pubmed>29217575</pubmed></ref><ref><pubmed>31435019</pubmed></ref> <ref><pubmed>29867213</pubmed></ref> 。https://doi.org/10.1101/709501。 | |||
島にあり、ヒトや霊長類に特徴的とされるvon Economoニューロン(紡錘細胞)のような希少な細胞のscRNA-seqにも成功している<ref><pubmed>32127543</pubmed></ref>。 | |||
海馬<ref><pubmed>29912866</pubmed></ref><ref><pubmed>29335606</pubmed></ref><ref><pubmed>31942070</pubmed></ref><ref><pubmed>29241552</pubmed></ref>では、これまでの研究で記載されてきた神経細胞のタイプが確認され、更に新しいタイプが見つかった。中枢神経系では、外側膝状体<ref><pubmed>29343640</pubmed></ref>、大脳基底核(足底核)<ref><pubmed>28384468</pubmed></ref> 、視床下部<ref><pubmed>28355573</pubmed></ref> <ref><pubmed>27991900</pubmed></ref> <ref><pubmed>31249056</pubmed></ref> <ref><pubmed>30858605</pubmed></ref><ref><pubmed>28166221</pubmed></ref> <ref><pubmed>30385464</pubmed></ref> 、線条体<ref><pubmed>31875543</pubmed></ref> <ref><pubmed>27425622</pubmed></ref> 、 | |||
中脳<ref><pubmed>27716510</pubmed></ref> <ref><pubmed>30718509</pubmed></ref> <ref><pubmed>29499164</pubmed></ref> 、発生中の間脳<ref><pubmed>30872278</pubmed></ref> 、さらに小脳<ref><pubmed>30735127</pubmed></ref><ref><pubmed>30220501</pubmed></ref><ref><pubmed>30690467</pubmed></ref><ref><pubmed>29576475</pubmed></ref>などの結果が得られている。マウスの小脳においては、分子層にこれまでの星状細胞、バスケット細胞というカテゴリーとは違った2種類の神経細胞があることが示唆されている[https://doi.org/10.1101/2020.03.04.976407]。脳の外部では、感覚神経<ref><pubmed>25420068</pubmed></ref> <ref><pubmed>26691752</pubmed></ref> 、らせん神経節<ref><pubmed>3007810</pubmed></ref> 、臭覚神経<ref><pubmed>26541607</pubmed></ref> 、腸神経系 <ref><pubmed>29483303</pubmed></ref>[https://doi.org/10.1101/2020.03.02.955757] 、網膜<ref><pubmed>27565351</pubmed></ref><ref><pubmed>29909983</pubmed></ref> <ref><pubmed>31260032</pubmed></ref><ref><pubmed>31128945</pubmed></ref><ref><pubmed>30018341</pubmed></ref><ref><pubmed>30712875</pubmed></ref><ref><pubmed>30548510</pubmed></ref><ref><pubmed>31075224</pubmed></ref><ref><pubmed>31399471</pubmed></ref><ref><pubmed>31848347</pubmed></ref><ref><pubmed>31673015</pubmed></ref><ref><pubmed>31653841</pubmed></ref><ref><pubmed>31784286</pubmed></ref>[https://doi.org/10.1101/2020.02.26.966093][https://www.biorxiv.org/content/10.1101/779694][https://www.biorxiv.org/content/10.1101/617555]でのscRNA-seqデータがある。またiPS細胞やES細胞由来のオルガノイドに含まれる神経細胞タイプを知る上でも利用されている<ref><pubmed>31168097</pubmed></ref><ref><pubmed>28094016</pubmed></ref><ref><pubmed>28279351</pubmed></ref><ref><pubmed>31996853</pubmed></ref><ref><pubmed>31968264</pubmed></ref>。 | |||
===神経細胞以外の細胞=== | |||
上衣細胞<ref><pubmed>29727663</pubmed></ref>は、神経幹細胞としての役割が示唆されてきたが、scRNA-seqの結果ではその可能性が支持されていない。グリア細胞では、ラジアルグリア<ref><pubmed>29217575</pubmed></ref><ref><pubmed>26406371</pubmed></ref><ref><pubmed>29539641</pubmed></ref><ref><pubmed>25734491</pubmed></ref><ref><pubmed>29281841</pubmed></ref> 、アストロサイト<ref><pubmed>32139688</pubmed></ref><ref><pubmed>32203496</pubmed></ref>に多様性があることが示唆されてきている。また、オリゴデンドロサイト<ref><pubmed>27284195</pubmed></ref>については、これまで細胞生物学的に研究されてきた分化の過程がscRNA-seqにより検出されている。 | |||
ミクログリアは、その活性化に伴うトランスクリプトームの変化の様子がscRNA-seqにより詳細に明らかになった | |||
<ref><pubmed>29539641</pubmed></ref><ref><pubmed>30206190</pubmed></ref> | |||
<ref><pubmed>27338705</pubmed></ref> | |||
<ref><pubmed>30471926</pubmed></ref> | |||
<ref><pubmed>31209379</pubmed></ref> | |||
<ref><pubmed>29020624</pubmed></ref> | |||
<ref><pubmed>31835035</pubmed></ref>。また、CNS境界関連マクロファージ(BAM) <ref><pubmed>31061494</pubmed></ref>のscRNA-seqも実施されている。 | |||
===疾患=== | ===疾患=== | ||
scRNA-seqは、疾患の理解にも有用である。筋萎縮性側索硬化症ALS <ref><pubmed>30948552</pubmed></ref>、アルツハイマー病やそのモデル動物<ref><pubmed>31042697</pubmed></ref><ref><pubmed>31399126</pubmed></ref> | |||
=== | [https://doi.org/10.1101/628347]<ref><pubmed>28602351</pubmed></ref>、自閉症やレット症候<ref><pubmed>31097668</pubmed></ref><ref><pubmed>30455458</pubmed></ref> | ||
、シャルコー・マリー・トゥース病<ref><pubmed>29888333</pubmed></ref>、ダウン症[https://www.biorxiv.org/content/10.1101/2020.01.01.892398v1]、パーキンソン病<ref><pubmed>30503143</pubmed></ref>、がん<ref><pubmed>31327527</pubmed></ref><ref><pubmed>28360267</pubmed></ref>などに適用されている。 | |||
==scRNA-seqの展望== | |||
===神経系の多様性と進化=== | |||
scRNA-seqは、既に多様な生物の神経系の細胞の理解、更には種間の相同性や差異の研究に利用されており、神経系の進化を細胞レベルで考察するのに有用であろう(例、カタユウレイボヤCiona intestinalis <ref><pubmed>30069052</pubmed></ref><ref><pubmed>30228204</pubmed></ref>、ショウジョウバエ <ref><pubmed>29909982</pubmed></ref><ref><pubmed>29149607</pubmed></ref><ref><pubmed>30703584</pubmed></ref><ref><pubmed>29909983</pubmed></ref>、ゼブラフィッシュ<ref><pubmed>31018142</pubmed></ref><ref><pubmed>30929901</pubmed></ref>、アカミミガメTrachemys scripta elegans、トカゲPogona vitticeps, pv<ref><pubmed>29724907</pubmed></ref>、ニワトリ、霊長類<ref><pubmed>30730291</pubmed></ref><ref><pubmed>31619793</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972 | |||
])。ただ、遺伝子やトランスクリプトームの研究が進んでいる生物種では比較的容易であるが、アノテーションが十分でない生物種を用いる場合、scRNA-seqのデータ解析は困難である。この場合は、NCBIのTaxonomy[https://www.ncbi.nlm.nih.gov/taxonomy]やEggNOG [http://eggnogdb.embl.de] <ref><pubmed>30418610</pubmed></ref>を利用する。 | |||
===データベースと統合=== | ===データベースと統合=== | ||
scRNA-seqのデータは様々な目的で利用できるため、データベース化し利用できるようにする必要がある。オープンサイエンスの典型として、神経系のトランスクリプトーム一般のデータベースが多数公開されており<ref><pubmed>29437890</pubmed></ref>、基本的にNCBIのGene Expression Omnibus[https://www.ncbi.nlm.nih.gov/geo/]に登録されている。また、common coordinate framework (CCF) やcentral annotation platform (CAP)という概念のもと、scRNA-seqを意識したものとして、米国のBRAIN Initiative Cell Census Consortium<ref><pubmed>29096072</pubmed></ref> 、Human Cell Atlas ProjectのHuman Cell Atlas Data Portal [https://data.humancellatlas.org]、アレン脳研究所のAllen Brain Atlas [https://portal.brain-map.org]、ブロード研究所のSingle Cell Portal, | |||
[https://singlecell.broadinstitute.org/]が稼働している。 | |||
また異なった方法や実験で得られたscRNA-seqのデータを比較することも重要である。最近、LIGER<ref><pubmed>31178122</pubmed></ref> 、Harmony<ref><pubmed>31740819</pubmed></ref> 、MetaNeighber<ref><pubmed>29491377</pubmed></ref>のようなアルゴリズムが開発されている。 | |||
===空間トランスクリプトミクス=== | ===空間トランスクリプトミクス=== | ||
scRNA-seqの弱点は、組織からそれぞれの細胞を解離する必要があるので、その細胞が存在していた空間的な位置の情報を失ってしまうということである。組織切片におけるタンパク質などの分布は免疫組織化学、mRNAの分布はin situ hybridizationで検出することができるが、数多くのmRNAの分布を一気に同定する方法がscRNA-seqと同様に開発されてきている。Slide-seq<ref><pubmed>30923225</pubmed></ref>、osmFISH<ref><pubmed>30377364</pubmed></ref> | |||
、STARmap (spatially-resolved transcript amplicon readout mapping), <ref><pubmed>29930089</pubmed></ref>、seqFISH <ref><pubmed>27764670</pubmed></ref>、pciSeq(probabilistic cell typing by in situ sequencing)[ https://doi.org/10.1101/431957 | |||
]、更に10xGenomics社のVisiumなどがある。現状では、組織を用いる空間トランスクリプトミクス(Spatial transcriptomics)は、空間解像度が1つずつの細胞のレベルにいたっておらず、課題も多い。しかし、そのデータを解析するためのアルゴリズム<ref><pubmed>29553578</pubmed></ref><ref><pubmed>29553579</pubmed></ref>[https://doi.org/10.1101/757096][ https://doi.org/10.1101/701680] | |||
やMerFish <ref><pubmed>25858977</pubmed></ref>、corrFISH <ref><pubmed>27271198</pubmed></ref>のように、一つの細胞内でのそれぞれのmRNAを検出できる方法が開発されてきており、scRNA-seqの弱点を補う空間トランスクリプトームは今後の発展が期待される。 | |||
=== | ===マルチモーダルなシングルセルオミクス=== | ||
同じ細胞からscRNA-seqの情報だけでなく、ゲノム配列、ATAC-seqなどによるエピゲノム解析、タンパク質、プロテオームなどを、同時に記録するマルチモーダルなオミクスomicsが注目されている<ref><pubmed>31907462</pubmed></ref><ref><pubmed>30696980</pubmed></ref>。Nature Methodsの2019年「Methods of the Year」に選ばれており、その特集号などを参考にされたい。神経科学分野で注目されるのは、パッチクランプの生理学的情報とscRNA-seqを組み合わせたPatch-seq <ref><pubmed>26689544</pubmed></ref> <ref><pubmed>26689543</pubmed></ref>であろう。また、細胞表面分子に対する抗体にDNAを付加することで、マーカーを発現する細胞のトランスクリプトームを観察するCITE-seq<ref><pubmed>28759029</pubmed></ref>、 REAP-seq<ref><pubmed>28854175</pubmed></ref>は細胞マーカー発現と遺伝子発現が同時に定量できるマルチモーダルなオミクスである。 また、BARseq (barcoded anatomy resolved by sequencing) <ref><pubmed>31626774</pubmed></ref>のような方法は、コネクトームと遺伝子発現を記録できるomicsとして興味深い。 | |||
== 関連項目 == | == 関連項目 == | ||
== 参考文献 == | == 参考文献 == | ||
<references /> | <references /> |