「シングルセルRNAシーケンシング」の版間の差分

ナビゲーションに移動検索に移動

「https://bsd.neuroinf.jp/wiki/シングルセルRNAシーケンシング」から取得

@@ 9行目: / 9行目: @@
 {{box|text=
-シングルセルRNAシーケンシング(single cell RNA sequencing, 以下scRNA-seq)は、次世代シーケンシング （next generation sequencing、以下NGS）技術を使用して個々の細胞が発現しているmRNA全体、つまりトランスクリプトームを質的、量的に網羅的に調べ、細胞ごとの違いを高解像度で検出、分類することで、細胞の分類を行うことができる分子生物学的、コンピュータ生物学的技術である。また、刺激、発生など細胞の状況に応じて、個々の細胞のトランスクリプトームの情報を得ることで、病態や細胞系譜などの解析も可能である。特に多様なニューロンが存在する神経系では、この方法により、神経細胞の分類や状態についての知見が深まり、更に新しいバイオマーカー(biomarker)の同定などが網羅的に行われるようになった。
+シングルセルRNAシーケンシング(single cell RNA sequencing, 以下scRNA-seq)は、次世代シーケンシング （next generation sequencing、以下NGS）技術を使用して個々の細胞が発現しているmRNA全体、つまりトランスクリプトームを質的、量的に網羅的に調べ、細胞ごとの違いを高解像度で検出、分類することで、細胞の分類を行うことができる分子生物学的、コンピュータ生物学的技術である。また、刺激、発生など細胞の状況に応じて、個々の細胞のトランスクリプトームの情報を得ることで、病態や細胞系譜などの解析も可能である。特に多様なニューロンが存在する神経系では、この方法により、神経細胞の分類や状態についての知見が深まり、更に新しいバイオマーカー(biomarker)の発見などが網羅的に行われるようになった。。
 。}}
-==トランスクリプトーム==
+==scRNA-seqとその開発史==
+===トランスクリプトーム===
 トランスクリプトーム（transcriptome）は、細胞中に存在する全ての転写産物（タンパク質をコードするmRNA、タンパク質をコードしないノンコーディングRNA、マイクロRNAなど）の総体である<ref><pubmed>19015660</pubmed></ref><ref><pubmed>31341269 </pubmed></ref>。トランスクリプトームは、ゲノムとは異なり、同一の個体でも、組織ごとに、更には発生段階や細胞外環境や刺激によって変化する。トランスクリプトームは、同質あるいは異質の多数の細胞集団（組織、培養細胞）からRNA抽出後、cDNAに変換し、それを1990年代に出現したDNAマイクロアレイのように数多くの既知mRNAを識別する技術によって解析されるようになった。その後、NGSの利用により、希少mRNAやノンコーディングRNAを含めた未知の転写産物の高感度検出が可能になるとともに、スプライシングで成熟していく過程のmRNAなど、転写産物の種類だけでなく、転写産物の構造的な違い（スプライシングバリアント、SNPs、変異など）の解析もできるようになった。また、NGSは、ヒトやモデル実験生物（マウス、ゼブラフィッシュ、ショウジョウバエ、センチュウなど）だけでなく、多種多様な生物のトランスクリプトームの把握も可能になった。本稿では、このような多数の細胞集団、つまり個体や特定の組織全体ではなく、細胞1つの持つトランスクリプトームを解析する方法（scRNA-seq）とそのscRNA-seqデータを利用することで得られる知見について概説する。
-==scRNA-seqの背景と開発史==
+===scRNA-seqの背景===
-つの細胞の持つ生体物質を解明し、定量しようとする試みは古くからあった。1960年代になると、フローサイトメトリーを利用した蛍光活性化セルソーティング（Fluorescence-activated cell sorting, FACS）が発明され、標識抗体などのプローブと組み合わせることで、多数の細胞集団の中で１つの細胞が持っている分子の種類や量についての断片的な研究が可能になり、この方法は現在でも利用されている<ref><pubmed>22271369 </pubmed></ref>。その後、免疫組織化学やin situ hybridizationなどにより、タンパク質やmRNAの種類や量が観察できるようになり、組織中に存在するそれぞれの細胞の同定などに活用されてきている。
+つの細胞の持つ生体物質を解明し、定量しようとする試みは古くからあった。1960年代になると、フローサイトメトリーを利用した蛍光活性化セルソーティング（Fluorescence-activated cell sorting, FACS）が発明され、標識抗体などのプローブと組み合わせることで、多数の細胞集団の中で１つの細胞が持っている分子の種類や量についての断片的な研究が可能になり、この方法は現在でも利用されている<ref><pubmed>22271369 </pubmed></ref>。その後、免疫組織化学やin situ hybridizationなどにより、タンパク質やmRNAの種類や量が観察できるようになり、組織中に存在するそれぞれの細胞の同定などに活用されてきている。最近では、それぞれの細胞の発現する抗原を、種々の金属イオンで標識した抗体とフローサイトメトリーを組み合わせた方法で検出するマスサイトメトリー（CyTOFなど）も利用されている<ref><pubmed>27153492</pubmed></ref>。
 つの細胞内にある全RNA（ribosomal RNAを含む）は細胞種にもよるが1-50pgである。そのうち、mRNAの占める割合は1-5%程度である<ref><pubmed>15239941</pubmed></ref>。この微量のmRNAをcDNAに変換してから大幅に増幅できるPCRが発明されることで、1つの細胞が発現するmRNAを高感度で検出できるようになった。例えば、1991年、Linda BuckとRichard Axelは、嗅覚受容体がGタンパク質であると仮定し、個々の嗅覚細胞で特異的に観察されるGタンパク質mRNAを比較することで、嗅覚受容体の同定に成功した<ref><pubmed>1840504</pubmed></ref>（2004年、ノーベル生理学・医学賞）。1995年になると、Catherine DulacとRichard Axelは、異なる鋤鼻神経細胞で特異的に発現する遺伝子を１つの細胞から作製したcDNAライブラリーを比較するディファレンシャル・スクリーニングにより、フェロモン受容体を同定した<ref><pubmed>7585937</pubmed></ref>。同じ手法で異なる種類の神経細胞で発現している遺伝子も同定されており<ref><pubmed>9778248</pubmed></ref><ref><pubmed>12230981</pubmed></ref>、１つの細胞の持つトランスクリプトームを比較するアプローチが神経系で特徴的に発現している遺伝子の同定に原理的に効果的であることを示した。
@@ 22行目: / 23行目: @@
 一方で多くの種類のmRNAを１細胞レベルで観察する単細胞トランスクリプトームには技術的なブレークスルーが待たれた。第一の問題はPCRなどの増幅に伴うcDNAごとのバイアスなどのアーティファクトが頻繁に観察されること、そしてもう一つの問題は多種類のcDNAを簡便に識別することを可能にする方法の開発であった。これを可能にしたのが、cDNA増幅法の改良とマイクロアレイの利用であった<ref><pubmed>16547197</pubmed></ref>。しかしながら、増幅に伴うアーティファクトの解決は依然として不十分で、また１つの細胞ごとに高価なマイクロアレイを使用することは、多数の細胞のトランスクリプトームを観察するのには限界があった。2009年になると、これらの問題を解決できる可能性として、High-throughput sequencing (HTS)を利用するscRNA-seqプロトコルがAzim Suraniのグループによって報告された<ref><pubmed>19349980</pubmed></ref>。しかしながら、この論文でもたった8個の細胞の解析に留まっており、この方法でも一つの細胞ごとに処理を行うという操作が必要で、多数の細胞についてのトランスクリプームを一挙に理解することはできなかった。
-==scRNA-seqの現在==
+===scRNA-seqの現状===
-それ以来、完全長cDNAを増幅したり、細胞ごとに異なる分子識別子（unique molecular identifiers: UMI）を持つcDNAを増幅させるscRNA-seqが考案され始め、2013年には、このような１細胞のシーケンシング技術が、Nature Methods誌のMethod of the Year に選ばれた https://www.nature.com/collections/mysbdwgfll。たとえば、SMART-seq（Switch mechanism at the 5' End of RNA Templates）<ref><pubmed>22820318</pubmed></ref>およびその改良されたプロトコルであるSMART-seq2 <ref><pubmed> 24056875 </pubmed></ref> <ref><pubmed>24385147</pubmed></ref>は、完全長cDNA合成のためのプロトコルである。また、MARS-seq（Massively parallel single-cell RNA-seq）<ref><pubmed> 24531970 </pubmed></ref>、STRT（single-cell tagged reverse transcription）<ref><pubmed>21543516</pubmed></ref> <ref><pubmed>24363023</pubmed></ref>、CEL-seq（Cell Expression by Linear amplification and Sequencing）<ref><pubmed>22939981</pubmed></ref>、CEL-seq2<ref><pubmed> 27121950 </pubmed></ref>などが報告されてきた。特にSMART-seq（SMART-seq2）は、微小管によるマニュアル捕獲、限界希釈、セルソーター、レーザー捕獲法などを用いる多穴プレート法、更に半導体集積回路製作技術で作った流体集積回路を利用するFluidigm C1の装置https://jp.fluidigm.comと組み合わせることで利用される機会が多い。このプロトコールの特徴は、全長トランスクリプトームを得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、SNPs、変異の検出にも利用できる点で次に説明するUMIを用いる方法に比べて利点があるが、そのコストと処理可能な細胞数の点で弱点がある。
+それ以来、完全長cDNAを増幅したり、細胞ごとに異なる分子識別子（unique molecular identifiers: UMI）を持つcDNAを増幅させるscRNA-seqが考案され始め、2013年には、このような１細胞のシーケンシング技術が、Nature Methods誌のMethod of the Year に選ばれた[https://www.nature.com/collections/mysbdwgfll]。たとえば、SMART-seq（Switch mechanism at the 5' End of RNA Templates）<ref><pubmed>22820318</pubmed></ref>およびその改良されたプロトコルであるSMART-seq2 <ref><pubmed> 24056875 </pubmed></ref> <ref><pubmed>24385147</pubmed></ref>は、完全長cDNA合成のためのプロトコルである。また、MARS-seq（Massively parallel single-cell RNA-seq）<ref><pubmed> 24531970 </pubmed></ref>、STRT（single-cell tagged reverse transcription）<ref><pubmed>21543516</pubmed></ref> <ref><pubmed>24363023</pubmed></ref>、CEL-seq（Cell Expression by Linear amplification and Sequencing）<ref><pubmed>22939981</pubmed></ref>、CEL-seq2<ref><pubmed> 27121950 </pubmed></ref>、Seq-Well <ref><pubmed> 28192419</pubmed></ref>
+などが報告されてきた。最近になって、sci-RNA-seq (single-cell combinatorial indexing RNA sequencing) <ref><pubmed> 28818938 </pubmed></ref>, SPLiT-seq(split-pool ligation-based transcriptome sequencing)<ref><pubmed>29545511</pubmed></ref>のように特殊な機器を利用せずに細胞特異的UMIを保持するcDNAを作製する方法も報告されている。
-しかしながら、更に、重要なscRNA-seqの方法論についての進歩は、2015年、Harvard Medical Schoolの独立した２つのグループが、inDropそしてDrop-seqという類似した2つの高スループットな方法を開発したことであろう<ref><pubmed>26000487</pubmed></ref> <ref><pubmed>26000488</pubmed></ref>。これらの方法では、マイクロ流体力学 (Microfluidics) 、 UMIとしてDNAバーコーディング (DNA barcoding) 、そしてNGSを利用することで、自動化とサンプル調製の容易さから、1つの細胞あたりに要するコストを大幅に低下させることに成功した（Drop-seqは発表時で、１細胞あたり6セント）。つまり、細胞1つずつをマイクロ流体力学によるエマルジョン技術を利用した装置に流入させ、その１細胞を試薬を封入した1つのDroplet（油滴）に自動的に閉じ込める。そのDroplet中には、DropletごとにUMIとして異なったDNAバーコードを持つゲルビーズが入っており、それを足場にcDNA合成反応を実施することで、同じ細胞に含まれていたmRNAが同じUMIを持つcDNAとして合成され、Dropletを破壊した後も、そのmRNA/cDNAが由来した細胞を識別できるということを利用している（図１）。このようにして増幅したUMI付きｃDNAをNGSで配列決定することによりscRNA-seqが可能になる。なお、DropSeqはコストが低いが、細胞の取得率と検出感度が低い弱点がある。inDropはDropSeqより細胞取得率が高く、パラメータを調整することで低レベルで発現される遺伝子の検出に有利である。
+これらの方法のうち、SMART-seq、その改良法であるSMART-seq2は、微小ピペットによるマニュアル捕獲、セルソーター、レーザー捕獲法などを用いる多穴プレート法、更に半導体集積回路製作技術で作った流体集積回路を利用するFluidigm C1の装置[https://jp.fluidigm.com]と組み合わせることで利用される機会が多い。このSMART-seq2プロトコールの特徴は、mRNAの全領域を読むことで、全長トランスクリプトームを得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、アリルごとの発現情報が得られるSNPs、変異の検出にも利用できる。また、それぞれ細胞ごとの反応を独立した場所で行うため、別の細胞の反応と混じる可能性がない。これらの点が、次に説明するDropletを使用して3’末端のみを標的にしたscRNA-seqに比べた場合の長所であるが、その高コストと処理可能な細胞数の少なさが短所である。
-inDropの方法は、1 Cellbio社から販売されているhttps://1cell-bio.com。しかし、特に重要なのは10xGenomics社が同様の原理を用いた「Chromium」と命名された機器と試薬のシステムを市販することで、多くの研究者に利用できることになったことであるhttps://www.10xgenomics.com/jp/。Svenssonらによる最近のデータベースhttps://www.biorxiv.org/content/10.1101/742304v2, https://www.nxn.se/single-cell-studies/guiでは、scRNA-seqを用いた論文で用いられた方法について網羅的に調査しているが、この数年、10xGenomics社のChromiumを用いた方法が飛躍的に増加し、ほぼ寡占状態になりつつあることがわかる（現在、10XGenomics社とBioRad社の間で関連特許をめぐる係争がある。）。このシステムは市販であるので導入が容易であり、inDropやDropSeqに比べ、多くの転写産物の高感度検出が可能であるが、ランニングコストが高い。
+===Droplet使用の3’エンドリード法===
+しかしながら、もっとも重要なscRNA-seqの方法論についての進歩は、2015年、Harvard Medical Schoolの独立した２つのグループが、inDropそしてDrop-seqという類似した2つの高スループットな方法を開発したことであろう<ref><pubmed>26000487</pubmed></ref> <ref><pubmed>26000488 </pubmed></ref>。これらの方法では、マイクロ流体力学 (Microfluidics) 、 Cell BarcodeとUMIとしてDNAバーコーディング (DNA barcoding) 、そしてNGSを利用することで、自動化とサンプル調製の容易さから、1つの細胞あたりに要するコストを大幅に低下させることに成功した（Drop-seqは発表時で、１細胞あたり6セント）。つまり、細胞1つずつをマイクロ流体力学によるエマルジョン技術を利用した装置に流入させ、その１細胞を1つのDroplet（油中水滴）に自動的に閉じ込める。そのDroplet中には、DropletごとにCell barcode/UMIとして異なったDNAバーコードを持つゲルビーズ(Gel Beads in Emulsion, GEMs)が入っており、それを足場に3’末端のみを標的にしたcDNA合成反応を実施することで、同じ細胞に含まれていたmRNAが同じUMIを持つcDNAとして合成され、そのmRNA/cDNAが由来した細胞を識別できるということを利用している（図１）。このようにして3’末端のみを増幅したバーコード付きｃDNAをNGSで配列決定することによりscRNA-seqが可能になる。なお、DropSeqはコストが低いが、細胞の取得率と検出感度が低い弱点がある。inDropはDropSeqより細胞取得率が高く、パラメータを調整することで低レベルで発現される遺伝子の検出にも有利である<ref><pubmed>30472192</pubmed></ref>。
+DropSeqのセットアップはDolomite Bio ([https://www.dolomite-bio.com])、inDropは1 Cellbio社から販売されている[https://1cell-bio.com]。しかし、特に重要なのは10xGenomics社が同様の原理を用いた「Chromium」と命名された機器と試薬のシステムを市販することで、多くの研究者に利用できることになったことである[https://www.10xgenomics.com/jp/]。Svenssonらによる最近のデータベース[https://www.biorxiv.org/content/10.1101/742304v2], [http://www.nxn.se/single-cell-studies/gui]では、scRNA-seqを用いた論文で用いられた方法について調査しているが、この数年、10xGenomics社Chromiumを用いた論文が飛躍的に増加し、scRNA-seqの方法として、最も一般的になりつつあることがわかる（現在、10XGenomics社とBioRad社の間で関連特許をめぐる係争がある。）。このシステムは市販であるので導入が容易であり、DropSeqやinDropに比べ、多くの転写産物の高感度検出が可能であるが、ランニングコストは高い<ref><pubmed>30472192</pubmed></ref>。
 ==scRNA-seqの実際==
-ここでは主流になっている10xGenomics社のChromiumを用いた方法とSMART-seqなどを用いた方法に共通する方法の実際について議論する。シングルセルRNAシーケンシングの利用には、4つのステップがある。１）細胞をバラバラに単離すること。２）ライブラリーの作製とNGSシーケンシング。３）前処理（preprocessing、得られた配列の整理）。４）ダウンストリーム分析（生物学的な情報を得る）。これらのうち、２）の段階については、上に記述したように市販の機器や試薬を利用することが多くなっているので、各社のマニュアル等を参考にするのが現実的である。
+ここでは主流になっている10xGenomics社のChromiumを用いた方法とSMART-seqなどを用いた方法に共通する方法の実際について俯瞰する。scRNA-seqの利用には、4つのステップがある（図２）<ref><pubmed>30089861</pubmed></ref>。１）個体や組織を採集し、そこから細胞あるいは細胞核を個別にすること。２）ChromiumやSMART-seq2などによる個々の細胞からのライブラリーの作製とNGSシーケンシング。３）前処理（preprocessing、得られた配列の整理）。４）ダウンストリーム解析（生物学的な情報を得る）。これらのうち、２）の段階については、上に記述したように市販の機器や試薬を利用する機会が多くなっているので、そのためのマニュアル等を参考にするのが現実的である。
-===組織からの細胞の分離===
+===組織からの細胞、細胞核の分離===
-血液細胞のように浮遊した細胞ではない場合、物理的あるいは酵素処理などによって、生組織から状態の良い細胞をdissociationする必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている。ただ、しばしば問題となるのが、酵素処理のため短時間加温することで、発現量が変化する遺伝子が存在することである。例えば、脳のミクログリアの解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった<ref><pubmed>30471926</pubmed></ref>。また、酵素処理時に転写阻害剤であるアクチノマイシンで処理することで、このような現象を抑制できる<ref><pubmed>29024657</pubmed></ref>。更に、ヒマラヤ氷河から得られた細菌Bacillus licheniformisから得られた低温プロテアーゼを用いる方法も報告されている<ref><pubmed>28851704</pubmed></ref>。なお、ヒト組織などから生細胞を得ることは困難なことが多い。この場合、凍結した組織から、各細胞由来の核を調製し、核内のmRNAを分析するアプローチもあり、細胞質を持つ生細胞を利用した場合より感度は劣るが、目的によっては利用可能である<ref><pubmed>30586455</pubmed></ref>。
+血液細胞のように浮遊した細胞ではない場合、物理的あるいは酵素処理などによって、生組織から状態の良い細胞をdissociationする必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている。ただ、しばしば問題となるのが、酵素処理のため短時間加温することで、発現量が変化する遺伝子が存在することである<ref><pubmed>27090946</pubmed></ref>。例えば、脳のミクログリアの解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった<ref><pubmed>30471926</pubmed></ref>。また、このような現象を抑制するために、酵素処理時に転写阻害剤であるアクチノマイシンで処理したり<ref><pubmed>29024657</pubmed></ref>、ヒマラヤ氷河から得られた細菌Bacillus licheniformisから得られた低温プロテアーゼを用いる方法も報告されている<ref><pubmed>28851704</pubmed></ref>。また、細胞解離後に、メタノールで固定しscRNA-seqに使用することも可能である<ref><pubmed>28526029</pubmed></ref>。
-単離した細胞は、そのまま10xGenomicsのChromiumのプラットフォームに導入することができるが、抗体などを用いたFACS、パニング、磁気ビーズカラムなどによる特定のマーカーを細胞表面などに発現する細胞の単離を行う場合もある。
+なお、ヒト組織などから生きた細胞を得ることは困難なことが多い。この場合、凍結した組織から、各細胞由来の核を調製し、核内のmRNAを分析する方法 snRNA-seq (single-nucleus RNA-seq)があり、細胞質を持つ生細胞を利用した場合より感度は劣るが、細胞の同定などの目的には十分使用に耐える<ref><pubmed>27471252</pubmed></ref><<<ref><pubmed>28846088</pubmed></ref><<ref><pubmed>29220646</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>30586455</pubmed></ref><ref><pubmed>28729663</pubmed></ref>[https://www.biorxiv.org/content/10.1101/630087v1]。snRNA-seqでは、組織をそのまま凍結することから開始するので、上述したscRNA-seqの問題である酵素処理や加温などを避けることができる。こうしたプロトコールの一部は、protocols.ioのHuman Cell Atlasのグループ[https://www.protocols.io/groups/hca]で公開されている。
-更に、RNAを分析するscRNA-seqではないが、シングルセルgenome-seqの変法として、シングルセルの遺伝子発現を推定する方法として、トランスポゾンを用いることでゲノムのオープンクロマチン領域を選択的に検出し、ライブラリーを作製しシーケンスするsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin)がある<ref><pubmed>26083756</pubmed></ref>。
+単離した細胞は、そのまま10xGenomicsのChromiumのプラットフォームに導入することができるが、抗体などを用いたFACS、パニング、MACS(磁気ビーズカラム)などによる特定のマーカーを細胞表面などに発現する細胞の単離を行う場合もある。
+更に、RNAを分析するscRNA-seqではないが、single cell genome-seqの変法として、シングルセルの遺伝子発現を推定する方法として、トランスポゾンを用いることでゲノムのオープンクロマチン領域を選択的に検出し、ライブラリーを作製しシーケンスするsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin)<ref><pubmed>26083756</pubmed></ref>, <ref><pubmed>29434377</pubmed></ref><ref><pubmed>25953818</pubmed></ref>, single cell THS-seq (transposome hypersensitive-site) <ref><pubmed>29227469</pubmed></ref>がある。またDNAメチル化をシングルセルレベルで観察する方法も報告されている<ref><pubmed>28798132</pubmed></ref>。
 ===scRNA-seqデータの前処理===
-血液細胞のように浮遊した細胞ではない場合、物理的あるいは酵素処理などによって、生組織から状態の良い細胞をdissociationする必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている。ただ、しばしば問題となるのが、酵素処理のため短時間加温することで、発現量が変化する遺伝子が存在することである。例えば、脳のミクログリアの解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった<ref><pubmed>30471926</pubmed></ref>。また、酵素処理時に転写阻害剤であるアクチノマイシンで処理することで、このような現象を抑制できる<ref><pubmed>29024657</pubmed></ref>。更に、ヒマラヤ氷河から得られた細菌Bacillus licheniformisから得られた低温プロテアーゼを用いる方法も報告されている<ref><pubmed>28851704</pubmed></ref>。なお、ヒト組織などから生細胞を得ることは困難なことが多い。この場合、凍結した組織から、各細胞由来の核を調製し、核内のmRNAを分析するアプローチもあり、細胞質を持つ生細胞を利用した場合より感度は劣るが、目的によっては利用可能である<ref><pubmed>30586455</pubmed></ref>。
+x Genomics社のChromium、IlluminaのNGSを利用した場合、Cell Ranger(Linux上で作動)を用いて、各生物種ごとのレファレンス配列リスト（https://www.ncbi.nlm.nih.gov/grc）やEggNOG ([http://eggnogdb.embl.de])などを利用し、細胞とトランスクリプトーム（各遺伝子の発現）の対応マトリックスを作製する。その後のデータの処理についても、10xGenomics社がソフトウェアLoupeを提供している。しかしながら、その後のダウンストリーム解析を考慮して、R言語, Python, MATLABなどのデータ解析のための汎用プログラミング言語やコードで扱えるオブジェクトに変換するのが通常である。ここでは、scRNA-seqデータ解析のために最もよく利用されているR言語を用いたパッケージ「Seurat」<ref><pubmed> 29608179 </pubmed></ref> <ref><pubmed> 31178118 </pubmed></ref>を中心に紹介したい。なお、Pythonを利用したものでは、ドイツ・ミュンヘンInstitute of Computational Biologyの Fabian J. Theisらが開発しているScanpyが有名である<ref><pubmed> 29409532</pubmed></ref>。
-単離した細胞は、そのまま10xGenomicsのChromiumのプラットフォームに導入することができるが、抗体などを用いたFACS、パニング、磁気ビーズカラムなどによる特定のマーカーを細胞表面などに発現する細胞の単離を行う場合もある。
-更に、RNAを分析するscRNA-seqではないが、シングルセルgenome-seqの変法として、シングルセルの遺伝子発現を推定する方法として、トランスポゾンを用いることでゲノムのオープンクロマチン領域を選択的に検出し、ライブラリーを作製しシーケンスするsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin)がある<ref><pubmed>26083756</pubmed></ref>。
+New York UniversityのRahul Satija研究室が開発しているSeuratは、scRNA-seq解析のために広く利用されているR言語のパッケージであり、2019年8月現在、その最新バージョンはSeurat 3.1である。論文の正式発表前から、サポート情報提供やコード修正なども頻繁に行っており、Satija研究室のWeb site（satijalab.org/Seurat, [http://satijalab.org/Seurat]）、Github([https://github.com/satijalab/Seurat])、更にTwitterアカウント（@satijalab）などで最新情報を得ることできる。
-===ダウンストリーム解析===
+最初に行うのは、scRNA-seqデータの品質管理である。ここでは、質の低い細胞のデータ（転写産物の種類が少ない、ミトコンドリア由来の転写産物が多い）を取り除く。また、複数の試料を組み合わせる場合には、バッチごとの違いについて検討する。特にDropletを使用するscRNA-seqの多くのケースで問題になるのが、Dropletに２つ以上の細胞が封じ込められ、それらが同じCell barcodeを持つために生じるアーティファクトである。通常Doubletsと呼ばれるこの問題はダウンストリーム解析を混乱させるので、細胞単離の段階から注意する必要があるが、明確なマーカー遺伝子が知られていればscRNA-seqデータ取得後にある程度のデータ処理で検討することは可能である。
-クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスターに特徴的に発現している遺伝子を具体的に探索し、細胞集団の持つバイオマーカーによって、そのクラスターの同定が可能になる。例えば、既にニューロンとグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、ニューロンのタイプごとに区別されるマーカーは、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子（差次的発現遺伝子）を見つけるためには、Seuratのコードや他のダウンストリーム解析のためのコード（MAST <ref><pubmed>26653891</pubmed></ref>など）を用いることができる。scRNA-seqの解析に必要な様々なコードは、scRNA-tools <ref>https://www.scrna-tools.org</ref>やBioconductor<ref> https://www.bioconductor.org</ref>で紹介されており、ダウンロードも可能である。また、最新の情報については、bioRxivなどのプレプリントサーバで公開されていることが多い。細胞ごとの差次的発現遺伝子の可視化には、ドットプロットやヴァイオリンプロットなどが頻繁に用いられる（図４）。
-また、scRNA-seqでしばしば得られる情報には、細胞の分類とそれらの類縁関係、状態、それらのバイオマーカー遺伝子だけでなく、病態や発生途上の細胞系譜などの動態がある。これらの分析のためには、成分分析（compositional analysis）や系譜干渉（Trajectory interference）の解析手法が用いられる。
+このようなノーマライゼーションの過程を経て、scRNA-seqのデータ解析において、最初に行うのが、次元圧縮 (dimensionality reduction)である<ref><pubmed> 30617341</pubmed></ref>
-https://github.com/dynverse/dynmethods
+。PCA (Principal component analysis, 主成分分析)、UMAP（Uniform Manifold Approximation and Projection, 均一マニフォールド近似と投影）、Diffusion maps,  t-SNE(t-distributed Stochastic Neighbor Embedding , t分布型確率的近傍埋込み)などの手法が用いられる。 特に、t-SNE[http://www.jmlr.org/papers/v9/vandermaaten08a.html]（ティースニーと読むのが通常)は、高次元データを低次元の点の集合として可視化することで、それぞれの細胞の持つトランスクリプトームの類似度についての直観的な表示が可能でありしばしば用いられる（図３）。次に、Louvainアルゴリズムなどでクラスタリング（コミュニティ分割）を行い、tSNEグラフ上に表示できる。こうして、違ったタイプの細胞の集合が別のクラスターとして表示される。
-また発現している遺伝子側から見た場合、制御ネットワークやパスウェイ解析といったシステム生物学で用いられてきた手法も用いられる。
+==ダウンストリーム解析==
+===細胞クラスターの解釈とマーカー遺伝子候補の発見===
+scRNA-seqデータから得られる生物学的知見には、内在的に存在する細胞の種類、外部刺激や環境で変化した細胞の状態、そして種類や変化により特徴的に発現するマーカー遺伝子候補の発見がある。クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスターに特徴的に発現している遺伝子を具体的に探索し、細胞集団の持つバイオマーカーによって、そのクラスターの同定が可能になる。例えば、既にニューロンとグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、ニューロンのタイプごとに区別されるマーカーや神経活動により変化したニューロンの状態は、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子（差次的発現遺伝子）を見つけるためには（Differential expression analysis, DE analysis）、SeuratのFindMarkersコマンドでも利用可能である目的別の解析のための専用コード（MAST <ref><pubmed>26653891</pubmed></ref>、DESeq2 <ref><pubmed>25516281</pubmed></ref>
+など）を用いることができる。scRNA-seqの解析に必要なコードは、scRNA-tools [https://www.scrna-tools.org], Awesome single cell [https://github.com/seandavi/awesome-single-cell], Bioconductor[https://www.bioconductor.org]で紹介されており、ほとんどがダウンロード可能である。また、最新の情報については、bioRxivなどのプレプリントサーバで公開されていることが多く、scRNA-seqのデータ（下記参考）とともに、オープンサイエンス実践の好例となっている。細胞ごとの差次的発現遺伝子の可視化には、ドットプロットやヴァイオリンプロットなどが頻繁に用いられる（図４）。
+===偽時系列解析、制御ネットワーク、パスウェイ解析===
+実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、細胞周期、概日リズム、破裂型プロモーターの作動などの理由で変動が見られるものもある<ref><pubmed> 31217225 </pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上の細胞系譜や細胞分化といった細胞の遷移状態の解析（偽時系列解析Pseudo-time analysis ）には、scRNA-seqデータを用いることが極めて効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref>
+。これらの分析のためには軌道推定（Trajectory inference）の解析手法が用いられる。しばしば用いられるMonocle3 <ref><pubmed>30787437</pubmed></ref>など、多くのコードを収集しているGithubのサイトがある [https://github.com/dynverse/dynmethods][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといった、転写産物のスプライシングの状態から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref>。しかし、これらの方法は、あくまで発生途上の細胞系譜や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNA-seqを行うことで、細胞タイプの系統関係を調べる方法として、CRISPR-Cas9を用いたゲノム編集による記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>がある。
+また変化している遺伝子発現を解釈するために、制御ネットワーク（例、SCENIC<ref><pubmed>28991892</pubmed></ref>, [https://github.com/aertslab/SCENIC]）やパスウェイ解析(例、Metascape<ref><pubmed>30944313</pubmed></ref>, [http://metascape.org])といったシステム生物学で用いられてきた手法も適用できる。
 ==神経科学への応用==
 ===ニューロンのクラスとタイプ===
-様々な神経・精神疾患について理解しその診断や治療に役立てるためには、ニューロン、グリア細胞を中心にした神経系にある細胞の「タイプ」を識別し、それぞれの細胞における分子的な変化を観察することが重要である。近年、中枢神経系のグリア細胞にも、多様なアストロサイト、オリゴデンドロサイト、ミクログリアの存在が報告されてきている。一方で、ニューロンは著しく多様であり、このニューロンの多様性こそが、神経系を特徴づけており、その多彩で複雑な機能の発現に必須であることは疑う余地がない。
+様々な神経・精神疾患について理解しその診断や治療に役立てるためには、ニューロン、グリア細胞を中心にした神経系にある細胞の「タイプ」を識別し、それぞれの細胞における分子的な変化を観察することが重要である <ref><pubmed>28775344</pubmed></ref><ref><pubmed>29738987</pubmed></ref>。近年、中枢神経系のグリア細胞にも、多様なアストロサイト、オリゴデンドロサイト、ミクログリアの存在が報告されてきている。一方で、ニューロンは著しく多様であり、このニューロンの多様性こそが、神経系を特徴づけており、その多彩で複雑な機能の発現に必須であることは疑う余地がない。
-解剖学的な視点から言えば、すべてのニューロンの存在する位置は異なるので、すべてのニューロンは異なるという見方もできる。しかし、これは極論であり、従来の神経科学では、ニューロンの多様性は、それぞれのニューロンの解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきた。こうしたニューロンの多様性を便宜的に記述するのに、タイプ（type）、クラス（class）、サブクラス（subclass）、サブタイプ（subtype） というような用語が用いられてきた。しかし、本稿では混乱を防ぐため、Masland（2004）の提唱に従い、「クラス」と「タイプ」という単語を用いることとする。タイプは、これ以上分類することができないとされる階層である。例えば、大脳皮質の錐体細胞、網膜神経節細胞といった大雑把な識別は「クラス」と呼ぶ。大脳皮質の錐体細胞というクラスは、層や領野によって「タイプ」が異なるし、網膜神経節細胞には視覚情報によって応答が異なる「タイプ」が存在する。この分類は、免疫組織化学、形態、電気生理学などの技術により識別可能である暫定的なものに過ぎない。本稿で解説するscRNA-seqの技術は、その網羅性からそれぞれのニューロンについてこれまでにないビッグデータを提供することで、このニューロンのタイプの理解に確実な根拠を与えつつある。
+解剖学的な視点から言えば、すべてのニューロンの存在する位置は異なるので、すべてのニューロンは異なるという見方もできる。しかし、これは極論であり、従来の神経科学では、ニューロンの多様性は、それぞれのニューロンの解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきた。こうしたニューロンの多様性を便宜的に記述するのに、タイプ（type）、クラス（class）、サブクラス（subclass）、サブタイプ（subtype） というような用語が用いられてきた。しかし、本稿では混乱を防ぐため、Masland（2004）<ref><pubmed>15242626</pubmed></ref>が提唱し、広く受けいれられている「クラス」と「タイプ」という単語を用いることとする。タイプは、これ以上分類することができないとされる階層である。例えば、大脳皮質の錐体細胞、網膜神経節細胞といった大雑把な識別は「クラス」と呼ぶ。大脳皮質の錐体細胞というクラスは、層や領野によって「タイプ」が異なるし、網膜神経節細胞には視覚情報によって応答が異なる「タイプ」が存在する。この分類は、免疫組織化学、形態、電気生理学などの技術により識別可能である暫定的なものに過ぎない。本稿で解説するscRNA-seqの技術は、その網羅性からそれぞれのニューロンについてこれまでにないビッグデータを提供することで、このニューロンのタイプの理解に確実な根拠を与えつつある。
 ===大脳===
@@ 63行目: / 78行目: @@
 ===網膜===
-===展望===
+==展望==
-データベース
+===進化と他の動物種===
+===データベース===
 Human Cell Atlas
 Human Brain Transcriptome project
 Single cell portal
 Allen Brain Atlas
+統合　LIGER, MetaNeighbor
+===空間トランスクリプミクス===
-空間トランスクリプミクス
+===マルチモーダルなオミクス===
 == 関連項目 ==

「シングルセルRNAシーケンシング」の版間の差分

案内メニュー

検索