「シングルセルRNAシーケンシング」の版間の差分

編集の要約なし
編集の要約なし
編集の要約なし
5行目: 5行目:
担当編集委員:<br>
担当編集委員:<br>
</div>
</div>
英:single cell RNA sequencing, scRNAseq
英:single cell RNA sequencing, scRNAseq
{{box|text=
{{box|text=
シングルセルRNAシーケンシング(single cell RNA sequencing, 以下scRNAseq)は、[[次世代シーケンシング]] (next generation sequencing、以下NGS)技術を使用して個々の細胞が発現しているmRNA全体、つまり[[トランスクリプトーム]]を質的、量的に網羅的に調べ、細胞ごとの違いを高解像度で検出し、数理的に解析する分子生物学的、コンピュータ生物学的技術である。組織内にある細胞の分類を行うことで、未知あるいは希少な細胞の種類や状態の検出に有効である。また、刺激、発生など細胞の状況に応じて、個々の細胞のトランスクリプトームの情報を得ることで、細胞系譜などの疑時系列解析や疾患のバイオマーカーの研究も可能である。特に多様な神経細胞が存在する神経系では、この方法により、神経細胞や非神経細胞の分類や状態についての知見が深まり、新しい細胞マーカーや機能遺伝子の同定などが系統的かつ網羅的に行われるようになった。空間的情報、エピゲノム情報、タンパク質情報などを取り入れながら、細胞タイプ間の発現変化を探索するマルチモーダル技術の発展も著しい。
シングルセルRNAシーケンシング(single cell RNA sequencing, 以下scRNAseq)は、[[次世代シーケンシング]] (next generation sequencing、以下NGS)技術を使用して個々の細胞が発現しているmRNA全体、つまり[[トランスクリプトーム]]を質的、量的に網羅的に調べ、細胞ごとの違いを高解像度で検出し、数理的に解析する分子生物学的、コンピュータ生物学的技術である。組織内にある細胞の分類を行うことで、未知あるいは希少な細胞の種類や状態の検出に有効である。また、刺激、発生など細胞の状況に応じて、個々の細胞のトランスクリプトームの情報を得ることで、細胞系譜などの疑時系列解析や疾患のバイオマーカーの研究も可能である。特に多様な神経細胞が存在する神経系では、この方法により、神経細胞や非神経細胞の分類や状態についての知見が深まり、新しい細胞マーカーや機能的な遺伝子の同定などが系統的かつ網羅的に行われるようになった。空間的情報、エピゲノム情報、タンパク質情報なども取り入れながら、特定の細胞タイプでの発現変化を探索するマルチモーダル解析の発展も著しい。
}}
}}


==scRNA-seqとその開発史==
==scRNAseqの背景==
===トランスクリプトーム===
===トランスクリプトーム===
トランスクリプトーム(transcriptome)は、細胞中に存在する全ての転写産物(タンパク質をコードするmRNA、タンパク質をコードしない[[ノンコーディングRNA]]、[[マイクロRNA]]など)の総体である<ref><pubmed>19015660</pubmed></ref><ref><pubmed>31341269 </pubmed></ref>。トランスクリプトームは、[[ゲノム]]とは異なり、同一の個体でも、組織ごとに、更には発生段階や細胞外環境や刺激によって変化する。トランスクリプトームは、同質あるいは異質の多数の細胞集団(組織、培養細胞)からRNA抽出後、cDNAに変換し、それを1990年代に出現した[[DNAマイクロアレイ]]のように数多くの既知mRNAを識別する技術によって解析されるようになった。その後、NGSの利用により、希少mRNAやノンコーディングRNAを含めた未知の転写産物の高感度検出が可能になるとともに、[[スプライシング]]で成熟していく過程のmRNAなど、転写産物の種類だけでなく、転写産物の構造的差異(スプライシングバリアント、SNPs、変異など)の解析もできるようになった。加えて、ヒトやモデル実験生物([[マウス]]、[[ゼブラフィッシュ]]、[[ショウジョウバエ]]、[[センチュウ]]など)だけでなく、多種多様な生物のトランスクリプトームの把握も可能になった。ここでは、このような多数の細胞集団、つまり個体や特定の組織全体(bulk RNAseq)ではなく、細胞1つの持つトランスクリプトームを解析する方法(scRNAseq)とそのscRNAseqデータを利用することで得られる情報について概説する。
トランスクリプトーム(transcriptome)は、細胞中に存在する全ての転写産物(タンパク質をコードするmRNA、タンパク質をコードしない[[ノンコーディングRNA]]、[[マイクロRNA]]など)の総体である<ref><pubmed>19015660</pubmed></ref><ref><pubmed>31341269 </pubmed></ref>。トランスクリプトームは、[[ゲノム]]とは異なり、同一の個体でも、組織ごとに、更には発生段階や細胞外環境や刺激によって変化する。トランスクリプトームは、同質あるいは異質の多数の細胞集団(組織、培養細胞)からRNA抽出後、cDNAに変換し、それを1990年代に出現した[[DNAマイクロアレイ]]のように数多くの既知mRNAを識別する技術によって解析されるようになった。その後、NGSの利用により、希少mRNAやノンコーディングRNAを含めた未知の転写産物の高感度検出が可能になるとともに、[[スプライシング]]で成熟していく過程のmRNAなど、転写産物の種類だけでなく、転写産物の構造的差異(スプライシングバリアント、SNPs、変異など)の解析もできるようになった。加えて、ヒトやモデル実験生物([[マウス]]、[[ゼブラフィッシュ]]、[[ショウジョウバエ]]、[[センチュウ]]など)だけでなく、多種多様な生物のトランスクリプトームの把握も可能になった。ここでは、このような多数の細胞集団、つまり個体や特定の組織全体(bulk RNAseq)ではなく、細胞1つの持つトランスクリプトームを解析する方法(scRNAseq)とそのscRNAseqデータを利用することで得られる情報について概説する。


===scRNA-seqとその開発史===
===scRNAseqとその開発史===
1つの細胞の持つ生体物質を解明し、定量しようとする試みは古くからあった。1960年代になると、フローサイトメトリーを利用した[[蛍光活性化セルソーティング]](Fluorescence-activated cell sorting, FACS)が発明され、標識抗体などのプローブと組み合わせることで、多数の細胞集団の中で1つの細胞が持っている分子の種類や量についての断片的な研究が可能になり、この方法は現在でも汎用されている<ref><pubmed>22271369</pubmed></ref>。その後、[[免疫組織化学]]や[[in situ hybridization]]nなどにより、タンパク質やmRNAの種類や量が観察できるようになり、組織中に存在するそれぞれの細胞の同定などに活用されてきている。最近では、それぞれの細胞が持つ抗原分子を、異なった金属イオンで標識した抗体とフローサイトメトリーを組み合わせた方法で検出する[[マスサイトメトリー]](CyTOFなど)も開発されてきている<ref><pubmed>27153492</pubmed></ref>。
1つの細胞の持つ生体物質を解明し、定量しようとする試みは古くからあった。1960年代になると、フローサイトメトリーを利用した[[蛍光活性化セルソーティング]](Fluorescence-activated cell sorting, FACS)が発明され、標識抗体などのプローブと組み合わせることで、多数の細胞集団の中で1つの細胞が持っている分子の種類や量についての断片的な研究が可能になり、この方法は現在でも汎用されている<ref><pubmed>22271369</pubmed></ref>。その後、[[免疫組織化学]]や[[in situ hybridization]]nなどにより、タンパク質やmRNAの種類や量が観察できるようになり、組織中に存在するそれぞれの細胞の同定などに活用されてきている。最近では、それぞれの細胞が持つ抗原分子を、異なった金属イオンで標識した抗体とフローサイトメトリーを組み合わせた方法で検出する[[マスサイトメトリー]](CyTOFなど)も開発されてきている<ref><pubmed>27153492</pubmed></ref>。


1つの細胞内にある全RNA(ribosomal RNAを含む)は細胞種にもよるが1-50pgである。そのうち、mRNAの占める割合は1-5%程度である<ref><pubmed>15239941</pubmed></ref>。この微量のmRNAをcDNAに変換してから大幅に増幅できる方法が発明されたことで、1つの細胞が発現するmRNAを高感度で検出できるようになった<ref><pubmed>1557406</pubmed></ref><ref><pubmed>7541630</pubmed></ref> 。例えば、1991年、Linda BuckとRichard Axelは、[[嗅覚受容体]]が[[Gタンパク質]]であると仮定し、個々の嗅覚細胞で特異的に観察されるGタンパク質mRNAを比較することで、嗅覚受容体の同定に成功した<ref><pubmed>1840504</pubmed></ref>。1995年になると、Catherine DulacとRichard Axelは、異なる[[鋤鼻神経細胞で特異的]]に発現する遺伝子を1つの細胞から作製したcDNAライブラリーを比較するディファレンシャル・スクリーニングを行うことで、[[フェロモン受容体]]を同定した<ref><pubmed>7585937</pubmed></ref>。同じ手法で異なる種類の神経細胞で発現している遺伝子も同定され<ref><pubmed>9778248</pubmed></ref><ref><pubmed>12230981</pubmed></ref>、1つの細胞の持つトランスクリプトームを比較するアプローチが神経細胞で特徴的に発現している遺伝子の同定に効果的なことを示した。
1つの細胞内にある全RNA(ribosomal RNAを含む)は細胞種にもよるが1-50pgである。そのうち、mRNAの占める割合は1-5%程度である<ref><pubmed>15239941</pubmed></ref>。この微量のmRNAをcDNAに変換してから大幅に増幅できる方法が発明されたことで、1つの細胞が発現するmRNAを高感度で検出できるようになった<ref><pubmed>1557406</pubmed></ref><ref><pubmed>7541630</pubmed></ref> 。例えば、1991年、Linda BuckとRichard Axelは、[[嗅覚受容体]]が[[Gタンパク質]]であると仮定し、個々の嗅覚細胞で特異的に観察されるGタンパク質mRNAを比較することで、嗅覚受容体の同定に成功した<ref><pubmed>1840504</pubmed></ref>。1995年になると、Catherine DulacとRichard Axelは、異なる[[鋤鼻神経細胞]]で特異的に発現する遺伝子を1つの細胞から作製したcDNAライブラリーを比較するディファレンシャル・スクリーニングを行うことで、[[フェロモン受容体]]を同定した<ref><pubmed>7585937</pubmed></ref>。同じ手法で異なる種類の神経細胞で発現している遺伝子も同定され<ref><pubmed>9778248</pubmed></ref><ref><pubmed>12230981</pubmed></ref>、1つの細胞の持つトランスクリプトームを比較するアプローチが神経細胞で特徴的に発現している遺伝子の同定に効果的なことを示した。
 
一方で多くの種類のmRNAを1細胞レベルで一挙に観察するトランスクリプトームのための技術にはブレークスルーが待たれた。1つの問題は多種類のcDNAを簡便に識別することを可能にする方法の開発であった。これを可能にしたのが、[[PCR]]などのcDNA増幅法の改良とマイクロアレイの利用であった<ref><pubmed>12736331</pubmed></ref><ref><pubmed>16547197</pubmed></ref>。しかしながら、細胞ごとに高価なマイクロアレイを使用することは、多数の細胞のトランスクリプトームの観察には限界があった。2009年になると、これらの問題を解決できる可能性として、NGSを利用するscRNAseqプロトコールがAzim Suraniのグループによって報告された<ref><pubmed>19349980</pubmed></ref>。しかしながら、この報告でもわずか8個の細胞の解析に留まっており、1つの細胞ごとに処理を行うという操作が必要で、多数の細胞についてのトランスクリプームを一挙に理解することはできなかった。また、塩基配列の違うcDNAごとにPCR効率に差がある結果生じる増幅バイアス、また3’末端側が選択的に補足されることなどの課題を残した。


一方で多くの種類のmRNAを1細胞レベルで一挙に観察するトランスクリプトームのための技術にはブレークスルーが待たれた。1つの問題は多種類のcDNAを簡便に識別することを可能にする方法の開発であった。これを可能にしたのが、[[PCR]]などのcDNA増幅法の改良とマイクロアレイの利用であった<ref><pubmed>12736331</pubmed></ref><ref><pubmed>16547197</pubmed></ref>。しかしながら、細胞ごとに高価なマイクロアレイを使用することは、多数の細胞のトランスクリプトームの観察には限界があった。2009年になると、これらの問題を解決できる可能性として、NGSを利用するscRNA-seqプロトコールがAzim Suraniのグループによって報告された<ref><pubmed>19349980</pubmed></ref>。しかしながら、この報告でもわずか8個の細胞の解析に留まっており、1つの細胞ごとに処理を行うという操作が必要で、多数の細胞についてのトランスクリプームを一挙に理解することはできなかった。また、塩基配列の違うcDNAごとにPCR効率に差がある結果生じる増幅バイアス、また3’末端側が選択的に補足されることなどの課題を残した。
===scRNAseqの現状===
その後、5’末端側も含めた完全長cDNAを増幅するscRNAseqのプロトコールが考案された。特に、SMART-seq(Switch mechanism at the 5' End of RNA Templates)<ref><pubmed>22820318</pubmed></ref>およびその改良されたプロトコールであるSMART-seq2<ref><pubmed>24056875</pubmed></ref> <ref><pubmed>24385147</pubmed></ref>の使用例が多い(既に、SMART-seq3という改良プロトコールもある<ref><pubmed>32518404</pubmed></ref>が、以下SMART-seqと呼ぶ)。また、類似法としてSTRT(single-cell tagged reverse transcription)<ref><pubmed>21543516</pubmed></ref>などがある。一方、MARS-seq(Massively parallel single-cell RNA-seq)<ref><pubmed>24531970 </pubmed></ref>、CEL-seq(Cell Expression by Linear amplification and Sequencing)<ref><pubmed>22939981</pubmed></ref>、CEL-seq2<ref><pubmed> 27121950 </pubmed></ref>では、[[T7 RNAポリメラーゼ]]による[[in vitro転写]]を用いることにより、PCRで顕著な増幅バイアスを減少させようとしている。


===scRNA-seqの現状===
その後、5’末端側も含めた完全長cDNAを増幅するscRNA-seqのプロトコールが考案された。特に、SMART-seq(Switch mechanism at the 5' End of RNA Templates)<ref><pubmed>22820318</pubmed></ref>およびその改良されたプロトコールであるSMART-seq2<ref><pubmed>24056875</pubmed></ref> <ref><pubmed>24385147</pubmed></ref>の使用例が多い(既に、SMART-seq3という改良プロトコールもある<ref><pubmed>32518404</pubmed></ref>が、以下SMART-seqと呼ぶ)。また、類似法としてSTRT(single-cell tagged reverse transcription)<ref><pubmed>21543516</pubmed></ref>などがある。一方、MARS-seq(Massively parallel single-cell RNA-seq)<ref><pubmed>24531970 </pubmed></ref>、CEL-seq(Cell Expression by Linear amplification and Sequencing)<ref><pubmed>22939981</pubmed></ref>、CEL-seq2<ref><pubmed> 27121950 </pubmed></ref>では、[[T7 RNAポリメラーゼ]]による[[in vitro転写]]を用いることにより、PCRで顕著な増幅バイアスを減少させようとしている。
増幅バイアス除去のアプローチとして特に重要なのは、2011年に発表された分子識別子(unique molecular identifiers: UMI)を持つcDNAを増幅させ、NGS後の情報処理を用いる方法である<ref><pubmed>22101854</pubmed></ref>。この方法では逆転写反応の際、ランダムなUMIをcDNA末端に付加した後、増幅反応、NGSを行い、cDNA配列とUMI配列の両方を読む。同一のUMIを持っていれば、逆転写時に同一のcDNA由来とカウントする。UMIをカウントすることで、増幅前のmRNAのコピー数を知ることができる<ref><pubmed>21543516</pubmed></ref><ref><pubmed>24363023</pubmed></ref><ref><pubmed>28192419</pubmed></ref> <ref><pubmed>29474909</pubmed></ref><ref><pubmed> 28818938 </pubmed></ref><ref><pubmed>29545511</pubmed></ref>。2013年には、このような1細胞のシーケンシング技術が、Nature Methods誌のMethod of the Year に選ばれた[https://www.nature.com/collections/mysbdwgfll]。
増幅バイアス除去のアプローチとして特に重要なのは、2011年に発表された分子識別子(unique molecular identifiers: UMI)を持つcDNAを増幅させ、NGS後の情報処理を用いる方法である<ref><pubmed>22101854</pubmed></ref>。この方法では逆転写反応の際、ランダムなUMIをcDNA末端に付加した後、増幅反応、NGSを行い、cDNA配列とUMI配列の両方を読む。同一のUMIを持っていれば、逆転写時に同一のcDNA由来とカウントする。UMIをカウントすることで、増幅前のmRNAのコピー数を知ることができる<ref><pubmed>21543516</pubmed></ref><ref><pubmed>24363023</pubmed></ref><ref><pubmed>28192419</pubmed></ref> <ref><pubmed>29474909</pubmed></ref><ref><pubmed> 28818938 </pubmed></ref><ref><pubmed>29545511</pubmed></ref>。2013年には、このような1細胞のシーケンシング技術が、Nature Methods誌のMethod of the Year に選ばれた[https://www.nature.com/collections/mysbdwgfll]。


これらの方法のうち、SMART-seqは、マイクロピペットによる捕獲、セルソーター、[[レーザー捕獲]]などを用いるマルチウェル法、あるいは半導体集積回路製作技術で作った流体集積回路を利用するFluidigm C1の装置[https://jp.fluidigm.com]と組み合わせることで利用される機会が多い<ref><pubmed>30405621</pubmed></ref>[https://doi.org/10.1101/742304]。SMART-seqプロトコールの特徴は、全長トランスクリプトームを得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、アリルごとの発現情報が得られるSNPs、変異の検出にも利用できる。また、それぞれ細胞ごとの反応を独立した場所で行うため、別の細胞の反応と混じる可能性がない。小型ウェルを用いるSeq-Wellも同様である<ref><pubmed>28192419</pubmed></ref>。これらの点が、次に説明するDropletを使用して3’末端のみを標的にしたscRNA-seqに比べた場合の長所であるが、その高コスト(1細胞あたり数十ドル)と処理可能な細胞数の少なさが短所である。
これらの方法のうち、SMART-seqは、マイクロピペットによる捕獲、セルソーター、[[レーザー捕獲]]などを用いるマルチウェル法、あるいは半導体集積回路製作技術で作った流体集積回路を利用するFluidigm C1の装置[https://jp.fluidigm.com]と組み合わせることで利用される機会が多い<ref><pubmed>30405621</pubmed></ref>[https://doi.org/10.1101/742304]。SMART-seqプロトコールの特徴は、全長トランスクリプトームを得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、アリルごとの発現情報が得られるSNPs、変異の検出にも利用できる。また、それぞれ細胞ごとの反応を独立した場所で行うため、別の細胞の反応と混じる可能性がない。小型ウェルを用いるSeq-Wellも同様である<ref><pubmed>28192419</pubmed></ref>。これらの点が、次に説明するDropletを使用して3’末端のみを標的にしたscRNAseqに比べた場合の長所であるが、その高コスト(1細胞あたり数十ドル)と処理可能な細胞数の少なさが短所である。


===Droplet使用の3’エンドリード法===
===Droplet使用の3’エンドリード法===
しかしながら、もっとも重要なscRNA-seqの方法論についての進歩は、2015年、Harvard Medical Schoolの独立した2つのグループが、inDrops<ref><pubmed>26000487</pubmed></ref>そしてDrop-seq<ref><pubmed>26000488 </pubmed></ref>という類似した2つの高スループットな方法を開発したことであろう(inDropsはT7RNAポリメラーゼ、Drop-seqはPCRで増幅)。これらの方法では、[[マイクロ流体力学]] (Microfluidics) 、 UMI(上述)と細胞ごとのCell Barcodeという2種類のDNAバーコーディング、そしてNGSと情報解析を利用している。そして、多く細胞のサンプル調製の自動化と容易さから、1つの細胞あたりに要するコストを大幅に低下させることに成功した(Drop-seqは発表時で、1細胞あたり約5セント)。つまり、細胞1つずつをマイクロ流体力学によるエマルジョン技術を利用した装置に流入させ、その1細胞を1つのDroplet(油中水滴)に自動的に閉じ込める。そのDroplet中には、DropletごとにCell barcode/UMIとしてユニークなDNAバーコードを持つゲルビーズ(Gel Beads in Emulsion, GEMs)が入っており、それを足場に3’末端のみを標的にしたcDNA合成反応を実施することで、同じ細胞に含まれていたmRNAが同じCell barcodeを持つcDNAとして合成され、そのmRNA/cDNAが由来した細胞を識別できるということを利用している(図1)。なお、DropSeqはコストが低いが、細胞の取得率と検出感度が低い弱点がある。inDropsはDropSeqより細胞取得率が高く、パラメータを調整することにより、低レベルで発現される遺伝子の検出にも有利であるとされる<ref><pubmed>30472192</pubmed></ref>。
しかしながら、もっとも重要なscRNAseqの方法論についての進歩は、2015年、Harvard Medical Schoolの独立した2つのグループが、inDrops<ref><pubmed>26000487</pubmed></ref>そしてDrop-seq<ref><pubmed>26000488 </pubmed></ref>という類似した2つの高スループットな方法を開発したことであろう(inDropsはT7RNAポリメラーゼ、Drop-seqはPCRで増幅)。これらの方法では、[[マイクロ流体力学]] (Microfluidics) 、 UMI(上述)と細胞ごとのバーコード(Cell Barcode)という2種類のDNAバーコーディング、そしてNGSと情報解析を利用している。そして、多く細胞のサンプル調製の自動化と容易さから、1つの細胞あたりに要するコストを大幅に低下させることに成功した(Drop-seqは発表時で、1細胞あたり約5セント)。つまり、細胞1つずつをマイクロ流体力学によるエマルジョン技術を利用した装置に流入させ、その1細胞を1つのDroplet(油中水滴)に自動的に閉じ込める。そのDroplet中には、DropletごとにCell barcode/UMIとしてユニークなDNAバーコードを持つゲルビーズ(Gel Beads in Emulsion, GEMs)が入っており、それを足場に3’末端のみを標的にしたcDNA合成反応を実施することで、同じ細胞に含まれていたmRNAが同じCell barcodeを持つcDNAとして合成され、そのmRNA/cDNAが由来した細胞を識別できるということを利用している(図1)。
 
なお、DropSeqはコストが低いが、細胞の取得率と検出感度が低い弱点がある。inDropsはDropSeqより細胞取得率が高く、パラメータを調整することにより、低レベルで発現される遺伝子の検出にも有利であるとされる<ref><pubmed>30472192</pubmed></ref>。
[http://www.youtube.com/watch?v=fHq9ewdYEWM]
[http://www.youtube.com/watch?v=fHq9ewdYEWM]
DropSeqのセットアップはDolomite Bio ([https://www.dolomite-bio.com])、inDropは1 Cellbio社から販売されている[https://1cell-bio.com]。しかし、特に重要なのは10x Genomics社が同様の原理を用いた「Chromium」と命名された機器と試薬のシステムを市販することで、多くの研究者が容易に利用できることになったことである<ref><pubmed>28091601
DropSeqのセットアップはDolomite Bio ([https://www.dolomite-bio.com])、inDropは1 Cellbio社から販売されている[https://1cell-bio.com]。しかし、特に重要なのは10x Genomics社が同様の原理を用いた「Chromium」と命名された機器と試薬のシステムを市販することで、多くの研究者が容易に利用できることになったことである<ref><pubmed>28091601
</pubmed></ref>[https://www.10xgenomics.com/jp/]。Svenssonらによる最近のデータベース[https://doi.org/10.1101/742304], [http://www.nxn.se/single-cell-studies/gui]では、scRNA-seqを用いた論文で用いられた方法について調査しているが、この数年、10x Genomics社Chromiumを用いた論文が飛躍的に増加し、scRNA-seqの方法として一般的になりつつあることがわかる(現在、10x Genomics社とBioRad社の間で関連特許をめぐる係争がある。)。このシステムは市販であるので導入が容易であり、DropSeqやinDropsに比べ多くの転写産物の高感度検出が可能であるが、ランニングコストは高い<ref><pubmed>30472192</pubmed></ref>。なお、3’エンドリード法だけでなく、N末端側に位置する抗体の可変領域などの検出には5’エンドリード法が利用されることがある。
</pubmed></ref>[https://www.10xgenomics.com/jp/]。Svenssonらによる最近のデータベース[https://doi.org/10.1101/742304], [http://www.nxn.se/single-cell-studies/gui]では、scRNAseqを用いた論文で用いられた方法について調査しているが、この数年、10x Genomics社Chromiumを用いた論文が飛躍的に増加し、scRNAseqの方法として一般的になりつつあることがわかる(現在、10x Genomics社とBioRad社の間で関連特許をめぐる係争がある。)。このシステムは市販であるので導入が容易であり、DropSeqやinDropsに比べ多くの転写産物の高感度検出が可能であるが、ランニングコストは高い<ref><pubmed>30472192</pubmed></ref>。なお、3’エンドリード法だけでなく、N末端側に位置する抗体の可変領域などの検出には5’エンドリード法が利用されることがある。
[[ファイル:scFig1.jpg|サムネイル|250px|'''図1.Droplet使用の3’エンドリード法 '''<br>組織から解離させた細胞それぞれを、マイクロ流体力学を利用した装置で、バーコードプライマーが結合したゲルビーズとともにオイルドロップレットに封じ込める。mRNAを逆転写した後、PCRで増幅する。]]
[[ファイル:scFig1.jpg|サムネイル|300px|'''図1.Droplet使用の3’エンドリード法 '''<br>組織から解離させた細胞それぞれを、マイクロ流体力学を利用した装置で、バーコードプライマーが結合したゲルビーズとともにオイルドロップレットに封じ込める。mRNAを逆転写した後、PCRで増幅する。]]


==scRNA-seqの実際==
==scRNAseqの実際==
ここでは主流になっている10x Genomics社のChromiumなどのDropletを用いた方法とSMART-seqなどを用いた方法に共通する方法の実際について俯瞰する。scRNA-seqの利用には、4つのステップがある(図2)<ref><pubmed> 31217225</pubmed></ref><ref><pubmed>30089861</pubmed></ref>。1)個体や組織を採集し、そこから細胞あるいは細胞核を個別にすること。2)Droplet法やSMART-seqなどによる個々の細胞からのライブラリーの作製とNGS。3)前処理(preprocessing、得られた配列の整理)。4)ダウンストリーム解析(生物学的な情報を得るコンピューター生物学)。これらのうち、2)の段階については、上に記述したように市販の機器や試薬を利用する機会が多くなっているので、そのためのマニュアル等が参考になるはずである。
ここでは主流になっている10x Genomics社のChromiumなどのDropletを用いた方法とSMART-seqなどを用いた方法に共通する方法の実際について俯瞰する。scRNAseqの利用には、4つのステップがある(図2)<ref><pubmed> 31217225</pubmed></ref><ref><pubmed>30089861</pubmed></ref>。1)個体や組織を採集し、そこから細胞あるいは細胞核を個別にすること。2)Droplet法やSMART-seqなどによる個々の細胞からのライブラリーの作製とNGS。3)前処理(preprocessing、得られた配列の整理)。4)ダウンストリーム解析(生物学的な情報を得るコンピューター生物学)。これらのうち、2)の段階については、上に記述したように市販の機器や試薬を利用する機会が多くなっているので、そのためのマニュアル等が参考になるはずである。
  [[ファイル:scFig2.jpg|サムネイル|250px|'''図2.scRNA-seqの実際のステップ '''<br>細胞の単離、ライブラリ作製とNGS、データの前処理から次元圧縮、ダウンストリーム解析。図の一部は2016 DBCLS TogoTV、あるいはSeuratを用いて10x Genomics社のPBMCデータ([https://support.10xgenomics.com/single-cell-gene-expression/datasets]から執筆者が作製。]]
  [[ファイル:scFig2.jpg|サムネイル|500px|'''図2.scRNAseqの実際のステップ '''<br>細胞の単離、ライブラリ作製とNGS、データの前処理から次元圧縮、ダウンストリーム解析。図の一部は2016 DBCLS TogoTV、あるいはSeuratを用いて10x Genomics社のPBMCデータ([https://support.10xgenomics.com/single-cell-gene-expression/datasets]から執筆者が作製。]]


===組織からの細胞、細胞核の分離===
===組織からの細胞、細胞核の分離===
血液細胞のように浮遊した細胞ではない場合、物理的あるいは酵素処理などによって解離することで、生組織から状態の良いバラバラになった細胞を調製する必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている。ここで、しばしば問題となるのが、酵素処理による短時間加温や機械的刺激で、発現量が変化する遺伝子が存在することである<ref><pubmed>27090946</pubmed></ref>。特に、脳の[[ミクログリア]]の解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった<ref><pubmed>30471926</pubmed></ref>。また、このような現象を抑制するために、酵素処理時に転写阻害剤である[[アクチノマイシン]]で処理したり<ref><pubmed>29024657</pubmed></ref>、ヒマラヤ氷河から得られた細菌Bacillus licheniformisから得られた低温プロテアーゼを用いる方法も報告されている<ref><pubmed>28851704</pubmed></ref>。また、細胞解離後に、メタノールで固定しscRNA-seqに使用したり<ref><pubmed>28526029</pubmed></ref>、クロスリンカーを用いる方法もある<ref><pubmed>29391536</pubmed></ref>。
血液細胞のように浮遊した細胞ではない場合、物理的あるいは酵素処理などによって解離することで、生組織から状態の良いバラバラになった細胞を調製する必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている。ここで、しばしば問題となるのが、酵素処理による短時間加温や機械的刺激で、発現量が変化する遺伝子が存在することである<ref><pubmed>27090946</pubmed></ref>。特に、脳の[[ミクログリア]]の解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった<ref><pubmed>30471926</pubmed></ref>。また、このような現象を抑制するために、酵素処理時に転写阻害剤である[[アクチノマイシン]]で処理したり<ref><pubmed>29024657</pubmed></ref>、ヒマラヤ氷河から得られた細菌Bacillus licheniformisから得られた低温プロテアーゼを用いる方法も報告されている<ref><pubmed>28851704</pubmed></ref>。また、細胞解離後に、メタノールで固定しscRNAseqに使用したり<ref><pubmed>28526029</pubmed></ref>、クロスリンカーを用いる方法もある<ref><pubmed>29391536</pubmed></ref>。


単離した細胞は、そのまま10x GenomicsのChromiumのプラットフォームに導入することができるが、抗体や蛍光タンパク質レポーターなどを用いたFACS、[[パニング]]、MACS(磁気ビーズカラム)などによる特定のマーカーを細胞表面などに発現する細胞の選択的濃縮や除去を行う場合もある。更に、抗体に抗体表示バーコードDNAをカップリングさせるCITE-seq(Cellular Indexing of Transcriptomes and Epitopes by Sequencing) については、下記のマルチモーダルなオミクスの項目で述べる。
単離した細胞は、そのまま10x GenomicsのChromiumのプラットフォームに導入することができるが、抗体や蛍光タンパク質レポーターなどを用いたFACS、[[パニング]]、MACS(磁気ビーズカラム)などによる特定のマーカーを細胞表面などに発現する細胞の選択的濃縮や除去を行う場合もある。更に、抗体に抗体表示バーコードDNAをカップリングさせるCITE-seq(Cellular Indexing of Transcriptomes and Epitopes by Sequencing) については、下記のマルチモーダルなオミクスの項目で述べる。


なお、ヒト組織や希少生物などから生細胞を得ることは困難なことが多い。この場合、scRNA-seqの変法として、凍結した組織から、各細胞由来の核を調製し、核内のmRNAを分析するsnRNA-seq (single-nucleus RNA-seq)が利用されている。ただ、snRNA-seqでは、FACSなどによる特定細胞集団の分離が困難であることが多く、細胞質を持つ生細胞を利用した場合より検出できる遺伝子数が少なく同等な結果が必ずしも得られない<ref><pubmed>24248345</pubmed></ref><ref><pubmed>26890679</pubmed></ref>  <ref><pubmed>27471252</pubmed></ref><ref><pubmed>28846088</pubmed></ref><<ref><pubmed>29220646</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>30586455</pubmed></ref><ref><pubmed>28729663</pubmed></ref><ref><pubmed>31728515</pubmed></ref><ref><pubmed>32341560</pubmed></ref> <ref><pubmed>32518403</pubmed></ref>。一方で、snRNA-seqでは、組織をそのまま凍結することから開始するので、上述したscRNA-seqの問題である酵素処理などを避けることができる。更に、核を用いることで、大きな細胞体はマイクロ流体力学の流路で詰まりやすいなど、細胞の形状に伴うバイアスを減らすことができるといったメリットもある。こうしたプロトコールの一部は、protocols.ioのHuman Cell Atlasのグループ[https://www.protocols.io/groups/hca]で公開されている。
なお、ヒト組織や希少生物などから生細胞を得ることは困難なことが多い。この場合、scRNAseqの変法として、凍結した組織から、各細胞由来の核を調製し、核内のmRNAを分析するsnRNAseq (single-nucleus RNA-seq)が利用されている。ただ、snRNAseqでは、FACSなどによる特定細胞集団の分離が困難であることが多く、細胞質を持つ生細胞を利用した場合より検出できる遺伝子数が少なく同等な結果が必ずしも得られない<ref><pubmed>24248345</pubmed></ref><ref><pubmed>26890679</pubmed></ref>  <ref><pubmed>27471252</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>29220646</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>30586455</pubmed></ref><ref><pubmed>28729663</pubmed></ref><ref><pubmed>31728515</pubmed></ref><ref><pubmed>32341560</pubmed></ref> <ref><pubmed>32518403</pubmed></ref>。一方で、snRNA-seqでは、組織をそのまま凍結することから開始するので、上述したscRNAseqの問題である酵素処理などを避けることができる。更に、核を用いることで、大きな細胞体はマイクロ流体力学の流路で詰まりやすいなど、細胞の形状に伴うバイアスを減らすことができるといったメリットもある。こうしたプロトコールの一部は、protocols.ioのHuman Cell Atlasのグループ[https://www.protocols.io/groups/hca]で公開されている。
通常のscRNA-seqは、ポリアデニル化されたmRNAを検出しているが、MATQ-seq(multiple annealing and dC-tailing-based quantitative single-cell RNA-seq)を用いると、ポリアデニル化されていないRNAの検出も可能である<ref><pubmed> 28092691</pubmed></ref>。更に、RNAを分析するscRNA-seqではないが、遺伝子発現との関係が想定される[[オープンクロマチン]]領域を[[トランスポゾン]]を用いることで個々の細胞レベルで選択的に検出するsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin)やsnATAC-seq <ref><pubmed>26083756</pubmed></ref>, <ref><pubmed>29434377</pubmed></ref><ref><pubmed>25953818</pubmed></ref>, single cell THS-seq (transposome hypersensitive-site) <ref><pubmed>29227469</pubmed></ref>、や[[DNAメチル化]]領域を観察するsnmC-seqのような方法も利用されている<ref><pubmed>28798132</pubmed></ref><ref><pubmed>30237449</pubmed></ref>。
通常のscRNAseqは、ポリアデニル化されたmRNAを検出しているが、MATQ-seq(multiple annealing and dC-tailing-based quantitative single-cell RNA-seq)を用いると、ポリアデニル化されていないRNAの検出も可能である<ref><pubmed> 28092691</pubmed></ref>。更に、RNAを分析するscRNAseqではないが、遺伝子発現との関係が想定される[[オープンクロマチン]]領域を[[トランスポゾン]]を用いることで個々の細胞レベルで選択的に検出するsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin)やsnATAC-seq <ref><pubmed>26083756</pubmed></ref>, <ref><pubmed>29434377</pubmed></ref><ref><pubmed>25953818</pubmed></ref>, single cell THS-seq (transposome hypersensitive-site) <ref><pubmed>29227469</pubmed></ref>、や[[DNAメチル化]]領域を観察するsnmC-seqのような方法も利用されている<ref><pubmed>28798132</pubmed></ref><ref><pubmed>30237449</pubmed></ref>。




===scRNA-seqデータの前処理===
===scRNAseqデータの前処理===
10x Genomics社のChromium、Illumina社のNGSを利用した場合、Cell Rangerのmkrefコマンド(Linux上で作動, https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/tutorial_mr)を用いて、各生物種ごとのレファレンス配列リスト([https://www.ncbi.nlm.nih.gov/grc])を用いて、EggNOG ([http://eggnogdb.embl.de])などを参考にしながら、細胞とトランスクリプトームの対応マトリックスを作製する。マウスやヒトでは既製のものを利用できる。その後のデータの処理についても、10x Genomics社がソフトウェアLoupeを提供している。しかしながら、その後のダウンストリーム解析を考慮して、[[R言語]], [[Python]], MATLABなどのデータ解析のための汎用プログラミング言語やコードで扱えるオブジェクトに変換するのが通常である。ここでは、scRNA-seqデータ解析のために最もよく利用されているR言語を用いたパッケージ「Seurat」<ref><pubmed> 29608179 </pubmed></ref> <ref><pubmed> 31178118 </pubmed></ref>を中心に紹介したい。また、その一部はUniversity of WashingtonのCole Trapnell研究室で開発されてきたMonocle3でも可能である([https://cole-trapnell-lab.github.io/monocle3/])。Pythonを利用したものでは、ドイツ・ミュンヘンInstitute of Computational Biologyの Fabian Theisらが開発しているScanpyが有名である<ref><pubmed> 29409532</pubmed></ref>。
10x Genomics社のChromium、Illumina社のNGSを利用した場合、Cell Rangerのmkrefコマンド(Linux上で作動, [https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/tutorial_mr])により、各生物種ごとのレファレンス配列リスト([https://www.ncbi.nlm.nih.gov/grc])、EggNOG ([http://eggnogdb.embl.de])などを参考にしながら、細胞とトランスクリプトームの対応マトリックスを作製する。マウスやヒトでは既製のものを利用できる。その後のデータの処理についても、10x Genomics社がソフトウェアLoupeを提供している。しかしながら、その後のダウンストリーム解析を考慮して、[[R]], [[Python]], MATLABなどのデータ解析のための汎用プログラミング言語やコードで扱えるオブジェクトに変換するのが通常である。ここでは、scRNAseqデータ解析のために最もよく利用されているRを用いたパッケージ「Seurat」<ref><pubmed> 29608179 </pubmed></ref> <ref><pubmed> 31178118 </pubmed></ref>を中心に紹介したい。また、その一部はUniversity of WashingtonのCole Trapnell研究室で開発されてきたmonocle3でも可能である([https://cole-trapnell-lab.github.io/monocle3/])。Pythonを利用したものでは、ドイツ・ミュンヘンInstitute of Computational Biologyの Fabian Theisらが開発しているScanpyが有名である<ref><pubmed> 29409532</pubmed></ref>。


New York UniversityのRahul Satija研究室が開発しているSeurat(画家スーラに由来)は、scRNA-seqデータ解析のために広く利用されているRパッケージであり、2020年秋現在、Seurat4のβバージョンが公開されている。論文の正式発表前から、サポート情報提供やコード修正なども頻繁に行っており、Satija研究室のウェッブサイト( [http://satijalab.org/Seurat])、Github([https://github.com/satijalab/Seurat])、更にTwitterアカウント(@satijalab)などで最新情報を得ることできる。
New York UniversityのRahul Satija研究室が開発しているSeurat(画家スーラに由来)は、scRNAseqデータ解析のために広く利用されているRパッケージであり、2020年秋現在、Seurat4のβバージョンが公開されている。論文の正式発表前から、サポート情報提供やコード修正なども頻繁に行っており、Satija研究室のウェッブサイト( [http://satijalab.org/Seurat])、Github([https://github.com/satijalab/Seurat])、更にTwitterアカウント(@satijalab)などで最新情報を得ることできる。


最初に行うのは、scRNA-seqデータの品質管理である。ここでは、質の低い細胞のデータ(壊れた細胞では、転写産物の種類が少なくミトコンドリア由来の転写産物が多い)を取り除く。また、複数の試料を組み合わせる場合には、バッチごとの違いについて検討する<ref><pubmed>29608177</pubmed></ref><ref><pubmed> 28045081
最初に行うのは、scRNAseqデータの品質管理である。ここでは、質の低い細胞のデータ(壊れた細胞では、転写産物の種類が少なくミトコンドリア由来の転写産物が多い)を取り除く。また、複数の試料を組み合わせる場合には、バッチごとの違いについて検討する<ref><pubmed>29608177</pubmed></ref><ref><pubmed> 28045081
</pubmed></ref>。現実には、実験ごとのバッチの違いによる影響(Batch effect)がscRNA-seqの最大の問題であると示されてきており、実験デザインを工夫する必要がある<ref><pubmed>29121214</pubmed></ref>。また、Dropletを使用するscRNA-seqでしばしば問題になるのが、Dropletに2つ以上の細胞が封じ込められ、それらが同一の細胞バーコードを持ってしまうアーティファクトである。通常「Doublet」「Multilet」と呼ばれるこの問題はダウンストリーム解析を混乱させるので、細胞単離の段階から注意する必要があるが、scRNA-seqデータ取得後にもデータ処理で検討することは可能である<ref><pubmed>30954476</pubmed></ref><ref><pubmed>30954475</pubmed></ref> <ref><pubmed>31693907</pubmed></ref><ref><pubmed>32592658</pubmed></ref> <ref><pubmed>29227470</pubmed></ref><ref><pubmed>31836005</pubmed></ref><ref><pubmed>31856883</pubmed></ref><ref><pubmed>30567574</pubmed></ref> <ref><pubmed>31266958</pubmed></ref>    [https://doi.org/10.1101/2019.12.17.879304][https://doi.org/10.1101/699637]。なお、この手法を利用することで、バッチ効果を抑えるために、異なるバーコードを持つ複数の試料を混ぜて一つの試料として扱い、計算機的に再び分離、解析するdemultiplexingが注目されている<ref><pubmed>32483174</pubmed></ref>。scRNA-seqデータのもうひとつのノイズは、ある遺伝子の発現が低いために、本来同じタイプの細胞であっても、その遺伝子の発現が全く見られない「Dropout」と呼ばれる現象であり解析に影響を与えるので、これについても検討が必要である<ref><pubmed> 24056876
</pubmed></ref>。現実には、実験ごとのバッチの違いによる影響(Batch effect)がscRNAseqの最大の問題であると示されてきており、実験デザインを工夫する必要がある<ref><pubmed>29121214</pubmed></ref>
 
また、Dropletを使用するscRNAseqでしばしば問題になるのが、Dropletに2つ以上の細胞が封じ込められ、それらが同一のCell barcodeを持ってしまうアーティファクトである。通常「Doublet」「Multilet」と呼ばれるこの問題はダウンストリーム解析を混乱させるので、細胞単離の段階から注意する必要があるが、scRNAseqデータ取得後にもデータ処理で検討することは可能である<ref><pubmed>30954476</pubmed></ref><ref><pubmed>30954475</pubmed></ref> <ref><pubmed>31693907</pubmed></ref><ref><pubmed>32592658</pubmed></ref> <ref><pubmed>29227470</pubmed></ref><ref><pubmed>31836005</pubmed></ref><ref><pubmed>31856883</pubmed></ref><ref><pubmed>30567574</pubmed></ref> <ref><pubmed>31266958</pubmed></ref>    [https://doi.org/10.1101/2019.12.17.879304][https://doi.org/10.1101/699637]。なお、この手法を利用することで、バッチ効果を抑えるために、異なるバーコードを持つ複数の試料を混ぜて一つの試料として扱い、計算機的に再び分離、解析するdemultiplexingが注目されている<ref><pubmed>32483174</pubmed></ref>
 
scRNAseqデータのもうひとつのノイズは、ある遺伝子の発現が低いために、本来同じタイプの細胞であっても、その遺伝子の発現が全く見られない「Dropout」と呼ばれる現象であり解析に影響を与えるので、これについても検討が必要である<ref><pubmed> 24056876
</pubmed></ref><ref><pubmed>32127540</pubmed></ref>。
</pubmed></ref><ref><pubmed>32127540</pubmed></ref>。


このようなノーマライゼーションの過程を経て<ref><pubmed>28504683</ref></pubmed>、scRNA-seqのデータ解析において、最初に行うのが、[[次元圧縮]] (dimensionality reduction)である<ref><pubmed>30617341</pubmed></ref><ref><pubmed>31780648</pubmed></ref>。PCA (Principal component analysis, 主成分分析)、UMAP(Uniform Manifold Approximation and Projection, 均一マニフォールド近似と投影)、Diffusion maps<ref><pubmed> 26002886
このようなノーマライゼーションの過程を経て<ref><pubmed>28504683</pubmed></ref>、scRNAseqのデータ解析において、最初に行うのが、[[次元圧縮]] (dimensionality reduction)である<ref><pubmed>30617341</pubmed></ref><ref><pubmed>31780648</pubmed></ref>。PCA (Principal component analysis, 主成分分析)、UMAP(Uniform Manifold Approximation and Projection, 均一マニフォールド近似と投影)、Diffusion maps<ref><pubmed> 26002886
</pubmed></ref>,  tSNE(t-distributed Stochastic Neighbor Embedding , t分布型確率的近傍埋込み)などの手法が用いられる。 特に、tSNE[http://www.jmlr.org/papers/v9/vandermaaten08a.html]とUMAP[https://arxiv.org/abs/1802.03426]は、高次元データを低次元の点の集合として可視化することで、それぞれの細胞の持つトランスクリプトームの類似度についての直観的な表示が可能でありしばしば用いられる(図3)。tSNEよりUMAPの方が迅速に類似集団間の関係が明確になるので、最近はUMAPを利用することが多くなってきている。次に、[[Louvainアルゴリズム]]などでクラスタリング(コミュニティ分割)を行いグラフ上に表示できる(図3の色分け)。こうして、違ったタイプの細胞の集合が別のクラスターとして表示される。
</pubmed></ref>,  tSNE(t-distributed Stochastic Neighbor Embedding , t分布型確率的近傍埋込み)などの手法が用いられる。 特に、tSNE[http://www.jmlr.org/papers/v9/vandermaaten08a.html]とUMAP[https://arxiv.org/abs/1802.03426]は、高次元データを低次元の点の集合として可視化することで、それぞれの細胞の持つトランスクリプトームの類似度についての直観的な表示が可能でありしばしば用いられる(図3)。tSNEよりUMAPの方が迅速に類似集団間の関係が明確になるので、最近はUMAPを利用することが多くなってきている。次に、[[Louvainアルゴリズム]]などでクラスタリング(コミュニティ分割)を行いグラフ上に表示できる(図3の色分け)。こうして、違ったタイプの細胞の集合が別のクラスターとして表示される。
  [[ファイル:scFig3.jpg|サムネイル|250px|'''図3.tSNEとUMAPによる同じデータの可視化'''<br>ニワトリ網膜の視細胞のデータを用いて作製[https://doi.org/10.1101/2020.10.09.333633
  [[ファイル:scFig3.jpg|サムネイル|250px|'''図3.tSNEとUMAPによる同じデータの可視化'''<br>ニワトリ網膜の視細胞のデータを用いて作製[https://doi.org/10.1101/2020.10.09.333633
64行目: 70行目:
==ダウンストリーム解析==
==ダウンストリーム解析==
===細胞クラスターの解釈とマーカー遺伝子候補の発見===
===細胞クラスターの解釈とマーカー遺伝子候補の発見===
scRNA-seqデータから得られる生物学的知見には、内在的に存在する細胞の種類、外部刺激や環境で変化した細胞の状態、そして種類や変化により特徴的に発現するマーカー遺伝子候補の発見がある<ref><pubmed>27824854</pubmed></ref><ref><pubmed>32033589</pubmed></ref>
scRNAseqデータから得られる生物学的知見には、内在的に存在する細胞の種類、外部刺激や環境で変化した細胞の状態、そして種類や変化により特徴的に発現するマーカー遺伝子候補の発見がある<ref><pubmed>27824854</pubmed></ref><ref><pubmed>32033589</pubmed></ref>
。クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスターに特徴的に発現している遺伝子を具体的に探索し、細胞集団の持つバイオマーカーによって、そのクラスターの同定が可能になる。例えば、既に神経細胞とグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、神経細胞のタイプを区別できるマーカーや、外部刺激によって遺伝子発現が変化した神経細胞の状態は、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子(差次的発現遺伝子)を見つけるためには(Differential expression analysis, DE analysis)、SeuratのFindMarkersコマンド中でも利用可能である専用コード(MAST <ref><pubmed>26653891</pubmed></ref>、DESeq2 <ref><pubmed>25516281</pubmed></ref>など)を用いることができる。scRNA-seqの解析に必要なコードは、scRNA-tools [https://www.scrna-tools.org], Awesome single cell [https://github.com/seandavi/awesome-single-cell], Bioconductor[https://www.bioconductor.org]などで紹介されており、ほとんどがダウンロード可能である。また、最新の情報については、bioRxivなどのプレプリントサーバで公開されていることが多く、scRNA-seqのデータ(下記参考)とともに、オープンサイエンス実践の好例となっている。細胞ごとの差次的発現遺伝子の可視化には、ドットプロット(dot plot)、ヴァイオリンプロット(violin plot)、リッジプロット(Ridge plot, joy plot)、UMAPなどの次元圧縮図に重ねるFeatureプロット(feature plot)などが頻繁に用いられる(図4)。
。クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスターに特徴的に発現している遺伝子を具体的に探索し、細胞集団の持つバイオマーカーによって、そのクラスターの同定が可能になる。例えば、既に神経細胞とグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、神経細胞のタイプを区別できるマーカーや、外部刺激によって遺伝子発現が変化した神経細胞の状態は、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子(差次的発現遺伝子)を見つけるためには(Differential expression analysis, DE analysis)、SeuratのFindMarkersコマンド中でも利用可能である専用コード(MAST <ref><pubmed>26653891</pubmed></ref>、DESeq2 <ref><pubmed>25516281</pubmed></ref>など)を用いることができる。scRNAseqの解析に必要なコードは、scRNA-tools [https://www.scrna-tools.org], Awesome single cell [https://github.com/seandavi/awesome-single-cell], Bioconductor[https://www.bioconductor.org]などで紹介されており、ほとんどがダウンロード可能である。また、最新の情報については、bioRxivなどのプレプリントサーバで公開されていることが多く、scRNAseqのデータ(下記参考)とともに、オープンサイエンス実践の好例となっている。細胞ごとの差次的発現遺伝子の可視化には、ドットプロット(dot plot)、ヴァイオリンプロット(violin plot)、リッジプロット(Ridge plot, joy plot)、UMAPなどの次元圧縮図に重ねるFeatureプロット(feature plot)などが、目的に応じて頻繁に用いられる(図4)。
[[ファイル:scFig4.jpg|サムネイル|250px|'''図4.scRNA-seqデータの可視化の例 '''<br>A. ドットプロット。B.ヴァイオリンプロット。C. リッジプロット。D. UMAPと重ねたFeatureプロット。ニワトリ網膜の視細胞のデータを用いて作製[https://doi.org/10.1101/2020.10.09.333633
[[ファイル:scFig4.jpg|サムネイル|300px|'''図4.scRNAseqデータの可視化の例 '''<br>A. ドットプロット。B.ヴァイオリンプロット。C. リッジプロット。D. UMAPと重ねたFeatureプロット。ニワトリ網膜の視細胞のデータを用いて作製[https://doi.org/10.1101/2020.10.09.333633
]。]]
]。]]


===偽時系列解析、遺伝子制御ネットワーク、パスウェイ解析===
===偽時系列解析、遺伝子制御ネットワーク、パスウェイ解析===
実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、[[細胞周期]]、[[概日リズム]]、発現変動が大きい破裂型プロモーターの作動などの理由で 変動が見られるものもある<ref><pubmed> 31217225 </pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上の細胞系譜や細胞分化といった細胞の遷移状態の解析([[軌道推定]](Trajectory inference);[[偽時系列解析]]Pseudo-time analysis )には、scRNA-seqデータを用いることが効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref>。しばしば用いられるmonocle3 <ref><pubmed>30787437</pubmed></ref>[https://cole-trapnell-lab.github.io/monocle3/]など、多くのコードを収集、比較しているサイトがある [https://dynverse.org][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといった転写産物のスプライシングの状態から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref>。しかし、これらの方法は、あくまで発生途上の[[細胞系譜]]や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNA-seqを行うことで、細胞タイプの系統関係を調べる方法として、CRISPR-Cas9を用いた[[ゲノム編集]]による記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>、あるいはアデノシンデアミナーゼでRNA編集を行いタイムスタンプを入れる方法<ref><pubmed>33077959</pubmed></ref>がある。
実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、[[細胞周期]]、[[概日リズム]]、発現変動が大きい破裂型プロモーターの作動などの理由で 変動が見られるものもある<ref><pubmed> 31217225 </pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上の細胞系譜や細胞分化といった細胞の遷移状態の解析([[軌道推定]](Trajectory inference);[[偽時系列解析]]Pseudo-time analysis )には、scRNAseqデータを用いることが効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref>。しばしば用いられるmonocle3 <ref><pubmed>30787437</pubmed></ref>[https://cole-trapnell-lab.github.io/monocle3/]など、多くのコードを収集、比較しているサイトがある [https://dynverse.org][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといった転写産物のスプライシングの状態から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref>。しかし、これらの方法は、あくまで発生途上の[[細胞系譜]]や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNAseqを行うことで、細胞タイプの系統関係を調べる方法として、CRISPR-Cas9を用いた[[ゲノム編集]]による記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>、あるいはアデノシンデアミナーゼでRNA編集を行いタイムスタンプを入れる方法<ref><pubmed>33077959</pubmed></ref>がある。


また細胞分化や変動に伴う特徴的な遺伝子発現をscRNA-seqで観察することは、遺伝子制御ネットワーク(例、SCENIC<ref><pubmed>28991892</pubmed></ref>, [https://github.com/aertslab/SCENIC])や[[代謝経路]]や[[シグナル伝達系]]のための[[パスウェイ解析]](例、Metascape<ref><pubmed>30944313</pubmed></ref>, [http://metascape.org])を理解するシステム生物学的な研究として有用である。更に、scRNA-seqで得られた結果をもとに、細胞間相互作用の理解を深めるのを目的とするCellPhoneDB<ref><pubmed>32103204</pubmed></ref>[https://github.com/Teichlab/cellphonedb]、NicheNet<ref><pubmed>3181926</pubmed></ref>, SVCA<ref><pubmed>31577949</pubmed></ref>などがある。特に、Perturb-seq<ref><pubmed>27984732</pubmed></ref> やその変法<ref><pubmed> 32231336</pubmed></ref>は、CRISPRライブラリーによるゲノム編集を施した細胞をscRNA-seqで解析することで、ゲノム編集で破壊された遺伝子の機能や遺伝子間の相互作用の理解を可能にしている後述するマルチモーダルなscRNA-seqの1つであり、注目されている。
また細胞分化や変動に伴う特徴的な遺伝子発現をscRNAseqで観察することは、遺伝子制御ネットワーク(例、SCENIC<ref><pubmed>28991892</pubmed></ref>, [https://github.com/aertslab/SCENIC])や[[代謝経路]]や[[シグナル伝達系]]のための[[パスウェイ解析]](例、Metascape<ref><pubmed>30944313</pubmed></ref>, [http://metascape.org])を理解するシステム生物学的な研究として有用である。更に、scRNAseqで得られた結果をもとに、細胞間相互作用の理解を深めるのを目的とするCellPhoneDB<ref><pubmed>32103204</pubmed></ref>[https://github.com/Teichlab/cellphonedb]、NicheNet<ref><pubmed>3181926</pubmed></ref>, SVCA<ref><pubmed>31577949</pubmed></ref>などがある。特に、Perturb-seq<ref><pubmed>27984732</pubmed></ref> やその変法<ref><pubmed> 32231336</pubmed></ref>は、CRISPRライブラリーによるゲノム編集を施した細胞をscRNAseqで解析することで、ゲノム編集で破壊された遺伝子の機能や遺伝子間の相互作用の理解を可能にしている後述するマルチモーダルなscRNAseqの1つであり、注目されている。


==scRNA-seqの神経科学研究への適用==
==scRNAseqの神経科学研究への適用==
===神経系細胞ビッグデータとしてのscRNA-seq===
===神経系細胞ビッグデータとしてのscRNAseq===
様々な神経・精神疾患について理解しその診断や治療に役立てるためには、神経細胞、[[グリア細胞]]を中心にした神経系にある細胞の種類や状態を識別し、それぞれの細胞における分子的な変化を観察することが重要である <ref><pubmed>28775344</pubmed></ref><ref><pubmed>29738987</pubmed></ref>。本本項目で解説してきたscRNA-seqの技術は、神経系に見られるそれぞれの細胞のトランスクリプトームについて[[ビッグデータ]]を提供することで、この細胞の種類や状態の識別に新たな根拠を与えつつある。近年、中枢神経系の[[アストロサイト]]、[[オリゴデンドロサイト]]、ミクログリアといったグリア細胞も均一ではなく、内在的な多様性や外部因子による状態の変動が報告されてきている。神経細胞は、著しく多様であり、この多様性が神経系を特徴づけており、その多彩で複雑な機能の発現に必須である。従来の神経科学では、神経細胞の多様性は、それぞれの神経細胞の解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきている。こうした神経細胞の多様性を便宜的に記述するのに、タイプ(type)、クラス(class)、サブクラス(subclass)、サブタイプ(subtype) というような用語が用いられてきた。しかし、ここでは混乱を防ぐため、Masland(2004)<ref><pubmed>15242626</pubmed></ref>が提唱し、広く受けいれられている「クラス」と「タイプ」という単語を用いることとする。タイプは、これ以上分類することができないとされる階層であり、共通性を持つタイプの集団がクラスである。例えば、大脳皮質の錐体細胞、網膜神経節細胞といった大雑把な区分はクラスである。大脳皮質の錐体細胞というクラスは、層や領野によって異なるタイプ、網膜神経節細胞には視覚情報に対して応答が異なるタイプが存在する。scRNA-seqは、「タイプ」の理解に新たな視点を提供している。
様々な神経・精神疾患について理解しその診断や治療に役立てるためには、神経細胞、[[グリア細胞]]を中心にした神経系にある細胞の種類や状態を識別し、それぞれの細胞における分子的な変化を観察することが重要である <ref><pubmed>28775344</pubmed></ref><ref><pubmed>29738987</pubmed></ref>。本本項目で解説してきたscRNAseq技術は、神経系に見られるそれぞれの細胞のトランスクリプトームについて[[ビッグデータ]]を提供することで、この細胞の種類や状態の識別に新たな根拠を与えつつある。近年、中枢神経系の[[アストロサイト]]、[[オリゴデンドロサイト]]、ミクログリアといったグリア細胞も均一ではなく、内在的な多様性や外部因子による状態の変動が報告されてきている。神経細胞は、著しく多様であり、この多様性が神経系を特徴づけており、その多彩で複雑な機能の発現に必須である。従来の神経科学では、神経細胞の多様性は、それぞれの神経細胞の解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきている。こうした神経細胞の多様性を便宜的に記述するのに、タイプ(type)、クラス(class)、サブクラス(subclass)、サブタイプ(subtype) というような用語が用いられてきた。しかし、ここでは混乱を防ぐため、Masland(2004)<ref><pubmed>15242626</pubmed></ref>が提唱し、広く受けいれられている「クラス」と「タイプ」という単語を用いることとする。タイプは、これ以上分類することができないとされる階層であり、共通性を持つタイプの集団がクラスである。例えば、大脳皮質の錐体細胞、網膜神経節細胞といった大雑把な区分はクラスである。大脳皮質の錐体細胞というクラスは、層や領野によって異なるタイプ、網膜神経節細胞には視覚情報に対して応答が異なるタイプが存在する。scRNAseqは、「タイプ」の理解に新たな視点を提供している。


===神経系へのscRNA-seqの適用===
===神経系へのscRNAseqの適用===
[[大脳皮質]]には、[[錐体細胞]]や[[非錐体細胞]]などの神経細胞や様々なグリア細胞などが見られ、古くから神経細胞タイプの識別が行われてきた。初期のscRNA-seq技術でも、マウス皮質の小規模な細胞数を分類した研究で、これまで知られていた主要な細胞タイプとは違うタイプが見つかりその有効性が示された<ref><pubmed>25700174</pubmed></ref>。その後のDroplet使用の3’エンドリード法を利用した多数の細胞数の解析で、更に多数の神経細胞のタイプが見つかっている<ref><pubmed>32839617</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>30096299</pubmed></ref><ref><pubmed>30096314</pubmed></ref><ref><pubmed>30382198</pubmed></ref><ref><pubmed>29320739</pubmed></ref><ref><pubmed>28846088</pubmed></ref>[https://doi.org/10.1101/2020.03.14.991018][https://doi.org/10.1101/2020.06.04.105700] [https://doi.org/10.1101/2020.07.02.184051]。特に、GABA作動性介在神経細胞タイプの多様性とその発生<ref><pubmed>28942923</pubmed></ref><ref><pubmed>28134272</pubmed></ref><ref><pubmed>29472441</pubmed></ref><ref><pubmed>29513653</pubmed></ref>についての情報は重要であろう。また、初期の発生過程<ref><pubmed>26940868</pubmed></ref><ref><pubmed>30485812</pubmed></ref><pubmed>31073041</pubmed></ref><ref><pubmed>30635555</pubmed></ref><ref><pubmed>30625322</pubmed></ref>、老化<ref><pubmed>31551601</pubmed></ref><の理解が、scRNA-Seq技術を利用することで進んでいる。更に、[[神経活動]]によって変化するトランスクリプトームの変化も細胞ごとに調査され興味深い<ref><pubmed>29230054</pubmed></ref> 。 ヒトを含めた霊長類の大脳についても発達段階を含めてscRNA-seqが適用されてきている<ref><pubmed>26060301</pubmed></ref><ref><pubmed>27339989</pubmed></ref><ref><pubmed>29539641</pubmed></ref><ref><pubmed>29217575</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>29227469</pubmed></ref><ref><pubmed>31303374</pubmed></ref><ref><pubmed>29867213</pubmed></ref><ref><pubmed>31435019</pubmed></ref><ref><pubmed>32424074</pubmed></ref> [https://doi.org/10.1101/709501[https://doi.org/10.1101/2020.03.31.016972][https://doi.org/10.1101/2020.04.23.056390]。ヒトや霊長類に特徴的とされる[[島]]のvon Economo神経細胞(紡錘細胞)のような希少な神経細胞のscRNA-seqにも成功している<ref><pubmed>32127543</pubmed></ref>。
scRNAseqの神経系での利用については、次々と新しい論文やプレプリントが発表されており、ここではscRNAseqで得られてきた情報の典型例を紹介することにとどめる。
 
[[大脳皮質]]には、[[錐体細胞]]や[[非錐体細胞]]などの神経細胞や様々なグリア細胞などが見られ、古くから神経細胞タイプの識別が行われてきた。初期のscRNAseq技術でも、マウス皮質の小規模な細胞数を分類した研究で、これまで知られていた主要な神経細胞タイプとは違うタイプが見つかりその有効性が示された<ref><pubmed>25700174</pubmed></ref>。その後のDroplet使用の3’エンドリード法を利用した多数の細胞数の解析で、更に多数の神経細胞のタイプが見つかっている<ref><pubmed>32839617</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>30096299</pubmed></ref><ref><pubmed>30096314</pubmed></ref><ref><pubmed>30382198</pubmed></ref><ref><pubmed>29320739</pubmed></ref><ref><pubmed>28846088</pubmed></ref>[https://doi.org/10.1101/2020.03.14.991018][https://doi.org/10.1101/2020.06.04.105700] [https://doi.org/10.1101/2020.07.02.184051]。特に、GABA作動性介在神経細胞タイプの多様性とその発生<ref><pubmed>28942923</pubmed></ref><ref><pubmed>28134272</pubmed></ref><ref><pubmed>29472441</pubmed></ref><ref><pubmed>29513653</pubmed></ref>についての情報は重要であろう。また、初期の発生過程<ref><pubmed>26940868</pubmed></ref><ref><pubmed>30485812</pubmed></ref><ref><pubmed>31073041</pubmed></ref><ref><pubmed>30635555</pubmed></ref><ref><pubmed>30625322</pubmed></ref>、老化<ref><pubmed>31551601</pubmed></ref><の理解が、scRNASeq技術を利用することで進んでいる。更に、[[神経活動]]によって変化するトランスクリプトームの変化も細胞ごとに調査され興味深い<ref><pubmed>29230054</pubmed></ref> 。 ヒトを含めた霊長類の大脳についても発達段階を含めてscRNAseqが適用されてきている<ref><pubmed>26060301</pubmed></ref><ref><pubmed>27339989</pubmed></ref><ref><pubmed>29539641</pubmed></ref><ref><pubmed>29217575</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>29227469</pubmed></ref><ref><pubmed>31303374</pubmed></ref><ref><pubmed>29867213</pubmed></ref><ref><pubmed>31435019</pubmed></ref><ref><pubmed>32424074</pubmed></ref> [https://doi.org/10.1101/709501][https://doi.org/10.1101/2020.03.31.016972][https://doi.org/10.1101/2020.04.23.056390]。ヒトや霊長類に特徴的とされる[[島]]のvon Economo神経細胞(紡錘細胞)のような希少な神経細胞のscRNAseqにも成功している<ref><pubmed>32127543</pubmed></ref>。


[[海馬]]<ref><pubmed>29241552</pubmed></ref><ref><pubmed>29912866</pubmed></ref><ref><pubmed>29335606</pubmed></ref><ref><pubmed>31942070</pubmed></ref>では、これまでの研究で記載されてきた神経細胞のタイプの存在が確認され、更に新規のタイプが見つかった。中枢神経系では、その他、[[外側膝状体]]<ref><pubmed>29343640</pubmed></ref>、[[大脳基底核]](足底核)<ref><pubmed>28384468</pubmed></ref> 、[[視床下部]]<ref><pubmed>28166221</pubmed></ref><ref><pubmed>28355573</pubmed></ref>  <ref><pubmed>27991900</pubmed></ref><ref><pubmed>30385464</pubmed></ref>  <ref><pubmed>31249056</pubmed></ref><ref><pubmed>30858605</pubmed></ref>、[[線条体]]<ref><pubmed>27425622</pubmed></ref><ref><pubmed>30134177</pubmed></ref><ref><pubmed>31875543</pubmed></ref>、[[中脳]]<ref><pubmed>27716510</pubmed></ref><ref><pubmed>29499164</pubmed></ref>  <ref><pubmed>30718509</pubmed></ref> 、[[手綱]]<ref><pubmed>29576475</pubmed></ref>、発生中の[[間脳]]<ref><pubmed>30872278</pubmed></ref> 、さらに[[小脳]]<ref><pubmed>30220501</pubmed></ref><ref><pubmed>30735127</pubmed></ref><ref><pubmed>30690467</pubmed></ref>などの結果が得られている。マウスの小脳においては、分子層にこれまでの星状細胞、バスケット細胞というカテゴリーとは違ったギャップジャンクションに特徴を持つ2種類の神経細胞があることが示唆されている[https://doi.org/10.1101/2020.03.04.976407]。
[[海馬]]<ref><pubmed>29241552</pubmed></ref><ref><pubmed>29912866</pubmed></ref><ref><pubmed>29335606</pubmed></ref><ref><pubmed>31942070</pubmed></ref>では、これまでの研究で記載されてきた神経細胞のタイプの存在が確認され、更に新規のタイプが見つかった。中枢神経系では、その他、[[外側膝状体]]<ref><pubmed>29343640</pubmed></ref>、[[大脳基底核]](足底核)<ref><pubmed>28384468</pubmed></ref> 、[[視床下部]]<ref><pubmed>28166221</pubmed></ref><ref><pubmed>28355573</pubmed></ref>  <ref><pubmed>27991900</pubmed></ref><ref><pubmed>30385464</pubmed></ref>  <ref><pubmed>31249056</pubmed></ref><ref><pubmed>30858605</pubmed></ref>、[[線条体]]<ref><pubmed>27425622</pubmed></ref><ref><pubmed>30134177</pubmed></ref><ref><pubmed>31875543</pubmed></ref>、[[中脳]]<ref><pubmed>27716510</pubmed></ref><ref><pubmed>29499164</pubmed></ref>  <ref><pubmed>30718509</pubmed></ref> 、[[手綱]]<ref><pubmed>29576475</pubmed></ref>、発生中の[[間脳]]<ref><pubmed>30872278</pubmed></ref> 、さらに[[小脳]]<ref><pubmed>30220501</pubmed></ref><ref><pubmed>30735127</pubmed></ref><ref><pubmed>30690467</pubmed></ref>などの結果が得られている。マウスの小脳においては、分子層にこれまでの星状細胞、バスケット細胞というカテゴリーとは違ったギャップジャンクションに特徴を持つ2種類の神経細胞があることが示唆されている[https://doi.org/10.1101/2020.03.04.976407]。


脳の外部では、[[運動神経]][ https://doi.org/10.1101/2020.03.16.992958]、[[感覚神経]]<ref><pubmed>25420068</pubmed></ref><ref><pubmed>26691752</pubmed></ref>、[[らせん神経節]]<ref><pubmed>30078709</pubmed></ref><ref><pubmed>30209249</pubmed></ref> 、[[臭覚神経]]<ref><pubmed>26541607</pubmed></ref> <ref><pubmed>32059767</pubmed></ref>、[[腸神経系]] <ref><pubmed>29483303</pubmed></ref>[https://doi.org/10.1101/2020.03.02.955757] 、[[網膜]]<ref><pubmed>27565351</pubmed></ref><ref><pubmed>29909983</pubmed></ref><ref><pubmed>30018341</pubmed></ref><ref><pubmed>31260032</pubmed></ref><ref><pubmed>31128945</pubmed></ref><ref><pubmed>30712875</pubmed></ref><ref><pubmed>30548510</pubmed></ref><ref><pubmed>31075224</pubmed></ref><ref><pubmed>31399471</pubmed></ref><ref><pubmed>31848347</pubmed></ref><ref><pubmed>31673015</pubmed></ref><ref><pubmed>31653841</pubmed></ref><ref><pubmed>31784286</pubmed></ref>[https://doi.org/10.1101/2020.02.26.966093][ https://doi.org/10.1101/779694][https://www.biorxiv.org/content/10.1101/617555][A]でのscRNA-seqデータがある。また[[iPS細胞]]や[[ES細胞]]由来の神経組織[[オルガノイド]]に含まれる神経細胞タイプを知る上でも利用されている<ref><pubmed>28094016</pubmed></ref><ref><pubmed>28279351</pubmed></ref><ref><pubmed>31168097</pubmed></ref><ref><pubmed>31996853</pubmed></ref><ref><pubmed>31968264</pubmed></ref><ref><pubmed><ref><pubmed>32221280</pubmed></ref></pubmed></ref>。
脳の外部では、[[運動神経]][https://doi.org/10.1101/2020.03.16.992958]、[[感覚神経]]<ref><pubmed>25420068</pubmed></ref><ref><pubmed>26691752</pubmed></ref>、[[らせん神経節]]<ref><pubmed>30078709</pubmed></ref><ref><pubmed>30209249</pubmed></ref> 、[[臭覚神経]]<ref><pubmed>26541607</pubmed></ref> <ref><pubmed>32059767</pubmed></ref>、[[腸神経系]] <ref><pubmed>29483303</pubmed></ref>[https://doi.org/10.1101/2020.03.02.955757] 、[[網膜]]<ref><pubmed>27565351</pubmed></ref><ref><pubmed>29909983</pubmed></ref><ref><pubmed>30018341</pubmed></ref><ref><pubmed>31260032</pubmed></ref><ref><pubmed>31128945</pubmed></ref><ref><pubmed>30712875</pubmed></ref><ref><pubmed>30548510</pubmed></ref><ref><pubmed>31075224</pubmed></ref><ref><pubmed>31399471</pubmed></ref><ref><pubmed>31848347</pubmed></ref><ref><pubmed>31673015</pubmed></ref><ref><pubmed>31653841</pubmed></ref><ref><pubmed>31784286</pubmed></ref>[https://doi.org/10.1101/2020.02.26.966093][https://doi.org/10.1101/779694][https://www.biorxiv.org/content/10.1101/617555][A]でのscRNAseqデータがある。また[[iPS細胞]]や[[ES細胞]]由来の神経組織[[オルガノイド]]に含まれる神経細胞タイプを知る上でも利用されている<ref><pubmed>28094016</pubmed></ref><ref><pubmed>28279351</pubmed></ref><ref><pubmed>31168097</pubmed></ref><ref><pubmed>31996853</pubmed></ref><ref><pubmed>31968264</pubmed></ref><ref><pubmed><ref><pubmed>32221280</pubmed></ref></pubmed></ref>。


===神経細胞以外の細胞===
===神経細胞以外の細胞===
[[上衣細胞]]<ref><pubmed>29727663</pubmed></ref>は、[[神経幹細胞]]としての役割が示唆されてきたが、scRNA-seqによる解析ではその可能性が支持されなかった。グリア細胞では、[[ラジアルグリア]]<ref><pubmed>26406371</pubmed></ref><ref><pubmed>25734491</pubmed></ref><ref><pubmed>29281841</pubmed></ref><ref><pubmed>29217575</pubmed></ref><ref><pubmed>29539641</pubmed></ref>[A]、アストロサイト<ref><pubmed>32139688</pubmed></ref><ref><pubmed>32203496</pubmed></ref>[ https://doi.org/10.1101/2020.04.27.064881]に多様性があることが示唆されてきている。また、オリゴデンドロサイト<ref><pubmed>27284195</pubmed></ref><ref><pubmed>30078729</pubmed></ref><ref><pubmed>30257220</pubmed></ref><ref><pubmed>30747918</pubmed></ref><ref><pubmed>31958186</pubmed></ref>[https://doi.org/10.1101/2020.03.06.981373] [A]については、これまで細胞生物学的に研究されてきた分化の過程がscRNA-seqにより検出されている。ミクログリアは、神経系の発達、老化、損傷などに伴うトランスクリプトームの変化がscRNA-seqにより詳細に明らかになった<ref><pubmed>27338705</pubmed></ref><ref><pubmed>29020624</pubmed></ref><ref><pubmed>30206190</pubmed></ref><ref><pubmed>30471926</pubmed></ref><ref><pubmed>31209379</pubmed></ref>
[[上衣細胞]]<ref><pubmed>29727663</pubmed></ref>は、[[神経幹細胞]]としての役割が示唆されてきたが、scRNAseqによる解析ではその可能性が支持されなかった。グリア細胞では、[[ラジアルグリア]]<ref><pubmed>26406371</pubmed></ref><ref><pubmed>25734491</pubmed></ref><ref><pubmed>29281841</pubmed></ref><ref><pubmed>29217575</pubmed></ref><ref><pubmed>29539641</pubmed></ref>[A]、アストロサイト<ref><pubmed>32139688</pubmed></ref><ref><pubmed>32203496</pubmed></ref>[https://doi.org/10.1101/2020.04.27.064881]に多様性があることが示唆されてきている。また、オリゴデンドロサイト<ref><pubmed>27284195</pubmed></ref><ref><pubmed>30078729</pubmed></ref><ref><pubmed>30257220</pubmed></ref><ref><pubmed>30747918</pubmed></ref><ref><pubmed>31958186</pubmed></ref>[https://doi.org/10.1101/2020.03.06.981373]については、これまで細胞生物学的に研究されてきた分化の過程がscRNAseqにより詳細に確認されている。ミクログリアは、神経系の発達、老化、損傷などに伴う重要なトランスクリプトームの変化がscRNAseqにより詳細に明らかになった<ref><pubmed>27338705</pubmed></ref><ref><pubmed>29020624</pubmed></ref><ref><pubmed>30206190</pubmed></ref><ref><pubmed>30471926</pubmed></ref><ref><pubmed>31209379</pubmed></ref>
<ref><pubmed>31835035</pubmed></ref>。また、[[CNS境界関連マクロファージ]](BAM) <ref><pubmed>31061494</pubmed></ref>や[[脳血管系]]<ref><pubmed>29443965</pubmed></ref>のscRNA-seqも実施されている。
<ref><pubmed>31835035</pubmed></ref>。また、[[CNS境界関連マクロファージ]](BAM) <ref><pubmed>31061494</pubmed></ref>や[[脳血管系]]<ref><pubmed>29443965</pubmed></ref>のscRNAseqも実施されている。


===疾患===
===疾患===
scRNA-seqは、疾患の理解にも有用である。筋萎縮性側索硬化症<ref><pubmed>30948552</pubmed></ref>、多発性硬化症<ref><pubmed>30747918</pubmed></ref><ref><pubmed>30420755</pubmed></ref><ref><pubmed>32313246</pubmed></ref>   
scRNAseqは、疾患の理解にも有用である。scRNAseqでは、疾患に伴う遺伝子発現の変化を細胞タイプごとに観察することができるので、bulk RNAseqでは埋もれていた遺伝子発現の変化や細胞ごとの変化を検出できるという長所がある。
例えば、筋萎縮性側索硬化症<ref><pubmed>30948552</pubmed></ref>、多発性硬化症<ref><pubmed>30747918</pubmed></ref><ref><pubmed>30420755</pubmed></ref><ref><pubmed>32313246</pubmed></ref>   
、アルツハイマー病やそのモデル動物<ref><pubmed>31042697</pubmed></ref><ref><pubmed>31399126</pubmed></ref><ref><pubmed>29020624</pubmed></ref>
、アルツハイマー病やそのモデル動物<ref><pubmed>31042697</pubmed></ref><ref><pubmed>31399126</pubmed></ref><ref><pubmed>29020624</pubmed></ref>
[https://doi.org/10.1101/628347]<ref><pubmed>28602351</pubmed></ref><ref><pubmed>32341542</pubmed></ref>、統合失調症<ref><pubmed>29785013</pubmed></ref><ref><pubmed>32203495</pubmed></ref>、自閉症やレット症候群<ref><pubmed>31097668</pubmed></ref><ref><pubmed>30455458</pubmed></ref>、シャルコー・マリー・トゥース病<ref><pubmed>29888333</pubmed></ref>、ダウン症[https://www.biorxiv.org/content/10.1101/2020.01.01.892398v1]、パーキンソン病<ref><pubmed>30503143</pubmed></ref> <ref><pubmed>32826893</pubmed></ref>、がん<ref><pubmed>31327527</pubmed></ref><ref><pubmed>28360267</pubmed></ref>などに適用されている。
[https://doi.org/10.1101/628347]<ref><pubmed>28602351</pubmed></ref><ref><pubmed>32341542</pubmed></ref>、統合失調症<ref><pubmed>29785013</pubmed></ref><ref><pubmed>32203495</pubmed></ref>、自閉症やレット症候群<ref><pubmed>31097668</pubmed></ref><ref><pubmed>30455458</pubmed></ref>、シャルコー・マリー・トゥース病<ref><pubmed>29888333</pubmed></ref>、ダウン症[https://www.biorxiv.org/content/10.1101/2020.01.01.892398v1]、パーキンソン病<ref><pubmed>30503143</pubmed></ref> <ref><pubmed>32826893</pubmed></ref>、がん<ref><pubmed>31327527</pubmed></ref><ref><pubmed>28360267</pubmed></ref>などに適用されている。


 
==scRNAseqの展望==
==scRNA-seqの展望==
===神経系の多様性と進化===
===神経系の多様性と進化===
NGSを用いることで、どんな生物種にも適用可能なscRNA-seqは、既に多様な生物の神経系の細胞の理解、更には種間の相同性や差異の研究に利用されており、神経系の進化を細胞レベルで考察するのに有用であろう(例、センチュウ<ref><pubmed> 28818938 </pubmed></ref>、ショウジョウバエ  <ref><pubmed>29909982</pubmed></ref><ref><pubmed>29149607</pubmed></ref><ref><pubmed>30703584</pubmed></ref><ref><pubmed>29909983</pubmed></ref>、カタユウレイボヤCiona intestinalis <ref><pubmed>30069052</pubmed></ref><ref><pubmed>30228204</pubmed></ref>、ゼブラフィッシュ<ref><pubmed>31018142</pubmed></ref><ref><pubmed>30929901</pubmed></ref>、アカミミガメTrachemys scripta elegans、トカゲPogona vitticeps, pv<ref><pubmed>29724907</pubmed></ref>、ニワトリ[https://doi.org/10.1101/2020.10.09.333633]、霊長類<ref><pubmed>30730291</pubmed></ref><ref><pubmed>31619793</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972])。ただ、遺伝子やトランスクリプトームの研究が進んでいる生物種では比較的容易であるが、遺伝子のアノテーションが十分でない生物種を用いる場合、scRNA-seqのデータ解析は困難を伴う。また種を超えた細胞タイプの相同性の理解には様々な工夫が必要である<ref><pubmed>31552245</pubmed></ref><ref><pubmed>30712875</pubmed></ref>>[https://doi.org/10.1101/2020.03.31.016972]。
NGSを用いることで、どんな生物種にも適用可能なscRNAseqは、既に多様な生物の神経系の細胞の理解、更には種間の相同性や差異の研究に利用されており、神経系の進化を細胞レベルで考察するのに有用であろう(例、センチュウ<ref><pubmed> 28818938 </pubmed></ref>、ショウジョウバエ  <ref><pubmed>29909982</pubmed></ref><ref><pubmed>29149607</pubmed></ref><ref><pubmed>30703584</pubmed></ref><ref><pubmed>29909983</pubmed></ref><ref><pubmed>33125872</pubmed></ref>、カタユウレイボヤCiona intestinalis <ref><pubmed>30069052</pubmed></ref><ref><pubmed>30228204</pubmed></ref>、ゼブラフィッシュ<ref><pubmed>31018142</pubmed></ref><ref><pubmed>30929901</pubmed></ref>、アカミミガメTrachemys scripta elegans、トカゲPogona vitticeps, pv<ref><pubmed>29724907</pubmed></ref>、ニワトリ[https://doi.org/10.1101/2020.10.09.333633]、霊長類<ref><pubmed>30730291</pubmed></ref><ref><pubmed>31619793</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972])。ただ、遺伝子やトランスクリプトームの研究が進んでいる生物種では比較的容易であるが、遺伝子のアノテーションが十分でない生物種を用いる場合、scRNAseqのデータ解析は困難を伴う。また種を超えた細胞タイプの相同性の理解には様々な工夫が必要である<ref><pubmed>31552245</pubmed></ref><ref><pubmed>30712875</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972]。


===データベースと統合===
===データベースと統合===
獲得されたscRNA-seqのデータは様々な目的で利用できるので、データベース化し利用できるようにする必要がある。神経系のトランスクリプトーム一般のデータベースが多数公開されており<ref><pubmed>29437890</pubmed></ref>、scRNA-seqのデータも基本的にNCBIのGene Expression Omnibus[https://www.ncbi.nlm.nih.gov/geo/]に登録されている。また、オープンサイエンス推進のためにcommon coordinate framework (CCF) やcentral annotation platform (CAP)という概念のもと、特にscRNA-seqを意識したものとして、米国のBRAIN Initiative Cell Census Consortium<ref><pubmed>29096072</pubmed></ref> 、Human Cell Atlas ProjectのHuman Cell Atlas Data Portal [https://data.humancellatlas.org]、そのマウス版であるTabula Muris <ref><pubmed>30283141</pubmed></ref>[https://genome.ucsc.edu/cgi-bin/hgTrackUi?db=mm10&g=tabulaMuris]やSten Linnarssonラボのマウス脳発生データベース[http://mousebrain.org]、アレン脳研究所のAllen Brain Atlas [https://portal.brain-map.org]、ブロード研究所のSingle Cell Portal [https://singlecell.broadinstitute.org/]などのデータベースが稼働している。また、異なった方法や実験で得られたscRNA-seqのデータを体系的に比較することも重要であり、CCA (Canonical correlation analysis)<ref><pubmed>29608179</pubmed></ref>, Seurat 3.0以降に組み込まれたMMN (Mutual Nearest Neighbors)、LIGER<ref><pubmed>31178122</pubmed></ref> 、Harmony<ref><pubmed>31740819</pubmed></ref>  、MetaNeighber<ref><pubmed>29491377</pubmed></ref>、Conos<ref><pubmed>31308548</pubmed></ref>のようなアルゴリズムが開発され、統合サイトもでき始めている([https://biccn.org])。
獲得されたscRNAseqのデータは様々な目的で利用できるので、データベース化し利用できるようにする必要がある。神経系のトランスクリプトーム一般のデータベースが多数公開されており<ref><pubmed>29437890</pubmed></ref>、scRNAseqのデータも基本的にNCBIのGene Expression Omnibus[https://www.ncbi.nlm.nih.gov/geo/]に登録されている。また、オープンサイエンス推進のためにcommon coordinate framework (CCF) やcentral annotation platform (CAP)という概念のもと、特にscRNAseqを意識したものとして、米国のBRAIN Initiative Cell Census Consortium<ref><pubmed>29096072</pubmed></ref> 、Human Cell Atlas ProjectのHuman Cell Atlas Data Portal [https://data.humancellatlas.org]、そのマウス版であるTabula Muris <ref><pubmed>30283141</pubmed></ref>[https://genome.ucsc.edu/cgi-bin/hgTrackUi?db=mm10&g=tabulaMuris]やSten Linnarssonラボのマウス脳発生データベース[http://mousebrain.org]、アレン脳研究所のAllen Brain Atlas [https://portal.brain-map.org]、ブロード研究所のSingle Cell Portal [https://singlecell.broadinstitute.org/]などのデータベースが稼働している。また、異なった方法や実験で得られたscRNAseqのデータや後述のマルチモーダルなシングルセルオミクスのデータを体系的に比較することも重要であり、CCA (Canonical correlation analysis)<ref><pubmed>29608179</pubmed></ref>, Seurat 3.0以降に組み込まれたMMN (Mutual Nearest Neighbors)、LIGER<ref><pubmed>31178122</pubmed></ref> 、Harmony<ref><pubmed>31740819</pubmed></ref>  、MetaNeighber<ref><pubmed>29491377</pubmed></ref>、Conos<ref><pubmed>31308548</pubmed></ref>のようなアルゴリズムが開発され、後述のマルチモーダルなシングルセルオミクスを組み込んだ統合サイトもでき始めている([https://biccn.org])。


===空間トランスクリプトミクス===
===空間トランスクリプトミクス===
多数の細胞を扱うscRNA-seqの弱点は、組織から細胞や細胞核を解離する必要があるので、その細胞が存在していた解剖学的あるいは空間的な位置の情報を消去してしまうということである。組織切片におけるタンパク質などの分布は免疫組織化学、mRNAの分布はin situ hybridizationで検出することができるが、数多くのmRNAの分布を情報処理技術と組み合わせ一気に同定する方法がscRNA-seqと同様に開発されてきている(Slide-seq<ref><pubmed>30923225</pubmed></ref>[ https://doi.org/10.1101/2020.03.12.989806]、HDST<ref><pubmed>31501547</pubmed></ref>、Expansion sequencing[http://doi.org/10.1101/2020.05.13.094268]など<ref><pubmed>27365449</pubmed></ref>, <ref><pubmed>31932730</pubmed></ref> <ref><pubmed>30948552</pubmed></ref>)、更に10x Genomics社が市販するVisiumなどがある。現状では、大きな組織の空間トランスクリプトミクスは、空間解像度が細胞レベルにいたっておらず、技術普及の観点からも課題が多い。しかし、そのデータを解析するためのアルゴリズム<ref><pubmed>29553578</pubmed></ref><ref><pubmed>29553579</pubmed></ref><ref><pubmed>32350282</pubmed></ref> [https://doi.org/10.1101/757096][ https://doi.org/10.1101/701680] [https://doi.org/10.1101/431957]
多数の細胞を扱うscRNAseqの弱点は、組織から細胞や細胞核を解離する必要があるので、その細胞が存在していた解剖学的あるいは空間的な位置の情報を消去してしまうということである。組織切片におけるタンパク質などの分布は免疫組織化学、mRNAの分布はin situ hybridizationで検出することができるが、数多くのmRNAの分布を情報処理技術と組み合わせ一気に同定する方法がscRNAseqと同様に開発されてきている(Slide-seq<ref><pubmed>30923225</pubmed></ref>[https://doi.org/10.1101/2020.03.12.989806]、HDST<ref><pubmed>31501547</pubmed></ref>、Expansion sequencing[http://doi.org/10.1101/2020.05.13.094268]など<ref><pubmed>27365449</pubmed></ref>, <ref><pubmed>31932730</pubmed></ref> <ref><pubmed>30948552</pubmed></ref>)、更に10x Genomics社が市販するVisiumなどがある。現状では、大きな組織の空間トランスクリプトミクスは、空間解像度は限定されており、技術普及の観点からも課題が多い。しかし、そのデータを解析するためのアルゴリズム<ref><pubmed>29553578</pubmed></ref><ref><pubmed>29553579</pubmed></ref><ref><pubmed>32350282</pubmed></ref> [https://doi.org/10.1101/757096][ https://doi.org/10.1101/701680] [https://doi.org/10.1101/431957]
更にMerFish <ref><pubmed>25858977</pubmed></ref>、corrFISH  <ref><pubmed>27271198</pubmed></ref>のように、subcellularレベルで多数のmRNAを検出する方法が開発されてきており(<ref><pubmed>25549890</pubmed></ref> osmFISH<ref><pubmed>30377364</pubmed></ref> 30377364、STARmap (spatially-resolved transcript amplicon readout mapping) <ref><pubmed>29930089</pubmed></ref>、seqFISH+<ref><pubmed>27764670</pubmed></ref>、pciSeq(probabilistic cell typing by in situ sequencing)[ https://doi.org/10.1101/431957]、DSP(Digital Spatial Profiling) <ref><pubmed>32393914</pubmed></ref>)
更にMerFish <ref><pubmed>25858977</pubmed></ref>、corrFISH<ref><pubmed>27271198</pubmed></ref>のように、subcellularレベルで多数のmRNAを検出する方法が多数開発されてきており(文献:<ref><pubmed>25549890</pubmed></ref> osmFISH<ref><pubmed>30377364</pubmed></ref> 30377364、STARmap (spatially-resolved transcript amplicon readout mapping) <ref><pubmed>29930089</pubmed></ref>、seqFISH+<ref><pubmed>27764670</pubmed></ref>、pciSeq(probabilistic cell typing by in situ sequencing)[https://doi.org/10.1101/431957]、DSP(Digital Spatial Profiling) <ref><pubmed>32393914</pubmed></ref>)
、scRNA-seqと組み合わせることで、その弱点を補う空間トランスクリプトミクスにも利用され始め<ref><pubmed>30385464</pubmed></ref>[https://doi.org/10.1101/2020.06.04.105700]、今後の発展が期待される。
、scRNAseqと組み合わせることで、その弱点を補う空間トランスクリプトミクスにも利用され始め<ref><pubmed>30385464</pubmed></ref>[https://doi.org/10.1101/2020.06.04.105700]、今後の発展が期待される分野である。




===マルチモーダルなシングルセルオミクス===
===マルチモーダルなシングルセルオミクス===
同一の細胞からscRNA-seqの情報だけでなく、ゲノム配列、ATAC-seqなどによるエピゲノム解析、少数のタンパク質、あるいはプロテオームなどを、同時に記録するマルチモーダルなオミクスが注目されている<ref><pubmed>31907462</pubmed></ref><ref><pubmed>30696980</pubmed></ref>。2019年には、Nature Methodsの「Methods of the Year」に選ばれており、現状については、その特集号などを参考にされたい。例えば、細胞表面分子に対する抗体にDNAを付加することで、マーカーを発現する細胞のトランスクリプトームを観察するCITE-seq<ref><pubmed>28759029</pubmed></ref>、 REAP-seq<ref><pubmed>28854175</pubmed></ref>は既知の細胞表面マーカーの発現とscRNA-seqが同時に観察できるマルチモーダルなオミクスである。
同一の細胞からscRNAseqの情報だけでなく、ゲノム配列、ATAC-seqなどによるエピゲノム解析、少数のタンパク質、あるいはプロテオームなどを、同時に記録するマルチモーダルなオミクスが注目されている<ref><pubmed>31907462</pubmed></ref><ref><pubmed>30696980</pubmed></ref>。2019年には、Nature Methodsの「Methods of the Year」に選ばれており、現状については、その特集号などを参考にされたい。例えば、細胞表面分子に対する抗体にDNAを付加することで、マーカーを発現する細胞のトランスクリプトームを観察するCITE-seq<ref><pubmed>28759029</pubmed></ref>、 REAP-seq<ref><pubmed>28854175</pubmed></ref>は既知の細胞表面マーカーの発現とscRNAseqが同時に観察できるマルチモーダルなオミクスである。


マルチモーダルなシングルセルオミクスとして、神経科学分野で注目されるのは、scRNA-seqをパッチクランプによる電気生理学的情報と組み合わせたPatch-seq<ref><pubmed>26689544</pubmed></ref> <ref><pubmed>26689543</pubmed></ref>である。また、ゲノムDNAとscRNA-seqを同時に観察することによって、近年、精神疾患の観点から注目されている発生途中で生じる遺伝子変異を研究するPRDD-seqは今後の展開が注目される[https://doi.org/10.1101/2020.04.19.046904]。最後に、BARseq (barcoded anatomy resolved by sequencing) <ref><pubmed>31626774</pubmed></ref>、CONNECTID[https://doi.org/10.1101/378760
マルチモーダルなシングルセルオミクスとして、神経科学分野で注目されるのは、scRNAseqをパッチクランプによる電気生理学的情報と組み合わせたPatch-seq<ref><pubmed>26689544</pubmed></ref> <ref><pubmed>26689543</pubmed></ref>である。また、ゲノムDNAとscRNAseqを同時に観察することによって、近年、精神疾患の観点から注目されている発生途中で生じる遺伝子変異を研究するPRDD-seqは今後の展開が注目される[https://doi.org/10.1101/2020.04.19.046904]。最後に、BARseq (barcoded anatomy resolved by sequencing) <ref><pubmed>31626774</pubmed></ref>、CONNECTID[https://doi.org/10.1101/378760]、Epi-Retro-seq[https://doi.org/10.1101/2020.04.01.019612]のような方法は、[[コネクトーム]](神経細胞の結合性)と遺伝子発現を記録できるオミクスの新たな方向として興味深い。
]、Epi-Retro-seq[https://doi.org/10.1101/2020.04.01.019612]のような方法は、コネクトーム(神経細胞の結合性)と遺伝子発現を記録できるオミクスの新たな方向として興味深い。