「シングルセルRNAシーケンシング」の版間の差分

提供:脳科学辞典
ナビゲーションに移動 検索に移動
(PMID:33393903をつかって、<ref name=Yamagata2021></ref>に変更)
編集の要約なし
(2人の利用者による、間の47版が非表示)
2行目: 2行目:
<font size="+1">[http://researchmap.jp/yamagatm 山形方人]</font><br>
<font size="+1">[http://researchmap.jp/yamagatm 山形方人]</font><br>
''Harvard University''<br>
''Harvard University''<br>
DOI:<selfdoi /> 原稿受付日:2020年10月22日 原稿完成日:2020年12月23日<br>
DOI:<selfdoi /> 原稿受付日:年月日 原稿完成日:年月日<br>
外部査読委員:京都大学メディカルイノベーションセンター [https://researchmap.jp/read0140206 渡辺 亮]<br>理化学研究所 生命機能科学研究センターバイオインフォマティクス研究開発チーム/東京医科歯科大学 難治疾患研究所 ゲノム応用医学部門 ゲノム機能情報分野 [https://researchmap.jp/dritoshi 二階堂 愛]<br>
担当編集委員:<br>
</div>
</div>
英:single-cell RNA sequencing, scRNA-seq
{{box|text= シングルセルRNAシーケンシング(single-cell RNA sequencing, 以下scRNA-seq)は、[[次世代シーケンサー]](next generation sequencer、以下NGS)を用いることで、個々の細胞が保持しているmRNA全体を質的、量的に網羅的に調べる方法である。次元圧縮などの数理的な解析と組み合わせることで、遺伝子発現の状態に基づいた細胞の分類を行うことが可能であり、従来の組織学的、あるいは細胞生物学的手法では知られなかった新規の細胞種の同定や細胞状態の推定を行うことが可能になった。また、遺伝子発現プロファイルの変化に基づく擬時系列解析(pseudotime analysis)によって、刺激や発生に伴う細胞状態の遷移の描写ができる。神経系では、この方法により、神経細胞や非神経細胞の分類や状態についての知見が深まり、新しい神経細胞タイプ、細胞マーカー、病態の理解、更に機能的な遺伝子の同定などが系統的かつ網羅的に行われるようになった。scRNA-seqに、空間的情報、エピゲノム情報、タンパク質情報などの複数モダリティを取り入れた統合解析(multimodal single-cell omics)も行われている。}}


==背景==
英:single cell RNA sequencing, scRNA-seq
===トランスクリプトーム===
 [[トランスクリプトーム]](transcriptome)は、細胞中に存在する全ての[[転写]]産物(タンパク質をコードする[[mRNA]]、タンパク質をコードしない[[ノンコーディングRNA]]、[[マイクロRNA]]など)の総体である<ref><pubmed>19015660</pubmed></ref><ref><pubmed>31341269</pubmed></ref>。トランスクリプトームは、[[ゲノム]]とは異なり、同一の個体でも、組織ごとに、更には発生段階や細胞外環境や刺激によって変化する。トランスクリプトームは、同質あるいは異質の多数の細胞集団(組織、[[培養細胞]])から[[RNA]]抽出後、[[cDNA]]に変換し、それを1990年代に出現した[[DNAマイクロアレイ]]のように数多くの既知mRNAを識別する技術によって解析されるようになった。その後、[[次世代シーケンサー]]の利用により、希少mRNAやノンコーディングRNAを含めた未知の転写産物の高感度検出が可能になるとともに、[[スプライシング]]で成熟していく過程のmRNAなど、転写産物の種類だけでなく、転写産物の構造的差異(スプライシングバリアント、[[SNPs]]、変異など)の解析もできるようになった。加えて、[[ヒト]]やモデル[[実験動物]]([[マウス]]、[[ゼブラフィッシュ]]、[[ショウジョウバエ]]、[[線虫]]など)だけでなく、多種多様な生物のトランスクリプトームの把握も可能になった。従来から行われてきた組織全体などの多数の細胞を対象としたRNA-seq(バルクRNA-seq)では、複数の細胞における転写産物の平均を観察しているが、本項目では個々の細胞における転写産物を解析するscRNA-seqの原理とその応用について概説する。


===開発史===
{{box|text=
 1つの細胞の持つ生体物質を解明し、定量しようとする試みは古くからあった。1960年代になると、[[フローサイトメトリー]]を利用した[[蛍光活性化セルソーティング]](Fluorescence-activated cell sorting, FACS)が発明され、標識抗体などのプローブと組み合わせることで、多数の細胞集団の中で1つの細胞が保持している生体分子の種類や量についての断片的な研究が可能になり、この方法は現在でも汎用されている<ref><pubmed>22271369</pubmed></ref>。その後、[[免疫組織化学]]や[[in situ hybridization]]nなどにより、タンパク質やmRNAの種類や量が観察できるようになり、組織中に存在するそれぞれの細胞の同定などに活用されてきている。最近では、それぞれの細胞が持つ抗原分子を、異なった金属イオンで標識した抗体とフローサイトメトリーを組み合わせた方法で検出する[[マスサイトメトリー]](CyTOFなど)も開発されてきている<ref><pubmed>27153492</pubmed></ref>
シングルセルRNAシーケンシング(single cell RNA sequencing, 以下scRNA-seq)は、次世代シーケンシング (next generation sequencing、以下NGS)技術を使用して個々の細胞が発現しているmRNA全体、つまりトランスクリプトームを質的、量的に網羅的に調べ、細胞ごとの違いを高解像度で検出、分類することで、細胞の分類を行うことができる分子生物学的、コンピュータ生物学的技術である。また、刺激、発生など細胞の状況に応じて、個々の細胞のトランスクリプトームの情報を得ることで、病態や細胞系譜などの解析も可能である。特に多様なニューロンが存在する神経系では、この方法により、神経細胞の分類や状態についての知見が深まり、更に新しいバイオマーカー(biomarker)の発見などが網羅的に行われるようになった。。
}}


 細胞種にもよるが、1つの細胞内にある全RNA(ribosomal RNAを含む)は細胞種にもよるが1-50pgである。そのうち、mRNAの占める割合は1-5%程度である<ref><pubmed>15239941</pubmed></ref>。この微量のmRNAをcDNAに変換してから大幅に増幅できる方法が発明されたことで、1つの細胞が発現するmRNAを高感度で検出できるようになった<ref><pubmed>1557406</pubmed></ref><ref><pubmed>7541630</pubmed></ref> 。例えば、1991年、[[wj:リンダ・バック|Linda Buck]]と[[wj:リチャード・アクセル|Richard Axel]]は、[[嗅覚受容体]]が[[Gタンパク質]]であると仮定し、個々の嗅覚細胞で特異的に観察されるGタンパク質mRNAを比較することで、嗅覚受容体の同定に成功した<ref><pubmed>1840504</pubmed></ref>。1995年になると、[[wj:キャサリン・ドュラック|Catherine Dulac]]とRichard Axelは、異なる[[鋤鼻神経細胞]]で特異的に発現する遺伝子を1つの細胞から作製したcDNAライブラリーを比較する[[ディファレンシャル・スクリーニング]]を行うことで、[[フェロモン受容体]]を同定した<ref><pubmed>7585937</pubmed></ref>。同じ手法で異なる種類の神経細胞で発現している遺伝子も同定され<ref><pubmed>9778248</pubmed></ref><ref><pubmed>12230981</pubmed></ref>、1つの細胞の持つトランスクリプトームを比較するアプローチが神経細胞で特徴的に発現している遺伝子の同定に効果的なことが示された。
==scRNA-seqとその開発史==
 
===トランスクリプトーム===
 一方で多くの種類のmRNAを1細胞レベルで一挙に観察するための技術には感度やスループット、そしてコストの観点からブレークスルーが待たれた。1つの問題は多種類のcDNAを簡便に識別することを可能にする方法の開発であった。これを可能にしたのが、[[PCR]]などのcDNA増幅法の改良とマイクロアレイの利用であった<ref><pubmed>12736331</pubmed></ref><ref><pubmed>16547197</pubmed></ref>。しかしながら、細胞ごとに高価な[[マイクロアレイ]]を使用することは、多数の細胞のトランスクリプトームの観察には限界があった。2009年になると、これらの問題を解決できる可能性として、次世代シーケンサーを利用するscRNA-seqプロトコールがAzim Suraniのグループによって報告された<ref><pubmed>19349980</pubmed></ref>。しかしながら、多数のマイクロアレイでなく1回の次世代シーケンサー使用で済ませることができるものの、この報告でもわずか8個の細胞の解析に留まっており、1つの細胞ごとに処理を行うという操作が必要で、多数の細胞についてのトランスクリプームを一挙に理解することはできなかった。また、塩基配列の違うcDNAごとにPCR効率に差がある結果生じる増幅バイアス、また3’末端側が選択的に補足されることなどの課題があった。
トランスクリプトーム(transcriptome)は、細胞中に存在する全ての転写産物(タンパク質をコードするmRNA、タンパク質をコードしないノンコーディングRNA、マイクロRNAなど)の総体である<ref><pubmed>19015660</pubmed></ref><ref><pubmed>31341269 </pubmed></ref>。トランスクリプトームは、ゲノムとは異なり、同一の個体でも、組織ごとに、更には発生段階や細胞外環境や刺激によって変化する。トランスクリプトームは、同質あるいは異質の多数の細胞集団(組織、培養細胞)からRNA抽出後、cDNAに変換し、それを1990年代に出現したDNAマイクロアレイのように数多くの既知mRNAを識別する技術によって解析されるようになった。その後、NGSの利用により、希少mRNAやノンコーディングRNAを含めた未知の転写産物の高感度検出が可能になるとともに、スプライシングで成熟していく過程のmRNAなど、転写産物の種類だけでなく、転写産物の構造的な違い(スプライシングバリアント、SNPs、変異など)の解析もできるようになった。また、NGSは、ヒトやモデル実験生物(マウス、ゼブラフィッシュ、ショウジョウバエ、センチュウなど)だけでなく、多種多様な生物のトランスクリプトームの把握も可能になった。本稿では、このような多数の細胞集団、つまり個体や特定の組織全体ではなく、細胞1つの持つトランスクリプトームを解析する方法(scRNA-seq)とそのscRNA-seqデータを利用することで得られる知見について概説する。


==現状==
===scRNA-seqの背景===
===分子生物学的反応===  
1つの細胞の持つ生体物質を解明し、定量しようとする試みは古くからあった。1960年代になると、フローサイトメトリーを利用した蛍光活性化セルソーティング(Fluorescence-activated cell sorting, FACS)が発明され、標識抗体などのプローブと組み合わせることで、多数の細胞集団の中で1つの細胞が持っている分子の種類や量についての断片的な研究が可能になり、この方法は現在でも利用されている<ref><pubmed>22271369 </pubmed></ref>。その後、免疫組織化学やin situ hybridizationなどにより、タンパク質やmRNAの種類や量が観察できるようになり、組織中に存在するそれぞれの細胞の同定などに活用されてきている。最近では、それぞれの細胞の発現する抗原を、種々の金属イオンで標識した抗体とフローサイトメトリーを組み合わせた方法で検出するマスサイトメトリー(CyTOFなど)も利用されている<ref><pubmed>27153492</pubmed></ref>
 その後、5’末端側の領域まで効率よく増幅するscRNA-seqのプロトコールが考案された<ref name=Mereu2020><pubmed>32518403</pubmed></ref>。特に、SMART-seq(Switching mechanism at the 5' End of RNA Templates)<ref><pubmed>22820318</pubmed></ref>およびその改良されたプロトコールであるSMART-seq2<ref><pubmed>24056875</pubmed></ref> <ref><pubmed>24385147</pubmed></ref>の使用例が多い(既に、SMART-seq3という改良プロトコールもある<ref><pubmed>32518404</pubmed></ref>が、以下SMART-seqと呼ぶ)。また、類似法としてSTRT(single-cell tagged reverse transcription)<ref name=Islam2011><pubmed>21543516</pubmed></ref>などがある。


 一方、CEL-seq(Cell Expression by Linear amplification and Sequencing)<ref><pubmed>22939981</pubmed></ref>、CEL-seq2<ref><pubmed> 27121950 </pubmed></ref> 、MARS-seq(Massively parallel single-cell RNA-seq)<ref><pubmed>24531970 </pubmed></ref>では、[[T7 RNAポリメラーゼ]]による[[in vitro転写]]を用いることにより、[[PCR]]による増幅で見られるバイアスを低減させようとしている。
1つの細胞内にある全RNA(ribosomal RNAを含む)は細胞種にもよるが1-50pgである。そのうち、mRNAの占める割合は1-5%程度である<ref><pubmed>15239941</pubmed></ref>。この微量のmRNAをcDNAに変換してから大幅に増幅できるPCRが発明されることで、1つの細胞が発現するmRNAを高感度で検出できるようになった。例えば、1991年、Linda BuckとRichard Axelは、嗅覚受容体がGタンパク質であると仮定し、個々の嗅覚細胞で特異的に観察されるGタンパク質mRNAを比較することで、嗅覚受容体の同定に成功した<ref><pubmed>1840504</pubmed></ref>(2004年、ノーベル生理学・医学賞)。1995年になると、Catherine DulacとRichard Axelは、異なる鋤鼻神経細胞で特異的に発現する遺伝子を1つの細胞から作製したcDNAライブラリーを比較するディファレンシャル・スクリーニングにより、フェロモン受容体を同定した<ref><pubmed>7585937</pubmed></ref>。同じ手法で異なる種類の神経細胞で発現している遺伝子も同定されており<ref><pubmed>9778248</pubmed></ref><ref><pubmed>12230981</pubmed></ref>、1つの細胞の持つトランスクリプトームを比較するアプローチが神経系で特徴的に発現している遺伝子の同定に原理的に効果的であることを示した。


 また、Quartz-SeqやQuartz-Seq2ではPCR用のアダプターを付加する反応にポリAテーリングを利用することで、他の手法と比較して1.5-5倍程度の遺伝子を検出できる<ref name=Mereu2020><pubmed>32518403</pubmed></ref>。
一方で多くの種類のmRNAを1細胞レベルで観察する単細胞トランスクリプトームには技術的なブレークスルーが待たれた。第一の問題はPCRなどの増幅に伴うcDNAごとのバイアスなどのアーティファクトが頻繁に観察されること、そしてもう一つの問題は多種類のcDNAを簡便に識別することを可能にする方法の開発であった。これを可能にしたのが、cDNA増幅法の改良とマイクロアレイの利用であった<ref><pubmed>16547197</pubmed></ref>。しかしながら、増幅に伴うアーティファクトの解決は依然として不十分で、また1つの細胞ごとに高価なマイクロアレイを使用することは、多数の細胞のトランスクリプトームを観察するのには限界があった。2009年になると、これらの問題を解決できる可能性として、High-throughput sequencing (HTS)を利用するscRNA-seqプロトコルがAzim Suraniのグループによって報告された<ref><pubmed>19349980</pubmed></ref>。しかしながら、この論文でもたった8個の細胞の解析に留まっており、この方法でも一つの細胞ごとに処理を行うという操作が必要で、多数の細胞についてのトランスクリプームを一挙に理解することはできなかった。
===バーコード技術 ===
 増幅バイアス除去のアプローチとして特に重要なのは、2011年に発表された核酸配列バーコードを利用した方法で、分子識別子(unique molecular identifiers: UMI)を持つcDNAを増幅させ、次世代シーケンサー後の情報処理を用いるものであると考えられる<ref><pubmed>22101854</pubmed></ref>。この方法では[[逆転写]]反応の際、ランダム塩基配列から構成されるUMIをcDNA末端に付加した後、増幅反応、次世代シーケンサーを行い、cDNA配列とUMI配列の両方を読む。cDNAにはRNA1分子に1つのUMIが付加されるので、同一のUMIを持っていれば、逆転写時に同一のcDNA由来とカウントする。UMIをカウントすることで、増幅前のmRNAのコピー数を知ることができる<ref name=Islam2011><pubmed>21543516</pubmed></ref><ref><pubmed>24363023</pubmed></ref><ref name=Gierahn2017><pubmed>28192419</pubmed></ref> <ref><pubmed>29474909</pubmed></ref><ref name=Cao2017><pubmed>28818938</pubmed></ref><ref name=Rosenberg2018><pubmed>29545511</pubmed></ref>。
===多様なプラットフォーム===
 細胞を分別するプラットフォームには、マイクロピペットによる捕獲、[[セルソーター]]、[[レーザー捕獲]]などを用いるマルチウェル法、あるいは半導体集積回路様の製作技術で作った流体回路を利用するFluidigm C1の装置([https://jp.fluidigm.com C1 Single- Cell Auto Prep])、更にドロップレット使用(下記)などがある<ref><pubmed>30405621</pubmed></ref><ref><pubmed>33247933</pubmed></ref>。これらは、SMART-seqと組み合わせて利用されることが多い。SMART-seqプロトコールの特徴は、全長mRNAのトランスクリプトーム情報を得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、SNPsの情報を利用したアリル特異的発現、変異の検出にも利用できる。また、それぞれ細胞ごとの反応を独立した場所で行うため、反応中に別の細胞の反応と混じる可能性が低い。小型のナノウェルを用いるSeq-Wellも同様に反応自体が混じる可能性が低い<ref name=Gierahn2017><pubmed>28192419</pubmed></ref>。これらの点が、次に説明するドロップレットを使用して3’末端のみを標的にしたscRNA-seqと比べた場合の長所であるが、その高コスト(1細胞あたり数十ドル)と処理可能な細胞数の少なさが短所である。


 これらとは別に、ハイスループットで安価な方法として、それぞれの細胞を独立に標識するのではなく、プールされた細胞を異なるウェルにランダムに振り分け、ウェル固有のバーコードで転写物を標識していく操作を複数回繰り返していくことで細胞を区別するSplit-seqやsci-RNA-seq3などの方法も用いられている<ref name=Rosenberg2018><pubmed>29545511</pubmed></ref><ref><pubmed>30787437</pubmed></ref>
===scRNA-seqの現状===
それ以来、完全長cDNAを増幅したり、細胞ごとに異なる分子識別子(unique molecular identifiers: UMI)を持つcDNAを増幅させるscRNA-seqが考案され始め、2013年には、このような1細胞のシーケンシング技術が、Nature Methods誌のMethod of the Year に選ばれた[https://www.nature.com/collections/mysbdwgfll]。たとえば、SMART-seq(Switch mechanism at the 5' End of RNA Templates)<ref><pubmed>22820318</pubmed></ref>およびその改良されたプロトコルであるSMART-seq2 <ref><pubmed> 24056875 </pubmed></ref> <ref><pubmed>24385147</pubmed></ref>は、完全長cDNA合成のためのプロトコルである。また、MARS-seq(Massively parallel single-cell RNA-seq)<ref><pubmed> 24531970 </pubmed></ref>、STRT(single-cell tagged reverse transcription)<ref><pubmed>21543516</pubmed></ref> <ref><pubmed>24363023</pubmed></ref>、CEL-seq(Cell Expression by Linear amplification and Sequencing)<ref><pubmed>22939981</pubmed></ref>、CEL-seq2<ref><pubmed> 27121950 </pubmed></ref>、Seq-Well <ref><pubmed> 28192419</pubmed></ref>
などが報告されてきた。最近になって、sci-RNA-seq (single-cell combinatorial indexing RNA sequencing) <ref><pubmed> 28818938 </pubmed></ref>, SPLiT-seq(split-pool ligation-based transcriptome sequencing)<ref><pubmed>29545511</pubmed></ref>のように特殊な機器を利用せずに細胞特異的UMIを保持するcDNAを作製する方法も報告されている。


===ドロップレット使用の3’エンドリード法===
これらの方法のうち、SMART-seq、その改良法であるSMART-seq2は、微小ピペットによるマニュアル捕獲、セルソーター、レーザー捕獲法などを用いる多穴プレート法、更に半導体集積回路製作技術で作った流体集積回路を利用するFluidigm C1の装置[https://jp.fluidigm.com]と組み合わせることで利用される機会が多い。このSMART-seq2プロトコールの特徴は、mRNAの全領域を読むことで、全長トランスクリプトームを得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、アリルごとの発現情報が得られるSNPs、変異の検出にも利用できる。また、それぞれ細胞ごとの反応を独立した場所で行うため、別の細胞の反応と混じる可能性がない。これらの点が、次に説明するDropletを使用して3’末端のみを標的にしたscRNA-seqに比べた場合の長所であるが、その高コストと処理可能な細胞数の少なさが短所である。
 scRNA-seqのプラットフォームと方法について重要と考えられる進歩は、2015年、Harvard Medical Schoolの独立した2つのグループが、inDrops<ref><pubmed>26000487</pubmed></ref>そしてDrop-seq<ref><pubmed>26000488 </pubmed></ref>という類似した2つのハイスループットな方法を開発したことであろう(inDropsは[[T7 RNAポリメラーゼ]]、Drop-seqはPCRで増幅)。これらの方法では、[[マイクロ流体力学]] (microfluidics) 、 UMI(上述)と細胞ごとのバーコード(Cell Barcode)という2種類のDNAバーコーディング、そしてNGSと情報解析法を利用している。そして、多く細胞のサンプル調製の自動化と容易さから、1つの細胞あたりに要するコストを大幅に低下させることに成功した(Drop-seqは発表時で、1細胞あたり約5セント)。つまり、細胞1つずつをマイクロ流体力学によるエマルジョン作製技術を利用した装置に流入させ、その1細胞を1つのドロップレットに自動的に閉じ込める。そのドロップレット中には、ドロップレットごとにCell barcode/UMIとしてユニークなDNAバーコードを持つゲルビーズ(Gel Beads in Emulsion, GEMs)が入っており、それを足場に3’末端のみを標的にしたcDNA合成反応を実施することで、同じ細胞に含まれていた1分子のmRNAが同じCell barcodeを持つcDNAとして合成され、そのmRNA/cDNAが由来した細胞を識別できるということを利用している('''図1''')。
[[ファイル:scFig1.jpg|サムネイル|300px|'''図1. ドロップレット使用の3’エンドリード法 '''<br>組織から解離させた細胞それぞれを、マイクロ流体力学を利用した装置で、バーコードプライマーが結合したゲルビーズとともにドロップレットに封じ込める。ドロップレット中には、ドロップレットごとにCell barcode/UMIとしてユニークなDNA配列を持つゲルビーズ(GEMs)が入っており、それを足場にcDNA合成反応を実施することで、同じ細胞に含まれていたmRNAが同じCell barcodeを持つDNAとして合成され、それを増幅する。]]


 DropSeqはコストが低いが、細胞の取得率と検出感度が低い弱点がある。inDropsはDropSeqより細胞取得率が高く、パラメータを調整することにより、低レベルで発現される遺伝子の検出にも有利であるとされる<ref name=Zhang2019><pubmed>30472192</pubmed></ref>。DropSeqのセットアップは[https://www.dolomite-bio.com Dolomite Bio]、inDropは[https://1cell-bio.com 1 Cellbio社]から販売されている。しかし、その後、[https://www.10xgenomics.com/jp/ 10x Genomics社]が同様の原理を用いたシングルセル遺伝子発現解析システムを市販することで、多くの研究者が利用できるようになっている<ref><pubmed>28091601</pubmed></ref>。Svenssonらによる最近の[http://www.nxn.se/single-cell-studies/gui データベース]<ref><pubmed>33247933</pubmed></ref>では、scRNA-seqを用いた論文で用いられた方法について調査しており、この数年、10x Genomics社のプラットフォームを用いた論文が飛躍的に増加していることがわかる。10x Genomics社のプラットフォームは市販であるので導入が容易であり、DropSeqやinDropsに比べ多くの転写産物の検出が可能であるが、それらよりランニングコストは高価である<ref name=Zhang2019><pubmed>30472192</pubmed></ref>。
===Droplet使用の3’エンドリード法===
しかしながら、もっとも重要なscRNA-seqの方法論についての進歩は、2015年、Harvard Medical Schoolの独立した2つのグループが、inDropそしてDrop-seqという類似した2つの高スループットな方法を開発したことであろう<ref><pubmed>26000487</pubmed></ref> <ref><pubmed>26000488 </pubmed></ref>。これらの方法では、マイクロ流体力学 (Microfluidics) 、 Cell BarcodeとUMIとしてDNAバーコーディング (DNA barcoding) 、そしてNGSを利用することで、自動化とサンプル調製の容易さから、1つの細胞あたりに要するコストを大幅に低下させることに成功した(Drop-seqは発表時で、1細胞あたり6セント)。つまり、細胞1つずつをマイクロ流体力学によるエマルジョン技術を利用した装置に流入させ、その1細胞を1つのDroplet(油中水滴)に自動的に閉じ込める。そのDroplet中には、DropletごとにCell barcode/UMIとして異なったDNAバーコードを持つゲルビーズ(Gel Beads in Emulsion, GEMs)が入っており、それを足場に3’末端のみを標的にしたcDNA合成反応を実施することで、同じ細胞に含まれていたmRNAが同じUMIを持つcDNAとして合成され、そのmRNA/cDNAが由来した細胞を識別できるということを利用している(図1)。このようにして3’末端のみを増幅したバーコード付きcDNAをNGSで配列決定することによりscRNA-seqが可能になる。なお、DropSeqはコストが低いが、細胞の取得率と検出感度が低い弱点がある。inDropはDropSeqより細胞取得率が高く、パラメータを調整することで低レベルで発現される遺伝子の検出にも有利である<ref><pubmed>30472192</pubmed></ref>
DropSeqのセットアップはDolomite Bio ([https://www.dolomite-bio.com])、inDropは1 Cellbio社から販売されている[https://1cell-bio.com]。しかし、特に重要なのは10xGenomics社が同様の原理を用いた「Chromium」と命名された機器と試薬のシステムを市販することで、多くの研究者に利用できることになったことである[https://www.10xgenomics.com/jp/]。Svenssonらによる最近のデータベース[https://www.biorxiv.org/content/10.1101/742304v2], [http://www.nxn.se/single-cell-studies/gui]では、scRNA-seqを用いた論文で用いられた方法について調査しているが、この数年、10xGenomics社Chromiumを用いた論文が飛躍的に増加し、scRNA-seqの方法として、最も一般的になりつつあることがわかる(現在、10XGenomics社とBioRad社の間で関連特許をめぐる係争がある。)。このシステムは市販であるので導入が容易であり、DropSeqやinDropに比べ、多くの転写産物の高感度検出が可能であるが、ランニングコストは高い<ref><pubmed>30472192</pubmed></ref>。


 なお、3’エンドリード法だけでなく、抗体やT細胞レセプターのN末端側に位置する可変領域の配列決定が可能である5'末端のシーケンシングには5’エンドリード法が利用されることがある。
==scRNA-seqの実際==
 
ここでは主流になっている10xGenomics社のChromiumを用いた方法とSMART-seqなどを用いた方法に共通する方法の実際について俯瞰する。scRNA-seqの利用には、4つのステップがある(図2)<ref><pubmed>30089861</pubmed></ref>。1)個体や組織を採集し、そこから細胞あるいは細胞核を個別にすること。2)ChromiumやSMART-seq2などによる個々の細胞からのライブラリーの作製とNGSシーケンシング。3)前処理(preprocessing、得られた配列の整理)。4)ダウンストリーム解析(生物学的な情報を得る)。これらのうち、2)の段階については、上に記述したように市販の機器や試薬を利用する機会が多くなっているので、そのためのマニュアル等を参考にするのが現実的である。
==実際==
 ここでは主流になっている10x Genomics社のChromium controllerなどのドロップレットを用いた方法とSMART-seqなどを用いた他のプラットフォームに共通する方法の実際について概説する。scRNA-seqの利用には、4つのステップがある('''図2''')<ref name=Luecken2019><pubmed>31217225</pubmed></ref><ref><pubmed>30089861</pubmed></ref>。これらのうち、'''2.'''の段階については、上に記述したように市販の機器や試薬を利用する機会が多くなっているので、詳細は説明しない。
[[ファイル:ScFig2d.jpg|サムネイル|500px|'''図2.scRNA-seqの実際のステップ '''<br>細胞の単離、ライブラリ作製とNGS、データの前処理から次元圧縮、データ解析。図の一部は2016 DBCLS TogoTV、あるいはSeuratを用いて10x Genomics社の[https://support.10xgenomics.com/single-cell-gene-expression/datasets PBMCデータ]から執筆者が作製。]]
# 個体や組織を採集し、そこから細胞あるいは細胞核を個別に解離された状態にすること。
# ドロップレット法やSMART-seq対応のプラットフォームなどによる個々の細胞からのライブラリーの作製とNGS。
# 得られた配列情報の前処理(preprocessing)。
# データ解析。


===組織からの細胞、細胞核の分離===
===組織からの細胞、細胞核の分離===
 浮遊細胞([[血液]]細胞など)ではない場合、物理的あるいは酵素処理などによって解離することで、生組織から状態の良い個々に分散した細胞を調製する必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている<ref><pubmed>29970990</pubmed></ref>。ここで、しばしば問題となるのが、酵素処理による短時間加温や機械的刺激で、発現量が変化する遺伝子が存在することである<ref><pubmed>27090946</pubmed></ref>。特に、脳の[[ミクログリア]]の解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった<ref name=Hammond2019><pubmed>30471926</pubmed></ref>。また、このような現象を抑制するために、酵素処理時に転写阻害剤である[[アクチノマイシン]]で処理したり<ref><pubmed>29024657</pubmed></ref>、ヒマラヤ氷河から得られた細菌''Bacillus licheniformis''から得られた低温プロテアーゼを用いる方法も報告されている<ref><pubmed>28851704</pubmed></ref><ref><pubmed>31623682</pubmed></ref>。また、細胞解離後に、[[メタノール]]で固定しscRNA-seqに使用したり<ref><pubmed>28526029</pubmed></ref>、クロスリンカーを用いる方法もある<ref><pubmed>29391536</pubmed></ref>
血液細胞のように浮遊した細胞ではない場合、物理的あるいは酵素処理などによって、生組織から状態の良い細胞をdissociationする必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている。ただ、しばしば問題となるのが、酵素処理のため短時間加温することで、発現量が変化する遺伝子が存在することである<ref><pubmed>27090946</pubmed></ref>。例えば、脳のミクログリアの解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった<ref><pubmed>30471926</pubmed></ref>。また、このような現象を抑制するために、酵素処理時に転写阻害剤であるアクチノマイシンで処理したり<ref><pubmed>29024657</pubmed></ref>、ヒマラヤ氷河から得られた細菌Bacillus licheniformisから得られた低温プロテアーゼを用いる方法も報告されている<ref><pubmed>28851704</pubmed></ref>。また、細胞解離後に、メタノールで固定しscRNA-seqに使用することも可能である<ref><pubmed>28526029</pubmed></ref>
なお、ヒト組織などから生きた細胞を得ることは困難なことが多い。この場合、凍結した組織から、各細胞由来の核を調製し、核内のmRNAを分析する方法 snRNA-seq (single-nucleus RNA-seq)があり、細胞質を持つ生細胞を利用した場合より感度は劣るが、細胞の同定などの目的には十分使用に耐える<ref><pubmed>27471252</pubmed></ref><<<ref><pubmed>28846088</pubmed></ref><<ref><pubmed>29220646</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>30586455</pubmed></ref><ref><pubmed>28729663</pubmed></ref>[https://www.biorxiv.org/content/10.1101/630087v1]。snRNA-seqでは、組織をそのまま凍結することから開始するので、上述したscRNA-seqの問題である酵素処理や加温などを避けることができる。こうしたプロトコールの一部は、protocols.ioのHuman Cell Atlasのグループ[https://www.protocols.io/groups/hca]で公開されている。


 単離した細胞は、そのまま10x Genomicsのシングルセル遺伝子発現解析のプラットフォームに導入することができるが、細胞表面分子マーカーに対する[[抗体]]や[[蛍光タンパク質]]レポーターなどを用いたFACS、[[パニング]]、MACS([[磁気ビーズカラム]])などによって、細胞の選択的濃縮や除去を行う場合もある。更に、抗体に抗体表示バーコードDNAをカップリングさせるCITE-seq(Cellular Indexing of Transcriptomes and Epitopes by Sequencing) については、下記の「統合解析」でも述べる。
単離した細胞は、そのまま10xGenomicsのChromiumのプラットフォームに導入することができるが、抗体などを用いたFACS、パニング、MACS(磁気ビーズカラム)などによる特定のマーカーを細胞表面などに発現する細胞の単離を行う場合もある。


 なお、ヒト組織や希少生物などから生細胞を得ることは困難なことが多い。この場合、scRNA-seqの変法として、凍結した組織から、各細胞由来の核を調製し、核内のmRNAを分析するsnRNA-seq (single-nucleus RNA-seq)が利用されている。ただ、snRNA-seqでは、FACSなどによる特定細胞集団の分離が困難であることが多い。また、細胞質を持つ生細胞を利用したscRNA-seqとは違って、スプライシングの途上にある未成熟な核内転写産物を検出すること、更に検出できる遺伝子数も少なく、同等な結果が必ずしも得られない<ref><pubmed>24248345</pubmed></ref><ref><pubmed>26890679</pubmed></ref> <ref><pubmed>27471252</pubmed></ref><ref name=Habib2017><pubmed>28846088</pubmed></ref><ref><pubmed>29220646</pubmed></ref><ref name=Habib2017><pubmed>28846088</pubmed></ref><ref><pubmed>30586455</pubmed></ref><ref><pubmed>28729663</pubmed></ref><ref><pubmed>31728515</pubmed></ref><ref><pubmed>32341560</pubmed></ref> <ref name=Mereu2020><pubmed>32518403</pubmed></ref>。一方で、snRNA-seqでは、組織をそのまま凍結することから開始することが可能であるので、上述したscRNA-seqの問題である細胞解離酵素による処理などを避けることができる。更に、核を用いることで、大きな細胞体はマイクロ流体力学の流路で詰まりやすいなど、特に神経細胞で顕著である細胞の形状の多様性に伴うバイアスを減らすことができるといったメリットもある。こうしたプロトコールの一部は、protocols.ioのHuman Cell Atlasの[https://www.protocols.io/groups/hca グループ]で公開されている。
更に、RNAを分析するscRNA-seqではないが、single cell genome-seqの変法として、シングルセルの遺伝子発現を推定する方法として、トランスポゾンを用いることでゲノムのオープンクロマチン領域を選択的に検出し、ライブラリーを作製しシーケンスするsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin)<ref><pubmed>26083756</pubmed></ref>, <ref><pubmed>29434377</pubmed></ref><ref><pubmed>25953818</pubmed></ref>, single cell THS-seq (transposome hypersensitive-site) <ref><pubmed>29227469</pubmed></ref>がある。またDNAメチル化をシングルセルレベルで観察する方法も報告されている<ref><pubmed>28798132</pubmed></ref>
===scRNA-seqデータの前処理===
10x Genomics社のChromium、IlluminaのNGSを利用した場合、Cell Ranger(Linux上で作動)を用いて、各生物種ごとのレファレンス配列リスト(https://www.ncbi.nlm.nih.gov/grc)やEggNOG ([http://eggnogdb.embl.de])などを利用し、細胞とトランスクリプトーム(各遺伝子の発現)の対応マトリックスを作製する。その後のデータの処理についても、10xGenomics社がソフトウェアLoupeを提供している。しかしながら、その後のダウンストリーム解析を考慮して、R言語, Python, MATLABなどのデータ解析のための汎用プログラミング言語やコードで扱えるオブジェクトに変換するのが通常である。ここでは、scRNA-seqデータ解析のために最もよく利用されているR言語を用いたパッケージ「Seurat」<ref><pubmed> 29608179 </pubmed></ref> <ref><pubmed> 31178118 </pubmed></ref>を中心に紹介したい。なお、Pythonを利用したものでは、ドイツ・ミュンヘンInstitute of Computational Biologyの Fabian J. Theisらが開発しているScanpyが有名である<ref><pubmed> 29409532</pubmed></ref>


 通常のscRNA-seqは、ポリアデニル化されたmRNAを検出しているが、MATQ-seq(multiple annealing and dC-tailing-based quantitative single-cell RNA-seq)、RamDA-seqなどを用いると、ポリアデニル化されていないRNAの検出も可能である<ref><pubmed> 28092691</pubmed></ref> <ref><pubmed>29434199 </pubmed></ref>[https://doi.org/10.1101/2020.06.02.131060]
New York UniversityのRahul Satija研究室が開発しているSeuratは、scRNA-seq解析のために広く利用されているR言語のパッケージであり、2019年8月現在、その最新バージョンはSeurat 3.1である。論文の正式発表前から、サポート情報提供やコード修正なども頻繁に行っており、Satija研究室のWeb site(satijalab.org/Seurat, [http://satijalab.org/Seurat])、Github([https://github.com/satijalab/Seurat])、更にTwitterアカウント(@satijalab)などで最新情報を得ることできる。


 更に、RNAを分析するscRNA-seqではないが、遺伝子発現状態との関係が想定される[[オープンクロマチン]]領域を[[トランスポゾン]]を用いることで個々の細胞レベルで選択的に検出するsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin) <ref><pubmed>26083756</pubmed></ref><ref><pubmed>29434377</pubmed></ref><ref><pubmed>25953818</pubmed></ref>, single cell THS-seq (transposome hypersensitive-site) <ref><pubmed>29227469</pubmed></ref>や [[DNAメチル化]]領域を観察するsnmC-seq、RRBSのような方法も利用されている<ref name=Lake2018><pubmed>28798132</pubmed></ref><ref><pubmed>30237449</pubmed></ref><ref><pubmed> 20852635</pubmed></ref>。
最初に行うのは、scRNA-seqデータの品質管理である。ここでは、質の低い細胞のデータ(転写産物の種類が少ない、ミトコンドリア由来の転写産物が多い)を取り除く。また、複数の試料を組み合わせる場合には、バッチごとの違いについて検討する。特にDropletを使用するscRNA-seqの多くのケースで問題になるのが、Dropletに2つ以上の細胞が封じ込められ、それらが同じCell barcodeを持つために生じるアーティファクトである。通常Doubletsと呼ばれるこの問題はダウンストリーム解析を混乱させるので、細胞単離の段階から注意する必要があるが、明確なマーカー遺伝子が知られていればscRNA-seqデータ取得後にある程度のデータ処理で検討することは可能である。


===データ処理の流れ===
このようなノーマライゼーションの過程を経て、scRNA-seqのデータ解析において、最初に行うのが、次元圧縮 (dimensionality reduction)である<ref><pubmed> 30617341</pubmed></ref>
====総論====
。PCA (Principal component analysis, 主成分分析)、UMAP(Uniform Manifold Approximation and Projection, 均一マニフォールド近似と投影)、Diffusion maps,  t-SNE(t-distributed Stochastic Neighbor Embedding , t分布型確率的近傍埋込み)などの手法が用いられる。 特に、t-SNE[http://www.jmlr.org/papers/v9/vandermaaten08a.html](ティースニーと読むのが通常)は、高次元データを低次元の点の集合として可視化することで、それぞれの細胞の持つトランスクリプトームの類似度についての直観的な表示が可能でありしばしば用いられる(図3)。次に、Louvainアルゴリズムなどでクラスタリング(コミュニティ分割)を行い、tSNEグラフ上に表示できる。こうして、違ったタイプの細胞の集合が別のクラスターとして表示される。
 Illumina社に代表される次世代シーケンサーを用いて得られた結果は、ベースコールや細胞バーコードを用いたdemultiplexingなどの基礎解析を行うことで、各細胞における遺伝子の発現量のマトリックスを出力する。例えば、10XGenomics社のChromiumプラットフォームを用いた場合、10XGenomics社が提供するCell Rangerの[https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/tutorial_mr mkrefコマンド](Linux上で作動)などにより、各生物種ごとの[https://www.ncbi.nlm.nih.gov/grc レファレンス配列リスト](マウスやヒトでは既製のものを利用できる)などを参考にしながら、細胞と転写産物量の対応マトリックスを作製する。その後のデータの処理についても、10x Genomics社がソフトウェアLoupeを提供している。しかしながら、その後のデータ解析を考慮して、[[R]], [[Python]], [[MATLAB]]などのデータ解析のための汎用プログラミング言語やコードで扱えるオブジェクトに変換するのが通常である。


 scRNA-seq解析のためには、数多くのツールが公開されている。これらのツールは、バージョンが更新されたり、新しいものに置き換えられることがあるので、実際に利用する場合は最新の動向に注意を払う必要がある。scRNA-seqの解析に必要なツールは、[https://www.scrna-tools.org scRNA-tools], [https://github.com/seandavi/awesome-single-cell Awesome single cell], [https://www.bioconductor.org Bioconductor]などで紹介されており、ほとんどがダウンロード可能である。また、[[bioRxiv]]などの査読前のプレプリントサーバで公開されて、随時試用、評価されていくものが多く、scRNA-seqのデータ(下記参考)とともに、オープンサイエンス実践の好例となっている。
==ダウンストリーム解析==
===細胞クラスターの解釈とマーカー遺伝子候補の発見===
scRNA-seqデータから得られる生物学的知見には、内在的に存在する細胞の種類、外部刺激や環境で変化した細胞の状態、そして種類や変化により特徴的に発現するマーカー遺伝子候補の発見がある。クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスターに特徴的に発現している遺伝子を具体的に探索し、細胞集団の持つバイオマーカーによって、そのクラスターの同定が可能になる。例えば、既にニューロンとグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、ニューロンのタイプごとに区別されるマーカーや神経活動により変化したニューロンの状態は、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子(差次的発現遺伝子)を見つけるためには(Differential expression analysis, DE analysis)、SeuratのFindMarkersコマンドでも利用可能である目的別の解析のための専用コード(MAST <ref><pubmed>26653891</pubmed></ref>、DESeq2 <ref><pubmed>25516281</pubmed></ref>
など)を用いることができる。scRNA-seqの解析に必要なコードは、scRNA-tools [https://www.scrna-tools.org], Awesome single cell [https://github.com/seandavi/awesome-single-cell], Bioconductor[https://www.bioconductor.org]で紹介されており、ほとんどがダウンロード可能である。また、最新の情報については、bioRxivなどのプレプリントサーバで公開されていることが多く、scRNA-seqのデータ(下記参考)とともに、オープンサイエンス実践の好例となっている。細胞ごとの差次的発現遺伝子の可視化には、ドットプロットやヴァイオリンプロットなどが頻繁に用いられる(図4)。


====Seurat====
===偽時系列解析、制御ネットワーク、パスウェイ解析===
 ここでは、scRNA-seqデータ解析のために最もよく利用されているRを用いたパッケージ「Seurat」<ref name=Butler2018><pubmed>29608179</pubmed></ref> <ref><pubmed> 31178118 </pubmed></ref>を中心に紹介しておきたい。なお、一部の解析操作は、University of WashingtonのCole Trapnell研究室で開発されてきた軌道推定(下記参考)によく使用される[https://cole-trapnell-lab.github.io/monocle3/ Monocle3]でも可能である。Pythonを利用したものでは、ドイツ・ミュンヘンInstitute of Computational Biologyの Fabian Theisらが開発しているScanpyが有名である<ref><pubmed> 29409532</pubmed></ref>
実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、細胞周期、概日リズム、破裂型プロモーターの作動などの理由で変動が見られるものもある<ref><pubmed> 31217225 </pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上の細胞系譜や細胞分化といった細胞の遷移状態の解析(偽時系列解析Pseudo-time analysis )には、scRNA-seqデータを用いることが極めて効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref>
。これらの分析のためには軌道推定(Trajectory inference)の解析手法が用いられる。しばしば用いられるMonocle3 <ref><pubmed>30787437</pubmed></ref>など、多くのコードを収集しているGithubのサイトがある [https://github.com/dynverse/dynmethods][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといった、転写産物のスプライシングの状態から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref>。しかし、これらの方法は、あくまで発生途上の細胞系譜や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNA-seqを行うことで、細胞タイプの系統関係を調べる方法として、CRISPR-Cas9を用いたゲノム編集による記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>がある。


 New York UniversityのRahul Satija研究室が開発しているSeurat(画家スーラに由来)は、scRNA-seqデータ解析のために広く利用されているRパッケージであり、2020年秋現在、Seurat4のβバージョンが公開されている。論文の正式発表前から、サポート情報提供やコード修正なども頻繁に行っており、Satija研究室の[https://satijalab.org/seurat/ ウェッブサイト]、[https://github.com/satijalab/Seurat Github]、更に[https://twitter.com/satijalab Twitterアカウント]などで最新情報を得ることできる。
また変化している遺伝子発現を解釈するために、制御ネットワーク(例、SCENIC<ref><pubmed>28991892</pubmed></ref>, [https://github.com/aertslab/SCENIC])やパスウェイ解析(例、Metascape<ref><pubmed>30944313</pubmed></ref>, [http://metascape.org])といったシステム生物学で用いられてきた手法も適用できる。


====品質の検討事項====
==神経科学への応用==
 最初に行うのは、scRNA-seqデータの品質管理である。ここでは、質の低い細胞のデータ(例えば、壊れた細胞では、転写産物の種類が少なくミトコンドリア由来の転写産物が多い)を取り除く。また、複数の試料を組み合わせる場合には、バッチごとの違いについて検討する<ref><pubmed>29608177</pubmed></ref><ref><pubmed> 28045081</pubmed></ref><ref><pubmed>31948481</pubmed></ref> <ref><pubmed>32854757</pubmed></ref>。現実には、実験ごとのバッチの違いによる影響(Batch effect)がscRNA-seqの最大の問題であると示されてきており、試料の処理を同時に行うなど実験デザインを工夫する必要がある<ref><pubmed>29121214</pubmed></ref>。
===ニューロンのクラスとタイプ===
様々な神経・精神疾患について理解しその診断や治療に役立てるためには、ニューロン、グリア細胞を中心にした神経系にある細胞の「タイプ」を識別し、それぞれの細胞における分子的な変化を観察することが重要である <ref><pubmed>28775344</pubmed></ref><ref><pubmed>29738987</pubmed></ref>。近年、中枢神経系のグリア細胞にも、多様なアストロサイト、オリゴデンドロサイト、ミクログリアの存在が報告されてきている。一方で、ニューロンは著しく多様であり、このニューロンの多様性こそが、神経系を特徴づけており、その多彩で複雑な機能の発現に必須であることは疑う余地がない。
解剖学的な視点から言えば、すべてのニューロンの存在する位置は異なるので、すべてのニューロンは異なるという見方もできる。しかし、これは極論であり、従来の神経科学では、ニューロンの多様性は、それぞれのニューロンの解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきた。こうしたニューロンの多様性を便宜的に記述するのに、タイプ(type)、クラス(class)、サブクラス(subclass)、サブタイプ(subtype) というような用語が用いられてきた。しかし、本稿では混乱を防ぐため、Masland(2004)<ref><pubmed>15242626</pubmed></ref>が提唱し、広く受けいれられている「クラス」と「タイプ」という単語を用いることとする。タイプは、これ以上分類することができないとされる階層である。例えば、大脳皮質の錐体細胞、網膜神経節細胞といった大雑把な識別は「クラス」と呼ぶ。大脳皮質の錐体細胞というクラスは、層や領野によって「タイプ」が異なるし、網膜神経節細胞には視覚情報によって応答が異なる「タイプ」が存在する。この分類は、免疫組織化学、形態、電気生理学などの技術により識別可能である暫定的なものに過ぎない。本稿で解説するscRNA-seqの技術は、その網羅性からそれぞれのニューロンについてこれまでにないビッグデータを提供することで、このニューロンのタイプの理解に確実な根拠を与えつつある。


 また、ドロップレットを使用するscRNA-seqでしばしば問題になるのが、ドロップレットに2つ以上の細胞が封じ込められ、それらが同一のCell barcodeを持ってしまうアーティファクトである。通常「Doublet」「Multilet」と呼ばれるこの問題はデータ解析を混乱させるので、細胞単離の段階から注意する必要があるが、scRNA-seqデータ取得後にもデータ処理で解決できる可能性もある<ref><pubmed>30954476</pubmed></ref><ref><pubmed>30954475</pubmed></ref> <ref><pubmed>31693907</pubmed></ref><ref><pubmed>32592658</pubmed></ref> <ref><pubmed>29227470</pubmed></ref><ref><pubmed>31836005</pubmed></ref><ref><pubmed>31856883</pubmed></ref><ref><pubmed>30567574</pubmed></ref> <ref><pubmed>31266958</pubmed></ref><ref><pubmed>32366989</pubmed></ref><ref><pubmed>33338399</pubmed></ref>[https://doi.org/10.1101/2019.12.17.879304]。なお、この手法を利用することで、バッチ効果を抑えるために、異なるバーコードを持つ複数の試料を混ぜて一つの試料として扱い、計算機的に再び分離、解析する手法が注目されている<ref><pubmed>32483174</pubmed></ref>。
===大脳===


 scRNA-seqデータの次のノイズは、ある遺伝子の発現が低いために、本来同じタイプの細胞であっても、その遺伝子の発現が全く見られない「Dropout」と呼ばれる現象であり解析に影響を与えるので、これについても検討が必要である<ref><pubmed>24056876
===その他のCNS===
</pubmed></ref><ref><pubmed>32127540</pubmed></ref>。


====次元圧縮====
===疾患===
 このような品質管理、ノーマライゼーションの過程を経て<ref><pubmed>28504683</pubmed></ref>、scRNA-seqのデータ解析において、最初に行うのが、[[次元圧縮]] (dimensionality reduction)である<ref><pubmed>30617341</pubmed></ref><ref><pubmed>31780648</pubmed></ref><ref><pubmed>31955711</pubmed></ref><ref><pubmed>31823809</pubmed></ref>。主成分分析 (Principal component analysis, PCA)、更に発展させた均一マニフォールド近似と投影(Uniform Manifold Approximation and Projection, UMAP)、Diffusion maps<ref><pubmed> 26002886
アルツハイマー、Autism
</pubmed></ref>, t分布型確率的近傍埋込み (t-distributed Stochastic Neighbor Embedding, tSNE)などの手法が用いられる。 特に、[http://www.jmlr.org/papers/v9/vandermaaten08a.html tSNE]と[https://arxiv.org/abs/1802.03426 UMAP]は、高次元データを低次元の点の集合として可視化することで、それぞれの細胞の持つ遺伝子発現状態の類似度についての直観的な表示が可能でありしばしば用いられる('''図3''')。tSNEよりUMAPの方が迅速に類似集団間の関係が明確になるので、最近はUMAPを利用することが多くなってきている。次に、[[Louvainアルゴリズム]]などでクラスタリング([[コミュニティ分割]])を行いグラフ上に表示できる('''図3'''の色分け)。こうして、異なる転写状態を示す細胞の集合が別のクラスターとして表示され、同定可能になる<ref><pubmed>31500660</pubmed></ref>。
===網膜===
[[ファイル:scFig3.jpg|サムネイル|250px|'''図3. tSNEとUMAPによる同じデータの可視化'''<br>網膜(ニワトリ)の視細胞のデータを用いて執筆者が作製<ref name=Yamagata2021><pubmed>33393903</pubmed></ref>。]]
 
==データ解析==
===細胞クラスターの解釈とマーカー遺伝子候補の発見===
 scRNA-seqデータから得られる生物学的知見には、内在的に存在する細胞の種類、外部刺激や環境で変化した細胞の状態、そして種類や変化により特徴的に発現するマーカー遺伝子候補の発見がある<ref><pubmed>27824854</pubmed></ref><ref><pubmed>32033589</pubmed></ref>。クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスター(群)に特徴的に発現している具体的な遺伝子を探索し、細胞集団の持つバイオマーカーによって、そのクラスター(群)の同定が可能になる。例えば、既に神経細胞とグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、神経細胞のタイプ(下記参考)を区別できるマーカーや、外部刺激によって遺伝子発現状態が変化した神経細胞の状態は、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子(差次的発現遺伝子)を見つけるためには(Differential expression analysis, DE analysis)、SeuratのFindMarkersコマンド中でも利用可能であるコード(MAST、DESeq2など<ref><pubmed>26653891</pubmed></ref><ref><pubmed>25516281</pubmed></ref><ref><pubmed>30658573</pubmed></ref>)を用いることができる。細胞ごとの差次的発現遺伝子のVisualization(表示可視化)には、[[ドットプロット]](dot plot)、[[ヴァイオリンプロット]](violin plot)、[[リッジプロット]](Ridge plot, joy plot)、UMAPなどの次元圧縮図上に転写物量をプロットするFeatureプロット(feature plot)などが、目的に応じて頻繁に用いられる('''図4''')。
[[ファイル:scFig4.jpg|サムネイル|300px|'''図4.scRNA-seqデータの可視化の例 '''<br>A. ドットプロット。B.ヴァイオリンプロット。C. リッジプロット。D. UMAP(灰色)に転写物量(青)をプロットした Featureプロット。網膜の視細胞のデータを用いて執筆者が作製<ref name=Yamagata2021></ref>。]]
===擬時系列解析===
 実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、[[細胞周期]]、[[概日リズム]]、発現変動が大きい破裂型[[プロモーター]]の作動などの理由で 変動が見られるものもある<ref name=Luecken2019><pubmed>31217225</pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上にある[[細胞系譜]]や[[細胞分化]]といった細胞の遷移状態の解析([[軌道推定]](Trajectory inference);[[擬時系列解析]](擬似時系列解析)、Pseudo-time analysis)には、scRNA-seqデータを用いることが効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref>。しばしば用いられるMonocle3 <ref><pubmed>30787437</pubmed></ref>[https://cole-trapnell-lab.github.io/monocle3/]など、多くのコードを収集、比較しているサイトがある [https://dynverse.org][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといったスプライシングされていく転写産物の量から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref><ref><pubmed> 32747759</pubmed></ref>。しかし、これらの方法は、あくまで細胞系譜や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNA-seqを行うことで、細胞タイプの系統関係を調べる方法として、[[CRISPR-Cas9]]を用いた[[ゲノム編集]]による痕跡追跡記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>、あるいはアデノシンデアミナーゼでRNA編集を行いタイムスタンプを入れる方法<ref><pubmed>33077959</pubmed></ref>がある。[[1塩基バリアント]](Single-nucleotide variants: SNV)の系統的解析は、細胞の不均一性や系統的な関係を明らかにするための最も有望なアプローチの一つである<ref><pubmed>31744515</pubmed></ref>。
===遺伝子制御ネットワーク、パスウェイ解析など===
 また細胞分化や刺激などによる変動に伴う特徴的な遺伝子発現状態をscRNA-seqで観察することは、[[遺伝子制御ネットワーク]](例、[https://github.com/aertslab/SCENIC SCENIC]<ref><pubmed>28991892</pubmed></ref>)、[[代謝経路]]や[[シグナル伝達系]]のための[[パスウェイ解析]](例、Metascape<ref><pubmed>30944313</pubmed></ref>, [http://metascape.org]、Gene Ontolgoy[http://geneontology.org])を理解するシステム生物学的な研究として有用である<ref><pubmed>32051003</pubmed></ref>。更に、scRNA-seqで得られた結果をもとに、細胞間相互作用の理解を深めるのを目的とするCellPhoneDB<ref><pubmed>32103204</pubmed></ref>[https://github.com/Teichlab/cellphonedb]、NicheNet<ref><pubmed>3181926</pubmed></ref>、SVCA<ref><pubmed>31577949</pubmed></ref>などがある。特に、Perturb-seq<ref><pubmed>27984732</pubmed></ref> やその変法<ref><pubmed> 32231336</pubmed></ref>は、CRISPRライブラリーによるゲノム編集を施した細胞をscRNA-seqで解析することで、ゲノム編集で破壊された遺伝子の機能や遺伝子間の相互作用の理解を可能にしている後述する複数モダリティ情報を取り込んだscRNA-seqの1つであり、注目されている。


==神経科学研究への適用==
==展望==
===神経系細胞ビッグデータとしてのscRNA-seq===
===進化と他の動物種===
 様々な神経・精神疾患について理解しその診断や治療に役立てるためには、神経細胞、[[グリア細胞]]を中心にした神経系にある細胞の種類や状態を識別し、それぞれの細胞における分子的な変化を観察することが重要である <ref><pubmed>28775344</pubmed></ref><ref><pubmed>29738987</pubmed></ref>。本項目で解説してきたscRNA-seq技術は、神経系に見られるそれぞれの細胞のトランスクリプトームについて[[ビッグデータ]]を提供することで、この細胞の種類や状態の識別に新たな判断材料を与えつつある。近年、中枢神経系の[[アストロサイト]]、[[オリゴデンドロサイト]]、[[ミクログリア]]といった[[グリア細胞]]も均一ではなく、内在的な多様性や外部因子による状態の変動が報告されてきている。神経細胞は、著しく多様であり、この多様性が神経系の多彩で複雑な機能発現の基盤となっている。従来の神経科学では、神経細胞の多様性は、それぞれの神経細胞の解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきている。こうした神経細胞の多様性を便宜的に記述するのに、タイプ(type)、クラス(class)、サブクラス(subclass)、サブタイプ(subtype) というような用語が用いられてきた。しかし、ここでは混乱を防ぐため、Masland(2004)<ref><pubmed>15242626</pubmed></ref>が提唱し、広く受けいれられている「クラス」と「タイプ」という単語を用いることとする<ref name=Yuste2020><pubmed>32839617</pubmed></ref>。タイプは、これ以上分類することができないとされる階層であり、共通性を持つタイプの集団がクラスである。例えば、[[大脳皮質]]の[[錐体細胞]]、[[網膜神経節細胞]]といった大雑把な区分はクラスである。大脳皮質の錐体細胞というクラスは、層や領野によって異なるタイプ、網膜神経節細胞には視覚情報に対して応答が異なるタイプが存在する。scRNA-seqは、「タイプ」の理解に新たな視点を提供している。
===データベース===
===神経系へのscRNA-seqの適用===
Human Cell Atlas
 scRNA-seqの神経系での利用については、次々と新しい論文やプレプリントが発表されており、ここではscRNA-seqで得られてきた情報の典型例を紹介することにとどめる。
Human Brain Transcriptome project
Single cell portal
Allen Brain Atlas
統合 LIGER, MetaNeighbor


 大脳皮質には、錐体細胞や[[非錐体細胞]]などの神経細胞や様々なグリア細胞などが見られ、古くから神経細胞タイプの識別が行われてきた。初期のFluidigm C1を用いたscRNA-seq技術でも、マウス皮質の小規模な細胞数を分類した研究で、これまで知られていた主要な神経細胞タイプとは違うタイプが見つかりscRNA-seqの有効性が示された<ref><pubmed>25700174</pubmed></ref>。その後のドロップレット使用の3’エンドリード法を利用した多数の細胞数の解析で、更に多数の神経細胞のタイプが見つかっている<ref name=Yuste2020><pubmed>32839617</pubmed></ref><ref name=Habib2017><pubmed>28846088</pubmed></ref><ref><pubmed>30096299</pubmed></ref><ref><pubmed>30096314</pubmed></ref><ref><pubmed>30382198</pubmed></ref><ref><pubmed>29320739</pubmed></ref><ref><pubmed>33338423</pubmed></ref>[https://doi.org/10.1101/2020.06.04.105700] [https://doi.org/10.1101/2020.07.02.184051]。特に、[[GABA]]作動性[[介在神経細胞]]タイプの多様性とその発生<ref><pubmed>28942923</pubmed></ref><ref><pubmed>28134272</pubmed></ref><ref><pubmed>29472441</pubmed></ref><ref><pubmed>29513653</pubmed></ref>についての、これまでの組織化学的な研究からは得られていなかった多くの情報は重要であろう。また、初期の発生過程<ref><pubmed>26940868</pubmed></ref><ref><pubmed>30485812</pubmed></ref><ref><pubmed>31073041</pubmed></ref><ref><pubmed>30635555</pubmed></ref><ref><pubmed>30625322</pubmed></ref>、老化<ref><pubmed>31551601</pubmed></ref>の理解が、scRNA-seq技術を利用することで進んでいる。更に、[[神経活動]]や[[臨界期]]に伴い変化するmRNAも細胞ごとに調査され興味深い<ref><pubmed>29230054</pubmed></ref> <ref><pubmed>32404418</pubmed></ref>。
===空間トランスクリプミクス===


 ヒトを含めた[[霊長類]]の大脳についても発達段階を含めてscRNA-seqが適用されてきている<ref><pubmed>26060301</pubmed></ref><ref><pubmed>27339989</pubmed></ref><ref name=Zhong2018><pubmed>29539641</pubmed></ref><ref name=Nowakowski2017><pubmed>29217575</pubmed></ref><ref name=Habib2017><pubmed>28846088</pubmed></ref><ref><pubmed>29227469</pubmed></ref><ref><pubmed>31303374</pubmed></ref><ref><pubmed>29867213</pubmed></ref><ref><pubmed>31435019</pubmed></ref><ref><pubmed>32424074</pubmed></ref> <ref><pubmed>32999462</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972][https://doi.org/10.1101/2020.04.23.056390]。ヒトや霊長類に特徴的とされる[[島]]の[[von Economo神経細胞]]([[紡錘細胞]])のような希少な神経細胞のscRNA-seqにも成功している<ref><pubmed>32127543</pubmed></ref>。
===マルチモーダルなオミクス===


 [[海馬]]<ref><pubmed>29241552</pubmed></ref><ref><pubmed>29912866</pubmed></ref><ref><pubmed>29335606</pubmed></ref><ref><pubmed>31942070</pubmed></ref>では、これまでの研究で記載されてきた神経細胞のタイプの存在が確認され、更に新規のタイプが見つかった。中枢神経系では、その他、[[外側膝状体]]<ref><pubmed>29343640</pubmed></ref>、[[大脳基底核]]<ref><pubmed>28384468</pubmed></ref>、[[視床下部]]<ref><pubmed>28166221</pubmed></ref><ref><pubmed>28355573</pubmed></ref>  <ref><pubmed>27991900</pubmed></ref><ref name=Moffitt2018><pubmed>30385464</pubmed></ref>  <ref><pubmed>31249056</pubmed></ref><ref><pubmed>30858605</pubmed></ref>、[[線条体]]<ref><pubmed>27425622</pubmed></ref><ref><pubmed>30134177</pubmed></ref><ref><pubmed>31875543</pubmed></ref>、[[中脳]]<ref><pubmed>27716510</pubmed></ref><ref><pubmed>29499164</pubmed></ref><ref><pubmed>30718509</pubmed></ref>、[[手綱核]]<ref><pubmed>29576475</pubmed></ref>、発生中の[[間脳]]<ref><pubmed>30872278</pubmed></ref> 、さらに[[小脳]]<ref><pubmed>30220501</pubmed></ref><ref><pubmed>30735127</pubmed></ref><ref><pubmed>30690467</pubmed></ref>などの結果が報告されてきている。例えば、構成する細胞についての情報が詳細に研究されてきたと思われていたマウスの小脳においても、分子層にこれまでの[[星状細胞]]、[[バスケット細胞]]というカテゴリーとは違った[[ギャップジャンクション]]に特徴を持つ2種類の神経細胞があることが示唆されている<ref><pubmed>24259518</pubmed></ref>。
== 関連項目 ==
 
*[[]]
 脳の外部では、[[運動神経]][https://doi.org/10.1101/2020.03.16.992958]、[[感覚神経]]<ref><pubmed>25420068</pubmed></ref><ref><pubmed>26691752</pubmed></ref>、[[らせん神経節]]<ref><pubmed>30078709</pubmed></ref><ref><pubmed>30209249</pubmed></ref> 、[[嗅覚神経]]<ref><pubmed>26541607</pubmed></ref><ref><pubmed>32059767</pubmed></ref>、[[腸神経系]] <ref><pubmed>29483303</pubmed></ref><ref><pubmed>33288908</pubmed></ref>、[[網膜]]<ref><pubmed>27565351</pubmed></ref><ref name=Konstantinides2018><pubmed>29909983</pubmed></ref><ref><pubmed>30018341</pubmed></ref><ref><pubmed>31260032</pubmed></ref><ref><pubmed>31128945</pubmed></ref><ref name=Peng2019><pubmed>30712875</pubmed></ref><ref><pubmed>30548510</pubmed></ref><ref><pubmed>31075224</pubmed></ref><ref><pubmed>31399471</pubmed></ref><ref><pubmed>31848347</pubmed></ref><ref><pubmed>31673015</pubmed></ref><ref><pubmed>31653841</pubmed></ref><ref><pubmed>31784286</pubmed></ref>[https://doi.org/10.1101/2020.02.26.966093]<ref><pubmed>32386599</pubmed></ref>[https://www.biorxiv.org/content/10.1101/617555v2]<ref name=Yamagata2021></ref><ref>'''Shekhar K, Sanes JR (2021)'''.<br>Generating and using transcriptomically based retinal cell atlases. Annu Rev Vis Sci 7: (in press)</ref>でのscRNA-seqデータがある。
*[[大脳皮質]]
*[[樹状突起]]
*[[軸索]]
*[[大脳皮質の局所神経回路]]


 また[[iPS細胞]]や[[ES細胞]]由来の神経組織[[オルガノイド]]に含まれる神経細胞タイプを知る上でも利用されている<ref><pubmed>28094016</pubmed></ref><ref><pubmed>28279351</pubmed></ref><ref><pubmed>31168097</pubmed></ref><ref><pubmed>31996853</pubmed></ref><ref><pubmed>31968264</pubmed></ref><ref><pubmed>32221280</pubmed></ref>。このようなアプローチは、[[ネアンデルタール人]]型の遺伝子を持つ脳オルガノイドの解析<ref><pubmed> 32559457</pubmed></ref>やSARS-CoV-2に感染する脳オルガノイド中の細胞の同定<ref><pubmed> 33113348</pubmed></ref>など、新たな応用例が発表されてきており興味深い。
===神経細胞以外の細胞===
 [[上衣細胞]]<ref><pubmed>29727663</pubmed></ref>は、[[神経幹細胞]]としての役割が示唆されてきたが、scRNA-seqによる解析ではその可能性が支持されなかった。グリア細胞では、[[ラジアルグリア]]<ref><pubmed>26406371</pubmed></ref><ref><pubmed>25734491</pubmed></ref><ref><pubmed>29281841</pubmed></ref><ref name=Nowakowski2017><pubmed>29217575</pubmed></ref><ref name=Zhong2018><pubmed>29539641</pubmed></ref>、アストロサイト<ref><pubmed>32139688</pubmed></ref><ref><pubmed>32203496</pubmed></ref>[https://doi.org/10.1101/2020.04.27.064881]に多様性があることが示唆されてきている。また、オリゴデンドロサイト<ref><pubmed>27284195</pubmed></ref><ref><pubmed>30078729</pubmed></ref><ref name=Avey2018><pubmed>30257220</pubmed></ref><ref name=Jäkel2019><pubmed>30747918</pubmed></ref><ref><pubmed>31958186</pubmed></ref>[https://doi.org/10.1101/2020.03.06.981373]については、これまで細胞生物学的に研究されてきた分化の過程がscRNA-seqにより詳細に解析されている。ミクログリアは、神経系の発達、老化、損傷などに伴う重要な遺伝子発現状態の変化がscRNA-seqにより詳細に明らかになった<ref><pubmed>27338705</pubmed></ref><ref name=Mathys2017><pubmed>29020624</pubmed></ref><ref><pubmed>30206190</pubmed></ref><ref name=Hammond2019><pubmed>30471926</pubmed></ref><ref><pubmed>31209379</pubmed></ref><ref><pubmed>31835035</pubmed></ref>。また、[[CNS境界関連マクロファージ]](BAM) <ref><pubmed>31061494</pubmed></ref>や[[脳血管系]]<ref><pubmed>29443965</pubmed></ref>のscRNA-seqも実施されている。
===疾患===
 scRNA-seqは、疾患の理解にも有用である。scRNA-seqでは、疾患に伴う遺伝子発現状態の変化を細胞タイプごとに観察することができるので、バルクRNA-seqでは埋もれていた遺伝子発現状態の変化や細胞ごとの変化を検出できるという長所がある。
例えば、[[筋萎縮性側索硬化症]]<ref name=Maniatis2019><pubmed>30948552</pubmed></ref>、[[多発性硬化症]]<ref name=Jäkel2019><pubmed>30747918</pubmed></ref><ref><pubmed>30420755</pubmed></ref><ref><pubmed>32313246</pubmed></ref>、[[アルツハイマー病]]やそのモデル動物<ref><pubmed>31042697</pubmed></ref><ref><pubmed>31399126</pubmed></ref><ref name=Mathys2017><pubmed>29020624</pubmed></ref>
[https://doi.org/10.1101/628347]<ref><pubmed>28602351</pubmed></ref><ref><pubmed>32341542</pubmed></ref>、[[統合失調症]]<ref><pubmed>29785013</pubmed></ref><ref><pubmed>32203495</pubmed></ref>、[[てんかん]]<ref><pubmed> 33028830</pubmed></ref>、[[自閉症]]や[[レット症候群]]<ref><pubmed>31097668</pubmed></ref><ref><pubmed>30455458</pubmed></ref>、[[シャルコー・マリー・トゥース病]]<ref><pubmed>29888333</pubmed></ref>、[[ダウン症]][https://www.biorxiv.org/content/10.1101/2020.01.01.892398v1]、[[パーキンソン病]]<ref><pubmed>30503143</pubmed></ref><ref><pubmed>32826893</pubmed></ref>、[[ハンチントン病]]<ref><pubmed>32070434</pubmed></ref>、[[がん]]<ref><pubmed>31327527</pubmed></ref><ref><pubmed>28360267</pubmed></ref>などに適用されている。最近、Perturb-seqにより、[[自閉症]]に関わる遺伝子の欠損に伴う細胞状態の変化などもscRNA-seqで報告されており<ref><pubmed>33243861</pubmed></ref>、疾患の理解のための新たな実験系の開発も始まりつつある。
==scRNA-seqの展望==
===神経系の多様性と進化===
 NGSを用いることで、どんな生物種にも適用可能なscRNA-seqは、既に多様な生物の神経系の細胞の理解、更には種間の相同性や差異の研究に利用されており、神経系の進化を細胞レベルで考察するのに有用であろう(例、[[線虫]]<ref name=Cao2017><pubmed>28818938</pubmed></ref>、[[ショウジョウバエ]]<ref><pubmed>29909982</pubmed></ref><ref><pubmed>29149607</pubmed></ref><ref><pubmed>30703584</pubmed></ref><ref name=Konstantinides2018><pubmed>29909983</pubmed></ref><ref><pubmed>33125872</pubmed></ref>、[[カタユウレイボヤ]]''Ciona intestinalis''<ref><pubmed>30069052</pubmed></ref><ref><pubmed>30228204</pubmed></ref>、[[ゼブラフィッシュ]]<ref><pubmed>31018142</pubmed></ref><ref><pubmed>30929901</pubmed></ref>、[[アカミミガメ]]''Trachemys scripta elegans''、[[トカゲ]]''Pogona vitticeps'', PV<ref><pubmed>29724907</pubmed></ref>、[[ニワトリ]]<ref name=Yamagata2021></ref>、[[霊長類]]<ref><pubmed>30730291</pubmed></ref><ref><pubmed>31619793</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972])。ただ、遺伝子やトランスクリプトームの研究が進んでいる生物種では比較的容易であるが、遺伝子のアノテーションが十分でない生物種を用いる場合、scRNA-seqのデータ解析は困難を伴う。また種を超えた細胞タイプの相同性の理解には様々な工夫が必要である<ref><pubmed>31552245</pubmed></ref><ref name=Peng2019><pubmed>30712875</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972]。
===データベースと統合===
 獲得されたscRNA-seqのデータは様々な目的で利用できるので、データベース化し利用できるようにする必要がある。神経系のトランスクリプトーム一般のデータベースが多数公開されており<ref><pubmed>29437890</pubmed></ref>、scRNA-seqのデータも基本的にNCBIの[https://www.ncbi.nlm.nih.gov/geo/ Gene Expression Omnibus]に登録されている。また、オープンサイエンス推進のためにcommon coordinate framework (CCF) やcentral annotation platform (CAP)という概念のもと、特にscRNA-seqを意識したものとして、米国のBRAIN Initiative Cell Census Consortium<ref><pubmed>29096072</pubmed></ref>、Human Cell Atlas Projectの[https://data.humancellatlas.org Human Cell Atlas Data Portal]、そのマウス版である[https://genome.ucsc.edu/cgi-bin/hgTrackUi?db=mm10&g=tabulaMuris Tabula Muris]<ref><pubmed>30283141</pubmed></ref>やSten Linnarssonラボの[http://mousebrain.org マウス脳発生データベース]、アレン脳研究所の[https://portal.brain-map.org Allen Brain Atlas]、ブロード研究所の[https://singlecell.broadinstitute.org/ Single Cell Portal]などのデータベースが稼働している。また、異なった方法や実験で得られたscRNA-seqのデータや後述の複数モダリティのシングルセルオミクスのデータを体系的に比較することも重要であり、CCA (Canonical correlation analysis)<ref name=Butler2018><pubmed>29608179</pubmed></ref>, Seurat 3.0以降に組み込まれたMMN (Mutual Nearest Neighbors)、LIGER<ref><pubmed>31178122</pubmed></ref> 、Harmony<ref><pubmed>31740819</pubmed></ref>  、MetaNeighber<ref><pubmed>29491377</pubmed></ref>、Conos<ref><pubmed>31308548</pubmed></ref>[https://doi.org/10.1101/2020.05.22.111161]のようなアルゴリズムが開発され、後述の複数モダリティのシングルセルオミクスを組み込んだ[https://biccn.org 統合サイト]もでき始めている。またデータベースを利用して発現類似性検索も研究されている<ref><pubmed>29608555</pubmed></ref><ref><pubmed>30744683</pubmed></ref>。
===空間トランスクリプトミクス===
 多数の細胞を扱うscRNA-seqの弱点は、組織から細胞や細胞核を解離する必要があるので、その細胞が存在していた解剖学的あるいは空間的な位置の情報を消去してしまうということである。組織切片におけるタンパク質などの分布は[[免疫組織化学]]、mRNAの分布はin situ hybridizationで検出することができるが、数多くのmRNAの分布を情報処理技術と組み合わせ一気に同定する方法がscRNA-seqと同様に開発されてきている(Slide-seq<ref><pubmed>30923225</pubmed></ref><ref><pubmed> 33288904</pubmed></ref>、HDST<ref><pubmed>31501547</pubmed></ref>、Expansion sequencing[http://doi.org/10.1101/2020.05.13.094268]など<ref><pubmed>27365449</pubmed></ref>, <ref><pubmed>31932730</pubmed></ref><ref name=Maniatis2019><pubmed>30948552</pubmed></ref>)、更に10x Genomics社が市販するVisium(現時点ではシングルセルレベルではない)などがある。現状では、大きな組織の空間トランスクリプトミクスは、空間解像度は限定されており、技術普及の観点からも課題が多い。しかし、そのデータを解析するためのアルゴリズム<ref><pubmed>29553578</pubmed></ref><ref><pubmed>29553579</pubmed></ref><ref><pubmed>32350282</pubmed></ref>[https://doi.org/10.1101/757096][https://doi.org/10.1101/701680][https://doi.org/10.1101/431957]、更にMerFish <ref><pubmed>25858977</pubmed></ref>、corrFISH<ref><pubmed>27271198</pubmed></ref>のように、subcellularレベルで多数のmRNAを検出する方法が多数開発されてきており(<ref><pubmed>25549890</pubmed></ref> osmFISH<ref><pubmed>30377364</pubmed></ref>、STARmap (spatially-resolved transcript amplicon readout mapping) <ref><pubmed>29930089</pubmed></ref>、seqFISH+<ref><pubmed>27764670</pubmed></ref>、pciSeq(probabilistic cell typing by in situ sequencing)[https://doi.org/10.1101/431957]、DSP(Digital Spatial Profiling) <ref><pubmed>32393914</pubmed></ref>、scRNA-seqと組み合わせることで、その弱点を補う空間トランスクリプトミクスにも利用され始め<ref name=Moffitt2018><pubmed>30385464</pubmed></ref>[https://doi.org/10.1101/2020.06.04.105700]、今後の発展が期待される分野である<ref><pubmed>32702314</pubmed></ref>。
===統合解析 ===
 同一の細胞からscRNA-seqの情報だけでなく、ゲノム配列、ATAC-seqなどによる[[エピゲノム]]解析、少数のタンパク質、あるいは[[プロテオーム]]など複数のモダリティを同時に観察するオミクス(Single-cell multimodal omics)が注目されている<ref><pubmed>31907462</pubmed></ref><ref><pubmed>30696980</pubmed></ref>。2019年には、Nature Methodsの「Methods of the Year」に選ばれており、現状については、その特集号などを参考にされたい。例えば、細胞表面に提示されているマーカー分子に対する抗体にDNAを付加することで、そのマーカーを発現する細胞のトランスクリプトームを解析するCITE-seq<ref><pubmed>28759029</pubmed></ref>、 REAP-seq<ref><pubmed>28854175</pubmed></ref>も、既知の細胞表面マーカーの発現とscRNA-seqが同時に観察できる方法である。
 複数モダリティのシングルセルオミクスとして、神経科学分野で注目されるのは、scRNA-seqを[[パッチクランプ]]による電気生理学的情報と組み合わせたPatch-seq<ref><pubmed>26689544</pubmed></ref> <ref><pubmed>26689543</pubmed></ref>である。また、ゲノムDNAとscRNA-seqを同時に観察することによって、近年、精神疾患の観点から注目されている発生途中で生じる遺伝子変異を研究するPRDD-seqは今後の展開が注目される<ref><pubmed> 32522880</pubmed></ref>。最後に、BARseq (barcoded anatomy resolved by sequencing) <ref><pubmed>31626774</pubmed></ref>、CONNECTID[https://doi.org/10.1101/378760]、Epi-Retro-seq<ref><pubmed>30276807</pubmed></ref>のような方法は、[[コネクトーム]](神経細胞の結合性)と遺伝子発現状態を記録できるオミクスの新たな方向として興味深い。
== 関連項目 ==
*[[ゲノムワイド関連解析 ]]
*[[ディファレンシャルディスプレイ ]]
*[[In situハイブリダイゼーション法 ]]
*[[免疫組織化学法]]
*[[エピジェネティクス]]
*[[コネクトーム]]
== 参考文献  ==
== 参考文献  ==
<references />
<references />

2020年1月8日 (水) 07:26時点における版

山形方人
Harvard University
DOI:10.14931/bsd.8038 原稿受付日:年月日 原稿完成日:年月日
担当編集委員:

英:single cell RNA sequencing, scRNA-seq

シングルセルRNAシーケンシング(single cell RNA sequencing, 以下scRNA-seq)は、次世代シーケンシング (next generation sequencing、以下NGS)技術を使用して個々の細胞が発現しているmRNA全体、つまりトランスクリプトームを質的、量的に網羅的に調べ、細胞ごとの違いを高解像度で検出、分類することで、細胞の分類を行うことができる分子生物学的、コンピュータ生物学的技術である。また、刺激、発生など細胞の状況に応じて、個々の細胞のトランスクリプトームの情報を得ることで、病態や細胞系譜などの解析も可能である。特に多様なニューロンが存在する神経系では、この方法により、神経細胞の分類や状態についての知見が深まり、更に新しいバイオマーカー(biomarker)の発見などが網羅的に行われるようになった。。 。

scRNA-seqとその開発史

トランスクリプトーム

トランスクリプトーム(transcriptome)は、細胞中に存在する全ての転写産物(タンパク質をコードするmRNA、タンパク質をコードしないノンコーディングRNA、マイクロRNAなど)の総体である[1][2]。トランスクリプトームは、ゲノムとは異なり、同一の個体でも、組織ごとに、更には発生段階や細胞外環境や刺激によって変化する。トランスクリプトームは、同質あるいは異質の多数の細胞集団(組織、培養細胞)からRNA抽出後、cDNAに変換し、それを1990年代に出現したDNAマイクロアレイのように数多くの既知mRNAを識別する技術によって解析されるようになった。その後、NGSの利用により、希少mRNAやノンコーディングRNAを含めた未知の転写産物の高感度検出が可能になるとともに、スプライシングで成熟していく過程のmRNAなど、転写産物の種類だけでなく、転写産物の構造的な違い(スプライシングバリアント、SNPs、変異など)の解析もできるようになった。また、NGSは、ヒトやモデル実験生物(マウス、ゼブラフィッシュ、ショウジョウバエ、センチュウなど)だけでなく、多種多様な生物のトランスクリプトームの把握も可能になった。本稿では、このような多数の細胞集団、つまり個体や特定の組織全体ではなく、細胞1つの持つトランスクリプトームを解析する方法(scRNA-seq)とそのscRNA-seqデータを利用することで得られる知見について概説する。

scRNA-seqの背景

1つの細胞の持つ生体物質を解明し、定量しようとする試みは古くからあった。1960年代になると、フローサイトメトリーを利用した蛍光活性化セルソーティング(Fluorescence-activated cell sorting, FACS)が発明され、標識抗体などのプローブと組み合わせることで、多数の細胞集団の中で1つの細胞が持っている分子の種類や量についての断片的な研究が可能になり、この方法は現在でも利用されている[3]。その後、免疫組織化学やin situ hybridizationなどにより、タンパク質やmRNAの種類や量が観察できるようになり、組織中に存在するそれぞれの細胞の同定などに活用されてきている。最近では、それぞれの細胞の発現する抗原を、種々の金属イオンで標識した抗体とフローサイトメトリーを組み合わせた方法で検出するマスサイトメトリー(CyTOFなど)も利用されている[4]

1つの細胞内にある全RNA(ribosomal RNAを含む)は細胞種にもよるが1-50pgである。そのうち、mRNAの占める割合は1-5%程度である[5]。この微量のmRNAをcDNAに変換してから大幅に増幅できるPCRが発明されることで、1つの細胞が発現するmRNAを高感度で検出できるようになった。例えば、1991年、Linda BuckとRichard Axelは、嗅覚受容体がGタンパク質であると仮定し、個々の嗅覚細胞で特異的に観察されるGタンパク質mRNAを比較することで、嗅覚受容体の同定に成功した[6](2004年、ノーベル生理学・医学賞)。1995年になると、Catherine DulacとRichard Axelは、異なる鋤鼻神経細胞で特異的に発現する遺伝子を1つの細胞から作製したcDNAライブラリーを比較するディファレンシャル・スクリーニングにより、フェロモン受容体を同定した[7]。同じ手法で異なる種類の神経細胞で発現している遺伝子も同定されており[8][9]、1つの細胞の持つトランスクリプトームを比較するアプローチが神経系で特徴的に発現している遺伝子の同定に原理的に効果的であることを示した。

一方で多くの種類のmRNAを1細胞レベルで観察する単細胞トランスクリプトームには技術的なブレークスルーが待たれた。第一の問題はPCRなどの増幅に伴うcDNAごとのバイアスなどのアーティファクトが頻繁に観察されること、そしてもう一つの問題は多種類のcDNAを簡便に識別することを可能にする方法の開発であった。これを可能にしたのが、cDNA増幅法の改良とマイクロアレイの利用であった[10]。しかしながら、増幅に伴うアーティファクトの解決は依然として不十分で、また1つの細胞ごとに高価なマイクロアレイを使用することは、多数の細胞のトランスクリプトームを観察するのには限界があった。2009年になると、これらの問題を解決できる可能性として、High-throughput sequencing (HTS)を利用するscRNA-seqプロトコルがAzim Suraniのグループによって報告された[11]。しかしながら、この論文でもたった8個の細胞の解析に留まっており、この方法でも一つの細胞ごとに処理を行うという操作が必要で、多数の細胞についてのトランスクリプームを一挙に理解することはできなかった。

scRNA-seqの現状

それ以来、完全長cDNAを増幅したり、細胞ごとに異なる分子識別子(unique molecular identifiers: UMI)を持つcDNAを増幅させるscRNA-seqが考案され始め、2013年には、このような1細胞のシーケンシング技術が、Nature Methods誌のMethod of the Year に選ばれた[1]。たとえば、SMART-seq(Switch mechanism at the 5' End of RNA Templates)[12]およびその改良されたプロトコルであるSMART-seq2 [13] [14]は、完全長cDNA合成のためのプロトコルである。また、MARS-seq(Massively parallel single-cell RNA-seq)[15]、STRT(single-cell tagged reverse transcription)[16] [17]、CEL-seq(Cell Expression by Linear amplification and Sequencing)[18]、CEL-seq2[19]、Seq-Well [20] などが報告されてきた。最近になって、sci-RNA-seq (single-cell combinatorial indexing RNA sequencing) [21], SPLiT-seq(split-pool ligation-based transcriptome sequencing)[22]のように特殊な機器を利用せずに細胞特異的UMIを保持するcDNAを作製する方法も報告されている。

これらの方法のうち、SMART-seq、その改良法であるSMART-seq2は、微小ピペットによるマニュアル捕獲、セルソーター、レーザー捕獲法などを用いる多穴プレート法、更に半導体集積回路製作技術で作った流体集積回路を利用するFluidigm C1の装置[2]と組み合わせることで利用される機会が多い。このSMART-seq2プロトコールの特徴は、mRNAの全領域を読むことで、全長トランスクリプトームを得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、アリルごとの発現情報が得られるSNPs、変異の検出にも利用できる。また、それぞれ細胞ごとの反応を独立した場所で行うため、別の細胞の反応と混じる可能性がない。これらの点が、次に説明するDropletを使用して3’末端のみを標的にしたscRNA-seqに比べた場合の長所であるが、その高コストと処理可能な細胞数の少なさが短所である。

Droplet使用の3’エンドリード法

しかしながら、もっとも重要なscRNA-seqの方法論についての進歩は、2015年、Harvard Medical Schoolの独立した2つのグループが、inDropそしてDrop-seqという類似した2つの高スループットな方法を開発したことであろう[23] [24]。これらの方法では、マイクロ流体力学 (Microfluidics) 、 Cell BarcodeとUMIとしてDNAバーコーディング (DNA barcoding) 、そしてNGSを利用することで、自動化とサンプル調製の容易さから、1つの細胞あたりに要するコストを大幅に低下させることに成功した(Drop-seqは発表時で、1細胞あたり6セント)。つまり、細胞1つずつをマイクロ流体力学によるエマルジョン技術を利用した装置に流入させ、その1細胞を1つのDroplet(油中水滴)に自動的に閉じ込める。そのDroplet中には、DropletごとにCell barcode/UMIとして異なったDNAバーコードを持つゲルビーズ(Gel Beads in Emulsion, GEMs)が入っており、それを足場に3’末端のみを標的にしたcDNA合成反応を実施することで、同じ細胞に含まれていたmRNAが同じUMIを持つcDNAとして合成され、そのmRNA/cDNAが由来した細胞を識別できるということを利用している(図1)。このようにして3’末端のみを増幅したバーコード付きcDNAをNGSで配列決定することによりscRNA-seqが可能になる。なお、DropSeqはコストが低いが、細胞の取得率と検出感度が低い弱点がある。inDropはDropSeqより細胞取得率が高く、パラメータを調整することで低レベルで発現される遺伝子の検出にも有利である[25]。 DropSeqのセットアップはDolomite Bio ([3])、inDropは1 Cellbio社から販売されている[4]。しかし、特に重要なのは10xGenomics社が同様の原理を用いた「Chromium」と命名された機器と試薬のシステムを市販することで、多くの研究者に利用できることになったことである[5]。Svenssonらによる最近のデータベース[6], [7]では、scRNA-seqを用いた論文で用いられた方法について調査しているが、この数年、10xGenomics社Chromiumを用いた論文が飛躍的に増加し、scRNA-seqの方法として、最も一般的になりつつあることがわかる(現在、10XGenomics社とBioRad社の間で関連特許をめぐる係争がある。)。このシステムは市販であるので導入が容易であり、DropSeqやinDropに比べ、多くの転写産物の高感度検出が可能であるが、ランニングコストは高い[26]

scRNA-seqの実際

ここでは主流になっている10xGenomics社のChromiumを用いた方法とSMART-seqなどを用いた方法に共通する方法の実際について俯瞰する。scRNA-seqの利用には、4つのステップがある(図2)[27]。1)個体や組織を採集し、そこから細胞あるいは細胞核を個別にすること。2)ChromiumやSMART-seq2などによる個々の細胞からのライブラリーの作製とNGSシーケンシング。3)前処理(preprocessing、得られた配列の整理)。4)ダウンストリーム解析(生物学的な情報を得る)。これらのうち、2)の段階については、上に記述したように市販の機器や試薬を利用する機会が多くなっているので、そのためのマニュアル等を参考にするのが現実的である。

組織からの細胞、細胞核の分離

血液細胞のように浮遊した細胞ではない場合、物理的あるいは酵素処理などによって、生組織から状態の良い細胞をdissociationする必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている。ただ、しばしば問題となるのが、酵素処理のため短時間加温することで、発現量が変化する遺伝子が存在することである[28]。例えば、脳のミクログリアの解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった[29]。また、このような現象を抑制するために、酵素処理時に転写阻害剤であるアクチノマイシンで処理したり[30]、ヒマラヤ氷河から得られた細菌Bacillus licheniformisから得られた低温プロテアーゼを用いる方法も報告されている[31]。また、細胞解離後に、メタノールで固定しscRNA-seqに使用することも可能である[32]。 なお、ヒト組織などから生きた細胞を得ることは困難なことが多い。この場合、凍結した組織から、各細胞由来の核を調製し、核内のmRNAを分析する方法 snRNA-seq (single-nucleus RNA-seq)があり、細胞質を持つ生細胞を利用した場合より感度は劣るが、細胞の同定などの目的には十分使用に耐える[33]<<[34]<[35][36][37][38][8]。snRNA-seqでは、組織をそのまま凍結することから開始するので、上述したscRNA-seqの問題である酵素処理や加温などを避けることができる。こうしたプロトコールの一部は、protocols.ioのHuman Cell Atlasのグループ[9]で公開されている。

単離した細胞は、そのまま10xGenomicsのChromiumのプラットフォームに導入することができるが、抗体などを用いたFACS、パニング、MACS(磁気ビーズカラム)などによる特定のマーカーを細胞表面などに発現する細胞の単離を行う場合もある。

更に、RNAを分析するscRNA-seqではないが、single cell genome-seqの変法として、シングルセルの遺伝子発現を推定する方法として、トランスポゾンを用いることでゲノムのオープンクロマチン領域を選択的に検出し、ライブラリーを作製しシーケンスするsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin)[39], [40][41], single cell THS-seq (transposome hypersensitive-site) [42]がある。またDNAメチル化をシングルセルレベルで観察する方法も報告されている[43]

scRNA-seqデータの前処理

10x Genomics社のChromium、IlluminaのNGSを利用した場合、Cell Ranger(Linux上で作動)を用いて、各生物種ごとのレファレンス配列リスト(https://www.ncbi.nlm.nih.gov/grc)やEggNOG ([10])などを利用し、細胞とトランスクリプトーム(各遺伝子の発現)の対応マトリックスを作製する。その後のデータの処理についても、10xGenomics社がソフトウェアLoupeを提供している。しかしながら、その後のダウンストリーム解析を考慮して、R言語, Python, MATLABなどのデータ解析のための汎用プログラミング言語やコードで扱えるオブジェクトに変換するのが通常である。ここでは、scRNA-seqデータ解析のために最もよく利用されているR言語を用いたパッケージ「Seurat」[44] [45]を中心に紹介したい。なお、Pythonを利用したものでは、ドイツ・ミュンヘンInstitute of Computational Biologyの Fabian J. Theisらが開発しているScanpyが有名である[46]

New York UniversityのRahul Satija研究室が開発しているSeuratは、scRNA-seq解析のために広く利用されているR言語のパッケージであり、2019年8月現在、その最新バージョンはSeurat 3.1である。論文の正式発表前から、サポート情報提供やコード修正なども頻繁に行っており、Satija研究室のWeb site(satijalab.org/Seurat, [11])、Github([12])、更にTwitterアカウント(@satijalab)などで最新情報を得ることできる。

最初に行うのは、scRNA-seqデータの品質管理である。ここでは、質の低い細胞のデータ(転写産物の種類が少ない、ミトコンドリア由来の転写産物が多い)を取り除く。また、複数の試料を組み合わせる場合には、バッチごとの違いについて検討する。特にDropletを使用するscRNA-seqの多くのケースで問題になるのが、Dropletに2つ以上の細胞が封じ込められ、それらが同じCell barcodeを持つために生じるアーティファクトである。通常Doubletsと呼ばれるこの問題はダウンストリーム解析を混乱させるので、細胞単離の段階から注意する必要があるが、明確なマーカー遺伝子が知られていればscRNA-seqデータ取得後にある程度のデータ処理で検討することは可能である。

このようなノーマライゼーションの過程を経て、scRNA-seqのデータ解析において、最初に行うのが、次元圧縮 (dimensionality reduction)である[47] 。PCA (Principal component analysis, 主成分分析)、UMAP(Uniform Manifold Approximation and Projection, 均一マニフォールド近似と投影)、Diffusion maps, t-SNE(t-distributed Stochastic Neighbor Embedding , t分布型確率的近傍埋込み)などの手法が用いられる。 特に、t-SNE[13](ティースニーと読むのが通常)は、高次元データを低次元の点の集合として可視化することで、それぞれの細胞の持つトランスクリプトームの類似度についての直観的な表示が可能でありしばしば用いられる(図3)。次に、Louvainアルゴリズムなどでクラスタリング(コミュニティ分割)を行い、tSNEグラフ上に表示できる。こうして、違ったタイプの細胞の集合が別のクラスターとして表示される。

ダウンストリーム解析

細胞クラスターの解釈とマーカー遺伝子候補の発見

scRNA-seqデータから得られる生物学的知見には、内在的に存在する細胞の種類、外部刺激や環境で変化した細胞の状態、そして種類や変化により特徴的に発現するマーカー遺伝子候補の発見がある。クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスターに特徴的に発現している遺伝子を具体的に探索し、細胞集団の持つバイオマーカーによって、そのクラスターの同定が可能になる。例えば、既にニューロンとグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、ニューロンのタイプごとに区別されるマーカーや神経活動により変化したニューロンの状態は、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子(差次的発現遺伝子)を見つけるためには(Differential expression analysis, DE analysis)、SeuratのFindMarkersコマンドでも利用可能である目的別の解析のための専用コード(MAST [48]、DESeq2 [49] など)を用いることができる。scRNA-seqの解析に必要なコードは、scRNA-tools [14], Awesome single cell [15], Bioconductor[16]で紹介されており、ほとんどがダウンロード可能である。また、最新の情報については、bioRxivなどのプレプリントサーバで公開されていることが多く、scRNA-seqのデータ(下記参考)とともに、オープンサイエンス実践の好例となっている。細胞ごとの差次的発現遺伝子の可視化には、ドットプロットやヴァイオリンプロットなどが頻繁に用いられる(図4)。

偽時系列解析、制御ネットワーク、パスウェイ解析

実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、細胞周期、概日リズム、破裂型プロモーターの作動などの理由で変動が見られるものもある[50][51]。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上の細胞系譜や細胞分化といった細胞の遷移状態の解析(偽時系列解析Pseudo-time analysis )には、scRNA-seqデータを用いることが極めて効果的である[52][53][54] 。これらの分析のためには軌道推定(Trajectory inference)の解析手法が用いられる。しばしば用いられるMonocle3 [55]など、多くのコードを収集しているGithubのサイトがある [17][18]。RNA velocityといった、転写産物のスプライシングの状態から細胞の分化状態を推定する方法もある[56]。しかし、これらの方法は、あくまで発生途上の細胞系譜や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNA-seqを行うことで、細胞タイプの系統関係を調べる方法として、CRISPR-Cas9を用いたゲノム編集による記録法を導入したscGESTALT[57]、ScarTrace[58] 、LINNAEUS[59]がある。

また変化している遺伝子発現を解釈するために、制御ネットワーク(例、SCENIC[60], [19])やパスウェイ解析(例、Metascape[61], [20])といったシステム生物学で用いられてきた手法も適用できる。

神経科学への応用

ニューロンのクラスとタイプ

様々な神経・精神疾患について理解しその診断や治療に役立てるためには、ニューロン、グリア細胞を中心にした神経系にある細胞の「タイプ」を識別し、それぞれの細胞における分子的な変化を観察することが重要である [62][63]。近年、中枢神経系のグリア細胞にも、多様なアストロサイト、オリゴデンドロサイト、ミクログリアの存在が報告されてきている。一方で、ニューロンは著しく多様であり、このニューロンの多様性こそが、神経系を特徴づけており、その多彩で複雑な機能の発現に必須であることは疑う余地がない。 解剖学的な視点から言えば、すべてのニューロンの存在する位置は異なるので、すべてのニューロンは異なるという見方もできる。しかし、これは極論であり、従来の神経科学では、ニューロンの多様性は、それぞれのニューロンの解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきた。こうしたニューロンの多様性を便宜的に記述するのに、タイプ(type)、クラス(class)、サブクラス(subclass)、サブタイプ(subtype) というような用語が用いられてきた。しかし、本稿では混乱を防ぐため、Masland(2004)[64]が提唱し、広く受けいれられている「クラス」と「タイプ」という単語を用いることとする。タイプは、これ以上分類することができないとされる階層である。例えば、大脳皮質の錐体細胞、網膜神経節細胞といった大雑把な識別は「クラス」と呼ぶ。大脳皮質の錐体細胞というクラスは、層や領野によって「タイプ」が異なるし、網膜神経節細胞には視覚情報によって応答が異なる「タイプ」が存在する。この分類は、免疫組織化学、形態、電気生理学などの技術により識別可能である暫定的なものに過ぎない。本稿で解説するscRNA-seqの技術は、その網羅性からそれぞれのニューロンについてこれまでにないビッグデータを提供することで、このニューロンのタイプの理解に確実な根拠を与えつつある。

大脳

その他のCNS

疾患

アルツハイマー、Autism

網膜

展望

進化と他の動物種

データベース

Human Cell Atlas Human Brain Transcriptome project Single cell portal Allen Brain Atlas 統合 LIGER, MetaNeighbor

空間トランスクリプミクス

マルチモーダルなオミクス

関連項目

参考文献 

  1. Wang, Z., Gerstein, M., & Snyder, M. (2009).
    RNA-Seq: a revolutionary tool for transcriptomics. Nature reviews. Genetics, 10(1), 57-63. [PubMed:19015660] [PMC] [WorldCat] [DOI]
  2. Stark, R., Grzelak, M., & Hadfield, J. (2019).
    RNA sequencing: the teenage years. Nature reviews. Genetics, 20(11), 631-656. [PubMed:31341269] [WorldCat] [DOI]
  3. Picot, J., Guerin, C.L., Le Van Kim, C., & Boulanger, C.M. (2012).
    Flow cytometry: retrospective, fundamentals and recent instrumentation. Cytotechnology, 64(2), 109-30. [PubMed:22271369] [PMC] [WorldCat] [DOI]
  4. Spitzer, M.H., & Nolan, G.P. (2016).
    Mass Cytometry: Single Cells, Many Features. Cell, 165(4), 780-91. [PubMed:27153492] [PMC] [WorldCat] [DOI]
  5. Livesey, F.J. (2003).
    Strategies for microarray analysis of limiting amounts of RNA. Briefings in functional genomics & proteomics, 2(1), 31-6. [PubMed:15239941] [WorldCat] [DOI]
  6. Buck, L., & Axel, R. (1991).
    A novel multigene family may encode odorant receptors: a molecular basis for odor recognition. Cell, 65(1), 175-87. [PubMed:1840504] [WorldCat] [DOI]
  7. Dulac, C., & Axel, R. (1995).
    A novel family of genes encoding putative pheromone receptors in mammals. Cell, 83(2), 195-206. [PubMed:7585937] [WorldCat] [DOI]
  8. Tanabe, Y., William, C., & Jessell, T.M. (1998).
    Specification of motor neuron identity by the MNR2 homeodomain protein. Cell, 95(1), 67-80. [PubMed:9778248] [WorldCat] [DOI]
  9. Yamagata, M., Weiner, J.A., & Sanes, J.R. (2002).
    Sidekicks: synaptic adhesion molecules that promote lamina-specific connectivity in the retina. Cell, 110(5), 649-60. [PubMed:12230981] [WorldCat] [DOI]
  10. Kurimoto, K., Yabuta, Y., Ohinata, Y., Ono, Y., Uno, K.D., Yamada, R.G., ..., & Saitou, M. (2006).
    An improved single-cell cDNA amplification method for efficient high-density oligonucleotide microarray analysis. Nucleic acids research, 34(5), e42. [PubMed:16547197] [PMC] [WorldCat] [DOI]
  11. Tang, F., Barbacioru, C., Wang, Y., Nordman, E., Lee, C., Xu, N., ..., & Surani, M.A. (2009).
    mRNA-Seq whole-transcriptome analysis of a single cell. Nature methods, 6(5), 377-82. [PubMed:19349980] [WorldCat] [DOI]
  12. Ramsköld, D., Luo, S., Wang, Y.C., Li, R., Deng, Q., Faridani, O.R., ..., & Sandberg, R. (2012).
    Full-length mRNA-Seq from single-cell levels of RNA and individual circulating tumor cells. Nature biotechnology, 30(8), 777-82. [PubMed:22820318] [PMC] [WorldCat] [DOI]
  13. Picelli, S., Björklund, Å.K., Faridani, O.R., Sagasser, S., Winberg, G., & Sandberg, R. (2013).
    Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nature methods, 10(11), 1096-8. [PubMed:24056875] [WorldCat] [DOI]
  14. Picelli, S., Faridani, O.R., Björklund, A.K., Winberg, G., Sagasser, S., & Sandberg, R. (2014).
    Full-length RNA-seq from single cells using Smart-seq2. Nature protocols, 9(1), 171-81. [PubMed:24385147] [WorldCat] [DOI]
  15. Jaitin, D.A., Kenigsberg, E., Keren-Shaul, H., Elefant, N., Paul, F., Zaretsky, I., ..., & Amit, I. (2014).
    Massively parallel single-cell RNA-seq for marker-free decomposition of tissues into cell types. Science (New York, N.Y.), 343(6172), 776-9. [PubMed:24531970] [PMC] [WorldCat] [DOI]
  16. Islam, S., Kjällquist, U., Moliner, A., Zajac, P., Fan, J.B., Lönnerberg, P., & Linnarsson, S. (2011).
    Characterization of the single-cell transcriptional landscape by highly multiplex RNA-seq. Genome research, 21(7), 1160-7. [PubMed:21543516] [PMC] [WorldCat] [DOI]
  17. Islam, S., Zeisel, A., Joost, S., La Manno, G., Zajac, P., Kasper, M., ..., & Linnarsson, S. (2014).
    Quantitative single-cell RNA-seq with unique molecular identifiers. Nature methods, 11(2), 163-6. [PubMed:24363023] [WorldCat] [DOI]
  18. Hashimshony, T., Wagner, F., Sher, N., & Yanai, I. (2012).
    CEL-Seq: single-cell RNA-Seq by multiplexed linear amplification. Cell reports, 2(3), 666-73. [PubMed:22939981] [WorldCat] [DOI]
  19. Hashimshony, T., Senderovich, N., Avital, G., Klochendler, A., de Leeuw, Y., Anavy, L., ..., & Yanai, I. (2016).
    CEL-Seq2: sensitive highly-multiplexed single-cell RNA-Seq. Genome biology, 17, 77. [PubMed:27121950] [PMC] [WorldCat] [DOI]
  20. Gierahn, T.M., Wadsworth, M.H., Hughes, T.K., Bryson, B.D., Butler, A., Satija, R., ..., & Shalek, A.K. (2017).
    Seq-Well: portable, low-cost RNA sequencing of single cells at high throughput. Nature methods, 14(4), 395-398. [PubMed:28192419] [PMC] [WorldCat] [DOI]
  21. Cao, J., Packer, J.S., Ramani, V., Cusanovich, D.A., Huynh, C., Daza, R., ..., & Shendure, J. (2017).
    Comprehensive single-cell transcriptional profiling of a multicellular organism. Science (New York, N.Y.), 357(6352), 661-667. [PubMed:28818938] [PMC] [WorldCat] [DOI]
  22. Rosenberg, A.B., Roco, C.M., Muscat, R.A., Kuchina, A., Sample, P., Yao, Z., ..., & Seelig, G. (2018).
    Single-cell profiling of the developing mouse brain and spinal cord with split-pool barcoding. Science (New York, N.Y.), 360(6385), 176-182. [PubMed:29545511] [WorldCat] [DOI]
  23. Klein, A.M., Mazutis, L., Akartuna, I., Tallapragada, N., Veres, A., Li, V., ..., & Kirschner, M.W. (2015).
    Droplet barcoding for single-cell transcriptomics applied to embryonic stem cells. Cell, 161(5), 1187-1201. [PubMed:26000487] [PMC] [WorldCat] [DOI]
  24. Macosko, E.Z., Basu, A., Satija, R., Nemesh, J., Shekhar, K., Goldman, M., ..., & McCarroll, S.A. (2015).
    Highly Parallel Genome-wide Expression Profiling of Individual Cells Using Nanoliter Droplets. Cell, 161(5), 1202-1214. [PubMed:26000488] [PMC] [WorldCat] [DOI]
  25. Zhang, X., Li, T., Liu, F., Chen, Y., Yao, J., Li, Z., ..., & Wang, J. (2019).
    Comparative Analysis of Droplet-Based Ultra-High-Throughput Single-Cell RNA-Seq Systems. Molecular cell, 73(1), 130-142.e5. [PubMed:30472192] [WorldCat] [DOI]
  26. Zhang, X., Li, T., Liu, F., Chen, Y., Yao, J., Li, Z., ..., & Wang, J. (2019).
    Comparative Analysis of Droplet-Based Ultra-High-Throughput Single-Cell RNA-Seq Systems. Molecular cell, 73(1), 130-142.e5. [PubMed:30472192] [WorldCat] [DOI]
  27. Hwang, B., Lee, J.H., & Bang, D. (2018).
    Single-cell RNA sequencing technologies and bioinformatics pipelines. Experimental & molecular medicine, 50(8), 96. [PubMed:30089861] [PMC] [WorldCat] [DOI]
  28. Lacar, B., Linker, S.B., Jaeger, B.N., Krishnaswami, S.R., Barron, J.J., Kelder, M.J.E., ..., & Gage, F.H. (2016).
    Nuclear RNA-seq of single neurons reveals molecular signatures of activation. Nature communications, 7, 11022. [PubMed:27090946] [PMC] [WorldCat] [DOI]
  29. Hammond, T.R., Dufort, C., Dissing-Olesen, L., Giera, S., Young, A., Wysoker, A., ..., & Stevens, B. (2019).
    Single-Cell RNA Sequencing of Microglia throughout the Mouse Lifespan and in the Injured Brain Reveals Complex Cell-State Changes. Immunity, 50(1), 253-271.e6. [PubMed:30471926] [PMC] [WorldCat] [DOI]
  30. Wu, Y.E., Pan, L., Zuo, Y., Li, X., & Hong, W. (2017).
    Detecting Activated Cell Populations Using Single-Cell RNA-Seq. Neuron, 96(2), 313-329.e6. [PubMed:29024657] [WorldCat] [DOI]
  31. Adam, M., Potter, A.S., & Potter, S.S. (2017).
    Psychrophilic proteases dramatically reduce single-cell RNA-seq artifacts: a molecular atlas of kidney development. Development (Cambridge, England), 144(19), 3625-3632. [PubMed:28851704] [PMC] [WorldCat] [DOI]
  32. Alles, J., Karaiskos, N., Praktiknjo, S.D., Grosswendt, S., Wahle, P., Ruffault, P.L., ..., & Rajewsky, N. (2017).
    Cell fixation and preservation for droplet-based single-cell transcriptomics. BMC biology, 15(1), 44. [PubMed:28526029] [PMC] [WorldCat] [DOI]
  33. Habib, N., Li, Y., Heidenreich, M., Swiech, L., Avraham-Davidi, I., Trombetta, J.J., ..., & Regev, A. (2016).
    Div-Seq: Single-nucleus RNA-Seq reveals dynamics of rare adult newborn neurons. Science (New York, N.Y.), 353(6302), 925-8. [PubMed:27471252] [PMC] [WorldCat] [DOI]
  34. Habib, N., Avraham-Davidi, I., Basu, A., Burks, T., Shekhar, K., Hofree, M., ..., & Regev, A. (2017).
    Massively parallel single-nucleus RNA-seq with DroNc-seq. Nature methods, 14(10), 955-958. [PubMed:28846088] [PMC] [WorldCat] [DOI]
  35. Hu, P., Fabyanic, E., Kwon, D.Y., Tang, S., Zhou, Z., & Wu, H. (2017).
    Dissecting Cell-Type Composition and Activity-Dependent Transcriptional State in Mammalian Brains by Massively Parallel Single-Nucleus RNA-Seq. Molecular cell, 68(5), 1006-1015.e7. [PubMed:29220646] [PMC] [WorldCat] [DOI]
  36. Habib, N., Avraham-Davidi, I., Basu, A., Burks, T., Shekhar, K., Hofree, M., ..., & Regev, A. (2017).
    Massively parallel single-nucleus RNA-seq with DroNc-seq. Nature methods, 14(10), 955-958. [PubMed:28846088] [PMC] [WorldCat] [DOI]
  37. Bakken, T.E., Hodge, R.D., Miller, J.A., Yao, Z., Nguyen, T.N., Aevermann, B., ..., & Tasic, B. (2018).
    Single-nucleus and single-cell transcriptomes compared in matched cortical cell types. PloS one, 13(12), e0209648. [PubMed:30586455] [PMC] [WorldCat] [DOI]
  38. Lake, B.B., Codeluppi, S., Yung, Y.C., Gao, D., Chun, J., Kharchenko, P.V., ..., & Zhang, K. (2017).
    A comparative strategy for single-nucleus and single-cell transcriptomes confirms accuracy in predicted cell-type expression from nuclear RNA. Scientific reports, 7(1), 6031. [PubMed:28729663] [PMC] [WorldCat] [DOI]
  39. Buenrostro, J.D., Wu, B., Litzenburger, U.M., Ruff, D., Gonzales, M.L., Snyder, M.P., ..., & Greenleaf, W.J. (2015).
    Single-cell chromatin accessibility reveals principles of regulatory variation. Nature, 523(7561), 486-90. [PubMed:26083756] [PMC] [WorldCat] [DOI]
  40. Preissl, S., Fang, R., Huang, H., Zhao, Y., Raviram, R., Gorkin, D.U., ..., & Ren, B. (2018).
    Single-nucleus analysis of accessible chromatin in developing mouse forebrain reveals cell-type-specific transcriptional regulation. Nature neuroscience, 21(3), 432-439. [PubMed:29434377] [PMC] [WorldCat] [DOI]
  41. Cusanovich, D.A., Daza, R., Adey, A., Pliner, H.A., Christiansen, L., Gunderson, K.L., ..., & Shendure, J. (2015).
    Multiplex single cell profiling of chromatin accessibility by combinatorial cellular indexing. Science (New York, N.Y.), 348(6237), 910-4. [PubMed:25953818] [PMC] [WorldCat] [DOI]
  42. Lake, B.B., Chen, S., Sos, B.C., Fan, J., Kaeser, G.E., Yung, Y.C., ..., & Zhang, K. (2018).
    Integrative single-cell analysis of transcriptional and epigenetic states in the human adult brain. Nature biotechnology, 36(1), 70-80. [PubMed:29227469] [WorldCat] [DOI]
  43. Luo, C., Keown, C.L., Kurihara, L., Zhou, J., He, Y., Li, J., ..., & Ecker, J.R. (2017).
    Single-cell methylomes identify neuronal subtypes and regulatory elements in mammalian cortex. Science (New York, N.Y.), 357(6351), 600-604. [PubMed:28798132] [PMC] [WorldCat] [DOI]
  44. Butler, A., Hoffman, P., Smibert, P., Papalexi, E., & Satija, R. (2018).
    Integrating single-cell transcriptomic data across different conditions, technologies, and species. Nature biotechnology, 36(5), 411-420. [PubMed:29608179] [PMC] [WorldCat] [DOI]
  45. Stuart, T., Butler, A., Hoffman, P., Hafemeister, C., Papalexi, E., Mauck, W.M., ..., & Satija, R. (2019).
    Comprehensive Integration of Single-Cell Data. Cell, 177(7), 1888-1902.e21. [PubMed:31178118] [PMC] [WorldCat] [DOI]
  46. Wolf, F.A., Angerer, P., & Theis, F.J. (2018).
    SCANPY: large-scale single-cell gene expression data analysis. Genome biology, 19(1), 15. [PubMed:29409532] [PMC] [WorldCat] [DOI]
  47. Kiselev, V.Y., Andrews, T.S., & Hemberg, M. (2019).
    Challenges in unsupervised clustering of single-cell RNA-seq data. Nature reviews. Genetics, 20(5), 273-282. [PubMed:30617341] [WorldCat] [DOI]
  48. Finak, G., McDavid, A., Yajima, M., Deng, J., Gersuk, V., Shalek, A.K., ..., & Gottardo, R. (2015).
    MAST: a flexible statistical framework for assessing transcriptional changes and characterizing heterogeneity in single-cell RNA sequencing data. Genome biology, 16, 278. [PubMed:26653891] [PMC] [WorldCat] [DOI]
  49. Love, M.I., Huber, W., & Anders, S. (2014).
    Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome biology, 15(12), 550. [PubMed:25516281] [PMC] [WorldCat] [DOI]
  50. Luecken, M.D., & Theis, F.J. (2019).
    Current best practices in single-cell RNA-seq analysis: a tutorial. Molecular systems biology, 15(6), e8746. [PubMed:31217225] [PMC] [WorldCat] [DOI]
  51. Kolodziejczyk, A.A., Kim, J.K., Svensson, V., Marioni, J.C., & Teichmann, S.A. (2015).
    The technology and biology of single-cell RNA sequencing. Molecular cell, 58(4), 610-20. [PubMed:26000846] [WorldCat] [DOI]
  52. Cembrowski, M.S., & Menon, V. (2018).
    Continuous Variation within Cell Types of the Nervous System. Trends in neurosciences, 41(6), 337-348. [PubMed:29576429] [WorldCat] [DOI]
  53. Marioni, J.C., & Arendt, D. (2017).
    How Single-Cell Genomics Is Changing Evolutionary and Developmental Biology. Annual review of cell and developmental biology, 33, 537-553. [PubMed:28813177] [WorldCat] [DOI]
  54. Telley, L., & Jabaudon, D. (2018).
    A mixed model of neuronal diversity. Nature, 555(7697), 452-454. [PubMed:29565398] [WorldCat] [DOI]
  55. Cao, J., Spielmann, M., Qiu, X., Huang, X., Ibrahim, D.M., Hill, A.J., ..., & Shendure, J. (2019).
    The single-cell transcriptional landscape of mammalian organogenesis. Nature, 566(7745), 496-502. [PubMed:30787437] [PMC] [WorldCat] [DOI]
  56. La Manno, G., Soldatov, R., Zeisel, A., Braun, E., Hochgerner, H., Petukhov, V., ..., & Kharchenko, P.V. (2018).
    RNA velocity of single cells. Nature, 560(7719), 494-498. [PubMed:30089906] [PMC] [WorldCat] [DOI]
  57. Raj, B., Wagner, D.E., McKenna, A., Pandey, S., Klein, A.M., Shendure, J., ..., & Schier, A.F. (2018).
    Simultaneous single-cell profiling of lineages and cell types in the vertebrate brain. Nature biotechnology, 36(5), 442-450. [PubMed:29608178] [PMC] [WorldCat] [DOI]
  58. Alemany, A., Florescu, M., Baron, C.S., Peterson-Maduro, J., & van Oudenaarden, A. (2018).
    Whole-organism clone tracing using single-cell sequencing. Nature, 556(7699), 108-112. [PubMed:29590089] [WorldCat] [DOI]
  59. Spanjaard, B., Hu, B., Mitic, N., Olivares-Chauvet, P., Janjuha, S., Ninov, N., & Junker, J.P. (2018).
    Simultaneous lineage tracing and cell-type identification using CRISPR-Cas9-induced genetic scars. Nature biotechnology, 36(5), 469-473. [PubMed:29644996] [PMC] [WorldCat] [DOI]
  60. Aibar, S., González-Blas, C.B., Moerman, T., Huynh-Thu, V.A., Imrichova, H., Hulselmans, G., ..., & Aerts, S. (2017).
    SCENIC: single-cell regulatory network inference and clustering. Nature methods, 14(11), 1083-1086. [PubMed:28991892] [PMC] [WorldCat] [DOI]
  61. Zhou, Y., Zhou, B., Pache, L., Chang, M., Khodabakhshi, A.H., Tanaseichuk, O., ..., & Chanda, S.K. (2019).
    Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature communications, 10(1), 1523. [PubMed:30944313] [PMC] [WorldCat] [DOI]
  62. Zeng, H., & Sanes, J.R. (2017).
    Neuronal cell-type classification: challenges, opportunities and the path forward. Nature reviews. Neuroscience, 18(9), 530-546. [PubMed:28775344] [WorldCat] [DOI]
  63. Tasic, B. (2018).
    Single cell transcriptomics in neuroscience: cell classification and beyond. Current opinion in neurobiology, 50, 242-249. [PubMed:29738987] [WorldCat] [DOI]
  64. Masland, R.H. (2004).
    Neuronal cell types. Current biology : CB, 14(13), R497-500. [PubMed:15242626] [WorldCat] [DOI]