「シングルセルRNAシーケンシング」の版間の差分

(2人の利用者による、間の50版が非表示)

1行目:

山形方人<[[br]]>

[http://researchmap.jp/yamagatm 山形方人]

''Harvard University''

DOI：<selfdoi />　~~原稿受付日：年月日　原稿完成日：年月日~~

DOI：<selfdoi />　原稿受付日：2020年10月22日　原稿完成日：2020年12月23日

~~担当編集委員：~~

外部査読委員：京都大学メディカルイノベーションセンター [https://researchmap.jp/read0140206 渡辺　亮] 理化学研究所生命機能科学研究センターバイオインフォマティクス研究開発チーム/東京医科歯科大学難治疾患研究所ゲノム応用医学部門ゲノム機能情報分野 [https://researchmap.jp/dritoshi 二階堂愛]

</div>

英：single cell RNA sequencing, scRNA-seq

英：single-cell RNA sequencing, scRNA-seq

{{box|text=　シングルセルRNAシーケンシング(single-cell RNA sequencing, 以下scRNA-seq)は、[[次世代シーケンサー]]（next generation sequencer、以下NGS）を用いることで、個々の細胞が保持しているmRNA全体を質的、量的に網羅的に調べる方法である。次元圧縮などの数理的な解析と組み合わせることで、遺伝子発現の状態に基づいた細胞の分類を行うことが可能であり、従来の組織学的、あるいは細胞生物学的手法では知られなかった新規の細胞種の同定や細胞状態の推定を行うことが可能になった。また、遺伝子発現プロファイルの変化に基づく擬時系列解析(pseudotime analysis)によって、刺激や発生に伴う細胞状態の遷移の描写ができる。神経系では、この方法により、神経細胞や非神経細胞の分類や状態についての知見が深まり、新しい神経細胞タイプ、細胞マーカー、病態の理解、更に機能的な遺伝子の同定などが系統的かつ網羅的に行われるようになった。scRNA-seqに、空間的情報、エピゲノム情報、タンパク質情報などの複数モダリティを取り入れた統合解析（multimodal single-cell omics）も行われている。}}

~~{{box|text~~=

==背景==

~~シングルセルRNAシーケンシング(scRNA~~-seq)は、次世代シーケンシング（Next Generation Sequencing、NGS）技術を使用して個々の細胞が発現しているmRNA全体、つまりトランスクリプトームを質的、量的に網羅的に調べ、細胞ごとの違いを高解像度で検出、分類することで、細胞の分類を行うことができる技術である。また、刺激、発生など細胞の状況に応じて、個々の細胞のトランスクリプトームの情報を得ることで、病態や細胞系譜などの解析も可能である。特に多様なニューロンが存在する神経系では、この方法により、神経細胞の分類や状態について、深い理解が進んできている。}

===トランスクリプトーム===

[[トランスクリプトーム]]（transcriptome）は、細胞中に存在する全ての[[転写]]産物（タンパク質をコードする[[mRNA]]、タンパク質をコードしない[[ノンコーディングRNA]]、[[マイクロRNA]]など）の総体である<ref><pubmed>19015660</pubmed></ref><ref><pubmed>31341269</pubmed></ref>。トランスクリプトームは、[[ゲノム]]とは異なり、同一の個体でも、組織ごとに、更には発生段階や細胞外環境や刺激によって変化する。トランスクリプトームは、同質あるいは異質の多数の細胞集団（組織、[[培養細胞]]）から[[RNA]]抽出後、[[cDNA]]に変換し、それを1990年代に出現した[[DNAマイクロアレイ]]のように数多くの既知mRNAを識別する技術によって解析されるようになった。その後、[[次世代シーケンサー]]の利用により、希少mRNAやノンコーディングRNAを含めた未知の転写産物の高感度検出が可能になるとともに、[[スプライシング]]で成熟していく過程のmRNAなど、転写産物の種類だけでなく、転写産物の構造的差異（スプライシングバリアント、[[SNPs]]、変異など）の解析もできるようになった。加えて、[[ヒト]]やモデル[[実験動物]]（[[マウス]]、[[ゼブラフィッシュ]]、[[ショウジョウバエ]]、[[線虫]]など）だけでなく、多種多様な生物のトランスクリプトームの把握も可能になった。従来から行われてきた組織全体などの多数の細胞を対象としたRNA-seq（バルクRNA-seq）では、複数の細胞における転写産物の平均を観察しているが、本項目では個々の細胞における転写産物を解析するscRNA-seqの原理とその応用について概説する。

==~~トランスクリプトーム~~==

===開発史===

トランスクリプトーム（transcriptome）は、細胞中に存在する全ての転写産物（タンパク質をコードするmRNA、タンパク質をコードしないノンコーディングRNA、マイクロRNAなど）の総体である。トランスクリプトームは、ゲノムとは異なり、同一の個体でも、組織ごとに、更には発生段階や細胞外からの影響によって固有のものである。このようなトランスクリプトームは、同質あるいは異質の多数の細胞集団（例、培養細胞株、組織）からRNAを抽出し、1990年代に開発されたDNAマイクロアレイのように数多くの既知のmRNAを一気に識別する技術によって解析されるようになった。その後、次世代シーケンシング（NGS）の利用により、希少mRNAやノンコーディングRNAを含めた未知の転写産物の高感度検出も可能になるとともに、スプライシングを経て成熟していく過程のmRNAの構造など、転写産物の種類だけでなく、転写産物の構造の理解も進むことになった。また、NGSは、ヒトやモデル実験生物（マウス、センチュウ、ショウジョウバエなど）として広く利用される生物だけでなく、多様な生物のトランスクリプトームの理解も可能にした。

1つの細胞の持つ生体物質を解明し、定量しようとする試みは古くからあった。1960年代になると、[[フローサイトメトリー]]を利用した[[蛍光活性化セルソーティング]]（Fluorescence-activated cell sorting, FACS）が発明され、標識抗体などのプローブと組み合わせることで、多数の細胞集団の中で１つの細胞が保持している生体分子の種類や量についての断片的な研究が可能になり、この方法は現在でも汎用されている<ref><pubmed>22271369</pubmed></ref>。その後、[[免疫組織化学]]や[[in situ hybridization]]nなどにより、タンパク質やmRNAの種類や量が観察できるようになり、組織中に存在するそれぞれの細胞の同定などに活用されてきている。最近では、それぞれの細胞が持つ抗原分子を、異なった金属イオンで標識した抗体とフローサイトメトリーを組み合わせた方法で検出する[[マスサイトメトリー]]（CyTOFなど）も開発されてきている<ref><pubmed>27153492</pubmed></ref>。

~~==シングルセルトランスクリプトーム研究史の概観==~~

細胞種にもよるが、1つの細胞内にある全RNA（ribosomal RNAを含む）は細胞種にもよるが1-50pgである。そのうち、mRNAの占める割合は1-5%程度である<ref><pubmed>15239941</pubmed></ref>。この微量のmRNAをcDNAに変換してから大幅に増幅できる方法が発明されたことで、1つの細胞が発現するmRNAを高感度で検出できるようになった<ref><pubmed>1557406</pubmed></ref><ref><pubmed>7541630</pubmed></ref> 。例えば、1991年、[[wj:リンダ・バック|Linda Buck]]と[[wj:リチャード・アクセル|Richard Axel]]は、[[嗅覚受容体]]が[[Gタンパク質]]であると仮定し、個々の嗅覚細胞で特異的に観察されるGタンパク質mRNAを比較することで、嗅覚受容体の同定に成功した<ref><pubmed>1840504</pubmed></ref>。1995年になると、[[wj:キャサリン・ドュラック|Catherine Dulac]]とRichard Axelは、異なる[[鋤鼻神経細胞]]で特異的に発現する遺伝子を１つの細胞から作製したcDNAライブラリーを比較する[[ディファレンシャル・スクリーニング]]を行うことで、[[フェロモン受容体]]を同定した<ref><pubmed>7585937</pubmed></ref>。同じ手法で異なる種類の神経細胞で発現している遺伝子も同定され<ref><pubmed>9778248</pubmed></ref><ref><pubmed>12230981</pubmed></ref>、1つの細胞の持つトランスクリプトームを比較するアプローチが神経細胞で特徴的に発現している遺伝子の同定に効果的なことが示された。

1つの細胞の持つ生体物質を定量しようとする試みは古くからあった。1960年代になると、Fluorescence-activated cell sorting (FACS)が発明され、標識抗体などのプローブと組み合わせることで、多くの細胞の中で１つの細胞が持っている分子の種類や量についての断片的な研究が可能になり、この方法は現在でも利用されている。その後、免疫組織化学やin situ hybridizationなどにより、タンパク質やmRNAの種類や量が観察できるようになり、組織中の1つの細胞の同定などに活用されてきている。

~~一つの細胞内にある全RNAは細胞種によるが1~~-50pgである。そのうち、mRNAの占める割合は1-5%程度である。この微量のmRNAをcDNAに変換してから大幅に増幅できるPCRが発明されることで、1つの細胞が発現するmRNAを高感度で検出できるようになった。例えば、1991年、Linda BuckとRichard Axelは、嗅覚受容体がGタンパク質であると仮定し、個々の嗅覚細胞で特異的に観察されるGタンパク質mRNAを比較することで、嗅覚受容体候補の同定に成功した（年、ノーベル生理学・医学賞）。1995年になると、Catherine DulacとRichard Axelは、異なる鋤鼻神経細胞で特異的に発現する遺伝子を単細胞cDNAライブラリーのディファレンシャル・スクリーニングという方法で、フェロモン受容体候補を同定した。同様な手法で異なる種類の網膜神経節細胞で発現している遺伝子も同定されており、このようなアプローチが生理的に重要な機能を持つ遺伝子の発見に効果的であることを示した。

一方で多くの種類のmRNAを１細胞レベルで観察する単細胞トランスクリプトームには技術的なブレークスルーが待たれた。１つ大きな問題はPCRなどの増幅に伴うバイアスなどのアーティファクトが頻繁に観察されること、そしてもう一つの課題は多くの種類のcDNAを簡便に観察することを可能にする方法の開発であった（PMID: 16547197）。これを可能にしたのが、増幅法の改良とマイクロアレイの利用であった。しかしながら、増幅に伴うアーティファクトの解決は依然として不十分で、また１つの細胞ごとに高価なマイクロアレイを利用することは、多数の細胞のトランスクリプトームを観察するのには限界があった。2009年に、これらの問題を解決できる可能性として、High-throughput sequencing (HTS)を利用するscRNA-seqプロトコルがAzim Suraniのグループによって報告されたPMID:19349980。しかしながら、この方法でも一つの細胞ごとに処理を行うという操作が必要で、この論文でもたった8個の細胞の解析に留まっており、非常に多くの細胞についてのトランスクリプームを一挙に理解することはできなかった。

~~==シングルセルRNAシーケンシング(scRNA-seq)の現状==~~

一方で多くの種類のmRNAを1細胞レベルで一挙に観察するための技術には感度やスループット、そしてコストの観点からブレークスルーが待たれた。1つの問題は多種類のcDNAを簡便に識別することを可能にする方法の開発であった。これを可能にしたのが、[[PCR]]などのcDNA増幅法の改良とマイクロアレイの利用であった<ref><pubmed>12736331</pubmed></ref><ref><pubmed>16547197</pubmed></ref>。しかしながら、細胞ごとに高価な[[マイクロアレイ]]を使用することは、多数の細胞のトランスクリプトームの観察には限界があった。2009年になると、これらの問題を解決できる可能性として、次世代シーケンサーを利用するscRNA-seqプロトコールがAzim Suraniのグループによって報告された<ref><pubmed>19349980</pubmed></ref>。しかしながら、多数のマイクロアレイでなく1回の次世代シーケンサー使用で済ませることができるものの、この報告でもわずか8個の細胞の解析に留まっており、1つの細胞ごとに処理を行うという操作が必要で、多数の細胞についてのトランスクリプームを一挙に理解することはできなかった。また、塩基配列の違うcDNAごとにPCR効率に差がある結果生じる増幅バイアス、また3’末端側が選択的に補足されることなどの課題があった。

以来、完全長cDNAまたは分子識別子（unique molecular identifiers: UMI）を持つcDNAを生成するためにmRNA転写産物を増幅する方法が異なるscRNA-seqが考案されてきた。2013年には、このような１細胞のシーケンシング技術が、Nature Methods誌のMethod of the Year に選ばれた。たとえば、SMART-seq（Switch mechanism at the 5' End of RNA Templates）（ 18 ）およびその改良されたプロトコルであるSMART-seq2（ 19、20 ）は、完全長cDNA合成のためのプロトコルである。また、MARS-seq（並列RNA単一細胞配列決定）（ 21 ）、STRT（単一細胞タグ付き逆転写）（ 22、23 ）、CEL-seq（線形増幅および配列決定による細胞発現）（ 24 ）、CEL-seq2（ 25 ）などが報告されてきた。特にSMART-seq（SMART-seq2）は、ピペット、限界希釈、レーザー捕獲法などを用いる多穴プレート法、更に半導体集積回路製作技術で作った流体集積回路を利用するFluidigm C1のシステム（https://jp.fluidigm.com）と組み合わせることで利用される機会が多い。このプロトコールの特徴は、全長のトランスクリプトームを得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、SNPs、変異の検出にも利用できる点で次に説明するUMIを用いる方法に比べて利点があるが、そのコストと処理できる細胞数の点で極めて不利である。

~~最も重要なscRNA~~-seqの方法論についての進歩は、2015年、Harvard Medical Schoolの独立した２つのグループから、inDropそしてDrop-seqという類似した2つの方法が発表されたことであろう。マイクロ流体力学 (Microfluidics) 、 UMIとしてDNAバーコーディング ([[DNA]] barcoding) 、そしてNGSを利用することで、自動化とサンプル調製の容易さから、一つの細胞あたりに要するコストを大幅に低下させることに成功した（Drop-seqはその発表時で、6セント/細胞）。これらの方法では、細胞1つずつをマイクロ流体力学によるエマルジョン技術を利用した装置に流入させ、その１細胞を試薬を封入した1つのDroplet（油滴）に自動的に閉じ込める。そのDroplet中には、DropletごとにUMIとして異なったDNAバーコードを持つゲルビーズが入っており、そこからcDNA合成反応を行うことで、それぞれの同じ細胞に含まれていたmRNAが同じUMIを持つcDNAとして合成され、Dropletを破壊した後も、そのcDNAが由来した細胞が区別できるということを利用している（図１）。このようにして増幅したUMI付きのｃDNAをNGSで配列決定することによりscRNA-seqが可能になる。なお、DropSeqはコストが低いが、細胞の取得率と検出感度が低い弱点がある。inDropはDropSeqより細胞取得率が高く、パラメータを調整することで低レベルで発現される遺伝子の検出に有利である。

==現状==

~~inDropの方法は、1 Cellbio社（https:~~//~~1cell~~-~~bio.com）から販売されているが、特に重要なのは同様の原理を用いた10xGenomics社（https:~~//~~www.10xgenomics.com~~/jp/~~）がChromiumと命名された市販機器と試薬を発売することで、多くの研究者に利用できることになったことである。Svenssonらのデータベース（www.nxn.se~~/~~single~~-cell~~-studies~~/gui）では、scRNA-seqを用いた論文で用いられた方法について調査しているが、この数年、10xGenomics社のChromiumを用いた方法が飛躍的に増加し、ほぼ寡占状態になりつつあることがわかる（現在、10XGenomics社とBioRad社の間で関連特許をめぐる係争がある。）。10X Genomics Chromiumは市販であるので導入が容易であり、inDropやDropSeqに比べ最大数の転写産物の検出に敏感であるが、コストが高い。

===分子生物学的反応===

その後、5’末端側の領域まで効率よく増幅するscRNA-seqのプロトコールが考案された<ref name=Mereu2020><pubmed>32518403</pubmed></ref>。特に、SMART-seq（Switching mechanism at the 5' End of RNA Templates）<ref><pubmed>22820318</pubmed></ref>およびその改良されたプロトコールであるSMART-seq2<ref><pubmed>24056875</pubmed></ref> <ref><pubmed>24385147</pubmed></ref>の使用例が多い（既に、SMART-seq3という改良プロトコールもある<ref><pubmed>32518404</pubmed></ref>が、以下SMART-seqと呼ぶ）。また、類似法としてSTRT（single-cell tagged reverse transcription）<ref name=Islam2011><pubmed>21543516</pubmed></ref>などがある。

~~==シングルセルRNAシーケンシング(scRNA~~-~~seq)の実際==~~

一方、CEL-seq（Cell Expression by Linear amplification and Sequencing）<ref><pubmed>22939981</pubmed></ref>、CEL-seq2<ref><pubmed> 27121950 </pubmed></ref> 、MARS-seq（Massively parallel single-cell RNA-seq）<ref><pubmed>24531970 </pubmed></ref>では、[[T7 RNAポリメラーゼ]]による[[in vitro転写]]を用いることにより、[[PCR]]による増幅で見られるバイアスを低減させようとしている。

~~ここでは主流になっている10xGenomics社のChromiumを用いた方法とSMART~~-seqなどを用いた方法に共通する方法の実際について議論する。シングルセルRNAシーケンシングの利用には、4つのステップがある。１）細胞をバラバラに単離すること。２）ライブラリーの作製とNGSシーケンシング。３）前処理（preprocessing、得られた配列の整理）。４）ダウンストリーム分析（生物学的な情報を得る）。これらのうち、２）の段階については、上に記述したように市販の機器や試薬を利用することが多くなっているので、各社のマニュアル等を参考にするのが現実的である。

===~~組織からの細胞の分離~~====

また、Quartz-SeqやQuartz-Seq2ではPCR用のアダプターを付加する反応にポリAテーリングを利用することで、他の手法と比較して1.5-5倍程度の遺伝子を検出できる<ref name=Mereu2020><pubmed>32518403</pubmed></ref>。

血液細胞のように浮遊した細胞ではない場合、物理的あるいは酵素処理などによって、生組織から状態の良い細胞をdissociationする必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている。ただ、しばしば問題となるのが、酵素処理のため短時間加温することで、発現が変化する遺伝子が存在することである。例えば、脳のミクログリアの解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった（Hammond et al.~~, 2019）。また、酵素処理時に転写阻害剤であるアクチノマイシンで処理することで、このような現象を抑制できる（Wu et al~~.~~, 2017）。更に、ヒマラヤ氷河から得られた細菌Bacillus licheniformisから得られた低温プロテアーゼを用いる方法も報告されている（Adam et al., 2017）。~~

===バーコード技術 ===

単離した細胞は、そのまま10xGenomicsのChromiumのプラットフォームに導入することができるが、抗体などを用いたFACS、パニング、磁気ビーズカラムなどによる細胞の単離を行う場合もある。

増幅バイアス除去のアプローチとして特に重要なのは、2011年に発表された核酸配列バーコードを利用した方法で、分子識別子（unique molecular identifiers: UMI）を持つcDNAを増幅させ、次世代シーケンサー後の情報処理を用いるものであると考えられる<ref><pubmed>22101854</pubmed></ref>。この方法では[[逆転写]]反応の際、ランダム塩基配列から構成されるUMIをcDNA末端に付加した後、増幅反応、次世代シーケンサーを行い、cDNA配列とUMI配列の両方を読む。cDNAにはRNA1分子に1つのUMIが付加されるので、同一のUMIを持っていれば、逆転写時に同一のcDNA由来とカウントする。UMIをカウントすることで、増幅前のmRNAのコピー数を知ることができる<ref name=Islam2011><pubmed>21543516</pubmed></ref><ref><pubmed>24363023</pubmed></ref><ref name=Gierahn2017><pubmed>28192419</pubmed></ref> <ref><pubmed>29474909</pubmed></ref><ref name=Cao2017><pubmed>28818938</pubmed></ref><ref name=Rosenberg2018><pubmed>29545511</pubmed></ref>。

なお、ヒト組織などから生細胞を得ることは困難なことが多い。この場合、凍結した組織から、核を調製し、これを分析する方法がある（）。更に、RNAを分析するscRNA-seqではないが、シングルセルの遺伝子発現を推定する方法として、トランスポゾンを用いることでゲノムのオープンクロマチン領域を選択的に検出し、ライブラリーを作製しシーケンスするATAC-~~seq (Assay for Transposase~~-~~Accessible Chromatin)がある。~~

===多様なプラットフォーム===

細胞を分別するプラットフォームには、マイクロピペットによる捕獲、[[セルソーター]]、[[レーザー捕獲]]などを用いるマルチウェル法、あるいは半導体集積回路様の製作技術で作った流体回路を利用するFluidigm C1の装置（[https://jp.fluidigm.com C1 Single- Cell Auto Prep]）、更にドロップレット使用（下記）などがある<ref><pubmed>30405621</pubmed></ref><ref><pubmed>33247933</pubmed></ref>。これらは、SMART-seqと組み合わせて利用されることが多い。SMART-seqプロトコールの特徴は、全長mRNAのトランスクリプトーム情報を得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、SNPsの情報を利用したアリル特異的発現、変異の検出にも利用できる。また、それぞれ細胞ごとの反応を独立した場所で行うため、反応中に別の細胞の反応と混じる可能性が低い。小型のナノウェルを用いるSeq-Wellも同様に反応自体が混じる可能性が低い<ref name=Gierahn2017><pubmed>28192419</pubmed></ref>。これらの点が、次に説明するドロップレットを使用して3’末端のみを標的にしたscRNA-seqと比べた場合の長所であるが、その高コスト（1細胞あたり数十ドル）と処理可能な細胞数の少なさが短所である。

~~===scRNA~~-~~seqデータの前処理==~~=

これらとは別に、ハイスループットで安価な方法として、それぞれの細胞を独立に標識するのではなく、プールされた細胞を異なるウェルにランダムに振り分け、ウェル固有のバーコードで転写物を標識していく操作を複数回繰り返していくことで細胞を区別するSplit-seqやsci-RNA-seq3などの方法も用いられている<ref name=Rosenberg2018><pubmed>29545511</pubmed></ref><ref><pubmed>30787437</pubmed></ref>。

~~Seurat, Scanpyなどのソフト。~~

~~Transcriptomeとの照合。質のチェック。~~

~~視覚化（Visualization。tSNE。~~

===~~ダウンストリーム分析~~===

===ドロップレット使用の3’エンドリード法===

~~Dimensionality Reductionとクラスタリング。~~

scRNA-seqのプラットフォームと方法について重要と考えられる進歩は、2015年、Harvard Medical Schoolの独立した２つのグループが、inDrops<ref><pubmed>26000487</pubmed></ref>そしてDrop-seq<ref><pubmed>26000488 </pubmed></ref>という類似した2つのハイスループットな方法を開発したことであろう（inDropsは[[T7 RNAポリメラーゼ]]、Drop-seqはPCRで増幅）。これらの方法では、[[マイクロ流体力学]] (microfluidics) 、 UMI（上述）と細胞ごとのバーコード（Cell Barcode）という2種類のDNAバーコーディング、そしてNGSと情報解析法を利用している。そして、多く細胞のサンプル調製の自動化と容易さから、1つの細胞あたりに要するコストを大幅に低下させることに成功した（Drop-seqは発表時で、１細胞あたり約5セント）。つまり、細胞1つずつをマイクロ流体力学によるエマルジョン作製技術を利用した装置に流入させ、その1細胞を1つのドロップレットに自動的に閉じ込める。そのドロップレット中には、ドロップレットごとにCell barcode/UMIとしてユニークなDNAバーコードを持つゲルビーズ(Gel Beads in Emulsion, GEMs)が入っており、それを足場に3’末端のみを標的にしたcDNA合成反応を実施することで、同じ細胞に含まれていた1分子のmRNAが同じCell barcodeを持つcDNAとして合成され、そのmRNA/cDNAが由来した細胞を識別できるということを利用している（'''図1'''）。

~~マーカー遺伝子とクラスタリングの同定。~~

[[ファイル:scFig1.jpg|サムネイル|300px|'''図1. ドロップレット使用の3’エンドリード法 ''' 組織から解離させた細胞それぞれを、マイクロ流体力学を利用した装置で、バーコードプライマーが結合したゲルビーズとともにドロップレットに封じ込める。ドロップレット中には、ドロップレットごとにCell barcode/UMIとしてユニークなDNA配列を持つゲルビーズ(GEMs)が入っており、それを足場にcDNA合成反応を実施することで、同じ細胞に含まれていたmRNAが同じCell barcodeを持つDNAとして合成され、それを増幅する。]]

~~DE遺伝子、の検出、MAST。~~

~~組成解析。~~

~~Trajectory interference 発生。発現の動態。~~

==~~神経科学への応用==~~

DropSeqはコストが低いが、細胞の取得率と検出感度が低い弱点がある。inDropsはDropSeqより細胞取得率が高く、パラメータを調整することにより、低レベルで発現される遺伝子の検出にも有利であるとされる<ref name=Zhang2019><pubmed>30472192</pubmed></ref>。DropSeqのセットアップは[https://www.dolomite-bio.com Dolomite Bio]、inDropは[https://1cell-bio.com 1 Cellbio社]から販売されている。しかし、その後、[https://www.10xgenomics.com/jp/ 10x Genomics社]が同様の原理を用いたシングルセル遺伝子発現解析システムを市販することで、多くの研究者が利用できるようになっている<ref><pubmed>28091601</pubmed></ref>。Svenssonらによる最近の[http://www.nxn.se/single-cell-studies/gui データベース]<ref><pubmed>33247933</pubmed></ref>では、scRNA-seqを用いた論文で用いられた方法について調査しており、この数年、10x Genomics社のプラットフォームを用いた論文が飛躍的に増加していることがわかる。10x Genomics社のプラットフォームは市販であるので導入が容易であり、DropSeqやinDropsに比べ多くの転写産物の検出が可能であるが、それらよりランニングコストは高価である<ref name=Zhang2019><pubmed>30472192</pubmed></ref>。

~~===ニューロンのクラスとタイプ===~~

様々な神経・精神疾患について理解しその診断や治療に役立てるためには、ニューロン、グリア細胞を中心にした神経系にある細胞の「タイプ」を識別し、それぞれの細胞における分子的な変化を観察することが重要である。近年、中枢神経系のグリア細胞にも、多様なアストロサイト、オリゴデンドロサイト、ミクログリアの存在が報告されてきている。一方で、ニューロンは著しく多様であり、このニューロンの多様性こそが、神経系を特徴づけており、その多彩で複雑な機能の発現に必須であることは疑う余地がない。

解剖学的な視点から言えば、すべてのニューロンの存在する位置は異なるので、すべてのニューロンは異なるという見方もできる。しかし、これは極論であり、従来の神経科学では、ニューロンの多様性は、それぞれのニューロンの解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきた。こうしたニューロンの多様性を便宜的に記述するのに、タイプ（type）、クラス（class）、サブクラス（subclass）、サブタイプ（subtype）というような用語が用いられてきた。しかし、本稿では混乱を防ぐため、Masland（2004）の提唱に従い、「クラス」と「タイプ」という単語を用いることとする。タイプは、これ以上分類することができないとされる階層である。例えば、大脳皮質の錐体細胞、網膜神経節細胞といった大雑把な識別は「クラス」と呼ぶ。大脳皮質の錐体細胞というクラスは、層や領野によって「タイプ」が異なるし、網膜神経節細胞には視覚情報によって応答が異なる「タイプ」が存在する。この分類は、免疫組織化学、形態、電気生理学などの技術により識別可能である暫定的なものに過ぎない。本稿で解説するscRNA-seqの技術は、その網羅性からそれぞれのニューロンについてこれまでにないビッグデータを提供することで、このニューロンのタイプの理解に確実な根拠を与えつつある。

~~===大脳===~~

　なお、3’エンドリード法だけでなく、抗体やT細胞レセプターのN末端側に位置する可変領域の配列決定が可能である5'末端のシーケンシングには5’エンドリード法が利用されることがある。

==~~=その他のCNS~~===

==実際==

ここでは主流になっている10x Genomics社のChromium controllerなどのドロップレットを用いた方法とSMART-seqなどを用いた他のプラットフォームに共通する方法の実際について概説する。scRNA-seqの利用には、4つのステップがある（'''図2'''）<ref name=Luecken2019><pubmed>31217225</pubmed></ref><ref><pubmed>30089861</pubmed></ref>。これらのうち、'''2.'''の段階については、上に記述したように市販の機器や試薬を利用する機会が多くなっているので、詳細は説明しない。

[[ファイル:ScFig2d.jpg|サムネイル|500px|'''図２．scRNA-seqの実際のステップ ''' 細胞の単離、ライブラリ作製とNGS、データの前処理から次元圧縮、データ解析。図の一部は2016 DBCLS TogoTV、あるいはSeuratを用いて10x Genomics社の[https://support.10xgenomics.com/single-cell-gene-expression/datasets PBMCデータ]から執筆者が作製。]]

# 個体や組織を採集し、そこから細胞あるいは細胞核を個別に解離された状態にすること。

# ドロップレット法やSMART-seq対応のプラットフォームなどによる個々の細胞からのライブラリーの作製とNGS。

# 得られた配列情報の前処理（preprocessing）。

# データ解析。

===疾患===

===組織からの細胞、細胞核の分離===

~~アルツハイマー、Autism~~

浮遊細胞（[[血液]]細胞など）ではない場合、物理的あるいは酵素処理などによって解離することで、生組織から状態の良い個々に分散した細胞を調製する必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている<ref><pubmed>29970990</pubmed></ref>。ここで、しばしば問題となるのが、酵素処理による短時間加温や機械的刺激で、発現量が変化する遺伝子が存在することである<ref><pubmed>27090946</pubmed></ref>。特に、脳の[[ミクログリア]]の解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった<ref name=Hammond2019><pubmed>30471926</pubmed></ref>。また、このような現象を抑制するために、酵素処理時に転写阻害剤である[[アクチノマイシン]]で処理したり<ref><pubmed>29024657</pubmed></ref>、ヒマラヤ氷河から得られた細菌''Bacillus licheniformis''から得られた低温プロテアーゼを用いる方法も報告されている<ref><pubmed>28851704</pubmed></ref><ref><pubmed>31623682</pubmed></ref>。また、細胞解離後に、[[メタノール]]で固定しscRNA-seqに使用したり<ref><pubmed>28526029</pubmed></ref>、クロスリンカーを用いる方法もある<ref><pubmed>29391536</pubmed></ref>。

===~~網膜==~~=

　単離した細胞は、そのまま10x Genomicsのシングルセル遺伝子発現解析のプラットフォームに導入することができるが、細胞表面分子マーカーに対する[[抗体]]や[[蛍光タンパク質]]レポーターなどを用いたFACS、[[パニング]]、MACS([[磁気ビーズカラム]])などによって、細胞の選択的濃縮や除去を行う場合もある。更に、抗体に抗体表示バーコードDNAをカップリングさせるCITE-seq(Cellular Indexing of Transcriptomes and Epitopes by Sequencing) については、下記の「統合解析」でも述べる。

なお、ヒト組織や希少生物などから生細胞を得ることは困難なことが多い。この場合、scRNA-seqの変法として、凍結した組織から、各細胞由来の核を調製し、核内のmRNAを分析するsnRNA-seq (single-nucleus RNA-seq)が利用されている。ただ、snRNA-seqでは、FACSなどによる特定細胞集団の分離が困難であることが多い。また、細胞質を持つ生細胞を利用したscRNA-seqとは違って、スプライシングの途上にある未成熟な核内転写産物を検出すること、更に検出できる遺伝子数も少なく、同等な結果が必ずしも得られない<ref><pubmed>24248345</pubmed></ref><ref><pubmed>26890679</pubmed></ref> <ref><pubmed>27471252</pubmed></ref><ref name=Habib2017><pubmed>28846088</pubmed></ref><ref><pubmed>29220646</pubmed></ref><ref name=Habib2017><pubmed>28846088</pubmed></ref><ref><pubmed>30586455</pubmed></ref><ref><pubmed>28729663</pubmed></ref><ref><pubmed>31728515</pubmed></ref><ref><pubmed>32341560</pubmed></ref> <ref name=Mereu2020><pubmed>32518403</pubmed></ref>。一方で、snRNA-seqでは、組織をそのまま凍結することから開始することが可能であるので、上述したscRNA-seqの問題である細胞解離酵素による処理などを避けることができる。更に、核を用いることで、大きな細胞体はマイクロ流体力学の流路で詰まりやすいなど、特に神経細胞で顕著である細胞の形状の多様性に伴うバイアスを減らすことができるといったメリットもある。こうしたプロトコールの一部は、protocols.ioのHuman Cell Atlasの[https://www.protocols.io/groups/hca グループ]で公開されている。

通常のscRNA-seqは、ポリアデニル化されたmRNAを検出しているが、MATQ-seq（multiple annealing and dC-tailing-based quantitative single-cell RNA-seq）、RamDA-seqなどを用いると、ポリアデニル化されていないRNAの検出も可能である<ref><pubmed> 28092691</pubmed></ref> <ref><pubmed>29434199 </pubmed></ref>[https://doi.org/10.1101/2020.06.02.131060]。

更に、RNAを分析するscRNA-seqではないが、遺伝子発現状態との関係が想定される[[オープンクロマチン]]領域を[[トランスポゾン]]を用いることで個々の細胞レベルで選択的に検出するsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin) <ref><pubmed>26083756</pubmed></ref><ref><pubmed>29434377</pubmed></ref><ref><pubmed>25953818</pubmed></ref>, single cell THS-seq (transposome hypersensitive-site) <ref><pubmed>29227469</pubmed></ref>や [[DNAメチル化]]領域を観察するsnmC-seq、RRBSのような方法も利用されている<ref name=Lake2018><pubmed>28798132</pubmed></ref><ref><pubmed>30237449</pubmed></ref><ref><pubmed> 20852635</pubmed></ref>。

===展望===

===データ処理の流れ===

====総論====

　Illumina社に代表される次世代シーケンサーを用いて得られた結果は、ベースコールや細胞バーコードを用いたdemultiplexingなどの基礎解析を行うことで、各細胞における遺伝子の発現量のマトリックスを出力する。例えば、10XGenomics社のChromiumプラットフォームを用いた場合、10XGenomics社が提供するCell Rangerの[https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/tutorial_mr mkrefコマンド](Linux上で作動)などにより、各生物種ごとの[https://www.ncbi.nlm.nih.gov/grc レファレンス配列リスト]（マウスやヒトでは既製のものを利用できる）などを参考にしながら、細胞と転写産物量の対応マトリックスを作製する。その後のデータの処理についても、10x Genomics社がソフトウェアLoupeを提供している。しかしながら、その後のデータ解析を考慮して、[[R]], [[Python]], [[MATLAB]]などのデータ解析のための汎用プログラミング言語やコードで扱えるオブジェクトに変換するのが通常である。

　scRNA-seq解析のためには、数多くのツールが公開されている。これらのツールは、バージョンが更新されたり、新しいものに置き換えられることがあるので、実際に利用する場合は最新の動向に注意を払う必要がある。scRNA-seqの解析に必要なツールは、[https://www.scrna-tools.org scRNA-tools], [https://github.com/seandavi/awesome-single-cell Awesome single cell], [https://www.bioconductor.org Bioconductor]などで紹介されており、ほとんどがダウンロード可能である。また、[[bioRxiv]]などの査読前のプレプリントサーバで公開されて、随時試用、評価されていくものが多く、scRNA-seqのデータ（下記参考）とともに、オープンサイエンス実践の好例となっている。

====Seurat====

ここでは、scRNA-seqデータ解析のために最もよく利用されているRを用いたパッケージ「Seurat」<ref name=Butler2018><pubmed>29608179</pubmed></ref> <ref><pubmed> 31178118 </pubmed></ref>を中心に紹介しておきたい。なお、一部の解析操作は、University of WashingtonのCole Trapnell研究室で開発されてきた軌道推定（下記参考）によく使用される[https://cole-trapnell-lab.github.io/monocle3/ Monocle3]でも可能である。Pythonを利用したものでは、ドイツ・ミュンヘンInstitute of Computational Biologyの Fabian Theisらが開発しているScanpyが有名である<ref><pubmed> 29409532</pubmed></ref>。

　一般的な方法としては、重鎖抗体を産生する動物を飼育し、それを抗原で免疫することで、重鎖抗体が得られる。比較的小型のリャマのほかに、アルパカ、ヒトコブラクダ、小型の[[wj:~~ネコザメ|ネコザメ~~]]~~（''Heterodontus francisci''）などが免疫に利用されている。~~

　New York UniversityのRahul Satija研究室が開発しているSeurat（画家スーラに由来）は、scRNA-seqデータ解析のために広く利用されているRパッケージであり、2020年秋現在、Seurat4のβバージョンが公開されている。論文の正式発表前から、サポート情報提供やコード修正なども頻繁に行っており、Satija研究室の[https://satijalab.org/seurat/ ウェッブサイト]、[https://github.com/satijalab/Seurat Github]、更に[https://twitter.com/satijalab Twitterアカウント]などで最新情報を得ることできる。

次に免疫された動物から血液を採集し、その中にある[[wj:B細胞|B細胞]]から、可変領域を含むcDNAライブラリーをM13ファージを使った[[ファージディスプレイ]]ライブラリーに組み込み、固定化した抗原を使ったスクリーニングすることで、cDNA配列を単離し、抗原に結合するナノボディ配列を知ることができる<ref><[[pubmed]]>~~24577359~~</pubmed></ref><ref><pubmed>~~19554288~~</pubmed></ref>~~。ラクダ科動物の遺伝子を組み込んだマウスも開発されているが、その利用は一般的ではないようである~~<ref><pubmed>~~16148123~~</pubmed></ref><ref><pubmed>~~17015837~~</pubmed></ref>。

====品質の検討事項====

最初に行うのは、scRNA-seqデータの品質管理である。ここでは、質の低い細胞のデータ（例えば、壊れた細胞では、転写産物の種類が少なくミトコンドリア由来の転写産物が多い）を取り除く。また、複数の試料を組み合わせる場合には、バッチごとの違いについて検討する<ref><pubmed>29608177</pubmed></ref><ref><pubmed> 28045081</pubmed></ref><ref><pubmed>31948481</pubmed></ref> <ref><pubmed>32854757</pubmed></ref>。現実には、実験ごとのバッチの違いによる影響（Batch effect）がscRNA-seqの最大の問題であると示されてきており、試料の処理を同時に行うなど実験デザインを工夫する必要がある<ref><pubmed>29121214</pubmed></ref>。

~~このスクリーニングを効果的に行うための工夫が多数開発されてきている~~<ref><pubmed>~~29477934~~</pubmed></ref>~~。ファージディスプレイの担体の工夫、~~[[w:~~Staphylococcus carnosus|''Staphylococcus carnosus''~~]]のような[[wj:グラム陽性菌|グラム陽性菌]]表面へのディスプレイ、酵母細胞表面へのディスプレイ、[[mRNAディスプレイ]]、[[リボソームディスプレイ]]、細胞内での[[2ハイブリッドスクリーニング]]などが用いられてきている。

また、ドロップレットを使用するscRNA-seqでしばしば問題になるのが、ドロップレットに２つ以上の細胞が封じ込められ、それらが同一のCell barcodeを持ってしまうアーティファクトである。通常「Doublet」「Multilet」と呼ばれるこの問題はデータ解析を混乱させるので、細胞単離の段階から注意する必要があるが、scRNA-seqデータ取得後にもデータ処理で解決できる可能性もある<ref><pubmed>30954476</pubmed></ref><ref><pubmed>30954475</pubmed></ref> <ref><pubmed>31693907</pubmed></ref><ref><pubmed>32592658</pubmed></ref> <ref><pubmed>29227470</pubmed></ref><ref><pubmed>31836005</pubmed></ref><ref><pubmed>31856883</pubmed></ref><ref><pubmed>30567574</pubmed></ref> <ref><pubmed>31266958</pubmed></ref><ref><pubmed>32366989</pubmed></ref><ref><pubmed>33338399</pubmed></ref>[https://doi.org/10.1101/2019.12.17.879304]。なお、この手法を利用することで、バッチ効果を抑えるために、異なるバーコードを持つ複数の試料を混ぜて一つの試料として扱い、計算機的に再び分離、解析する手法が注目されている<ref><pubmed>32483174</pubmed></ref>。

特に、最近、これらの方法を組み合わせることで、効率的に行う戦略が考案されている。Fridyらは、免疫動物の結合抗体を精製しその質量スペクトルの結果とファージディスプレイのハイスループットな配列決定を組み合わせる方法で、蛍光タンパク質に結合する多数のナノボディを報告した<ref><pubmed>~~25362362~~</pubmed></ref>~~。Zimmermann は、リボソームディスプレイ、ファージディスプレイ、ELISAを組み合わせることで、短期間にナノボディ配列を得る戦略を報告している~~<ref><pubmed>29792401</pubmed></ref>。また、McMahon らは、酵母ディスプレイを用いて、免疫動物を用いない合成ライブラリーをスクリーニングすることで親和性の高いナノボディ配列を得ることができることを示している<ref><pubmed>29434346</pubmed></ref> 。

scRNA-seqデータの次のノイズは、ある遺伝子の発現が低いために、本来同じタイプの細胞であっても、その遺伝子の発現が全く見られない「Dropout」と呼ばれる現象であり解析に影響を与えるので、これについても検討が必要である<ref><pubmed>24056876

</pubmed></ref><ref><pubmed>32127540</pubmed></ref>。

ただ、このような非免疫ライブラリーや合成ライブラリーを用いる方法については、まだ適用例が多くなく、標準的な方法とされるものが存在しないというのが実情であろう。また、ある程度の抗原親和性を示すナノボディの配列を調整することで、親和性の成熟（affinity maturation）を行うこともできる<ref><pubmed>~~15777944~~</pubmed></ref> 。

====次元圧縮====

このような品質管理、ノーマライゼーションの過程を経て<ref><pubmed>28504683</pubmed></ref>、scRNA-seqのデータ解析において、最初に行うのが、[[次元圧縮]] (dimensionality reduction)である<ref><pubmed>30617341</pubmed></ref><ref><pubmed>31780648</pubmed></ref><ref><pubmed>31955711</pubmed></ref><ref><pubmed>31823809</pubmed></ref>。主成分分析 (Principal component analysis, PCA)、更に発展させた均一マニフォールド近似と投影(Uniform Manifold Approximation and Projection, UMAP)、Diffusion maps<ref><pubmed> 26002886

</pubmed></ref>, t分布型確率的近傍埋込み (t-distributed Stochastic Neighbor Embedding, tSNE)などの手法が用いられる。特に、[http://www.jmlr.org/papers/v9/vandermaaten08a.html tSNE]と[https://arxiv.org/abs/1802.03426 UMAP]は、高次元データを低次元の点の集合として可視化することで、それぞれの細胞の持つ遺伝子発現状態の類似度についての直観的な表示が可能でありしばしば用いられる（'''図3'''）。tSNEよりUMAPの方が迅速に類似集団間の関係が明確になるので、最近はUMAPを利用することが多くなってきている。次に、[[Louvainアルゴリズム]]などでクラスタリング（[[コミュニティ分割]]）を行いグラフ上に表示できる（'''図3'''の色分け）。こうして、異なる転写状態を示す細胞の集合が別のクラスターとして表示され、同定可能になる<ref><pubmed>31500660</pubmed></ref>。

[[ファイル:scFig3.jpg|サムネイル|250px|'''図３． tSNEとUMAPによる同じデータの可視化''' 網膜（ニワトリ）の視細胞のデータを用いて執筆者が作製<ref name=Yamagata2021><pubmed>33393903</pubmed></ref>。]]

~~将来的には人工知能などを使ったナノボディのデザインなども可能になるのかもしれない~~<ref><pubmed>~~29672675~~</pubmed></ref><ref><pubmed>~~28953867~~</pubmed></ref>。

==データ解析==

===細胞クラスターの解釈とマーカー遺伝子候補の発見===

scRNA-seqデータから得られる生物学的知見には、内在的に存在する細胞の種類、外部刺激や環境で変化した細胞の状態、そして種類や変化により特徴的に発現するマーカー遺伝子候補の発見がある<ref><pubmed>27824854</pubmed></ref><ref><pubmed>32033589</pubmed></ref>。クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスター（群）に特徴的に発現している具体的な遺伝子を探索し、細胞集団の持つバイオマーカーによって、そのクラスター（群）の同定が可能になる。例えば、既に神経細胞とグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、神経細胞のタイプ（下記参考）を区別できるマーカーや、外部刺激によって遺伝子発現状態が変化した神経細胞の状態は、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子（差次的発現遺伝子）を見つけるためには（Differential expression analysis, DE analysis）、SeuratのFindMarkersコマンド中でも利用可能であるコード（MAST、DESeq2など<ref><pubmed>26653891</pubmed></ref><ref><pubmed>25516281</pubmed></ref><ref><pubmed>30658573</pubmed></ref>）を用いることができる。細胞ごとの差次的発現遺伝子のVisualization（表示可視化）には、[[ドットプロット]]（dot plot）、[[ヴァイオリンプロット]]（violin plot）、[[リッジプロット]]（Ridge plot, joy plot）、UMAPなどの次元圧縮図上に転写物量をプロットするFeatureプロット（feature plot）などが、目的に応じて頻繁に用いられる（'''図4'''）。

[[ファイル:scFig4.jpg|サムネイル|300px|'''図４．scRNA-seqデータの可視化の例 ''' A. ドットプロット。B.ヴァイオリンプロット。C. リッジプロット。D. UMAP（灰色）に転写物量（青）をプロットした Featureプロット。網膜の視細胞のデータを用いて執筆者が作製<ref name=Yamagata2021></ref>。]]

===擬時系列解析===

実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、[[細胞周期]]、[[概日リズム]]、発現変動が大きい破裂型[[プロモーター]]の作動などの理由で変動が見られるものもある<ref name=Luecken2019><pubmed>31217225</pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上にある[[細胞系譜]]や[[細胞分化]]といった細胞の遷移状態の解析（[[軌道推定]]（Trajectory inference）；[[擬時系列解析]]（擬似時系列解析）、Pseudo-time analysis）には、scRNA-seqデータを用いることが効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref>。しばしば用いられるMonocle3 <ref><pubmed>30787437</pubmed></ref>[https://cole-trapnell-lab.github.io/monocle3/]など、多くのコードを収集、比較しているサイトがある [https://dynverse.org][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといったスプライシングされていく転写産物の量から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref><ref><pubmed> 32747759</pubmed></ref>。しかし、これらの方法は、あくまで細胞系譜や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNA-seqを行うことで、細胞タイプの系統関係を調べる方法として、[[CRISPR-Cas9]]を用いた[[ゲノム編集]]による痕跡追跡記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>、あるいはアデノシンデアミナーゼでRNA編集を行いタイムスタンプを入れる方法<ref><pubmed>33077959</pubmed></ref>がある。[[1塩基バリアント]]（Single-nucleotide variants: SNV）の系統的解析は、細胞の不均一性や系統的な関係を明らかにするための最も有望なアプローチの一つである<ref><pubmed>31744515</pubmed></ref>。

===遺伝子制御ネットワーク、パスウェイ解析など===

また細胞分化や刺激などによる変動に伴う特徴的な遺伝子発現状態をscRNA-seqで観察することは、[[遺伝子制御ネットワーク]]（例、[https://github.com/aertslab/SCENIC SCENIC]<ref><pubmed>28991892</pubmed></ref>）、[[代謝経路]]や[[シグナル伝達系]]のための[[パスウェイ解析]](例、Metascape<ref><pubmed>30944313</pubmed></ref>, [http://metascape.org]、Gene Ontolgoy[http://geneontology.org])を理解するシステム生物学的な研究として有用である<ref><pubmed>32051003</pubmed></ref>。更に、scRNA-seqで得られた結果をもとに、細胞間相互作用の理解を深めるのを目的とするCellPhoneDB<ref><pubmed>32103204</pubmed></ref>[https://github.com/Teichlab/cellphonedb]、NicheNet<ref><pubmed>3181926</pubmed></ref>、SVCA<ref><pubmed>31577949</pubmed></ref>などがある。特に、Perturb-seq<ref><pubmed>27984732</pubmed></ref> やその変法<ref><pubmed> 32231336</pubmed></ref>は、CRISPRライブラリーによるゲノム編集を施した細胞をscRNA-seqで解析することで、ゲノム編集で破壊された遺伝子の機能や遺伝子間の相互作用の理解を可能にしている後述する複数モダリティ情報を取り込んだscRNA-seqの１つであり、注目されている。

~~通常、ナノボディは、目的別に発現ベクターにクローニングした後、哺乳類細胞だけなく、~~[[~~wj:細菌|細菌~~]]、[[~~wj:酵母|酵母~~]]、[[~~wj:植物|植物~~]]~~でも産生させることができる。哺乳類細胞では、抗体が本来機能する細胞外だけでなく、細胞内部でも発現させることが可能である（~~[[~~ナノボディ#イントラボディ、クロモボディ|イントラボディ~~]]~~）。ただし、ナノボディの配列はそれぞれ異なり、~~[[~~wj:ジスルフィド結合|ジスルフィド結合~~]]の生成が抗原との結合力あるコンフォメーションを取るために必要な場合、細胞外とは還元環境の異なる細胞内や細菌などでは活性のあるものが産生できないものもある。ナノボディの中には90℃という高温でも失活しないものもあるように<ref><pubmed>~~10209277~~</pubmed></ref><ref><pubmed>~~24739391~~</pubmed></ref>~~、一般に安定性は高いが、これも各ナノボディのアミノ酸配列から生じる特性による。~~

==神経科学研究への適用==

===神経系細胞ビッグデータとしてのscRNA-seq===

様々な神経・精神疾患について理解しその診断や治療に役立てるためには、神経細胞、[[グリア細胞]]を中心にした神経系にある細胞の種類や状態を識別し、それぞれの細胞における分子的な変化を観察することが重要である <ref><pubmed>28775344</pubmed></ref><ref><pubmed>29738987</pubmed></ref>。本項目で解説してきたscRNA-seq技術は、神経系に見られるそれぞれの細胞のトランスクリプトームについて[[ビッグデータ]]を提供することで、この細胞の種類や状態の識別に新たな判断材料を与えつつある。近年、中枢神経系の[[アストロサイト]]、[[オリゴデンドロサイト]]、[[ミクログリア]]といった[[グリア細胞]]も均一ではなく、内在的な多様性や外部因子による状態の変動が報告されてきている。神経細胞は、著しく多様であり、この多様性が神経系の多彩で複雑な機能発現の基盤となっている。従来の神経科学では、神経細胞の多様性は、それぞれの神経細胞の解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきている。こうした神経細胞の多様性を便宜的に記述するのに、タイプ（type）、クラス（class）、サブクラス（subclass）、サブタイプ（subtype）というような用語が用いられてきた。しかし、ここでは混乱を防ぐため、Masland（2004）<ref><pubmed>15242626</pubmed></ref>が提唱し、広く受けいれられている「クラス」と「タイプ」という単語を用いることとする<ref name=Yuste2020><pubmed>32839617</pubmed></ref>。タイプは、これ以上分類することができないとされる階層であり、共通性を持つタイプの集団がクラスである。例えば、[[大脳皮質]]の[[錐体細胞]]、[[網膜神経節細胞]]といった大雑把な区分はクラスである。大脳皮質の錐体細胞というクラスは、層や領野によって異なるタイプ、網膜神経節細胞には視覚情報に対して応答が異なるタイプが存在する。scRNA-seqは、「タイプ」の理解に新たな視点を提供している。

===神経系へのscRNA-seqの適用===

　scRNA-seqの神経系での利用については、次々と新しい論文やプレプリントが発表されており、ここではscRNA-seqで得られてきた情報の典型例を紹介することにとどめる。

==~~=既知ナノボディ===~~

大脳皮質には、錐体細胞や[[非錐体細胞]]などの神経細胞や様々なグリア細胞などが見られ、古くから神経細胞タイプの識別が行われてきた。初期のFluidigm C1を用いたscRNA-seq技術でも、マウス皮質の小規模な細胞数を分類した研究で、これまで知られていた主要な神経細胞タイプとは違うタイプが見つかりscRNA-seqの有効性が示された<ref><pubmed>25700174</pubmed></ref>。その後のドロップレット使用の3’エンドリード法を利用した多数の細胞数の解析で、更に多数の神経細胞のタイプが見つかっている<ref name=Yuste2020><pubmed>32839617</pubmed></ref><ref name=Habib2017><pubmed>28846088</pubmed></ref><ref><pubmed>30096299</pubmed></ref><ref><pubmed>30096314</pubmed></ref><ref><pubmed>30382198</pubmed></ref><ref><pubmed>29320739</pubmed></ref><ref><pubmed>33338423</pubmed></ref>[https://doi.org/10.1101/2020.06.04.105700] [https://doi.org/10.1101/2020.07.02.184051]。特に、[[GABA]]作動性[[介在神経細胞]]タイプの多様性とその発生<ref><pubmed>28942923</pubmed></ref><ref><pubmed>28134272</pubmed></ref><ref><pubmed>29472441</pubmed></ref><ref><pubmed>29513653</pubmed></ref>についての、これまでの組織化学的な研究からは得られていなかった多くの情報は重要であろう。また、初期の発生過程<ref><pubmed>26940868</pubmed></ref><ref><pubmed>30485812</pubmed></ref><ref><pubmed>31073041</pubmed></ref><ref><pubmed>30635555</pubmed></ref><ref><pubmed>30625322</pubmed></ref>、老化<ref><pubmed>31551601</pubmed></ref>の理解が、scRNA-seq技術を利用することで進んでいる。更に、[[神経活動]]や[[臨界期]]に伴い変化するmRNAも細胞ごとに調査され興味深い<ref><pubmed>29230054</pubmed></ref> <ref><pubmed>32404418</pubmed></ref>。

~~ナノボディの情報を系統的に収集してきている中国の南京にある~~[~~[wj~~:~~東南大学|東南大学]~~]の[~~http~~://~~ican~~.~~ils~~.~~seu~~.~~edu~~.~~cn iCAN (Institute Collection & Analysis of Nanobody)~~]<ref><pubmed>~~29041922~~</pubmed></ref>~~には、2018年8月現在、約2400のナノボディ配列が登録されている。~~

　１つのナノボディは、120アミノ酸（cDNAとして360bp）ほどなので、クローニングなどに利用するための配列を付加しても500bp未満の長さに収めることができる。したがって、利用したい特定ナノボディのアミノ酸配列がわかっていれば、いくつかの民間会社が提供している長鎖DNAを化学合成するサービスなどを利用することで短期間のうちにcDNA配列が入手可能である。

ヒトを含めた[[霊長類]]の大脳についても発達段階を含めてscRNA-seqが適用されてきている<ref><pubmed>26060301</pubmed></ref><ref><pubmed>27339989</pubmed></ref><ref name=Zhong2018><pubmed>29539641</pubmed></ref><ref name=Nowakowski2017><pubmed>29217575</pubmed></ref><ref name=Habib2017><pubmed>28846088</pubmed></ref><ref><pubmed>29227469</pubmed></ref><ref><pubmed>31303374</pubmed></ref><ref><pubmed>29867213</pubmed></ref><ref><pubmed>31435019</pubmed></ref><ref><pubmed>32424074</pubmed></ref> <ref><pubmed>32999462</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972][https://doi.org/10.1101/2020.04.23.056390]。ヒトや霊長類に特徴的とされる[[島]]の[[von Economo神経細胞]]（[[紡錘細胞]]）のような希少な神経細胞のscRNA-seqにも成功している<ref><pubmed>32127543</pubmed></ref>。

=~~==修飾===~~

[[海馬]]<ref><pubmed>29241552</pubmed></ref><ref><pubmed>29912866</pubmed></ref><ref><pubmed>29335606</pubmed></ref><ref><pubmed>31942070</pubmed></ref>では、これまでの研究で記載されてきた神経細胞のタイプの存在が確認され、更に新規のタイプが見つかった。中枢神経系では、その他、[[外側膝状体]]<ref><pubmed>29343640</pubmed></ref>、[[大脳基底核]]<ref><pubmed>28384468</pubmed></ref>、[[視床下部]]<ref><pubmed>28166221</pubmed></ref><ref><pubmed>28355573</pubmed></ref> <ref><pubmed>27991900</pubmed></ref><ref name=Moffitt2018><pubmed>30385464</pubmed></ref> <ref><pubmed>31249056</pubmed></ref><ref><pubmed>30858605</pubmed></ref>、[[線条体]]<ref><pubmed>27425622</pubmed></ref><ref><pubmed>30134177</pubmed></ref><ref><pubmed>31875543</pubmed></ref>、[[中脳]]<ref><pubmed>27716510</pubmed></ref><ref><pubmed>29499164</pubmed></ref><ref><pubmed>30718509</pubmed></ref>、[[手綱核]]<ref><pubmed>29576475</pubmed></ref>、発生中の[[間脳]]<ref><pubmed>30872278</pubmed></ref> 、さらに[[小脳]]<ref><pubmed>30220501</pubmed></ref><ref><pubmed>30735127</pubmed></ref><ref><pubmed>30690467</pubmed></ref>などの結果が報告されてきている。例えば、構成する細胞についての情報が詳細に研究されてきたと思われていたマウスの小脳においても、分子層にこれまでの[[星状細胞]]、[[バスケット細胞]]というカテゴリーとは違った[[ギャップジャンクション]]に特徴を持つ２種類の神経細胞があることが示唆されている<ref><pubmed>24259518</pubmed></ref>。

　ナノボディだけでは通常の抗体と違い定常領域を欠いているため、何らかの修飾が必要である。このことはナノボディが抗体のように簡便に利用できないという不便さになっているが、修飾を実験に合わせて自在に工夫できるという利点にもなっている。また、余分な構造を持たないので、バックグラウンドを低下させ、感度や精度の高い解析が可能になるという長所もある。

==~~==化学的カップリング====~~

脳の外部では、[[運動神経]][https://doi.org/10.1101/2020.03.16.992958]、[[感覚神経]]<ref><pubmed>25420068</pubmed></ref><ref><pubmed>26691752</pubmed></ref>、[[らせん神経節]]<ref><pubmed>30078709</pubmed></ref><ref><pubmed>30209249</pubmed></ref> 、[[嗅覚神経]]<ref><pubmed>26541607</pubmed></ref><ref><pubmed>32059767</pubmed></ref>、[[腸神経系]] <ref><pubmed>29483303</pubmed></ref><ref><pubmed>33288908</pubmed></ref>、[[網膜]]<ref><pubmed>27565351</pubmed></ref><ref name=Konstantinides2018><pubmed>29909983</pubmed></ref><ref><pubmed>30018341</pubmed></ref><ref><pubmed>31260032</pubmed></ref><ref><pubmed>31128945</pubmed></ref><ref name=Peng2019><pubmed>30712875</pubmed></ref><ref><pubmed>30548510</pubmed></ref><ref><pubmed>31075224</pubmed></ref><ref><pubmed>31399471</pubmed></ref><ref><pubmed>31848347</pubmed></ref><ref><pubmed>31673015</pubmed></ref><ref><pubmed>31653841</pubmed></ref><ref><pubmed>31784286</pubmed></ref>[https://doi.org/10.1101/2020.02.26.966093]<ref><pubmed>32386599</pubmed></ref>[https://www.biorxiv.org/content/10.1101/617555v2]<ref name=Yamagata2021></ref><ref>'''Shekhar K, Sanes JR (2021)'''. Generating and using transcriptomically based retinal cell atlases. Annu Rev Vis Sci 7: (in press)</ref>でのscRNA-seqデータがある。

免疫組織化学に最もよく用いられているのは、ナノボディをタンパク質として精製後、色素分子などを化学的にカップリングするという方法である。このような試薬は既製のナノボディ試薬として市販もされている（例、ChromoTek社<ref>https://www.~~chromotek~~.~~com~~/</ref> ~~）。最近、1次抗体を認識する「2次抗体」の活性を持つナノボディが報告されている~~<ref><~~pubmed~~>~~29263082~~<~~/pubmed~~></ref> ~~。ナノボディの多くは、大腸菌で活性あるものを大量産生、精製することができるので、一度、配列がわかれば、動物を使用する必要がなくなる。~~

~~また、化学的なカップリングなので、カップリングする分子を変化させ工夫することで、目的に合わせて様々な標識ナノボディ（薬剤を結合した~~[[~~wj:武装抗体|武装抗体~~]]~~など）を作製できる可能性がある~~<ref><pubmed>~~28883823~~ </pubmed></ref> 。しかし、カップリングによるアミノ酸残基を修飾する反応により抗原結合能を失うことも想定される。この問題については、修飾するアミノ酸残基の位置を制御することで解決は可能である<ref><pubmed>~~26633879~~</pubmed></ref> 。

また[[iPS細胞]]や[[ES細胞]]由来の神経組織[[オルガノイド]]に含まれる神経細胞タイプを知る上でも利用されている<ref><pubmed>28094016</pubmed></ref><ref><pubmed>28279351</pubmed></ref><ref><pubmed>31168097</pubmed></ref><ref><pubmed>31996853</pubmed></ref><ref><pubmed>31968264</pubmed></ref><ref><pubmed>32221280</pubmed></ref>。このようなアプローチは、[[ネアンデルタール人]]型の遺伝子を持つ脳オルガノイドの解析<ref><pubmed> 32559457</pubmed></ref>やSARS-CoV-2に感染する脳オルガノイド中の細胞の同定<ref><pubmed> 33113348</pubmed></ref>など、新たな応用例が発表されてきており興味深い。

~~====RANbody====~~

化学的カップリング反応は、しばしばナノボディの活性を消失させるが、実験的にも条件決定など必ずしも容易ではない。この問題を克服するために開発されたプラットフォームがRANbody（Receptor-~~and~~-~~Nanobody)である~~<ref ~~name=yamagata2018~~><pubmed>~~29440485~~</pubmed></ref>。

~~RANbodyは、１つのナノボディを酵素（改良型~~[[wj:~~西洋ワサビペルオキシダーゼ|西洋ワサビペルオキシダーゼ~~]] HRP）、抗原性のあるニワトリ抗体IgYのFc断片、あるいは多重エピトープタグなどのうち1つと、組み換えDNA技術により融合させることで、検出可能にしたものである。プラスミドを293T細胞などの動物細胞に導入するだけで、培地中に放出されるので多くの生物医学系の実験室で利用できる。HRPは大腸菌の中では活性のある酵素として発現させることができない。その一つの解決策として、[[~~アスコルビン酸オキシダーゼ~~]] ([[~~APEX2~~]])~~との融合タンパク質を大腸菌で発現させて用いることができるが、APEX2はHRPに比べて活性が弱い~~<ref><pubmed>~~29915061~~</pubmed></ref><ref><pubmed>~~25419960~~</pubmed></ref> 。

===神経細胞以外の細胞===

[[上衣細胞]]<ref><pubmed>29727663</pubmed></ref>は、[[神経幹細胞]]としての役割が示唆されてきたが、scRNA-seqによる解析ではその可能性が支持されなかった。グリア細胞では、[[ラジアルグリア]]<ref><pubmed>26406371</pubmed></ref><ref><pubmed>25734491</pubmed></ref><ref><pubmed>29281841</pubmed></ref><ref name=Nowakowski2017><pubmed>29217575</pubmed></ref><ref name=Zhong2018><pubmed>29539641</pubmed></ref>、アストロサイト<ref><pubmed>32139688</pubmed></ref><ref><pubmed>32203496</pubmed></ref>[https://doi.org/10.1101/2020.04.27.064881]に多様性があることが示唆されてきている。また、オリゴデンドロサイト<ref><pubmed>27284195</pubmed></ref><ref><pubmed>30078729</pubmed></ref><ref name=Avey2018><pubmed>30257220</pubmed></ref><ref name=Jäkel2019><pubmed>30747918</pubmed></ref><ref><pubmed>31958186</pubmed></ref>[https://doi.org/10.1101/2020.03.06.981373]については、これまで細胞生物学的に研究されてきた分化の過程がscRNA-seqにより詳細に解析されている。ミクログリアは、神経系の発達、老化、損傷などに伴う重要な遺伝子発現状態の変化がscRNA-seqにより詳細に明らかになった<ref><pubmed>27338705</pubmed></ref><ref name=Mathys2017><pubmed>29020624</pubmed></ref><ref><pubmed>30206190</pubmed></ref><ref name=Hammond2019><pubmed>30471926</pubmed></ref><ref><pubmed>31209379</pubmed></ref><ref><pubmed>31835035</pubmed></ref>。また、[[CNS境界関連マクロファージ]](BAM) <ref><pubmed>31061494</pubmed></ref>や[[脳血管系]]<ref><pubmed>29443965</pubmed></ref>のscRNA-seqも実施されている。

===疾患===

　scRNA-seqは、疾患の理解にも有用である。scRNA-seqでは、疾患に伴う遺伝子発現状態の変化を細胞タイプごとに観察することができるので、バルクRNA-seqでは埋もれていた遺伝子発現状態の変化や細胞ごとの変化を検出できるという長所がある。

例えば、[[筋萎縮性側索硬化症]]<ref name=Maniatis2019><pubmed>30948552</pubmed></ref>、[[多発性硬化症]]<ref name=Jäkel2019><pubmed>30747918</pubmed></ref><ref><pubmed>30420755</pubmed></ref><ref><pubmed>32313246</pubmed></ref>、[[アルツハイマー病]]やそのモデル動物<ref><pubmed>31042697</pubmed></ref><ref><pubmed>31399126</pubmed></ref><ref name=Mathys2017><pubmed>29020624</pubmed></ref>

[https://doi.org/10.1101/628347]<ref><pubmed>28602351</pubmed></ref><ref><pubmed>32341542</pubmed></ref>、[[統合失調症]]<ref><pubmed>29785013</pubmed></ref><ref><pubmed>32203495</pubmed></ref>、[[てんかん]]<ref><pubmed> 33028830</pubmed></ref>、[[自閉症]]や[[レット症候群]]<ref><pubmed>31097668</pubmed></ref><ref><pubmed>30455458</pubmed></ref>、[[シャルコー・マリー・トゥース病]]<ref><pubmed>29888333</pubmed></ref>、[[ダウン症]][https://www.biorxiv.org/content/10.1101/2020.01.01.892398v1]、[[パーキンソン病]]<ref><pubmed>30503143</pubmed></ref><ref><pubmed>32826893</pubmed></ref>、[[ハンチントン病]]<ref><pubmed>32070434</pubmed></ref>、[[がん]]<ref><pubmed>31327527</pubmed></ref><ref><pubmed>28360267</pubmed></ref>などに適用されている。最近、Perturb-seqにより、[[自閉症]]に関わる遺伝子の欠損に伴う細胞状態の変化などもscRNA-seqで報告されており<ref><pubmed>33243861</pubmed></ref>、疾患の理解のための新たな実験系の開発も始まりつつある。

==scRNA-seqの展望==

===神経系の多様性と進化===

NGSを用いることで、どんな生物種にも適用可能なscRNA-seqは、既に多様な生物の神経系の細胞の理解、更には種間の相同性や差異の研究に利用されており、神経系の進化を細胞レベルで考察するのに有用であろう（例、[[線虫]]<ref name=Cao2017><pubmed>28818938</pubmed></ref>、[[ショウジョウバエ]]<ref><pubmed>29909982</pubmed></ref><ref><pubmed>29149607</pubmed></ref><ref><pubmed>30703584</pubmed></ref><ref name=Konstantinides2018><pubmed>29909983</pubmed></ref><ref><pubmed>33125872</pubmed></ref>、[[カタユウレイボヤ]]''Ciona intestinalis''<ref><pubmed>30069052</pubmed></ref><ref><pubmed>30228204</pubmed></ref>、[[ゼブラフィッシュ]]<ref><pubmed>31018142</pubmed></ref><ref><pubmed>30929901</pubmed></ref>、[[アカミミガメ]]''Trachemys scripta elegans''、[[トカゲ]]''Pogona vitticeps'', PV<ref><pubmed>29724907</pubmed></ref>、[[ニワトリ]]<ref name=Yamagata2021></ref>、[[霊長類]]<ref><pubmed>30730291</pubmed></ref><ref><pubmed>31619793</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972]）。ただ、遺伝子やトランスクリプトームの研究が進んでいる生物種では比較的容易であるが、遺伝子のアノテーションが十分でない生物種を用いる場合、scRNA-seqのデータ解析は困難を伴う。また種を超えた細胞タイプの相同性の理解には様々な工夫が必要である<ref><pubmed>31552245</pubmed></ref><ref name=Peng2019><pubmed>30712875</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972]。

===データベースと統合===

獲得されたscRNA-seqのデータは様々な目的で利用できるので、データベース化し利用できるようにする必要がある。神経系のトランスクリプトーム一般のデータベースが多数公開されており<ref><pubmed>29437890</pubmed></ref>、scRNA-seqのデータも基本的にNCBIの[https://www.ncbi.nlm.nih.gov/geo/ Gene Expression Omnibus]に登録されている。また、オープンサイエンス推進のためにcommon coordinate framework (CCF) やcentral annotation platform (CAP)という概念のもと、特にscRNA-seqを意識したものとして、米国のBRAIN Initiative Cell Census Consortium<ref><pubmed>29096072</pubmed></ref>、Human Cell Atlas Projectの[https://data.humancellatlas.org Human Cell Atlas Data Portal]、そのマウス版である[https://genome.ucsc.edu/cgi-bin/hgTrackUi?db=mm10&g=tabulaMuris Tabula Muris]<ref><pubmed>30283141</pubmed></ref>やSten Linnarssonラボの[http://mousebrain.org マウス脳発生データベース]、アレン脳研究所の[https://portal.brain-map.org Allen Brain Atlas]、ブロード研究所の[https://singlecell.broadinstitute.org/ Single Cell Portal]などのデータベースが稼働している。また、異なった方法や実験で得られたscRNA-seqのデータや後述の複数モダリティのシングルセルオミクスのデータを体系的に比較することも重要であり、CCA (Canonical correlation analysis)<ref name=Butler2018><pubmed>29608179</pubmed></ref>, Seurat 3.0以降に組み込まれたMMN (Mutual Nearest Neighbors)、LIGER<ref><pubmed>31178122</pubmed></ref> 、Harmony<ref><pubmed>31740819</pubmed></ref> 、MetaNeighber<ref><pubmed>29491377</pubmed></ref>、Conos<ref><pubmed>31308548</pubmed></ref>[https://doi.org/10.1101/2020.05.22.111161]のようなアルゴリズムが開発され、後述の複数モダリティのシングルセルオミクスを組み込んだ[https://biccn.org 統合サイト]もでき始めている。またデータベースを利用して発現類似性検索も研究されている<ref><pubmed>29608555</pubmed></ref><ref><pubmed>30744683</pubmed></ref>。

===空間トランスクリプトミクス===

多数の細胞を扱うscRNA-seqの弱点は、組織から細胞や細胞核を解離する必要があるので、その細胞が存在していた解剖学的あるいは空間的な位置の情報を消去してしまうということである。組織切片におけるタンパク質などの分布は[[免疫組織化学]]、mRNAの分布はin situ hybridizationで検出することができるが、数多くのmRNAの分布を情報処理技術と組み合わせ一気に同定する方法がscRNA-seqと同様に開発されてきている（Slide-seq<ref><pubmed>30923225</pubmed></ref><ref><pubmed> 33288904</pubmed></ref>、HDST<ref><pubmed>31501547</pubmed></ref>、Expansion sequencing[http://doi.org/10.1101/2020.05.13.094268]など<ref><pubmed>27365449</pubmed></ref>, <ref><pubmed>31932730</pubmed></ref><ref name=Maniatis2019><pubmed>30948552</pubmed></ref>）、更に10x Genomics社が市販するVisium（現時点ではシングルセルレベルではない）などがある。現状では、大きな組織の空間トランスクリプトミクスは、空間解像度は限定されており、技術普及の観点からも課題が多い。しかし、そのデータを解析するためのアルゴリズム<ref><pubmed>29553578</pubmed></ref><ref><pubmed>29553579</pubmed></ref><ref><pubmed>32350282</pubmed></ref>[https://doi.org/10.1101/757096][https://doi.org/10.1101/701680][https://doi.org/10.1101/431957]、更にMerFish <ref><pubmed>25858977</pubmed></ref>、corrFISH<ref><pubmed>27271198</pubmed></ref>のように、subcellularレベルで多数のmRNAを検出する方法が多数開発されてきており（<ref><pubmed>25549890</pubmed></ref> osmFISH<ref><pubmed>30377364</pubmed></ref>、STARmap (spatially-resolved transcript amplicon readout mapping) <ref><pubmed>29930089</pubmed></ref>、seqFISH+<ref><pubmed>27764670</pubmed></ref>、pciSeq(probabilistic cell typing by in situ sequencing)[https://doi.org/10.1101/431957]、DSP(Digital Spatial Profiling) <ref><pubmed>32393914</pubmed></ref>、scRNA-seqと組み合わせることで、その弱点を補う空間トランスクリプトミクスにも利用され始め<ref name=Moffitt2018><pubmed>30385464</pubmed></ref>[https://doi.org/10.1101/2020.06.04.105700]、今後の発展が期待される分野である<ref><pubmed>32702314</pubmed></ref>。

===統合解析 ===

同一の細胞からscRNA-seqの情報だけでなく、ゲノム配列、ATAC-seqなどによる[[エピゲノム]]解析、少数のタンパク質、あるいは[[プロテオーム]]など複数のモダリティを同時に観察するオミクス（Single-cell multimodal omics）が注目されている<ref><pubmed>31907462</pubmed></ref><ref><pubmed>30696980</pubmed></ref>。2019年には、Nature Methodsの「Methods of the Year」に選ばれており、現状については、その特集号などを参考にされたい。例えば、細胞表面に提示されているマーカー分子に対する抗体にDNAを付加することで、そのマーカーを発現する細胞のトランスクリプトームを解析するCITE-seq<ref><pubmed>28759029</pubmed></ref>、 REAP-seq<ref><pubmed>28854175</pubmed></ref>も、既知の細胞表面マーカーの発現とscRNA-seqが同時に観察できる方法である。

==~~利用法~~==

複数モダリティのシングルセルオミクスとして、神経科学分野で注目されるのは、scRNA-seqを[[パッチクランプ]]による電気生理学的情報と組み合わせたPatch-seq<ref><pubmed>26689544</pubmed></ref> <ref><pubmed>26689543</pubmed></ref>である。また、ゲノムDNAとscRNA-seqを同時に観察することによって、近年、精神疾患の観点から注目されている発生途中で生じる遺伝子変異を研究するPRDD-seqは今後の展開が注目される<ref><pubmed> 32522880</pubmed></ref>。最後に、BARseq (barcoded anatomy resolved by sequencing) <ref><pubmed>31626774</pubmed></ref>、CONNECTID[https://doi.org/10.1101/378760]、Epi-Retro-seq<ref><pubmed>30276807</pubmed></ref>のような方法は、[[コネクトーム]]（神経細胞の結合性）と遺伝子発現状態を記録できるオミクスの新たな方向として興味深い。

[[~~ファイル:nanobody4.jpg ‎|サムネイル|300px|'''図4．ナノボディの利用法'''~~]]

== 関連項目 ==

==~~参考文献~~==

*[[ゲノムワイド関連解析 ]]

*[[ディファレンシャルディスプレイ ]]

*[[In situハイブリダイゼーション法 ]]

*[[免疫組織化学法]]

*[[エピジェネティクス]]

*[[コネクトーム]]

== 参考文献 ==

@@ 1行目: / 1行目: @@
 <div align="right">
-<font size="+1">山形方人</font><[[br]]>
+<font size="+1">[http://researchmap.jp/yamagatm 山形方人]</font><br>
 ''Harvard University''<br>
-DOI：<selfdoi />　原稿受付日：年月日　原稿完成日：年月日<br>
+DOI：<selfdoi />　原稿受付日：2020年10月22日　原稿完成日：2020年12月23日<br>
-担当編集委員：<br>
+外部査読委員：京都大学メディカルイノベーションセンター [https://researchmap.jp/read0140206 渡辺　亮]<br>理化学研究所 生命機能科学研究センターバイオインフォマティクス研究開発チーム/東京医科歯科大学 難治疾患研究所 ゲノム応用医学部門 ゲノム機能情報分野 [https://researchmap.jp/dritoshi 二階堂 愛]<br>
 </div>
-英：single cell RNA sequencing, scRNA-seq
+英：single-cell RNA sequencing, scRNA-seq
+{{box|text=　シングルセルRNAシーケンシング(single-cell RNA sequencing, 以下scRNA-seq)は、[[次世代シーケンサー]]（next generation sequencer、以下NGS）を用いることで、個々の細胞が保持しているmRNA全体を質的、量的に網羅的に調べる方法である。次元圧縮などの数理的な解析と組み合わせることで、遺伝子発現の状態に基づいた細胞の分類を行うことが可能であり、従来の組織学的、あるいは細胞生物学的手法では知られなかった新規の細胞種の同定や細胞状態の推定を行うことが可能になった。また、遺伝子発現プロファイルの変化に基づく擬時系列解析(pseudotime analysis)によって、刺激や発生に伴う細胞状態の遷移の描写ができる。神経系では、この方法により、神経細胞や非神経細胞の分類や状態についての知見が深まり、新しい神経細胞タイプ、細胞マーカー、病態の理解、更に機能的な遺伝子の同定などが系統的かつ網羅的に行われるようになった。scRNA-seqに、空間的情報、エピゲノム情報、タンパク質情報などの複数モダリティを取り入れた統合解析（multimodal single-cell omics）も行われている。}}
-{{box|text=
+==背景==
-シングルセルRNAシーケンシング(scRNA-seq)は、次世代シーケンシング （Next Generation Sequencing、NGS）技術を使用して個々の細胞が発現しているmRNA全体、つまりトランスクリプトームを質的、量的に網羅的に調べ、細胞ごとの違いを高解像度で検出、分類することで、細胞の分類を行うことができる技術である。また、刺激、発生など細胞の状況に応じて、個々の細胞のトランスクリプトームの情報を得ることで、病態や細胞系譜などの解析も可能である。特に多様なニューロンが存在する神経系では、この方法により、神経細胞の分類や状態について、深い理解が進んできている。}
+===トランスクリプトーム===
+　[[トランスクリプトーム]]（transcriptome）は、細胞中に存在する全ての[[転写]]産物（タンパク質をコードする[[mRNA]]、タンパク質をコードしない[[ノンコーディングRNA]]、[[マイクロRNA]]など）の総体である<ref><pubmed>19015660</pubmed></ref><ref><pubmed>31341269</pubmed></ref>。トランスクリプトームは、[[ゲノム]]とは異なり、同一の個体でも、組織ごとに、更には発生段階や細胞外環境や刺激によって変化する。トランスクリプトームは、同質あるいは異質の多数の細胞集団（組織、[[培養細胞]]）から[[RNA]]抽出後、[[cDNA]]に変換し、それを1990年代に出現した[[DNAマイクロアレイ]]のように数多くの既知mRNAを識別する技術によって解析されるようになった。その後、[[次世代シーケンサー]]の利用により、希少mRNAやノンコーディングRNAを含めた未知の転写産物の高感度検出が可能になるとともに、[[スプライシング]]で成熟していく過程のmRNAなど、転写産物の種類だけでなく、転写産物の構造的差異（スプライシングバリアント、[[SNPs]]、変異など）の解析もできるようになった。加えて、[[ヒト]]やモデル[[実験動物]]（[[マウス]]、[[ゼブラフィッシュ]]、[[ショウジョウバエ]]、[[線虫]]など）だけでなく、多種多様な生物のトランスクリプトームの把握も可能になった。従来から行われてきた組織全体などの多数の細胞を対象としたRNA-seq（バルクRNA-seq）では、複数の細胞における転写産物の平均を観察しているが、本項目では個々の細胞における転写産物を解析するscRNA-seqの原理とその応用について概説する。
-==トランスクリプトーム==
+===開発史===
-トランスクリプトーム（transcriptome）は、細胞中に存在する全ての転写産物（タンパク質をコードするmRNA、タンパク質をコードしないノンコーディングRNA、マイクロRNAなど）の総体である。トランスクリプトームは、ゲノムとは異なり、同一の個体でも、組織ごとに、更には発生段階や細胞外からの影響によって固有のものである。このようなトランスクリプトームは、同質あるいは異質の多数の細胞集団（例、培養細胞株、組織）からRNAを抽出し、1990年代に開発されたDNAマイクロアレイのように数多くの既知のmRNAを一気に識別する技術によって解析されるようになった。その後、次世代シーケンシング（NGS）の利用により、希少mRNAやノンコーディングRNAを含めた未知の転写産物の高感度検出も可能になるとともに、スプライシングを経て成熟していく過程のmRNAの構造など、転写産物の種類だけでなく、転写産物の構造の理解も進むことになった。また、NGSは、ヒトやモデル実験生物（マウス、センチュウ、ショウジョウバエなど）として広く利用される生物だけでなく、多様な生物のトランスクリプトームの理解も可能にした。
+つの細胞の持つ生体物質を解明し、定量しようとする試みは古くからあった。1960年代になると、[[フローサイトメトリー]]を利用した[[蛍光活性化セルソーティング]]（Fluorescence-activated cell sorting, FACS）が発明され、標識抗体などのプローブと組み合わせることで、多数の細胞集団の中で１つの細胞が保持している生体分子の種類や量についての断片的な研究が可能になり、この方法は現在でも汎用されている<ref><pubmed>22271369</pubmed></ref>。その後、[[免疫組織化学]]や[[in situ hybridization]]nなどにより、タンパク質やmRNAの種類や量が観察できるようになり、組織中に存在するそれぞれの細胞の同定などに活用されてきている。最近では、それぞれの細胞が持つ抗原分子を、異なった金属イオンで標識した抗体とフローサイトメトリーを組み合わせた方法で検出する[[マスサイトメトリー]]（CyTOFなど）も開発されてきている<ref><pubmed>27153492</pubmed></ref>。
-==シングルセルトランスクリプトーム研究史の概観==
+　細胞種にもよるが、1つの細胞内にある全RNA（ribosomal RNAを含む）は細胞種にもよるが1-50pgである。そのうち、mRNAの占める割合は1-5%程度である<ref><pubmed>15239941</pubmed></ref>。この微量のmRNAをcDNAに変換してから大幅に増幅できる方法が発明されたことで、1つの細胞が発現するmRNAを高感度で検出できるようになった<ref><pubmed>1557406</pubmed></ref><ref><pubmed>7541630</pubmed></ref> 。例えば、1991年、[[wj:リンダ・バック|Linda Buck]]と[[wj:リチャード・アクセル|Richard Axel]]は、[[嗅覚受容体]]が[[Gタンパク質]]であると仮定し、個々の嗅覚細胞で特異的に観察されるGタンパク質mRNAを比較することで、嗅覚受容体の同定に成功した<ref><pubmed>1840504</pubmed></ref>。1995年になると、[[wj:キャサリン・ドュラック|Catherine Dulac]]とRichard Axelは、異なる[[鋤鼻神経細胞]]で特異的に発現する遺伝子を１つの細胞から作製したcDNAライブラリーを比較する[[ディファレンシャル・スクリーニング]]を行うことで、[[フェロモン受容体]]を同定した<ref><pubmed>7585937</pubmed></ref>。同じ手法で異なる種類の神経細胞で発現している遺伝子も同定され<ref><pubmed>9778248</pubmed></ref><ref><pubmed>12230981</pubmed></ref>、1つの細胞の持つトランスクリプトームを比較するアプローチが神経細胞で特徴的に発現している遺伝子の同定に効果的なことが示された。
-つの細胞の持つ生体物質を定量しようとする試みは古くからあった。1960年代になると、Fluorescence-activated cell sorting (FACS)が発明され、標識抗体などのプローブと組み合わせることで、多くの細胞の中で１つの細胞が持っている分子の種類や量についての断片的な研究が可能になり、この方法は現在でも利用されている。その後、免疫組織化学やin situ hybridizationなどにより、タンパク質やmRNAの種類や量が観察できるようになり、組織中の1つの細胞の同定などに活用されてきている。
-一つの細胞内にある全RNAは細胞種によるが1-50pgである。そのうち、mRNAの占める割合は1-5%程度である。この微量のmRNAをcDNAに変換してから大幅に増幅できるPCRが発明されることで、1つの細胞が発現するmRNAを高感度で検出できるようになった。例えば、1991年、Linda BuckとRichard Axelは、嗅覚受容体がGタンパク質であると仮定し、個々の嗅覚細胞で特異的に観察されるGタンパク質mRNAを比較することで、嗅覚受容体候補の同定に成功した（年、ノーベル生理学・医学賞）。1995年になると、Catherine DulacとRichard Axelは、異なる鋤鼻神経細胞で特異的に発現する遺伝子を単細胞cDNAライブラリーのディファレンシャル・スクリーニングという方法で、フェロモン受容体候補を同定した。同様な手法で異なる種類の網膜神経節細胞で発現している遺伝子も同定されており、このようなアプローチが生理的に重要な機能を持つ遺伝子の発見に効果的であることを示した。
-一方で多くの種類のmRNAを１細胞レベルで観察する単細胞トランスクリプトームには技術的なブレークスルーが待たれた。１つ大きな問題はPCRなどの増幅に伴うバイアスなどのアーティファクトが頻繁に観察されること、そしてもう一つの課題は多くの種類のcDNAを簡便に観察することを可能にする方法の開発であった（PMID: 16547197）。これを可能にしたのが、増幅法の改良とマイクロアレイの利用であった。しかしながら、増幅に伴うアーティファクトの解決は依然として不十分で、また１つの細胞ごとに高価なマイクロアレイを利用することは、多数の細胞のトランスクリプトームを観察するのには限界があった。2009年に、これらの問題を解決できる可能性として、High-throughput sequencing (HTS)を利用するscRNA-seqプロトコルがAzim Suraniのグループによって報告されたPMID:19349980。しかしながら、この方法でも一つの細胞ごとに処理を行うという操作が必要で、この論文でもたった8個の細胞の解析に留まっており、非常に多くの細胞についてのトランスクリプームを一挙に理解することはできなかった。
-==シングルセルRNAシーケンシング(scRNA-seq)の現状==
+　一方で多くの種類のmRNAを1細胞レベルで一挙に観察するための技術には感度やスループット、そしてコストの観点からブレークスルーが待たれた。1つの問題は多種類のcDNAを簡便に識別することを可能にする方法の開発であった。これを可能にしたのが、[[PCR]]などのcDNA増幅法の改良とマイクロアレイの利用であった<ref><pubmed>12736331</pubmed></ref><ref><pubmed>16547197</pubmed></ref>。しかしながら、細胞ごとに高価な[[マイクロアレイ]]を使用することは、多数の細胞のトランスクリプトームの観察には限界があった。2009年になると、これらの問題を解決できる可能性として、次世代シーケンサーを利用するscRNA-seqプロトコールがAzim Suraniのグループによって報告された<ref><pubmed>19349980</pubmed></ref>。しかしながら、多数のマイクロアレイでなく1回の次世代シーケンサー使用で済ませることができるものの、この報告でもわずか8個の細胞の解析に留まっており、1つの細胞ごとに処理を行うという操作が必要で、多数の細胞についてのトランスクリプームを一挙に理解することはできなかった。また、塩基配列の違うcDNAごとにPCR効率に差がある結果生じる増幅バイアス、また3’末端側が選択的に補足されることなどの課題があった。
-以来、完全長cDNAまたは分子識別子（unique molecular identifiers: UMI）を持つcDNAを生成するためにmRNA転写産物を増幅する方法が異なるscRNA-seqが考案されてきた。2013年には、このような１細胞のシーケンシング技術が、Nature Methods誌のMethod of the Year に選ばれた。たとえば、SMART-seq（Switch mechanism at the 5' End of RNA Templates）（ 18 ）およびその改良されたプロトコルであるSMART-seq2（ 19、20 ）は、完全長cDNA合成のためのプロトコルである。また、MARS-seq（並列RNA単一細胞配列決定）（ 21 ）、STRT（単一細胞タグ付き逆転写）（ 22、23 ）、CEL-seq（線形増幅および配列決定による細胞発現）（ 24 ）、CEL-seq2（ 25 ）などが報告されてきた。特にSMART-seq（SMART-seq2）は、ピペット、限界希釈、レーザー捕獲法などを用いる多穴プレート法、更に半導体集積回路製作技術で作った流体集積回路を利用するFluidigm C1のシステム（https://jp.fluidigm.com）と組み合わせることで利用される機会が多い。このプロトコールの特徴は、全長のトランスクリプトームを得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、SNPs、変異の検出にも利用できる点で次に説明するUMIを用いる方法に比べて利点があるが、そのコストと処理できる細胞数の点で極めて不利である。
-最も重要なscRNA-seqの方法論についての進歩は、2015年、Harvard Medical Schoolの独立した２つのグループから、inDropそしてDrop-seqという類似した2つの方法が発表されたことであろう。マイクロ流体力学 (Microfluidics) 、 UMIとしてDNAバーコーディング ([[DNA]] barcoding) 、そしてNGSを利用することで、自動化とサンプル調製の容易さから、一つの細胞あたりに要するコストを大幅に低下させることに成功した（Drop-seqはその発表時で、6セント/細胞）。これらの方法では、細胞1つずつをマイクロ流体力学によるエマルジョン技術を利用した装置に流入させ、その１細胞を試薬を封入した1つのDroplet（油滴）に自動的に閉じ込める。そのDroplet中には、DropletごとにUMIとして異なったDNAバーコードを持つゲルビーズが入っており、そこからcDNA合成反応を行うことで、それぞれの同じ細胞に含まれていたmRNAが同じUMIを持つcDNAとして合成され、Dropletを破壊した後も、そのcDNAが由来した細胞が区別できるということを利用している（図１）。このようにして増幅したUMI付きのｃDNAをNGSで配列決定することによりscRNA-seqが可能になる。なお、DropSeqはコストが低いが、細胞の取得率と検出感度が低い弱点がある。inDropはDropSeqより細胞取得率が高く、パラメータを調整することで低レベルで発現される遺伝子の検出に有利である。
+==現状==
-inDropの方法は、1 Cellbio社（https://1cell-bio.com）から販売されているが、特に重要なのは同様の原理を用いた10xGenomics社（https://www.10xgenomics.com/jp/）がChromiumと命名された市販機器と試薬を発売することで、多くの研究者に利用できることになったことである。Svenssonらのデータベース（www.nxn.se/single-cell-studies/gui）では、scRNA-seqを用いた論文で用いられた方法について調査しているが、この数年、10xGenomics社のChromiumを用いた方法が飛躍的に増加し、ほぼ寡占状態になりつつあることがわかる（現在、10XGenomics社とBioRad社の間で関連特許をめぐる係争がある。）。10X Genomics Chromiumは市販であるので導入が容易であり、inDropやDropSeqに比べ最大数の転写産物の検出に敏感であるが、コストが高い。
+===分子生物学的反応===
+　その後、5’末端側の領域まで効率よく増幅するscRNA-seqのプロトコールが考案された<ref name=Mereu2020><pubmed>32518403</pubmed></ref>。特に、SMART-seq（Switching mechanism at the 5' End of RNA Templates）<ref><pubmed>22820318</pubmed></ref>およびその改良されたプロトコールであるSMART-seq2<ref><pubmed>24056875</pubmed></ref> <ref><pubmed>24385147</pubmed></ref>の使用例が多い（既に、SMART-seq3という改良プロトコールもある<ref><pubmed>32518404</pubmed></ref>が、以下SMART-seqと呼ぶ）。また、類似法としてSTRT（single-cell tagged reverse transcription）<ref name=Islam2011><pubmed>21543516</pubmed></ref>などがある。
-==シングルセルRNAシーケンシング(scRNA-seq)の実際==
+　一方、CEL-seq（Cell Expression by Linear amplification and Sequencing）<ref><pubmed>22939981</pubmed></ref>、CEL-seq2<ref><pubmed> 27121950 </pubmed></ref> 、MARS-seq（Massively parallel single-cell RNA-seq）<ref><pubmed>24531970 </pubmed></ref>では、[[T7 RNAポリメラーゼ]]による[[in vitro転写]]を用いることにより、[[PCR]]による増幅で見られるバイアスを低減させようとしている。
-ここでは主流になっている10xGenomics社のChromiumを用いた方法とSMART-seqなどを用いた方法に共通する方法の実際について議論する。シングルセルRNAシーケンシングの利用には、4つのステップがある。１）細胞をバラバラに単離すること。２）ライブラリーの作製とNGSシーケンシング。３）前処理（preprocessing、得られた配列の整理）。４）ダウンストリーム分析（生物学的な情報を得る）。これらのうち、２）の段階については、上に記述したように市販の機器や試薬を利用することが多くなっているので、各社のマニュアル等を参考にするのが現実的である。
-===組織からの細胞の分離====
+　また、Quartz-SeqやQuartz-Seq2ではPCR用のアダプターを付加する反応にポリAテーリングを利用することで、他の手法と比較して1.5-5倍程度の遺伝子を検出できる<ref name=Mereu2020><pubmed>32518403</pubmed></ref>。
-血液細胞のように浮遊した細胞ではない場合、物理的あるいは酵素処理などによって、生組織から状態の良い細胞をdissociationする必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている。ただ、しばしば問題となるのが、酵素処理のため短時間加温することで、発現が変化する遺伝子が存在することである。例えば、脳のミクログリアの解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった（Hammond et al., 2019）。また、酵素処理時に転写阻害剤であるアクチノマイシンで処理することで、このような現象を抑制できる（Wu et al., 2017）。更に、ヒマラヤ氷河から得られた細菌Bacillus licheniformisから得られた低温プロテアーゼを用いる方法も報告されている（Adam et al., 2017）。
+===バーコード技術 ===
-単離した細胞は、そのまま10xGenomicsのChromiumのプラットフォームに導入することができるが、抗体などを用いたFACS、パニング、磁気ビーズカラムなどによる細胞の単離を行う場合もある。
+　増幅バイアス除去のアプローチとして特に重要なのは、2011年に発表された核酸配列バーコードを利用した方法で、分子識別子（unique molecular identifiers: UMI）を持つcDNAを増幅させ、次世代シーケンサー後の情報処理を用いるものであると考えられる<ref><pubmed>22101854</pubmed></ref>。この方法では[[逆転写]]反応の際、ランダム塩基配列から構成されるUMIをcDNA末端に付加した後、増幅反応、次世代シーケンサーを行い、cDNA配列とUMI配列の両方を読む。cDNAにはRNA1分子に1つのUMIが付加されるので、同一のUMIを持っていれば、逆転写時に同一のcDNA由来とカウントする。UMIをカウントすることで、増幅前のmRNAのコピー数を知ることができる<ref name=Islam2011><pubmed>21543516</pubmed></ref><ref><pubmed>24363023</pubmed></ref><ref name=Gierahn2017><pubmed>28192419</pubmed></ref> <ref><pubmed>29474909</pubmed></ref><ref name=Cao2017><pubmed>28818938</pubmed></ref><ref name=Rosenberg2018><pubmed>29545511</pubmed></ref>。
-なお、ヒト組織などから生細胞を得ることは困難なことが多い。この場合、凍結した組織から、核を調製し、これを分析する方法がある（）。更に、RNAを分析するscRNA-seqではないが、シングルセルの遺伝子発現を推定する方法として、トランスポゾンを用いることでゲノムのオープンクロマチン領域を選択的に検出し、ライブラリーを作製しシーケンスするATAC-seq (Assay for Transposase-Accessible Chromatin)がある。
+===多様なプラットフォーム===
+　細胞を分別するプラットフォームには、マイクロピペットによる捕獲、[[セルソーター]]、[[レーザー捕獲]]などを用いるマルチウェル法、あるいは半導体集積回路様の製作技術で作った流体回路を利用するFluidigm C1の装置（[https://jp.fluidigm.com C1 Single- Cell Auto Prep]）、更にドロップレット使用（下記）などがある<ref><pubmed>30405621</pubmed></ref><ref><pubmed>33247933</pubmed></ref>。これらは、SMART-seqと組み合わせて利用されることが多い。SMART-seqプロトコールの特徴は、全長mRNAのトランスクリプトーム情報を得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、SNPsの情報を利用したアリル特異的発現、変異の検出にも利用できる。また、それぞれ細胞ごとの反応を独立した場所で行うため、反応中に別の細胞の反応と混じる可能性が低い。小型のナノウェルを用いるSeq-Wellも同様に反応自体が混じる可能性が低い<ref name=Gierahn2017><pubmed>28192419</pubmed></ref>。これらの点が、次に説明するドロップレットを使用して3’末端のみを標的にしたscRNA-seqと比べた場合の長所であるが、その高コスト（1細胞あたり数十ドル）と処理可能な細胞数の少なさが短所である。
-===scRNA-seqデータの前処理===
+　これらとは別に、ハイスループットで安価な方法として、それぞれの細胞を独立に標識するのではなく、プールされた細胞を異なるウェルにランダムに振り分け、ウェル固有のバーコードで転写物を標識していく操作を複数回繰り返していくことで細胞を区別するSplit-seqやsci-RNA-seq3などの方法も用いられている<ref name=Rosenberg2018><pubmed>29545511</pubmed></ref><ref><pubmed>30787437</pubmed></ref>。
-Seurat, Scanpyなどのソフト。
-Transcriptomeとの照合。質のチェック。
-視覚化（Visualization。tSNE。
-===ダウンストリーム分析===
+===ドロップレット使用の3’エンドリード法===
-Dimensionality Reductionとクラスタリング。
+　scRNA-seqのプラットフォームと方法について重要と考えられる進歩は、2015年、Harvard Medical Schoolの独立した２つのグループが、inDrops<ref><pubmed>26000487</pubmed></ref>そしてDrop-seq<ref><pubmed>26000488 </pubmed></ref>という類似した2つのハイスループットな方法を開発したことであろう（inDropsは[[T7 RNAポリメラーゼ]]、Drop-seqはPCRで増幅）。これらの方法では、[[マイクロ流体力学]] (microfluidics) 、 UMI（上述）と細胞ごとのバーコード（Cell Barcode）という2種類のDNAバーコーディング、そしてNGSと情報解析法を利用している。そして、多く細胞のサンプル調製の自動化と容易さから、1つの細胞あたりに要するコストを大幅に低下させることに成功した（Drop-seqは発表時で、１細胞あたり約5セント）。つまり、細胞1つずつをマイクロ流体力学によるエマルジョン作製技術を利用した装置に流入させ、その1細胞を1つのドロップレットに自動的に閉じ込める。そのドロップレット中には、ドロップレットごとにCell barcode/UMIとしてユニークなDNAバーコードを持つゲルビーズ(Gel Beads in Emulsion, GEMs)が入っており、それを足場に3’末端のみを標的にしたcDNA合成反応を実施することで、同じ細胞に含まれていた1分子のmRNAが同じCell barcodeを持つcDNAとして合成され、そのmRNA/cDNAが由来した細胞を識別できるということを利用している（'''図1'''）。
-マーカー遺伝子とクラスタリングの同定。
+[[ファイル:scFig1.jpg|サムネイル|300px|'''図1. ドロップレット使用の3’エンドリード法 '''<br>組織から解離させた細胞それぞれを、マイクロ流体力学を利用した装置で、バーコードプライマーが結合したゲルビーズとともにドロップレットに封じ込める。ドロップレット中には、ドロップレットごとにCell barcode/UMIとしてユニークなDNA配列を持つゲルビーズ(GEMs)が入っており、それを足場にcDNA合成反応を実施することで、同じ細胞に含まれていたmRNAが同じCell barcodeを持つDNAとして合成され、それを増幅する。]]
-DE遺伝子、の検出、MAST。
-組成解析。
-Trajectory interference 発生。発現の動態。
-==神経科学への応用==
+　DropSeqはコストが低いが、細胞の取得率と検出感度が低い弱点がある。inDropsはDropSeqより細胞取得率が高く、パラメータを調整することにより、低レベルで発現される遺伝子の検出にも有利であるとされる<ref name=Zhang2019><pubmed>30472192</pubmed></ref>。DropSeqのセットアップは[https://www.dolomite-bio.com Dolomite Bio]、inDropは[https://1cell-bio.com 1 Cellbio社]から販売されている。しかし、その後、[https://www.10xgenomics.com/jp/ 10x Genomics社]が同様の原理を用いたシングルセル遺伝子発現解析システムを市販することで、多くの研究者が利用できるようになっている<ref><pubmed>28091601</pubmed></ref>。Svenssonらによる最近の[http://www.nxn.se/single-cell-studies/gui データベース]<ref><pubmed>33247933</pubmed></ref>では、scRNA-seqを用いた論文で用いられた方法について調査しており、この数年、10x Genomics社のプラットフォームを用いた論文が飛躍的に増加していることがわかる。10x Genomics社のプラットフォームは市販であるので導入が容易であり、DropSeqやinDropsに比べ多くの転写産物の検出が可能であるが、それらよりランニングコストは高価である<ref name=Zhang2019><pubmed>30472192</pubmed></ref>。
-===ニューロンのクラスとタイプ===
-様々な神経・精神疾患について理解しその診断や治療に役立てるためには、ニューロン、グリア細胞を中心にした神経系にある細胞の「タイプ」を識別し、それぞれの細胞における分子的な変化を観察することが重要である。近年、中枢神経系のグリア細胞にも、多様なアストロサイト、オリゴデンドロサイト、ミクログリアの存在が報告されてきている。一方で、ニューロンは著しく多様であり、このニューロンの多様性こそが、神経系を特徴づけており、その多彩で複雑な機能の発現に必須であることは疑う余地がない。
-解剖学的な視点から言えば、すべてのニューロンの存在する位置は異なるので、すべてのニューロンは異なるという見方もできる。しかし、これは極論であり、従来の神経科学では、ニューロンの多様性は、それぞれのニューロンの解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきた。こうしたニューロンの多様性を便宜的に記述するのに、タイプ（type）、クラス（class）、サブクラス（subclass）、サブタイプ（subtype） というような用語が用いられてきた。しかし、本稿では混乱を防ぐため、Masland（2004）の提唱に従い、「クラス」と「タイプ」という単語を用いることとする。タイプは、これ以上分類することができないとされる階層である。例えば、大脳皮質の錐体細胞、網膜神経節細胞といった大雑把な識別は「クラス」と呼ぶ。大脳皮質の錐体細胞というクラスは、層や領野によって「タイプ」が異なるし、網膜神経節細胞には視覚情報によって応答が異なる「タイプ」が存在する。この分類は、免疫組織化学、形態、電気生理学などの技術により識別可能である暫定的なものに過ぎない。本稿で解説するscRNA-seqの技術は、その網羅性からそれぞれのニューロンについてこれまでにないビッグデータを提供することで、このニューロンのタイプの理解に確実な根拠を与えつつある。
-===大脳===
+　なお、3’エンドリード法だけでなく、抗体やT細胞レセプターのN末端側に位置する可変領域の配列決定が可能である5'末端のシーケンシングには5’エンドリード法が利用されることがある。
-===その他のCNS===
+==実際==
+　ここでは主流になっている10x Genomics社のChromium controllerなどのドロップレットを用いた方法とSMART-seqなどを用いた他のプラットフォームに共通する方法の実際について概説する。scRNA-seqの利用には、4つのステップがある（'''図2'''）<ref name=Luecken2019><pubmed>31217225</pubmed></ref><ref><pubmed>30089861</pubmed></ref>。これらのうち、'''2.'''の段階については、上に記述したように市販の機器や試薬を利用する機会が多くなっているので、詳細は説明しない。
+[[ファイル:ScFig2d.jpg|サムネイル|500px|'''図２．scRNA-seqの実際のステップ '''<br>細胞の単離、ライブラリ作製とNGS、データの前処理から次元圧縮、データ解析。図の一部は2016 DBCLS TogoTV、あるいはSeuratを用いて10x Genomics社の[https://support.10xgenomics.com/single-cell-gene-expression/datasets PBMCデータ]から執筆者が作製。]]
+# 個体や組織を採集し、そこから細胞あるいは細胞核を個別に解離された状態にすること。
+# ドロップレット法やSMART-seq対応のプラットフォームなどによる個々の細胞からのライブラリーの作製とNGS。
+# 得られた配列情報の前処理（preprocessing）。
+# データ解析。
-===疾患===
+===組織からの細胞、細胞核の分離===
-アルツハイマー、Autism
+　浮遊細胞（[[血液]]細胞など）ではない場合、物理的あるいは酵素処理などによって解離することで、生組織から状態の良い個々に分散した細胞を調製する必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている<ref><pubmed>29970990</pubmed></ref>。ここで、しばしば問題となるのが、酵素処理による短時間加温や機械的刺激で、発現量が変化する遺伝子が存在することである<ref><pubmed>27090946</pubmed></ref>。特に、脳の[[ミクログリア]]の解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった<ref name=Hammond2019><pubmed>30471926</pubmed></ref>。また、このような現象を抑制するために、酵素処理時に転写阻害剤である[[アクチノマイシン]]で処理したり<ref><pubmed>29024657</pubmed></ref>、ヒマラヤ氷河から得られた細菌''Bacillus licheniformis''から得られた低温プロテアーゼを用いる方法も報告されている<ref><pubmed>28851704</pubmed></ref><ref><pubmed>31623682</pubmed></ref>。また、細胞解離後に、[[メタノール]]で固定しscRNA-seqに使用したり<ref><pubmed>28526029</pubmed></ref>、クロスリンカーを用いる方法もある<ref><pubmed>29391536</pubmed></ref>。
-===網膜===
+　単離した細胞は、そのまま10x Genomicsのシングルセル遺伝子発現解析のプラットフォームに導入することができるが、細胞表面分子マーカーに対する[[抗体]]や[[蛍光タンパク質]]レポーターなどを用いたFACS、[[パニング]]、MACS([[磁気ビーズカラム]])などによって、細胞の選択的濃縮や除去を行う場合もある。更に、抗体に抗体表示バーコードDNAをカップリングさせるCITE-seq(Cellular Indexing of Transcriptomes and Epitopes by Sequencing) については、下記の「統合解析」でも述べる。
+　なお、ヒト組織や希少生物などから生細胞を得ることは困難なことが多い。この場合、scRNA-seqの変法として、凍結した組織から、各細胞由来の核を調製し、核内のmRNAを分析するsnRNA-seq (single-nucleus RNA-seq)が利用されている。ただ、snRNA-seqでは、FACSなどによる特定細胞集団の分離が困難であることが多い。また、細胞質を持つ生細胞を利用したscRNA-seqとは違って、スプライシングの途上にある未成熟な核内転写産物を検出すること、更に検出できる遺伝子数も少なく、同等な結果が必ずしも得られない<ref><pubmed>24248345</pubmed></ref><ref><pubmed>26890679</pubmed></ref>  <ref><pubmed>27471252</pubmed></ref><ref name=Habib2017><pubmed>28846088</pubmed></ref><ref><pubmed>29220646</pubmed></ref><ref name=Habib2017><pubmed>28846088</pubmed></ref><ref><pubmed>30586455</pubmed></ref><ref><pubmed>28729663</pubmed></ref><ref><pubmed>31728515</pubmed></ref><ref><pubmed>32341560</pubmed></ref> <ref name=Mereu2020><pubmed>32518403</pubmed></ref>。一方で、snRNA-seqでは、組織をそのまま凍結することから開始することが可能であるので、上述したscRNA-seqの問題である細胞解離酵素による処理などを避けることができる。更に、核を用いることで、大きな細胞体はマイクロ流体力学の流路で詰まりやすいなど、特に神経細胞で顕著である細胞の形状の多様性に伴うバイアスを減らすことができるといったメリットもある。こうしたプロトコールの一部は、protocols.ioのHuman Cell Atlasの[https://www.protocols.io/groups/hca グループ]で公開されている。
+　通常のscRNA-seqは、ポリアデニル化されたmRNAを検出しているが、MATQ-seq（multiple annealing and dC-tailing-based quantitative single-cell RNA-seq）、RamDA-seqなどを用いると、ポリアデニル化されていないRNAの検出も可能である<ref><pubmed> 28092691</pubmed></ref> <ref><pubmed>29434199 </pubmed></ref>[https://doi.org/10.1101/2020.06.02.131060]。
+　更に、RNAを分析するscRNA-seqではないが、遺伝子発現状態との関係が想定される[[オープンクロマチン]]領域を[[トランスポゾン]]を用いることで個々の細胞レベルで選択的に検出するsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin) <ref><pubmed>26083756</pubmed></ref><ref><pubmed>29434377</pubmed></ref><ref><pubmed>25953818</pubmed></ref>, single cell THS-seq (transposome hypersensitive-site) <ref><pubmed>29227469</pubmed></ref>や [[DNAメチル化]]領域を観察するsnmC-seq、RRBSのような方法も利用されている<ref name=Lake2018><pubmed>28798132</pubmed></ref><ref><pubmed>30237449</pubmed></ref><ref><pubmed> 20852635</pubmed></ref>。
-===展望===
+===データ処理の流れ===
+====総論====
+　Illumina社に代表される次世代シーケンサーを用いて得られた結果は、ベースコールや細胞バーコードを用いたdemultiplexingなどの基礎解析を行うことで、各細胞における遺伝子の発現量のマトリックスを出力する。例えば、10XGenomics社のChromiumプラットフォームを用いた場合、10XGenomics社が提供するCell Rangerの[https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/tutorial_mr mkrefコマンド](Linux上で作動)などにより、各生物種ごとの[https://www.ncbi.nlm.nih.gov/grc レファレンス配列リスト]（マウスやヒトでは既製のものを利用できる）などを参考にしながら、細胞と転写産物量の対応マトリックスを作製する。その後のデータの処理についても、10x Genomics社がソフトウェアLoupeを提供している。しかしながら、その後のデータ解析を考慮して、[[R]], [[Python]], [[MATLAB]]などのデータ解析のための汎用プログラミング言語やコードで扱えるオブジェクトに変換するのが通常である。
+　scRNA-seq解析のためには、数多くのツールが公開されている。これらのツールは、バージョンが更新されたり、新しいものに置き換えられることがあるので、実際に利用する場合は最新の動向に注意を払う必要がある。scRNA-seqの解析に必要なツールは、[https://www.scrna-tools.org scRNA-tools], [https://github.com/seandavi/awesome-single-cell Awesome single cell], [https://www.bioconductor.org Bioconductor]などで紹介されており、ほとんどがダウンロード可能である。また、[[bioRxiv]]などの査読前のプレプリントサーバで公開されて、随時試用、評価されていくものが多く、scRNA-seqのデータ（下記参考）とともに、オープンサイエンス実践の好例となっている。
+====Seurat====
+　ここでは、scRNA-seqデータ解析のために最もよく利用されているRを用いたパッケージ「Seurat」<ref name=Butler2018><pubmed>29608179</pubmed></ref> <ref><pubmed> 31178118 </pubmed></ref>を中心に紹介しておきたい。なお、一部の解析操作は、University of WashingtonのCole Trapnell研究室で開発されてきた軌道推定（下記参考）によく使用される[https://cole-trapnell-lab.github.io/monocle3/ Monocle3]でも可能である。Pythonを利用したものでは、ドイツ・ミュンヘンInstitute of Computational Biologyの Fabian Theisらが開発しているScanpyが有名である<ref><pubmed> 29409532</pubmed></ref>。
-　一般的な方法としては、重鎖抗体を産生する動物を飼育し、それを抗原で免疫することで、重鎖抗体が得られる。比較的小型のリャマのほかに、アルパカ、ヒトコブラクダ、小型の[[wj:ネコザメ|ネコザメ]]（''Heterodontus francisci''）などが免疫に利用されている。
+　New York UniversityのRahul Satija研究室が開発しているSeurat（画家スーラに由来）は、scRNA-seqデータ解析のために広く利用されているRパッケージであり、2020年秋現在、Seurat4のβバージョンが公開されている。論文の正式発表前から、サポート情報提供やコード修正なども頻繁に行っており、Satija研究室の[https://satijalab.org/seurat/ ウェッブサイト]、[https://github.com/satijalab/Seurat Github]、更に[https://twitter.com/satijalab Twitterアカウント]などで最新情報を得ることできる。
-　次に免疫された動物から血液を採集し、その中にある[[wj:B細胞|B細胞]]から、可変領域を含むcDNAライブラリーをM13ファージを使った[[ファージディスプレイ]]ライブラリーに組み込み、固定化した抗原を使ったスクリーニングすることで、cDNA配列を単離し、抗原に結合するナノボディ配列を知ることができる<ref><[[pubmed]]>24577359</pubmed></ref><ref><pubmed>19554288</pubmed></ref>。ラクダ科動物の遺伝子を組み込んだマウスも開発されているが、その利用は一般的ではないようである<ref><pubmed>16148123</pubmed></ref><ref><pubmed>17015837</pubmed></ref>。
+====品質の検討事項====
+　最初に行うのは、scRNA-seqデータの品質管理である。ここでは、質の低い細胞のデータ（例えば、壊れた細胞では、転写産物の種類が少なくミトコンドリア由来の転写産物が多い）を取り除く。また、複数の試料を組み合わせる場合には、バッチごとの違いについて検討する<ref><pubmed>29608177</pubmed></ref><ref><pubmed> 28045081</pubmed></ref><ref><pubmed>31948481</pubmed></ref> <ref><pubmed>32854757</pubmed></ref>。現実には、実験ごとのバッチの違いによる影響（Batch effect）がscRNA-seqの最大の問題であると示されてきており、試料の処理を同時に行うなど実験デザインを工夫する必要がある<ref><pubmed>29121214</pubmed></ref>。
-　このスクリーニングを効果的に行うための工夫が多数開発されてきている<ref><pubmed>29477934</pubmed></ref>。ファージディスプレイの担体の工夫、[[w:Staphylococcus carnosus|''Staphylococcus carnosus'']]のような[[wj:グラム陽性菌|グラム陽性菌]]表面へのディスプレイ、酵母細胞表面へのディスプレイ、[[mRNAディスプレイ]]、[[リボソームディスプレイ]]、細胞内での[[2ハイブリッドスクリーニング]]などが用いられてきている。
+　また、ドロップレットを使用するscRNA-seqでしばしば問題になるのが、ドロップレットに２つ以上の細胞が封じ込められ、それらが同一のCell barcodeを持ってしまうアーティファクトである。通常「Doublet」「Multilet」と呼ばれるこの問題はデータ解析を混乱させるので、細胞単離の段階から注意する必要があるが、scRNA-seqデータ取得後にもデータ処理で解決できる可能性もある<ref><pubmed>30954476</pubmed></ref><ref><pubmed>30954475</pubmed></ref> <ref><pubmed>31693907</pubmed></ref><ref><pubmed>32592658</pubmed></ref> <ref><pubmed>29227470</pubmed></ref><ref><pubmed>31836005</pubmed></ref><ref><pubmed>31856883</pubmed></ref><ref><pubmed>30567574</pubmed></ref> <ref><pubmed>31266958</pubmed></ref><ref><pubmed>32366989</pubmed></ref><ref><pubmed>33338399</pubmed></ref>[https://doi.org/10.1101/2019.12.17.879304]。なお、この手法を利用することで、バッチ効果を抑えるために、異なるバーコードを持つ複数の試料を混ぜて一つの試料として扱い、計算機的に再び分離、解析する手法が注目されている<ref><pubmed>32483174</pubmed></ref>。
-　特に、最近、これらの方法を組み合わせることで、効率的に行う戦略が考案されている。Fridyらは、免疫動物の結合抗体を精製しその質量スペクトルの結果とファージディスプレイのハイスループットな配列決定を組み合わせる方法で、蛍光タンパク質に結合する多数のナノボディを報告した<ref><pubmed>25362362</pubmed></ref>。Zimmermann は、リボソームディスプレイ、ファージディスプレイ、ELISAを組み合わせることで、短期間にナノボディ配列を得る戦略を報告している<ref><pubmed>29792401</pubmed></ref>。また、McMahon らは、酵母ディスプレイを用いて、免疫動物を用いない合成ライブラリーをスクリーニングすることで親和性の高いナノボディ配列を得ることができることを示している<ref><pubmed>29434346</pubmed></ref> 。
+　scRNA-seqデータの次のノイズは、ある遺伝子の発現が低いために、本来同じタイプの細胞であっても、その遺伝子の発現が全く見られない「Dropout」と呼ばれる現象であり解析に影響を与えるので、これについても検討が必要である<ref><pubmed>24056876
+</pubmed></ref><ref><pubmed>32127540</pubmed></ref>。
-　ただ、このような非免疫ライブラリーや合成ライブラリーを用いる方法については、まだ適用例が多くなく、標準的な方法とされるものが存在しないというのが実情であろう。また、ある程度の抗原親和性を示すナノボディの配列を調整することで、親和性の成熟（affinity maturation）を行うこともできる<ref><pubmed>15777944</pubmed></ref> 。
+====次元圧縮====
+　このような品質管理、ノーマライゼーションの過程を経て<ref><pubmed>28504683</pubmed></ref>、scRNA-seqのデータ解析において、最初に行うのが、[[次元圧縮]] (dimensionality reduction)である<ref><pubmed>30617341</pubmed></ref><ref><pubmed>31780648</pubmed></ref><ref><pubmed>31955711</pubmed></ref><ref><pubmed>31823809</pubmed></ref>。主成分分析 (Principal component analysis, PCA)、更に発展させた均一マニフォールド近似と投影(Uniform Manifold Approximation and Projection, UMAP)、Diffusion maps<ref><pubmed> 26002886
+</pubmed></ref>, t分布型確率的近傍埋込み (t-distributed Stochastic Neighbor Embedding, tSNE)などの手法が用いられる。 特に、[http://www.jmlr.org/papers/v9/vandermaaten08a.html tSNE]と[https://arxiv.org/abs/1802.03426 UMAP]は、高次元データを低次元の点の集合として可視化することで、それぞれの細胞の持つ遺伝子発現状態の類似度についての直観的な表示が可能でありしばしば用いられる（'''図3'''）。tSNEよりUMAPの方が迅速に類似集団間の関係が明確になるので、最近はUMAPを利用することが多くなってきている。次に、[[Louvainアルゴリズム]]などでクラスタリング（[[コミュニティ分割]]）を行いグラフ上に表示できる（'''図3'''の色分け）。こうして、異なる転写状態を示す細胞の集合が別のクラスターとして表示され、同定可能になる<ref><pubmed>31500660</pubmed></ref>。
+ [[ファイル:scFig3.jpg|サムネイル|250px|'''図３． tSNEとUMAPによる同じデータの可視化'''<br>網膜（ニワトリ）の視細胞のデータを用いて執筆者が作製<ref name=Yamagata2021><pubmed>33393903</pubmed></ref>。]]
-　将来的には人工知能などを使ったナノボディのデザインなども可能になるのかもしれない<ref><pubmed>29672675</pubmed></ref><ref><pubmed>28953867</pubmed></ref>。
+==データ解析==
+===細胞クラスターの解釈とマーカー遺伝子候補の発見===
+　scRNA-seqデータから得られる生物学的知見には、内在的に存在する細胞の種類、外部刺激や環境で変化した細胞の状態、そして種類や変化により特徴的に発現するマーカー遺伝子候補の発見がある<ref><pubmed>27824854</pubmed></ref><ref><pubmed>32033589</pubmed></ref>。クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスター（群）に特徴的に発現している具体的な遺伝子を探索し、細胞集団の持つバイオマーカーによって、そのクラスター（群）の同定が可能になる。例えば、既に神経細胞とグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、神経細胞のタイプ（下記参考）を区別できるマーカーや、外部刺激によって遺伝子発現状態が変化した神経細胞の状態は、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子（差次的発現遺伝子）を見つけるためには（Differential expression analysis, DE analysis）、SeuratのFindMarkersコマンド中でも利用可能であるコード（MAST、DESeq2など<ref><pubmed>26653891</pubmed></ref><ref><pubmed>25516281</pubmed></ref><ref><pubmed>30658573</pubmed></ref>）を用いることができる。細胞ごとの差次的発現遺伝子のVisualization（表示可視化）には、[[ドットプロット]]（dot plot）、[[ヴァイオリンプロット]]（violin plot）、[[リッジプロット]]（Ridge plot, joy plot）、UMAPなどの次元圧縮図上に転写物量をプロットするFeatureプロット（feature plot）などが、目的に応じて頻繁に用いられる（'''図4'''）。
+[[ファイル:scFig4.jpg|サムネイル|300px|'''図４．scRNA-seqデータの可視化の例 '''<br>A. ドットプロット。B.ヴァイオリンプロット。C. リッジプロット。D. UMAP（灰色）に転写物量（青）をプロットした Featureプロット。網膜の視細胞のデータを用いて執筆者が作製<ref name=Yamagata2021></ref>。]]
+===擬時系列解析===
+　実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、[[細胞周期]]、[[概日リズム]]、発現変動が大きい破裂型[[プロモーター]]の作動などの理由で 変動が見られるものもある<ref name=Luecken2019><pubmed>31217225</pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上にある[[細胞系譜]]や[[細胞分化]]といった細胞の遷移状態の解析（[[軌道推定]]（Trajectory inference）；[[擬時系列解析]]（擬似時系列解析）、Pseudo-time analysis）には、scRNA-seqデータを用いることが効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref>。しばしば用いられるMonocle3 <ref><pubmed>30787437</pubmed></ref>[https://cole-trapnell-lab.github.io/monocle3/]など、多くのコードを収集、比較しているサイトがある [https://dynverse.org][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといったスプライシングされていく転写産物の量から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref><ref><pubmed> 32747759</pubmed></ref>。しかし、これらの方法は、あくまで細胞系譜や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNA-seqを行うことで、細胞タイプの系統関係を調べる方法として、[[CRISPR-Cas9]]を用いた[[ゲノム編集]]による痕跡追跡記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>、あるいはアデノシンデアミナーゼでRNA編集を行いタイムスタンプを入れる方法<ref><pubmed>33077959</pubmed></ref>がある。[[1塩基バリアント]]（Single-nucleotide variants: SNV）の系統的解析は、細胞の不均一性や系統的な関係を明らかにするための最も有望なアプローチの一つである<ref><pubmed>31744515</pubmed></ref>。
+===遺伝子制御ネットワーク、パスウェイ解析など===
+　また細胞分化や刺激などによる変動に伴う特徴的な遺伝子発現状態をscRNA-seqで観察することは、[[遺伝子制御ネットワーク]]（例、[https://github.com/aertslab/SCENIC SCENIC]<ref><pubmed>28991892</pubmed></ref>）、[[代謝経路]]や[[シグナル伝達系]]のための[[パスウェイ解析]](例、Metascape<ref><pubmed>30944313</pubmed></ref>, [http://metascape.org]、Gene Ontolgoy[http://geneontology.org])を理解するシステム生物学的な研究として有用である<ref><pubmed>32051003</pubmed></ref>。更に、scRNA-seqで得られた結果をもとに、細胞間相互作用の理解を深めるのを目的とするCellPhoneDB<ref><pubmed>32103204</pubmed></ref>[https://github.com/Teichlab/cellphonedb]、NicheNet<ref><pubmed>3181926</pubmed></ref>、SVCA<ref><pubmed>31577949</pubmed></ref>などがある。特に、Perturb-seq<ref><pubmed>27984732</pubmed></ref> やその変法<ref><pubmed> 32231336</pubmed></ref>は、CRISPRライブラリーによるゲノム編集を施した細胞をscRNA-seqで解析することで、ゲノム編集で破壊された遺伝子の機能や遺伝子間の相互作用の理解を可能にしている後述する複数モダリティ情報を取り込んだscRNA-seqの１つであり、注目されている。
-　通常、ナノボディは、目的別に発現ベクターにクローニングした後、哺乳類細胞だけなく、[[wj:細菌|細菌]]、[[wj:酵母|酵母]]、[[wj:植物|植物]]でも産生させることができる。哺乳類細胞では、抗体が本来機能する細胞外だけでなく、細胞内部でも発現させることが可能である（[[ナノボディ#イントラボディ、クロモボディ|イントラボディ]]）。ただし、ナノボディの配列はそれぞれ異なり、[[wj:ジスルフィド結合|ジスルフィド結合]]の生成が抗原との結合力あるコンフォメーションを取るために必要な場合、細胞外とは還元環境の異なる細胞内や細菌などでは活性のあるものが産生できないものもある。ナノボディの中には90℃という高温でも失活しないものもあるように<ref><pubmed>10209277</pubmed></ref><ref><pubmed>24739391</pubmed></ref>、一般に安定性は高いが、これも各ナノボディのアミノ酸配列から生じる特性による。
+==神経科学研究への適用==
+===神経系細胞ビッグデータとしてのscRNA-seq===
+　様々な神経・精神疾患について理解しその診断や治療に役立てるためには、神経細胞、[[グリア細胞]]を中心にした神経系にある細胞の種類や状態を識別し、それぞれの細胞における分子的な変化を観察することが重要である <ref><pubmed>28775344</pubmed></ref><ref><pubmed>29738987</pubmed></ref>。本項目で解説してきたscRNA-seq技術は、神経系に見られるそれぞれの細胞のトランスクリプトームについて[[ビッグデータ]]を提供することで、この細胞の種類や状態の識別に新たな判断材料を与えつつある。近年、中枢神経系の[[アストロサイト]]、[[オリゴデンドロサイト]]、[[ミクログリア]]といった[[グリア細胞]]も均一ではなく、内在的な多様性や外部因子による状態の変動が報告されてきている。神経細胞は、著しく多様であり、この多様性が神経系の多彩で複雑な機能発現の基盤となっている。従来の神経科学では、神経細胞の多様性は、それぞれの神経細胞の解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきている。こうした神経細胞の多様性を便宜的に記述するのに、タイプ（type）、クラス（class）、サブクラス（subclass）、サブタイプ（subtype） というような用語が用いられてきた。しかし、ここでは混乱を防ぐため、Masland（2004）<ref><pubmed>15242626</pubmed></ref>が提唱し、広く受けいれられている「クラス」と「タイプ」という単語を用いることとする<ref name=Yuste2020><pubmed>32839617</pubmed></ref>。タイプは、これ以上分類することができないとされる階層であり、共通性を持つタイプの集団がクラスである。例えば、[[大脳皮質]]の[[錐体細胞]]、[[網膜神経節細胞]]といった大雑把な区分はクラスである。大脳皮質の錐体細胞というクラスは、層や領野によって異なるタイプ、網膜神経節細胞には視覚情報に対して応答が異なるタイプが存在する。scRNA-seqは、「タイプ」の理解に新たな視点を提供している。
+===神経系へのscRNA-seqの適用===
+　scRNA-seqの神経系での利用については、次々と新しい論文やプレプリントが発表されており、ここではscRNA-seqで得られてきた情報の典型例を紹介することにとどめる。
-===既知ナノボディ===
+　大脳皮質には、錐体細胞や[[非錐体細胞]]などの神経細胞や様々なグリア細胞などが見られ、古くから神経細胞タイプの識別が行われてきた。初期のFluidigm C1を用いたscRNA-seq技術でも、マウス皮質の小規模な細胞数を分類した研究で、これまで知られていた主要な神経細胞タイプとは違うタイプが見つかりscRNA-seqの有効性が示された<ref><pubmed>25700174</pubmed></ref>。その後のドロップレット使用の3’エンドリード法を利用した多数の細胞数の解析で、更に多数の神経細胞のタイプが見つかっている<ref name=Yuste2020><pubmed>32839617</pubmed></ref><ref name=Habib2017><pubmed>28846088</pubmed></ref><ref><pubmed>30096299</pubmed></ref><ref><pubmed>30096314</pubmed></ref><ref><pubmed>30382198</pubmed></ref><ref><pubmed>29320739</pubmed></ref><ref><pubmed>33338423</pubmed></ref>[https://doi.org/10.1101/2020.06.04.105700] [https://doi.org/10.1101/2020.07.02.184051]。特に、[[GABA]]作動性[[介在神経細胞]]タイプの多様性とその発生<ref><pubmed>28942923</pubmed></ref><ref><pubmed>28134272</pubmed></ref><ref><pubmed>29472441</pubmed></ref><ref><pubmed>29513653</pubmed></ref>についての、これまでの組織化学的な研究からは得られていなかった多くの情報は重要であろう。また、初期の発生過程<ref><pubmed>26940868</pubmed></ref><ref><pubmed>30485812</pubmed></ref><ref><pubmed>31073041</pubmed></ref><ref><pubmed>30635555</pubmed></ref><ref><pubmed>30625322</pubmed></ref>、老化<ref><pubmed>31551601</pubmed></ref>の理解が、scRNA-seq技術を利用することで進んでいる。更に、[[神経活動]]や[[臨界期]]に伴い変化するmRNAも細胞ごとに調査され興味深い<ref><pubmed>29230054</pubmed></ref> <ref><pubmed>32404418</pubmed></ref>。
-　ナノボディの情報を系統的に収集してきている中国の南京にある[[wj:東南大学|東南大学]]の[http://ican.ils.seu.edu.cn iCAN (Institute Collection & Analysis of Nanobody)]<ref><pubmed>29041922</pubmed></ref>には、2018年8月現在、約2400のナノボディ配列が登録されている。
-　１つのナノボディは、120アミノ酸（cDNAとして360bp）ほどなので、クローニングなどに利用するための配列を付加しても500bp未満の長さに収めることができる。したがって、利用したい特定ナノボディのアミノ酸配列がわかっていれば、いくつかの民間会社が提供している長鎖DNAを化学合成するサービスなどを利用することで短期間のうちにcDNA配列が入手可能である。
+　ヒトを含めた[[霊長類]]の大脳についても発達段階を含めてscRNA-seqが適用されてきている<ref><pubmed>26060301</pubmed></ref><ref><pubmed>27339989</pubmed></ref><ref name=Zhong2018><pubmed>29539641</pubmed></ref><ref name=Nowakowski2017><pubmed>29217575</pubmed></ref><ref name=Habib2017><pubmed>28846088</pubmed></ref><ref><pubmed>29227469</pubmed></ref><ref><pubmed>31303374</pubmed></ref><ref><pubmed>29867213</pubmed></ref><ref><pubmed>31435019</pubmed></ref><ref><pubmed>32424074</pubmed></ref> <ref><pubmed>32999462</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972][https://doi.org/10.1101/2020.04.23.056390]。ヒトや霊長類に特徴的とされる[[島]]の[[von Economo神経細胞]]（[[紡錘細胞]]）のような希少な神経細胞のscRNA-seqにも成功している<ref><pubmed>32127543</pubmed></ref>。
-===修飾===
+　[[海馬]]<ref><pubmed>29241552</pubmed></ref><ref><pubmed>29912866</pubmed></ref><ref><pubmed>29335606</pubmed></ref><ref><pubmed>31942070</pubmed></ref>では、これまでの研究で記載されてきた神経細胞のタイプの存在が確認され、更に新規のタイプが見つかった。中枢神経系では、その他、[[外側膝状体]]<ref><pubmed>29343640</pubmed></ref>、[[大脳基底核]]<ref><pubmed>28384468</pubmed></ref>、[[視床下部]]<ref><pubmed>28166221</pubmed></ref><ref><pubmed>28355573</pubmed></ref>  <ref><pubmed>27991900</pubmed></ref><ref name=Moffitt2018><pubmed>30385464</pubmed></ref>  <ref><pubmed>31249056</pubmed></ref><ref><pubmed>30858605</pubmed></ref>、[[線条体]]<ref><pubmed>27425622</pubmed></ref><ref><pubmed>30134177</pubmed></ref><ref><pubmed>31875543</pubmed></ref>、[[中脳]]<ref><pubmed>27716510</pubmed></ref><ref><pubmed>29499164</pubmed></ref><ref><pubmed>30718509</pubmed></ref>、[[手綱核]]<ref><pubmed>29576475</pubmed></ref>、発生中の[[間脳]]<ref><pubmed>30872278</pubmed></ref> 、さらに[[小脳]]<ref><pubmed>30220501</pubmed></ref><ref><pubmed>30735127</pubmed></ref><ref><pubmed>30690467</pubmed></ref>などの結果が報告されてきている。例えば、構成する細胞についての情報が詳細に研究されてきたと思われていたマウスの小脳においても、分子層にこれまでの[[星状細胞]]、[[バスケット細胞]]というカテゴリーとは違った[[ギャップジャンクション]]に特徴を持つ２種類の神経細胞があることが示唆されている<ref><pubmed>24259518</pubmed></ref>。
-　ナノボディだけでは 通常の抗体と違い定常領域を欠いているため、何らかの修飾が必要である。このことはナノボディが抗体のように簡便に利用できないという不便さになっているが、修飾を実験に合わせて自在に工夫できるという利点にもなっている。また、余分な構造を持たないので、バックグラウンドを低下させ、感度や精度の高い解析が可能になるという長所もある。
-====化学的カップリング====
+　脳の外部では、[[運動神経]][https://doi.org/10.1101/2020.03.16.992958]、[[感覚神経]]<ref><pubmed>25420068</pubmed></ref><ref><pubmed>26691752</pubmed></ref>、[[らせん神経節]]<ref><pubmed>30078709</pubmed></ref><ref><pubmed>30209249</pubmed></ref> 、[[嗅覚神経]]<ref><pubmed>26541607</pubmed></ref><ref><pubmed>32059767</pubmed></ref>、[[腸神経系]] <ref><pubmed>29483303</pubmed></ref><ref><pubmed>33288908</pubmed></ref>、[[網膜]]<ref><pubmed>27565351</pubmed></ref><ref name=Konstantinides2018><pubmed>29909983</pubmed></ref><ref><pubmed>30018341</pubmed></ref><ref><pubmed>31260032</pubmed></ref><ref><pubmed>31128945</pubmed></ref><ref name=Peng2019><pubmed>30712875</pubmed></ref><ref><pubmed>30548510</pubmed></ref><ref><pubmed>31075224</pubmed></ref><ref><pubmed>31399471</pubmed></ref><ref><pubmed>31848347</pubmed></ref><ref><pubmed>31673015</pubmed></ref><ref><pubmed>31653841</pubmed></ref><ref><pubmed>31784286</pubmed></ref>[https://doi.org/10.1101/2020.02.26.966093]<ref><pubmed>32386599</pubmed></ref>[https://www.biorxiv.org/content/10.1101/617555v2]<ref name=Yamagata2021></ref><ref>'''Shekhar K, Sanes JR (2021)'''.<br>Generating and using transcriptomically based retinal cell atlases. Annu Rev Vis Sci 7: (in press)</ref>でのscRNA-seqデータがある。
-　免疫組織化学に最もよく用いられているのは、ナノボディをタンパク質として精製後、色素分子などを化学的にカップリングするという方法である。このような試薬は既製のナノボディ試薬として市販もされている（例、ChromoTek社<ref>https://www.chromotek.com/</ref> ）。最近、1次抗体を認識する「2次抗体」の活性を持つナノボディが報告されている<ref><pubmed>29263082</pubmed></ref> 。ナノボディの多くは、大腸菌で活性あるものを大量産生、精製することができるので、一度、配列がわかれば、動物を使用する必要がなくなる。
-　また、化学的なカップリングなので、カップリングする分子を変化させ工夫することで、目的に合わせて様々な標識ナノボディ（薬剤を結合した[[wj:武装抗体|武装抗体]]など）を作製できる可能性がある<ref><pubmed>28883823 </pubmed></ref> 。しかし、カップリングによるアミノ酸残基を修飾する反応により抗原結合能を失うことも想定される。この問題については、修飾するアミノ酸残基の位置を制御することで解決は可能である<ref><pubmed>26633879</pubmed></ref> 。
+　また[[iPS細胞]]や[[ES細胞]]由来の神経組織[[オルガノイド]]に含まれる神経細胞タイプを知る上でも利用されている<ref><pubmed>28094016</pubmed></ref><ref><pubmed>28279351</pubmed></ref><ref><pubmed>31168097</pubmed></ref><ref><pubmed>31996853</pubmed></ref><ref><pubmed>31968264</pubmed></ref><ref><pubmed>32221280</pubmed></ref>。このようなアプローチは、[[ネアンデルタール人]]型の遺伝子を持つ脳オルガノイドの解析<ref><pubmed> 32559457</pubmed></ref>やSARS-CoV-2に感染する脳オルガノイド中の細胞の同定<ref><pubmed> 33113348</pubmed></ref>など、新たな応用例が発表されてきており興味深い。
-====RANbody====
-　化学的カップリング反応は、しばしばナノボディの活性を消失させるが、実験的にも条件決定など必ずしも容易ではない。この問題を克服するために開発されたプラットフォームがRANbody（Receptor-and-Nanobody)である<ref name=yamagata2018><pubmed>29440485</pubmed></ref>。
-　RANbodyは、１つのナノボディを酵素（改良型[[wj:西洋ワサビペルオキシダーゼ|西洋ワサビペルオキシダーゼ]] HRP）、抗原性のあるニワトリ抗体IgYのFc断片、あるいは多重エピトープタグなどのうち1つと、組み換えDNA技術により融合させることで、検出可能にしたものである。プラスミドを293T細胞などの動物細胞に導入するだけで、培地中に放出されるので多くの生物医学系の実験室で利用できる。HRPは大腸菌の中では活性のある酵素として発現させることができない。その一つの解決策として、[[アスコルビン酸オキシダーゼ]] ([[APEX2]])との融合タンパク質を大腸菌で発現させて用いることができるが、APEX2はHRPに比べて活性が弱い<ref><pubmed>29915061</pubmed></ref><ref><pubmed>25419960</pubmed></ref> 。
+===神経細胞以外の細胞===
+　[[上衣細胞]]<ref><pubmed>29727663</pubmed></ref>は、[[神経幹細胞]]としての役割が示唆されてきたが、scRNA-seqによる解析ではその可能性が支持されなかった。グリア細胞では、[[ラジアルグリア]]<ref><pubmed>26406371</pubmed></ref><ref><pubmed>25734491</pubmed></ref><ref><pubmed>29281841</pubmed></ref><ref name=Nowakowski2017><pubmed>29217575</pubmed></ref><ref name=Zhong2018><pubmed>29539641</pubmed></ref>、アストロサイト<ref><pubmed>32139688</pubmed></ref><ref><pubmed>32203496</pubmed></ref>[https://doi.org/10.1101/2020.04.27.064881]に多様性があることが示唆されてきている。また、オリゴデンドロサイト<ref><pubmed>27284195</pubmed></ref><ref><pubmed>30078729</pubmed></ref><ref name=Avey2018><pubmed>30257220</pubmed></ref><ref name=Jäkel2019><pubmed>30747918</pubmed></ref><ref><pubmed>31958186</pubmed></ref>[https://doi.org/10.1101/2020.03.06.981373]については、これまで細胞生物学的に研究されてきた分化の過程がscRNA-seqにより詳細に解析されている。ミクログリアは、神経系の発達、老化、損傷などに伴う重要な遺伝子発現状態の変化がscRNA-seqにより詳細に明らかになった<ref><pubmed>27338705</pubmed></ref><ref name=Mathys2017><pubmed>29020624</pubmed></ref><ref><pubmed>30206190</pubmed></ref><ref name=Hammond2019><pubmed>30471926</pubmed></ref><ref><pubmed>31209379</pubmed></ref><ref><pubmed>31835035</pubmed></ref>。また、[[CNS境界関連マクロファージ]](BAM) <ref><pubmed>31061494</pubmed></ref>や[[脳血管系]]<ref><pubmed>29443965</pubmed></ref>のscRNA-seqも実施されている。
+===疾患===
+　scRNA-seqは、疾患の理解にも有用である。scRNA-seqでは、疾患に伴う遺伝子発現状態の変化を細胞タイプごとに観察することができるので、バルクRNA-seqでは埋もれていた遺伝子発現状態の変化や細胞ごとの変化を検出できるという長所がある。
+例えば、[[筋萎縮性側索硬化症]]<ref name=Maniatis2019><pubmed>30948552</pubmed></ref>、[[多発性硬化症]]<ref name=Jäkel2019><pubmed>30747918</pubmed></ref><ref><pubmed>30420755</pubmed></ref><ref><pubmed>32313246</pubmed></ref>、[[アルツハイマー病]]やそのモデル動物<ref><pubmed>31042697</pubmed></ref><ref><pubmed>31399126</pubmed></ref><ref name=Mathys2017><pubmed>29020624</pubmed></ref>
+[https://doi.org/10.1101/628347]<ref><pubmed>28602351</pubmed></ref><ref><pubmed>32341542</pubmed></ref>、[[統合失調症]]<ref><pubmed>29785013</pubmed></ref><ref><pubmed>32203495</pubmed></ref>、[[てんかん]]<ref><pubmed> 33028830</pubmed></ref>、[[自閉症]]や[[レット症候群]]<ref><pubmed>31097668</pubmed></ref><ref><pubmed>30455458</pubmed></ref>、[[シャルコー・マリー・トゥース病]]<ref><pubmed>29888333</pubmed></ref>、[[ダウン症]][https://www.biorxiv.org/content/10.1101/2020.01.01.892398v1]、[[パーキンソン病]]<ref><pubmed>30503143</pubmed></ref><ref><pubmed>32826893</pubmed></ref>、[[ハンチントン病]]<ref><pubmed>32070434</pubmed></ref>、[[がん]]<ref><pubmed>31327527</pubmed></ref><ref><pubmed>28360267</pubmed></ref>などに適用されている。最近、Perturb-seqにより、[[自閉症]]に関わる遺伝子の欠損に伴う細胞状態の変化などもscRNA-seqで報告されており<ref><pubmed>33243861</pubmed></ref>、疾患の理解のための新たな実験系の開発も始まりつつある。
+==scRNA-seqの展望==
+===神経系の多様性と進化===
+　NGSを用いることで、どんな生物種にも適用可能なscRNA-seqは、既に多様な生物の神経系の細胞の理解、更には種間の相同性や差異の研究に利用されており、神経系の進化を細胞レベルで考察するのに有用であろう（例、[[線虫]]<ref name=Cao2017><pubmed>28818938</pubmed></ref>、[[ショウジョウバエ]]<ref><pubmed>29909982</pubmed></ref><ref><pubmed>29149607</pubmed></ref><ref><pubmed>30703584</pubmed></ref><ref name=Konstantinides2018><pubmed>29909983</pubmed></ref><ref><pubmed>33125872</pubmed></ref>、[[カタユウレイボヤ]]''Ciona intestinalis''<ref><pubmed>30069052</pubmed></ref><ref><pubmed>30228204</pubmed></ref>、[[ゼブラフィッシュ]]<ref><pubmed>31018142</pubmed></ref><ref><pubmed>30929901</pubmed></ref>、[[アカミミガメ]]''Trachemys scripta elegans''、[[トカゲ]]''Pogona vitticeps'', PV<ref><pubmed>29724907</pubmed></ref>、[[ニワトリ]]<ref name=Yamagata2021></ref>、[[霊長類]]<ref><pubmed>30730291</pubmed></ref><ref><pubmed>31619793</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972]）。ただ、遺伝子やトランスクリプトームの研究が進んでいる生物種では比較的容易であるが、遺伝子のアノテーションが十分でない生物種を用いる場合、scRNA-seqのデータ解析は困難を伴う。また種を超えた細胞タイプの相同性の理解には様々な工夫が必要である<ref><pubmed>31552245</pubmed></ref><ref name=Peng2019><pubmed>30712875</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972]。
+===データベースと統合===
+　獲得されたscRNA-seqのデータは様々な目的で利用できるので、データベース化し利用できるようにする必要がある。神経系のトランスクリプトーム一般のデータベースが多数公開されており<ref><pubmed>29437890</pubmed></ref>、scRNA-seqのデータも基本的にNCBIの[https://www.ncbi.nlm.nih.gov/geo/ Gene Expression Omnibus]に登録されている。また、オープンサイエンス推進のためにcommon coordinate framework (CCF) やcentral annotation platform (CAP)という概念のもと、特にscRNA-seqを意識したものとして、米国のBRAIN Initiative Cell Census Consortium<ref><pubmed>29096072</pubmed></ref>、Human Cell Atlas Projectの[https://data.humancellatlas.org Human Cell Atlas Data Portal]、そのマウス版である[https://genome.ucsc.edu/cgi-bin/hgTrackUi?db=mm10&g=tabulaMuris Tabula Muris]<ref><pubmed>30283141</pubmed></ref>やSten Linnarssonラボの[http://mousebrain.org マウス脳発生データベース]、アレン脳研究所の[https://portal.brain-map.org Allen Brain Atlas]、ブロード研究所の[https://singlecell.broadinstitute.org/ Single Cell Portal]などのデータベースが稼働している。また、異なった方法や実験で得られたscRNA-seqのデータや後述の複数モダリティのシングルセルオミクスのデータを体系的に比較することも重要であり、CCA (Canonical correlation analysis)<ref name=Butler2018><pubmed>29608179</pubmed></ref>, Seurat 3.0以降に組み込まれたMMN (Mutual Nearest Neighbors)、LIGER<ref><pubmed>31178122</pubmed></ref> 、Harmony<ref><pubmed>31740819</pubmed></ref>  、MetaNeighber<ref><pubmed>29491377</pubmed></ref>、Conos<ref><pubmed>31308548</pubmed></ref>[https://doi.org/10.1101/2020.05.22.111161]のようなアルゴリズムが開発され、後述の複数モダリティのシングルセルオミクスを組み込んだ[https://biccn.org 統合サイト]もでき始めている。またデータベースを利用して発現類似性検索も研究されている<ref><pubmed>29608555</pubmed></ref><ref><pubmed>30744683</pubmed></ref>。
+===空間トランスクリプトミクス===
+　多数の細胞を扱うscRNA-seqの弱点は、組織から細胞や細胞核を解離する必要があるので、その細胞が存在していた解剖学的あるいは空間的な位置の情報を消去してしまうということである。組織切片におけるタンパク質などの分布は[[免疫組織化学]]、mRNAの分布はin situ hybridizationで検出することができるが、数多くのmRNAの分布を情報処理技術と組み合わせ一気に同定する方法がscRNA-seqと同様に開発されてきている（Slide-seq<ref><pubmed>30923225</pubmed></ref><ref><pubmed> 33288904</pubmed></ref>、HDST<ref><pubmed>31501547</pubmed></ref>、Expansion sequencing[http://doi.org/10.1101/2020.05.13.094268]など<ref><pubmed>27365449</pubmed></ref>, <ref><pubmed>31932730</pubmed></ref><ref name=Maniatis2019><pubmed>30948552</pubmed></ref>）、更に10x Genomics社が市販するVisium（現時点ではシングルセルレベルではない）などがある。現状では、大きな組織の空間トランスクリプトミクスは、空間解像度は限定されており、技術普及の観点からも課題が多い。しかし、そのデータを解析するためのアルゴリズム<ref><pubmed>29553578</pubmed></ref><ref><pubmed>29553579</pubmed></ref><ref><pubmed>32350282</pubmed></ref>[https://doi.org/10.1101/757096][https://doi.org/10.1101/701680][https://doi.org/10.1101/431957]、更にMerFish <ref><pubmed>25858977</pubmed></ref>、corrFISH<ref><pubmed>27271198</pubmed></ref>のように、subcellularレベルで多数のmRNAを検出する方法が多数開発されてきており（<ref><pubmed>25549890</pubmed></ref> osmFISH<ref><pubmed>30377364</pubmed></ref>、STARmap (spatially-resolved transcript amplicon readout mapping) <ref><pubmed>29930089</pubmed></ref>、seqFISH+<ref><pubmed>27764670</pubmed></ref>、pciSeq(probabilistic cell typing by in situ sequencing)[https://doi.org/10.1101/431957]、DSP(Digital Spatial Profiling) <ref><pubmed>32393914</pubmed></ref>、scRNA-seqと組み合わせることで、その弱点を補う空間トランスクリプトミクスにも利用され始め<ref name=Moffitt2018><pubmed>30385464</pubmed></ref>[https://doi.org/10.1101/2020.06.04.105700]、今後の発展が期待される分野である<ref><pubmed>32702314</pubmed></ref>。
+===統合解析 ===
+　同一の細胞からscRNA-seqの情報だけでなく、ゲノム配列、ATAC-seqなどによる[[エピゲノム]]解析、少数のタンパク質、あるいは[[プロテオーム]]など複数のモダリティを同時に観察するオミクス（Single-cell multimodal omics）が注目されている<ref><pubmed>31907462</pubmed></ref><ref><pubmed>30696980</pubmed></ref>。2019年には、Nature Methodsの「Methods of the Year」に選ばれており、現状については、その特集号などを参考にされたい。例えば、細胞表面に提示されているマーカー分子に対する抗体にDNAを付加することで、そのマーカーを発現する細胞のトランスクリプトームを解析するCITE-seq<ref><pubmed>28759029</pubmed></ref>、 REAP-seq<ref><pubmed>28854175</pubmed></ref>も、既知の細胞表面マーカーの発現とscRNA-seqが同時に観察できる方法である。
-==利用法==
+　複数モダリティのシングルセルオミクスとして、神経科学分野で注目されるのは、scRNA-seqを[[パッチクランプ]]による電気生理学的情報と組み合わせたPatch-seq<ref><pubmed>26689544</pubmed></ref> <ref><pubmed>26689543</pubmed></ref>である。また、ゲノムDNAとscRNA-seqを同時に観察することによって、近年、精神疾患の観点から注目されている発生途中で生じる遺伝子変異を研究するPRDD-seqは今後の展開が注目される<ref><pubmed> 32522880</pubmed></ref>。最後に、BARseq (barcoded anatomy resolved by sequencing) <ref><pubmed>31626774</pubmed></ref>、CONNECTID[https://doi.org/10.1101/378760]、Epi-Retro-seq<ref><pubmed>30276807</pubmed></ref>のような方法は、[[コネクトーム]]（神経細胞の結合性）と遺伝子発現状態を記録できるオミクスの新たな方向として興味深い。
-[[ファイル:nanobody4.jpg ‎|サムネイル|300px|'''図4．ナノボディの利用法''']]
+== 関連項目 ==
-==参考文献==
+*[[ゲノムワイド関連解析 ]]
-<references/>
+*[[ディファレンシャルディスプレイ ]]
+*[[In situハイブリダイゼーション法 ]]
+*[[免疫組織化学法]]
+*[[エピジェネティクス]]
+*[[コネクトーム]]
+== 参考文献  ==
+<references />