「シングルセルRNAシーケンシング」の版間の差分

ナビゲーションに移動 検索に移動
PMID:33393903をつかって、<ref name=Yamagata2021></ref>に変更
(PMID:33393903をつかって、<ref name=Yamagata2021></ref>に変更)
 
(2人の利用者による、間の7版が非表示)
29行目: 29行目:
 増幅バイアス除去のアプローチとして特に重要なのは、2011年に発表された核酸配列バーコードを利用した方法で、分子識別子(unique molecular identifiers: UMI)を持つcDNAを増幅させ、次世代シーケンサー後の情報処理を用いるものであると考えられる<ref><pubmed>22101854</pubmed></ref>。この方法では[[逆転写]]反応の際、ランダム塩基配列から構成されるUMIをcDNA末端に付加した後、増幅反応、次世代シーケンサーを行い、cDNA配列とUMI配列の両方を読む。cDNAにはRNA1分子に1つのUMIが付加されるので、同一のUMIを持っていれば、逆転写時に同一のcDNA由来とカウントする。UMIをカウントすることで、増幅前のmRNAのコピー数を知ることができる<ref name=Islam2011><pubmed>21543516</pubmed></ref><ref><pubmed>24363023</pubmed></ref><ref name=Gierahn2017><pubmed>28192419</pubmed></ref> <ref><pubmed>29474909</pubmed></ref><ref name=Cao2017><pubmed>28818938</pubmed></ref><ref name=Rosenberg2018><pubmed>29545511</pubmed></ref>。
 増幅バイアス除去のアプローチとして特に重要なのは、2011年に発表された核酸配列バーコードを利用した方法で、分子識別子(unique molecular identifiers: UMI)を持つcDNAを増幅させ、次世代シーケンサー後の情報処理を用いるものであると考えられる<ref><pubmed>22101854</pubmed></ref>。この方法では[[逆転写]]反応の際、ランダム塩基配列から構成されるUMIをcDNA末端に付加した後、増幅反応、次世代シーケンサーを行い、cDNA配列とUMI配列の両方を読む。cDNAにはRNA1分子に1つのUMIが付加されるので、同一のUMIを持っていれば、逆転写時に同一のcDNA由来とカウントする。UMIをカウントすることで、増幅前のmRNAのコピー数を知ることができる<ref name=Islam2011><pubmed>21543516</pubmed></ref><ref><pubmed>24363023</pubmed></ref><ref name=Gierahn2017><pubmed>28192419</pubmed></ref> <ref><pubmed>29474909</pubmed></ref><ref name=Cao2017><pubmed>28818938</pubmed></ref><ref name=Rosenberg2018><pubmed>29545511</pubmed></ref>。
===多様なプラットフォーム===
===多様なプラットフォーム===
 細胞を分別するプラットフォームには、マイクロピペットによる捕獲、[[セルソーター]]、[[レーザー捕獲]]などを用いるマルチウェル法、あるいは半導体集積回路様の製作技術で作った流体回路を利用するFluidigm C1の装置(C1 Single- Cell Auto Prep)[https://jp.fluidigm.com] 、更にドロップレット使用(下記)などがある<ref><pubmed>30405621</pubmed></ref><ref><pubmed>33247933</pubmed></ref>。これらは、SMART-seqと組み合わせて利用されることが多い。SMART-seqプロトコールの特徴は、全長mRNAのトランスクリプトーム情報を得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、SNPsの情報を利用したアリル特異的発現、変異の検出にも利用できる。また、それぞれ細胞ごとの反応を独立した場所で行うため、反応中に別の細胞の反応と混じる可能性が低い。小型のナノウェルを用いるSeq-Wellも同様に反応自体が混じる可能性が低い<ref name=Gierahn2017><pubmed>28192419</pubmed></ref>。これらの点が、次に説明するドロップレットを使用して3’末端のみを標的にしたscRNA-seqと比べた場合の長所であるが、その高コスト(1細胞あたり数十ドル)と処理可能な細胞数の少なさが短所である。
 細胞を分別するプラットフォームには、マイクロピペットによる捕獲、[[セルソーター]]、[[レーザー捕獲]]などを用いるマルチウェル法、あるいは半導体集積回路様の製作技術で作った流体回路を利用するFluidigm C1の装置([https://jp.fluidigm.com C1 Single- Cell Auto Prep])、更にドロップレット使用(下記)などがある<ref><pubmed>30405621</pubmed></ref><ref><pubmed>33247933</pubmed></ref>。これらは、SMART-seqと組み合わせて利用されることが多い。SMART-seqプロトコールの特徴は、全長mRNAのトランスクリプトーム情報を得ることができることであり、mRNAのスプライシングバリアントなどのアイソフォーム、SNPsの情報を利用したアリル特異的発現、変異の検出にも利用できる。また、それぞれ細胞ごとの反応を独立した場所で行うため、反応中に別の細胞の反応と混じる可能性が低い。小型のナノウェルを用いるSeq-Wellも同様に反応自体が混じる可能性が低い<ref name=Gierahn2017><pubmed>28192419</pubmed></ref>。これらの点が、次に説明するドロップレットを使用して3’末端のみを標的にしたscRNA-seqと比べた場合の長所であるが、その高コスト(1細胞あたり数十ドル)と処理可能な細胞数の少なさが短所である。


 これらとは別に、ハイスループットで安価な方法として、それぞれの細胞を独立に標識するのではなく、プールされた細胞を異なるウェルにランダムに振り分け、ウェル固有のバーコードで転写物を標識していく操作を複数回繰り返していくことで細胞を区別するSplit-seqやsci-RNA-seq3などの方法も用いられている<ref name=Rosenberg2018><pubmed>29545511</pubmed></ref><ref><pubmed>30787437</pubmed></ref>。
 これらとは別に、ハイスループットで安価な方法として、それぞれの細胞を独立に標識するのではなく、プールされた細胞を異なるウェルにランダムに振り分け、ウェル固有のバーコードで転写物を標識していく操作を複数回繰り返していくことで細胞を区別するSplit-seqやsci-RNA-seq3などの方法も用いられている<ref name=Rosenberg2018><pubmed>29545511</pubmed></ref><ref><pubmed>30787437</pubmed></ref>。
42行目: 42行目:


==実際==
==実際==
 ここでは主流になっている10x Genomics社のChromium controllerなどのドロップレットを用いた方法とSMART-seqなどを用いた他のプラットフォームに共通する方法の実際について概説する。scRNA-seqの利用には、4つのステップがある('''図2''')<ref name=Luecken2019><pubmed>31217225</pubmed></ref><ref><pubmed>30089861</pubmed></ref>
 ここでは主流になっている10x Genomics社のChromium controllerなどのドロップレットを用いた方法とSMART-seqなどを用いた他のプラットフォームに共通する方法の実際について概説する。scRNA-seqの利用には、4つのステップがある('''図2''')<ref name=Luecken2019><pubmed>31217225</pubmed></ref><ref><pubmed>30089861</pubmed></ref>。これらのうち、'''2.'''の段階については、上に記述したように市販の機器や試薬を利用する機会が多くなっているので、詳細は説明しない。
[[ファイル:ScFig2d.jpg|サムネイル|500px|'''図2.scRNA-seqの実際のステップ '''<br>細胞の単離、ライブラリ作製とNGS、データの前処理から次元圧縮、データ解析。図の一部は2016 DBCLS TogoTV、あるいはSeuratを用いて10x Genomics社のPBMCデータ([https://support.10xgenomics.com/single-cell-gene-expression/datasets]から執筆者が作製。]]
[[ファイル:ScFig2d.jpg|サムネイル|500px|'''図2.scRNA-seqの実際のステップ '''<br>細胞の単離、ライブラリ作製とNGS、データの前処理から次元圧縮、データ解析。図の一部は2016 DBCLS TogoTV、あるいはSeuratを用いて10x Genomics社の[https://support.10xgenomics.com/single-cell-gene-expression/datasets PBMCデータ]から執筆者が作製。]]
# 個体や組織を採集し、そこから細胞あるいは細胞核を個別に解離された状態にすること。
# 個体や組織を採集し、そこから細胞あるいは細胞核を個別に解離された状態にすること。
# ドロップレット法やSMART-seq対応のプラットフォームなどによる個々の細胞からのライブラリーの作製とNGS。
# ドロップレット法やSMART-seq対応のプラットフォームなどによる個々の細胞からのライブラリーの作製とNGS。
# 得られた配列情報の前処理(preprocessing)。
# 得られた配列情報の前処理(preprocessing)。
# データ解析。これらのうち、'''2.'''の段階については、上に記述したように市販の機器や試薬を利用する機会が多くなっているので、詳細は説明しない。
# データ解析。
 
===組織からの細胞、細胞核の分離===
===組織からの細胞、細胞核の分離===
 浮遊細胞([[血液]]細胞など)ではない場合、物理的あるいは酵素処理などによって解離することで、生組織から状態の良い個々に分散した細胞を調製する必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている<ref><pubmed>29970990</pubmed></ref>。ここで、しばしば問題となるのが、酵素処理による短時間加温や機械的刺激で、発現量が変化する遺伝子が存在することである<ref><pubmed>27090946</pubmed></ref>。特に、脳の[[ミクログリア]]の解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった<ref name=Hammond2019><pubmed>30471926</pubmed></ref>。また、このような現象を抑制するために、酵素処理時に転写阻害剤である[[アクチノマイシン]]で処理したり<ref><pubmed>29024657</pubmed></ref>、ヒマラヤ氷河から得られた細菌''Bacillus licheniformis''から得られた低温プロテアーゼを用いる方法も報告されている<ref><pubmed>28851704</pubmed></ref><ref><pubmed>31623682</pubmed></ref>。また、細胞解離後に、[[メタノール]]で固定しscRNA-seqに使用したり<ref><pubmed>28526029</pubmed></ref>、クロスリンカーを用いる方法もある<ref><pubmed>29391536</pubmed></ref>。
 浮遊細胞([[血液]]細胞など)ではない場合、物理的あるいは酵素処理などによって解離することで、生組織から状態の良い個々に分散した細胞を調製する必要がある。神経系組織の酵素処理には、パパインを用いる方法が広く用いられている<ref><pubmed>29970990</pubmed></ref>。ここで、しばしば問題となるのが、酵素処理による短時間加温や機械的刺激で、発現量が変化する遺伝子が存在することである<ref><pubmed>27090946</pubmed></ref>。特に、脳の[[ミクログリア]]の解析には、低温下で組織をホモゲナイズするなどの工夫が必要であった<ref name=Hammond2019><pubmed>30471926</pubmed></ref>。また、このような現象を抑制するために、酵素処理時に転写阻害剤である[[アクチノマイシン]]で処理したり<ref><pubmed>29024657</pubmed></ref>、ヒマラヤ氷河から得られた細菌''Bacillus licheniformis''から得られた低温プロテアーゼを用いる方法も報告されている<ref><pubmed>28851704</pubmed></ref><ref><pubmed>31623682</pubmed></ref>。また、細胞解離後に、[[メタノール]]で固定しscRNA-seqに使用したり<ref><pubmed>28526029</pubmed></ref>、クロスリンカーを用いる方法もある<ref><pubmed>29391536</pubmed></ref>。
81行目: 82行目:
 このような品質管理、ノーマライゼーションの過程を経て<ref><pubmed>28504683</pubmed></ref>、scRNA-seqのデータ解析において、最初に行うのが、[[次元圧縮]] (dimensionality reduction)である<ref><pubmed>30617341</pubmed></ref><ref><pubmed>31780648</pubmed></ref><ref><pubmed>31955711</pubmed></ref><ref><pubmed>31823809</pubmed></ref>。主成分分析 (Principal component analysis, PCA)、更に発展させた均一マニフォールド近似と投影(Uniform Manifold Approximation and Projection, UMAP)、Diffusion maps<ref><pubmed> 26002886
 このような品質管理、ノーマライゼーションの過程を経て<ref><pubmed>28504683</pubmed></ref>、scRNA-seqのデータ解析において、最初に行うのが、[[次元圧縮]] (dimensionality reduction)である<ref><pubmed>30617341</pubmed></ref><ref><pubmed>31780648</pubmed></ref><ref><pubmed>31955711</pubmed></ref><ref><pubmed>31823809</pubmed></ref>。主成分分析 (Principal component analysis, PCA)、更に発展させた均一マニフォールド近似と投影(Uniform Manifold Approximation and Projection, UMAP)、Diffusion maps<ref><pubmed> 26002886
</pubmed></ref>, t分布型確率的近傍埋込み (t-distributed Stochastic Neighbor Embedding, tSNE)などの手法が用いられる。 特に、[http://www.jmlr.org/papers/v9/vandermaaten08a.html tSNE]と[https://arxiv.org/abs/1802.03426 UMAP]は、高次元データを低次元の点の集合として可視化することで、それぞれの細胞の持つ遺伝子発現状態の類似度についての直観的な表示が可能でありしばしば用いられる('''図3''')。tSNEよりUMAPの方が迅速に類似集団間の関係が明確になるので、最近はUMAPを利用することが多くなってきている。次に、[[Louvainアルゴリズム]]などでクラスタリング([[コミュニティ分割]])を行いグラフ上に表示できる('''図3'''の色分け)。こうして、異なる転写状態を示す細胞の集合が別のクラスターとして表示され、同定可能になる<ref><pubmed>31500660</pubmed></ref>。
</pubmed></ref>, t分布型確率的近傍埋込み (t-distributed Stochastic Neighbor Embedding, tSNE)などの手法が用いられる。 特に、[http://www.jmlr.org/papers/v9/vandermaaten08a.html tSNE]と[https://arxiv.org/abs/1802.03426 UMAP]は、高次元データを低次元の点の集合として可視化することで、それぞれの細胞の持つ遺伝子発現状態の類似度についての直観的な表示が可能でありしばしば用いられる('''図3''')。tSNEよりUMAPの方が迅速に類似集団間の関係が明確になるので、最近はUMAPを利用することが多くなってきている。次に、[[Louvainアルゴリズム]]などでクラスタリング([[コミュニティ分割]])を行いグラフ上に表示できる('''図3'''の色分け)。こうして、異なる転写状態を示す細胞の集合が別のクラスターとして表示され、同定可能になる<ref><pubmed>31500660</pubmed></ref>。
  [[ファイル:scFig3.jpg|サムネイル|250px|'''図3. tSNEとUMAPによる同じデータの可視化'''<br>網膜(ニワトリ)の視細胞のデータを用いて執筆者が作製[https://doi.org/10.1101/2020.10.09.333633]。]]
  [[ファイル:scFig3.jpg|サムネイル|250px|'''図3. tSNEとUMAPによる同じデータの可視化'''<br>網膜(ニワトリ)の視細胞のデータを用いて執筆者が作製<ref name=Yamagata2021><pubmed>33393903</pubmed></ref>。]]


==データ解析==
==データ解析==
===細胞クラスターの解釈とマーカー遺伝子候補の発見===
===細胞クラスターの解釈とマーカー遺伝子候補の発見===
 scRNA-seqデータから得られる生物学的知見には、内在的に存在する細胞の種類、外部刺激や環境で変化した細胞の状態、そして種類や変化により特徴的に発現するマーカー遺伝子候補の発見がある<ref><pubmed>27824854</pubmed></ref><ref><pubmed>32033589</pubmed></ref>。クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスター(群)に特徴的に発現している具体的な遺伝子を探索し、細胞集団の持つバイオマーカーによって、そのクラスター(群)の同定が可能になる。例えば、既に神経細胞とグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、神経細胞のタイプ(下記参考)を区別できるマーカーや、外部刺激によって遺伝子発現状態が変化した神経細胞の状態は、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子(差次的発現遺伝子)を見つけるためには(Differential expression analysis, DE analysis)、SeuratのFindMarkersコマンド中でも利用可能であるコード(MAST、DESeq2など<ref><pubmed>26653891</pubmed></ref><ref><pubmed>25516281</pubmed></ref><ref><pubmed>30658573</pubmed></ref>)を用いることができる。細胞ごとの差次的発現遺伝子のVisualization(表示可視化)には、[[ドットプロット]](dot plot)、[[ヴァイオリンプロット]](violin plot)、[[リッジプロット]](Ridge plot, joy plot)、UMAPなどの次元圧縮図上に転写物量をプロットするFeatureプロット(feature plot)などが、目的に応じて頻繁に用いられる('''図4''')。
 scRNA-seqデータから得られる生物学的知見には、内在的に存在する細胞の種類、外部刺激や環境で変化した細胞の状態、そして種類や変化により特徴的に発現するマーカー遺伝子候補の発見がある<ref><pubmed>27824854</pubmed></ref><ref><pubmed>32033589</pubmed></ref>。クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスター(群)に特徴的に発現している具体的な遺伝子を探索し、細胞集団の持つバイオマーカーによって、そのクラスター(群)の同定が可能になる。例えば、既に神経細胞とグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、神経細胞のタイプ(下記参考)を区別できるマーカーや、外部刺激によって遺伝子発現状態が変化した神経細胞の状態は、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子(差次的発現遺伝子)を見つけるためには(Differential expression analysis, DE analysis)、SeuratのFindMarkersコマンド中でも利用可能であるコード(MAST、DESeq2など<ref><pubmed>26653891</pubmed></ref><ref><pubmed>25516281</pubmed></ref><ref><pubmed>30658573</pubmed></ref>)を用いることができる。細胞ごとの差次的発現遺伝子のVisualization(表示可視化)には、[[ドットプロット]](dot plot)、[[ヴァイオリンプロット]](violin plot)、[[リッジプロット]](Ridge plot, joy plot)、UMAPなどの次元圧縮図上に転写物量をプロットするFeatureプロット(feature plot)などが、目的に応じて頻繁に用いられる('''図4''')。
[[ファイル:scFig4.jpg|サムネイル|300px|'''図4.scRNA-seqデータの可視化の例 '''<br>A. ドットプロット。B.ヴァイオリンプロット。C. リッジプロット。D. UMAP(灰色)に転写物量(青)をプロットした Featureプロット。網膜の視細胞のデータを用いて執筆者が作製[https://doi.org/10.1101/2020.10.09.333633]。]]
[[ファイル:scFig4.jpg|サムネイル|300px|'''図4.scRNA-seqデータの可視化の例 '''<br>A. ドットプロット。B.ヴァイオリンプロット。C. リッジプロット。D. UMAP(灰色)に転写物量(青)をプロットした Featureプロット。網膜の視細胞のデータを用いて執筆者が作製<ref name=Yamagata2021></ref>。]]
===擬時系列解析===
===擬時系列解析===
 実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、[[細胞周期]]、[[概日リズム]]、発現変動が大きい破裂型[[プロモーター]]の作動などの理由で 変動が見られるものもある<ref name=Luecken2019><pubmed>31217225</pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上にある[[細胞系譜]]や[[細胞分化]]といった細胞の遷移状態の解析([[軌道推定]](Trajectory inference);[[擬時系列解析]](擬似時系列解析)、Pseudo-time analysis)には、scRNA-seqデータを用いることが効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref>。しばしば用いられるMonocle3 <ref><pubmed>30787437</pubmed></ref>[https://cole-trapnell-lab.github.io/monocle3/]など、多くのコードを収集、比較しているサイトがある [https://dynverse.org][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといったスプライシングされていく転写産物の量から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref><ref><pubmed> 32747759</pubmed></ref>。しかし、これらの方法は、あくまで細胞系譜や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNA-seqを行うことで、細胞タイプの系統関係を調べる方法として、[[CRISPR-Cas9]]を用いた[[ゲノム編集]]による痕跡追跡記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>、あるいはアデノシンデアミナーゼでRNA編集を行いタイムスタンプを入れる方法<ref><pubmed>33077959</pubmed></ref>がある。[[1塩基バリアント]](Single-nucleotide variants: SNV)の系統的解析は、細胞の不均一性や系統的な関係を明らかにするための最も有望なアプローチの一つである<ref><pubmed>31744515</pubmed></ref>。
 実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、[[細胞周期]]、[[概日リズム]]、発現変動が大きい破裂型[[プロモーター]]の作動などの理由で 変動が見られるものもある<ref name=Luecken2019><pubmed>31217225</pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上にある[[細胞系譜]]や[[細胞分化]]といった細胞の遷移状態の解析([[軌道推定]](Trajectory inference);[[擬時系列解析]](擬似時系列解析)、Pseudo-time analysis)には、scRNA-seqデータを用いることが効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref>。しばしば用いられるMonocle3 <ref><pubmed>30787437</pubmed></ref>[https://cole-trapnell-lab.github.io/monocle3/]など、多くのコードを収集、比較しているサイトがある [https://dynverse.org][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといったスプライシングされていく転写産物の量から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref><ref><pubmed> 32747759</pubmed></ref>。しかし、これらの方法は、あくまで細胞系譜や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNA-seqを行うことで、細胞タイプの系統関係を調べる方法として、[[CRISPR-Cas9]]を用いた[[ゲノム編集]]による痕跡追跡記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>、あるいはアデノシンデアミナーゼでRNA編集を行いタイムスタンプを入れる方法<ref><pubmed>33077959</pubmed></ref>がある。[[1塩基バリアント]](Single-nucleotide variants: SNV)の系統的解析は、細胞の不均一性や系統的な関係を明らかにするための最も有望なアプローチの一つである<ref><pubmed>31744515</pubmed></ref>。
===遺伝子制御ネットワーク、パスウェイ解析など===
===遺伝子制御ネットワーク、パスウェイ解析など===
 また細胞分化や刺激などによる変動に伴う特徴的な遺伝子発現状態をscRNA-seqで観察することは、[[遺伝子制御ネットワーク]](例、SCENIC<ref><pubmed>28991892</pubmed></ref>, [https://github.com/aertslab/SCENIC])、[[代謝経路]]や[[シグナル伝達系]]のための[[パスウェイ解析]](例、Metascape<ref><pubmed>30944313</pubmed></ref>, [http://metascape.org]、Gene Ontolgoy[http://geneontology.org])を理解するシステム生物学的な研究として有用である<ref><pubmed>32051003</pubmed></ref>。更に、scRNA-seqで得られた結果をもとに、細胞間相互作用の理解を深めるのを目的とするCellPhoneDB<ref><pubmed>32103204</pubmed></ref>[https://github.com/Teichlab/cellphonedb]、NicheNet<ref><pubmed>3181926</pubmed></ref>, SVCA<ref><pubmed>31577949</pubmed></ref>などがある。特に、Perturb-seq<ref><pubmed>27984732</pubmed></ref> やその変法<ref><pubmed> 32231336</pubmed></ref>は、CRISPRライブラリーによるゲノム編集を施した細胞をscRNA-seqで解析することで、ゲノム編集で破壊された遺伝子の機能や遺伝子間の相互作用の理解を可能にしている後述する複数モダリティ情報を取り込んだscRNA-seqの1つであり、注目されている。
 また細胞分化や刺激などによる変動に伴う特徴的な遺伝子発現状態をscRNA-seqで観察することは、[[遺伝子制御ネットワーク]](例、[https://github.com/aertslab/SCENIC SCENIC]<ref><pubmed>28991892</pubmed></ref>)、[[代謝経路]]や[[シグナル伝達系]]のための[[パスウェイ解析]](例、Metascape<ref><pubmed>30944313</pubmed></ref>, [http://metascape.org]、Gene Ontolgoy[http://geneontology.org])を理解するシステム生物学的な研究として有用である<ref><pubmed>32051003</pubmed></ref>。更に、scRNA-seqで得られた結果をもとに、細胞間相互作用の理解を深めるのを目的とするCellPhoneDB<ref><pubmed>32103204</pubmed></ref>[https://github.com/Teichlab/cellphonedb]、NicheNet<ref><pubmed>3181926</pubmed></ref>、SVCA<ref><pubmed>31577949</pubmed></ref>などがある。特に、Perturb-seq<ref><pubmed>27984732</pubmed></ref> やその変法<ref><pubmed> 32231336</pubmed></ref>は、CRISPRライブラリーによるゲノム編集を施した細胞をscRNA-seqで解析することで、ゲノム編集で破壊された遺伝子の機能や遺伝子間の相互作用の理解を可能にしている後述する複数モダリティ情報を取り込んだscRNA-seqの1つであり、注目されている。
 
==神経科学研究への適用==
==神経科学研究への適用==
===神経系細胞ビッグデータとしてのscRNA-seq===
===神経系細胞ビッグデータとしてのscRNA-seq===
103行目: 105行目:
 [[海馬]]<ref><pubmed>29241552</pubmed></ref><ref><pubmed>29912866</pubmed></ref><ref><pubmed>29335606</pubmed></ref><ref><pubmed>31942070</pubmed></ref>では、これまでの研究で記載されてきた神経細胞のタイプの存在が確認され、更に新規のタイプが見つかった。中枢神経系では、その他、[[外側膝状体]]<ref><pubmed>29343640</pubmed></ref>、[[大脳基底核]]<ref><pubmed>28384468</pubmed></ref>、[[視床下部]]<ref><pubmed>28166221</pubmed></ref><ref><pubmed>28355573</pubmed></ref>  <ref><pubmed>27991900</pubmed></ref><ref name=Moffitt2018><pubmed>30385464</pubmed></ref>  <ref><pubmed>31249056</pubmed></ref><ref><pubmed>30858605</pubmed></ref>、[[線条体]]<ref><pubmed>27425622</pubmed></ref><ref><pubmed>30134177</pubmed></ref><ref><pubmed>31875543</pubmed></ref>、[[中脳]]<ref><pubmed>27716510</pubmed></ref><ref><pubmed>29499164</pubmed></ref><ref><pubmed>30718509</pubmed></ref>、[[手綱核]]<ref><pubmed>29576475</pubmed></ref>、発生中の[[間脳]]<ref><pubmed>30872278</pubmed></ref> 、さらに[[小脳]]<ref><pubmed>30220501</pubmed></ref><ref><pubmed>30735127</pubmed></ref><ref><pubmed>30690467</pubmed></ref>などの結果が報告されてきている。例えば、構成する細胞についての情報が詳細に研究されてきたと思われていたマウスの小脳においても、分子層にこれまでの[[星状細胞]]、[[バスケット細胞]]というカテゴリーとは違った[[ギャップジャンクション]]に特徴を持つ2種類の神経細胞があることが示唆されている<ref><pubmed>24259518</pubmed></ref>。
 [[海馬]]<ref><pubmed>29241552</pubmed></ref><ref><pubmed>29912866</pubmed></ref><ref><pubmed>29335606</pubmed></ref><ref><pubmed>31942070</pubmed></ref>では、これまでの研究で記載されてきた神経細胞のタイプの存在が確認され、更に新規のタイプが見つかった。中枢神経系では、その他、[[外側膝状体]]<ref><pubmed>29343640</pubmed></ref>、[[大脳基底核]]<ref><pubmed>28384468</pubmed></ref>、[[視床下部]]<ref><pubmed>28166221</pubmed></ref><ref><pubmed>28355573</pubmed></ref>  <ref><pubmed>27991900</pubmed></ref><ref name=Moffitt2018><pubmed>30385464</pubmed></ref>  <ref><pubmed>31249056</pubmed></ref><ref><pubmed>30858605</pubmed></ref>、[[線条体]]<ref><pubmed>27425622</pubmed></ref><ref><pubmed>30134177</pubmed></ref><ref><pubmed>31875543</pubmed></ref>、[[中脳]]<ref><pubmed>27716510</pubmed></ref><ref><pubmed>29499164</pubmed></ref><ref><pubmed>30718509</pubmed></ref>、[[手綱核]]<ref><pubmed>29576475</pubmed></ref>、発生中の[[間脳]]<ref><pubmed>30872278</pubmed></ref> 、さらに[[小脳]]<ref><pubmed>30220501</pubmed></ref><ref><pubmed>30735127</pubmed></ref><ref><pubmed>30690467</pubmed></ref>などの結果が報告されてきている。例えば、構成する細胞についての情報が詳細に研究されてきたと思われていたマウスの小脳においても、分子層にこれまでの[[星状細胞]]、[[バスケット細胞]]というカテゴリーとは違った[[ギャップジャンクション]]に特徴を持つ2種類の神経細胞があることが示唆されている<ref><pubmed>24259518</pubmed></ref>。


 脳の外部では、[[運動神経]][https://doi.org/10.1101/2020.03.16.992958]、[[感覚神経]]<ref><pubmed>25420068</pubmed></ref><ref><pubmed>26691752</pubmed></ref>、[[らせん神経節]]<ref><pubmed>30078709</pubmed></ref><ref><pubmed>30209249</pubmed></ref> 、[[嗅覚神経]]<ref><pubmed>26541607</pubmed></ref><ref><pubmed>32059767</pubmed></ref>、[[腸神経系]] <ref><pubmed>29483303</pubmed></ref><ref><pubmed>33288908</pubmed></ref>、[[網膜]]<ref><pubmed>27565351</pubmed></ref><ref name=Konstantinides2018><pubmed>29909983</pubmed></ref><ref><pubmed>30018341</pubmed></ref><ref><pubmed>31260032</pubmed></ref><ref><pubmed>31128945</pubmed></ref><ref name=Peng2019><pubmed>30712875</pubmed></ref><ref><pubmed>30548510</pubmed></ref><ref><pubmed>31075224</pubmed></ref><ref><pubmed>31399471</pubmed></ref><ref><pubmed>31848347</pubmed></ref><ref><pubmed>31673015</pubmed></ref><ref><pubmed>31653841</pubmed></ref><ref><pubmed>31784286</pubmed></ref>[https://doi.org/10.1101/2020.02.26.966093]<ref><pubmed>32386599</pubmed></ref>[https://www.biorxiv.org/content/10.1101/617555v2][https://doi.org/10.1101/2020.10.09.333633]<ref>'''Shekhar K, Sanes JR (2021)'''.<br>Generating and using transcriptomically based retinal cell atlases. Annu Rev Vis Sci 7: (in press)</ref>でのscRNA-seqデータがある。
 脳の外部では、[[運動神経]][https://doi.org/10.1101/2020.03.16.992958]、[[感覚神経]]<ref><pubmed>25420068</pubmed></ref><ref><pubmed>26691752</pubmed></ref>、[[らせん神経節]]<ref><pubmed>30078709</pubmed></ref><ref><pubmed>30209249</pubmed></ref> 、[[嗅覚神経]]<ref><pubmed>26541607</pubmed></ref><ref><pubmed>32059767</pubmed></ref>、[[腸神経系]] <ref><pubmed>29483303</pubmed></ref><ref><pubmed>33288908</pubmed></ref>、[[網膜]]<ref><pubmed>27565351</pubmed></ref><ref name=Konstantinides2018><pubmed>29909983</pubmed></ref><ref><pubmed>30018341</pubmed></ref><ref><pubmed>31260032</pubmed></ref><ref><pubmed>31128945</pubmed></ref><ref name=Peng2019><pubmed>30712875</pubmed></ref><ref><pubmed>30548510</pubmed></ref><ref><pubmed>31075224</pubmed></ref><ref><pubmed>31399471</pubmed></ref><ref><pubmed>31848347</pubmed></ref><ref><pubmed>31673015</pubmed></ref><ref><pubmed>31653841</pubmed></ref><ref><pubmed>31784286</pubmed></ref>[https://doi.org/10.1101/2020.02.26.966093]<ref><pubmed>32386599</pubmed></ref>[https://www.biorxiv.org/content/10.1101/617555v2]<ref name=Yamagata2021></ref><ref>'''Shekhar K, Sanes JR (2021)'''.<br>Generating and using transcriptomically based retinal cell atlases. Annu Rev Vis Sci 7: (in press)</ref>でのscRNA-seqデータがある。


 また[[iPS細胞]]や[[ES細胞]]由来の神経組織[[オルガノイド]]に含まれる神経細胞タイプを知る上でも利用されている<ref><pubmed>28094016</pubmed></ref><ref><pubmed>28279351</pubmed></ref><ref><pubmed>31168097</pubmed></ref><ref><pubmed>31996853</pubmed></ref><ref><pubmed>31968264</pubmed></ref><ref><pubmed>32221280</pubmed></ref>。このようなアプローチは、[[ネアンデルタール人]]型の遺伝子を持つ脳オルガノイドの解析<ref><pubmed> 32559457</pubmed></ref>やSARS-CoV-2に感染する脳オルガノイド中の細胞の同定<ref><pubmed> 33113348</pubmed></ref>など、新たな応用例が発表されてきており興味深い。
 また[[iPS細胞]]や[[ES細胞]]由来の神経組織[[オルガノイド]]に含まれる神経細胞タイプを知る上でも利用されている<ref><pubmed>28094016</pubmed></ref><ref><pubmed>28279351</pubmed></ref><ref><pubmed>31168097</pubmed></ref><ref><pubmed>31996853</pubmed></ref><ref><pubmed>31968264</pubmed></ref><ref><pubmed>32221280</pubmed></ref>。このようなアプローチは、[[ネアンデルタール人]]型の遺伝子を持つ脳オルガノイドの解析<ref><pubmed> 32559457</pubmed></ref>やSARS-CoV-2に感染する脳オルガノイド中の細胞の同定<ref><pubmed> 33113348</pubmed></ref>など、新たな応用例が発表されてきており興味深い。
115行目: 117行目:
==scRNA-seqの展望==
==scRNA-seqの展望==
===神経系の多様性と進化===
===神経系の多様性と進化===
 NGSを用いることで、どんな生物種にも適用可能なscRNA-seqは、既に多様な生物の神経系の細胞の理解、更には種間の相同性や差異の研究に利用されており、神経系の進化を細胞レベルで考察するのに有用であろう(例、[[線虫]]<ref name=Cao2017><pubmed>28818938</pubmed></ref>、[[ショウジョウバエ]]<ref><pubmed>29909982</pubmed></ref><ref><pubmed>29149607</pubmed></ref><ref><pubmed>30703584</pubmed></ref><ref name=Konstantinides2018><pubmed>29909983</pubmed></ref><ref><pubmed>33125872</pubmed></ref>、[[カタユウレイボヤ]]''Ciona intestinalis''<ref><pubmed>30069052</pubmed></ref><ref><pubmed>30228204</pubmed></ref>、[[ゼブラフィッシュ]]<ref><pubmed>31018142</pubmed></ref><ref><pubmed>30929901</pubmed></ref>、[[アカミミガメ]]''Trachemys scripta elegans''、[[トカゲ]]''Pogona vitticeps'', PV<ref><pubmed>29724907</pubmed></ref>、[[ニワトリ]][https://doi.org/10.1101/2020.10.09.333633]、[[霊長類]]<ref><pubmed>30730291</pubmed></ref><ref><pubmed>31619793</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972])。ただ、遺伝子やトランスクリプトームの研究が進んでいる生物種では比較的容易であるが、遺伝子のアノテーションが十分でない生物種を用いる場合、scRNA-seqのデータ解析は困難を伴う。また種を超えた細胞タイプの相同性の理解には様々な工夫が必要である<ref><pubmed>31552245</pubmed></ref><ref name=Peng2019><pubmed>30712875</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972]。
 NGSを用いることで、どんな生物種にも適用可能なscRNA-seqは、既に多様な生物の神経系の細胞の理解、更には種間の相同性や差異の研究に利用されており、神経系の進化を細胞レベルで考察するのに有用であろう(例、[[線虫]]<ref name=Cao2017><pubmed>28818938</pubmed></ref>、[[ショウジョウバエ]]<ref><pubmed>29909982</pubmed></ref><ref><pubmed>29149607</pubmed></ref><ref><pubmed>30703584</pubmed></ref><ref name=Konstantinides2018><pubmed>29909983</pubmed></ref><ref><pubmed>33125872</pubmed></ref>、[[カタユウレイボヤ]]''Ciona intestinalis''<ref><pubmed>30069052</pubmed></ref><ref><pubmed>30228204</pubmed></ref>、[[ゼブラフィッシュ]]<ref><pubmed>31018142</pubmed></ref><ref><pubmed>30929901</pubmed></ref>、[[アカミミガメ]]''Trachemys scripta elegans''、[[トカゲ]]''Pogona vitticeps'', PV<ref><pubmed>29724907</pubmed></ref>、[[ニワトリ]]<ref name=Yamagata2021></ref>、[[霊長類]]<ref><pubmed>30730291</pubmed></ref><ref><pubmed>31619793</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972])。ただ、遺伝子やトランスクリプトームの研究が進んでいる生物種では比較的容易であるが、遺伝子のアノテーションが十分でない生物種を用いる場合、scRNA-seqのデータ解析は困難を伴う。また種を超えた細胞タイプの相同性の理解には様々な工夫が必要である<ref><pubmed>31552245</pubmed></ref><ref name=Peng2019><pubmed>30712875</pubmed></ref>[https://doi.org/10.1101/2020.03.31.016972]。
===データベースと統合===
===データベースと統合===
 獲得されたscRNA-seqのデータは様々な目的で利用できるので、データベース化し利用できるようにする必要がある。神経系のトランスクリプトーム一般のデータベースが多数公開されており<ref><pubmed>29437890</pubmed></ref>、scRNA-seqのデータも基本的にNCBIの[https://www.ncbi.nlm.nih.gov/geo/ Gene Expression Omnibus]に登録されている。また、オープンサイエンス推進のためにcommon coordinate framework (CCF) やcentral annotation platform (CAP)という概念のもと、特にscRNA-seqを意識したものとして、米国のBRAIN Initiative Cell Census Consortium<ref><pubmed>29096072</pubmed></ref>、Human Cell Atlas Projectの[https://data.humancellatlas.org Human Cell Atlas Data Portal]、そのマウス版である[https://genome.ucsc.edu/cgi-bin/hgTrackUi?db=mm10&g=tabulaMuris Tabula Muris]<ref><pubmed>30283141</pubmed></ref>やSten Linnarssonラボの[http://mousebrain.org マウス脳発生データベース]、アレン脳研究所の[https://portal.brain-map.org Allen Brain Atlas]、ブロード研究所の[https://singlecell.broadinstitute.org/ Single Cell Portal]などのデータベースが稼働している。また、異なった方法や実験で得られたscRNA-seqのデータや後述の複数モダリティのシングルセルオミクスのデータを体系的に比較することも重要であり、CCA (Canonical correlation analysis)<ref name=Butler2018><pubmed>29608179</pubmed></ref>, Seurat 3.0以降に組み込まれたMMN (Mutual Nearest Neighbors)、LIGER<ref><pubmed>31178122</pubmed></ref> 、Harmony<ref><pubmed>31740819</pubmed></ref>  、MetaNeighber<ref><pubmed>29491377</pubmed></ref>、Conos<ref><pubmed>31308548</pubmed></ref>[https://doi.org/10.1101/2020.05.22.111161]のようなアルゴリズムが開発され、後述の複数モダリティのシングルセルオミクスを組み込んだ[https://biccn.org 統合サイト]もでき始めている。またデータベースを利用して発現類似性検索も研究されている<ref><pubmed>29608555</pubmed></ref><ref><pubmed>30744683</pubmed></ref>。
 獲得されたscRNA-seqのデータは様々な目的で利用できるので、データベース化し利用できるようにする必要がある。神経系のトランスクリプトーム一般のデータベースが多数公開されており<ref><pubmed>29437890</pubmed></ref>、scRNA-seqのデータも基本的にNCBIの[https://www.ncbi.nlm.nih.gov/geo/ Gene Expression Omnibus]に登録されている。また、オープンサイエンス推進のためにcommon coordinate framework (CCF) やcentral annotation platform (CAP)という概念のもと、特にscRNA-seqを意識したものとして、米国のBRAIN Initiative Cell Census Consortium<ref><pubmed>29096072</pubmed></ref>、Human Cell Atlas Projectの[https://data.humancellatlas.org Human Cell Atlas Data Portal]、そのマウス版である[https://genome.ucsc.edu/cgi-bin/hgTrackUi?db=mm10&g=tabulaMuris Tabula Muris]<ref><pubmed>30283141</pubmed></ref>やSten Linnarssonラボの[http://mousebrain.org マウス脳発生データベース]、アレン脳研究所の[https://portal.brain-map.org Allen Brain Atlas]、ブロード研究所の[https://singlecell.broadinstitute.org/ Single Cell Portal]などのデータベースが稼働している。また、異なった方法や実験で得られたscRNA-seqのデータや後述の複数モダリティのシングルセルオミクスのデータを体系的に比較することも重要であり、CCA (Canonical correlation analysis)<ref name=Butler2018><pubmed>29608179</pubmed></ref>, Seurat 3.0以降に組み込まれたMMN (Mutual Nearest Neighbors)、LIGER<ref><pubmed>31178122</pubmed></ref> 、Harmony<ref><pubmed>31740819</pubmed></ref>  、MetaNeighber<ref><pubmed>29491377</pubmed></ref>、Conos<ref><pubmed>31308548</pubmed></ref>[https://doi.org/10.1101/2020.05.22.111161]のようなアルゴリズムが開発され、後述の複数モダリティのシングルセルオミクスを組み込んだ[https://biccn.org 統合サイト]もでき始めている。またデータベースを利用して発現類似性検索も研究されている<ref><pubmed>29608555</pubmed></ref><ref><pubmed>30744683</pubmed></ref>。

案内メニュー