「シングルセルRNAシーケンシング」の版間の差分

編集の要約なし
編集の要約なし
編集の要約なし
19行目: 19行目:
細胞種にもよるが、1つの細胞内にある全RNA(ribosomal RNAを含む)は細胞種にもよるが1-50pgである。そのうち、mRNAの占める割合は1-5%程度である<ref><pubmed>15239941</pubmed></ref>。この微量のmRNAをcDNAに変換してから大幅に増幅できる方法が発明されたことで、1つの細胞が発現するmRNAを高感度で検出できるようになった<ref><pubmed>1557406</pubmed></ref><ref><pubmed>7541630</pubmed></ref> 。例えば、1991年、Linda BuckとRichard Axelは、[[嗅覚受容体]]が[[Gタンパク質]]であると仮定し、個々の嗅覚細胞で特異的に観察されるGタンパク質mRNAを比較することで、嗅覚受容体の同定に成功した<ref><pubmed>1840504</pubmed></ref>。1995年になると、Catherine DulacとRichard Axelは、異なる[[鋤鼻神経細胞]]で特異的に発現する遺伝子を1つの細胞から作製したcDNAライブラリーを比較するディファレンシャル・スクリーニングを行うことで、[[フェロモン受容体]]を同定した<ref><pubmed>7585937</pubmed></ref>。同じ手法で異なる種類の神経細胞で発現している遺伝子も同定され<ref><pubmed>9778248</pubmed></ref><ref><pubmed>12230981</pubmed></ref>、1つの細胞の持つトランスクリプトームを比較するアプローチが神経細胞で特徴的に発現している遺伝子の同定に効果的なことが示された。
細胞種にもよるが、1つの細胞内にある全RNA(ribosomal RNAを含む)は細胞種にもよるが1-50pgである。そのうち、mRNAの占める割合は1-5%程度である<ref><pubmed>15239941</pubmed></ref>。この微量のmRNAをcDNAに変換してから大幅に増幅できる方法が発明されたことで、1つの細胞が発現するmRNAを高感度で検出できるようになった<ref><pubmed>1557406</pubmed></ref><ref><pubmed>7541630</pubmed></ref> 。例えば、1991年、Linda BuckとRichard Axelは、[[嗅覚受容体]]が[[Gタンパク質]]であると仮定し、個々の嗅覚細胞で特異的に観察されるGタンパク質mRNAを比較することで、嗅覚受容体の同定に成功した<ref><pubmed>1840504</pubmed></ref>。1995年になると、Catherine DulacとRichard Axelは、異なる[[鋤鼻神経細胞]]で特異的に発現する遺伝子を1つの細胞から作製したcDNAライブラリーを比較するディファレンシャル・スクリーニングを行うことで、[[フェロモン受容体]]を同定した<ref><pubmed>7585937</pubmed></ref>。同じ手法で異なる種類の神経細胞で発現している遺伝子も同定され<ref><pubmed>9778248</pubmed></ref><ref><pubmed>12230981</pubmed></ref>、1つの細胞の持つトランスクリプトームを比較するアプローチが神経細胞で特徴的に発現している遺伝子の同定に効果的なことが示された。


一方で多くの種類のmRNAを1細胞レベルで一挙に観察するための技術には感度やスループット、そしてコストの観点からブレークスルーが待たれた。1つの問題は多種類のcDNAを簡便に識別することを可能にする方法の開発であった。これを可能にしたのが、[[PCR]]などのcDNA増幅法の改良と[[マイクロアレイ]]の利用であった<ref><pubmed>12736331</pubmed></ref><ref><pubmed>16547197</pubmed></ref>。しかしながら、細胞ごとに高価なマイクロアレイを使用することは、多数の細胞のトランスクリプトームの観察には限界があった。2009年になると、これらの問題を解決できる可能性として、NGSを利用するscRNAseqプロトコールがAzim Suraniのグループによって報告された<ref><pubmed>19349980</pubmed></ref>。しかしながら、多数のマイクロアレイでなく1回のNGS使用で済ませることができるものの、この報告でもわずか8個の細胞の解析に留まっており、1つの細胞ごとに処理を行うという操作が必要で、多数の細胞についてのトランスクリプームを一挙に理解することはできなかった。また、塩基配列の違うcDNAごとにPCR効率に差がある結果生じる増幅バイアス、また3’末端側が選択的に補足されることなどの課題があった。
一方で多くの種類のmRNAを1細胞レベルで一挙に観察するための技術には感度やスループット、そしてコストの観点からブレークスルーが待たれた。1つの問題は多種類のcDNAを簡便に識別することを可能にする方法の開発であった。これを可能にしたのが、[[PCR]]などのcDNA増幅法の改良とマイクロアレイの利用であった<ref><pubmed>12736331</pubmed></ref><ref><pubmed>16547197</pubmed></ref>。しかしながら、細胞ごとに高価なマイクロアレイを使用することは、多数の細胞のトランスクリプトームの観察には限界があった。2009年になると、これらの問題を解決できる可能性として、NGSを利用するscRNAseqプロトコールがAzim Suraniのグループによって報告された<ref><pubmed>19349980</pubmed></ref>。しかしながら、多数のマイクロアレイでなく1回のNGS使用で済ませることができるものの、この報告でもわずか8個の細胞の解析に留まっており、1つの細胞ごとに処理を行うという操作が必要で、多数の細胞についてのトランスクリプームを一挙に理解することはできなかった。また、塩基配列の違うcDNAごとにPCR効率に差がある結果生じる増幅バイアス、また3’末端側が選択的に補足されることなどの課題があった。


==scRNAseqの現状==
==scRNAseqの現状==
50行目: 50行目:


なお、ヒト組織や希少生物などから生細胞を得ることは困難なことが多い。この場合、scRNAseqの変法として、凍結した組織から、各細胞由来の核を調製し、核内のmRNAを分析するsnRNAseq (single-nucleus RNA-seq)が利用されている。ただ、snRNAseqでは、FACSなどによる特定細胞集団の分離が困難であることが多い。また、細胞質を持つ生細胞を利用したscRNAseqとは違って、スプライシングの途上にある未成熟な核内転写産物を検出すること、更に検出できる遺伝子数も少なく、同等な結果が必ずしも得られない<ref><pubmed>24248345</pubmed></ref><ref><pubmed>26890679</pubmed></ref>  <ref><pubmed>27471252</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>29220646</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>30586455</pubmed></ref><ref><pubmed>28729663</pubmed></ref><ref><pubmed>31728515</pubmed></ref><ref><pubmed>32341560</pubmed></ref> <ref><pubmed>32518403</pubmed></ref>。一方で、snRNA-seqでは、組織をそのまま凍結することから開始することが可能であるので、上述したscRNAseqの問題である細胞解離酵素による処理などを避けることができる。更に、核を用いることで、大きな細胞体はマイクロ流体力学の流路で詰まりやすいなど、特に神経細胞で顕著である細胞の形状の多様性に伴うバイアスを減らすことができるといったメリットもある。こうしたプロトコールの一部は、protocols.ioのHuman Cell Atlasのグループ[https://www.protocols.io/groups/hca]で公開されている。
なお、ヒト組織や希少生物などから生細胞を得ることは困難なことが多い。この場合、scRNAseqの変法として、凍結した組織から、各細胞由来の核を調製し、核内のmRNAを分析するsnRNAseq (single-nucleus RNA-seq)が利用されている。ただ、snRNAseqでは、FACSなどによる特定細胞集団の分離が困難であることが多い。また、細胞質を持つ生細胞を利用したscRNAseqとは違って、スプライシングの途上にある未成熟な核内転写産物を検出すること、更に検出できる遺伝子数も少なく、同等な結果が必ずしも得られない<ref><pubmed>24248345</pubmed></ref><ref><pubmed>26890679</pubmed></ref>  <ref><pubmed>27471252</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>29220646</pubmed></ref><ref><pubmed>28846088</pubmed></ref><ref><pubmed>30586455</pubmed></ref><ref><pubmed>28729663</pubmed></ref><ref><pubmed>31728515</pubmed></ref><ref><pubmed>32341560</pubmed></ref> <ref><pubmed>32518403</pubmed></ref>。一方で、snRNA-seqでは、組織をそのまま凍結することから開始することが可能であるので、上述したscRNAseqの問題である細胞解離酵素による処理などを避けることができる。更に、核を用いることで、大きな細胞体はマイクロ流体力学の流路で詰まりやすいなど、特に神経細胞で顕著である細胞の形状の多様性に伴うバイアスを減らすことができるといったメリットもある。こうしたプロトコールの一部は、protocols.ioのHuman Cell Atlasのグループ[https://www.protocols.io/groups/hca]で公開されている。
通常のscRNAseqは、ポリアデニル化されたmRNAを検出しているが、MATQ-seq(multiple annealing and dC-tailing-based quantitative single-cell RNA-seq)、RamDA-seqなどを用いると、ポリアデニル化されていないRNAの検出も可能である<ref><pubmed> 28092691</pubmed></ref> <ref><pubmed>29434199 </pubmed></ref>[https://doi.org/10.1101/2020.06.02.131060]。更に、RNAを分析するscRNAseqではないが、遺伝子発現との関係が想定される[[オープンクロマチン]]領域を[[トランスポゾン]]を用いることで個々の細胞レベルで選択的に検出するsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin) <ref><pubmed>26083756</pubmed></ref>, <ref><pubmed>29434377</pubmed></ref><ref><pubmed>25953818</pubmed></ref>, single cell THS-seq (transposome hypersensitive-site) <ref><pubmed>29227469</pubmed></ref>や [[DNAメチル化]]領域を観察するsnmC-seq、RRBSのような方法も利用されている<ref><pubmed>28798132</pubmed></ref><ref><pubmed>30237449</pubmed></ref><ref><pubmed> 20852635</pubmed></ref>。
通常のscRNAseqは、ポリアデニル化されたmRNAを検出しているが、MATQ-seq(multiple annealing and dC-tailing-based quantitative single-cell RNA-seq)、RamDA-seqなどを用いると、ポリアデニル化されていないRNAの検出も可能である<ref><pubmed> 28092691</pubmed></ref> <ref><pubmed>29434199 </pubmed></ref>[https://doi.org/10.1101/2020.06.02.131060]
 
更に、RNAを分析するscRNAseqではないが、遺伝子発現との関係が想定される[[オープンクロマチン]]領域を[[トランスポゾン]]を用いることで個々の細胞レベルで選択的に検出するsingle cell ATAC-seq (Assay for Transposase-Accessible Chromatin) <ref><pubmed>26083756</pubmed></ref>, <ref><pubmed>29434377</pubmed></ref><ref><pubmed>25953818</pubmed></ref>, single cell THS-seq (transposome hypersensitive-site) <ref><pubmed>29227469</pubmed></ref>や [[DNAメチル化]]領域を観察するsnmC-seq、RRBSのような方法も利用されている<ref><pubmed>28798132</pubmed></ref><ref><pubmed>30237449</pubmed></ref><ref><pubmed> 20852635</pubmed></ref>。
===scRNAseqデータ処理の流れ===
===scRNAseqデータ処理の流れ===
====総論====
====総論====
77行目: 79行目:
scRNAseqデータから得られる生物学的知見には、内在的に存在する細胞の種類、外部刺激や環境で変化した細胞の状態、そして種類や変化により特徴的に発現するマーカー遺伝子候補の発見がある<ref><pubmed>27824854</pubmed></ref><ref><pubmed>32033589</pubmed></ref>
scRNAseqデータから得られる生物学的知見には、内在的に存在する細胞の種類、外部刺激や環境で変化した細胞の状態、そして種類や変化により特徴的に発現するマーカー遺伝子候補の発見がある<ref><pubmed>27824854</pubmed></ref><ref><pubmed>32033589</pubmed></ref>
。クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスター(群)に特徴的に発現している具体的な遺伝子を探索し、細胞集団の持つバイオマーカーによって、そのクラスター(群)の同定が可能になる。例えば、既に神経細胞とグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、神経細胞のタイプ(下記参考)を区別できるマーカーや、外部刺激によって遺伝子発現が変化した神経細胞の状態は、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子(差次的発現遺伝子)を見つけるためには(Differential expression analysis, DE analysis)、SeuratのFindMarkersコマンド中でも利用可能であるコード(MAST、DESeq2など<ref><pubmed>26653891</pubmed></ref><ref><pubmed>25516281</pubmed></ref><ref><pubmed>30658573</pubmed></ref>)を用いることができる。細胞ごとの差次的発現遺伝子のVisualization(表示可視化)には、ドットプロット(dot plot)、ヴァイオリンプロット(violin plot)、リッジプロット(Ridge plot, joy plot)、UMAPなどの次元圧縮図上に転写物量をプロットするFeatureプロット(feature plot)などが、目的に応じて頻繁に用いられる(図4)。
。クラスタリングにより、異なった細胞集団の存在が認識されると、それぞれのクラスター(群)に特徴的に発現している具体的な遺伝子を探索し、細胞集団の持つバイオマーカーによって、そのクラスター(群)の同定が可能になる。例えば、既に神経細胞とグリア細胞に特異的に発現する典型的マーカーはよく知られており、それぞれのクラスターの識別は容易である。更に、神経細胞のタイプ(下記参考)を区別できるマーカーや、外部刺激によって遺伝子発現が変化した神経細胞の状態は、In situ hybridizationや免疫組織化学などにより確認できる。このようなクラスターごとに発現が異なる遺伝子(差次的発現遺伝子)を見つけるためには(Differential expression analysis, DE analysis)、SeuratのFindMarkersコマンド中でも利用可能であるコード(MAST、DESeq2など<ref><pubmed>26653891</pubmed></ref><ref><pubmed>25516281</pubmed></ref><ref><pubmed>30658573</pubmed></ref>)を用いることができる。細胞ごとの差次的発現遺伝子のVisualization(表示可視化)には、ドットプロット(dot plot)、ヴァイオリンプロット(violin plot)、リッジプロット(Ridge plot, joy plot)、UMAPなどの次元圧縮図上に転写物量をプロットするFeatureプロット(feature plot)などが、目的に応じて頻繁に用いられる(図4)。
[[ファイル:scFig4.jpg|サムネイル|300px|'''図4.scRNAseqデータの可視化の例 '''<br>A. ドットプロット。B.ヴァイオリンプロット。C. リッジプロット。D. UMAP(灰色)に転写物量(青)をプロットした Featureプロット。網膜の視細胞のデータを用いて執筆者が作製[https://doi.org/10.1101/2020.10.09.333633
[[ファイル:scFig4.jpg|サムネイル|300px|'''図4.scRNAseqデータの可視化の例 '''<br>A. ドットプロット。B.ヴァイオリンプロット。C. リッジプロット。D. UMAP(灰色)に転写物量(青)をプロットした Featureプロット。網膜の視細胞のデータを用いて執筆者が作製[https://doi.org/10.1101/2020.10.09.333633]。]]
]。]]
===擬時系列解析===
===擬時系列解析===
実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、[[細胞周期]]、[[概日リズム]]、発現変動が大きい破裂型プロモーターの作動などの理由で 変動が見られるものもある<ref><pubmed> 31217225 </pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上にある細胞系譜や細胞分化といった細胞の遷移状態の解析([[軌道推定]](Trajectory inference);[[擬時系列解析]](擬似時系列解析、偽時系列解析)、Pseudo-time analysis )には、scRNAseqデータを用いることが効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref>。しばしば用いられるMonocle3 <ref><pubmed>30787437</pubmed></ref>[https://cole-trapnell-lab.github.io/monocle3/]など、多くのコードを収集、比較しているサイトがある [https://dynverse.org][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといったスプライシングされていく転写産物の量から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref><ref><pubmed> 32747759</pubmed></ref>。しかし、これらの方法は、あくまで[[細胞系譜]]や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNAseqを行うことで、細胞タイプの系統関係を調べる方法として、CRISPR-Cas9を用いた[[ゲノム編集]]による痕跡追跡記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>、あるいはアデノシンデアミナーゼでRNA編集を行いタイムスタンプを入れる方法<ref><pubmed>33077959</pubmed></ref>がある。1塩基バリアント(Single-nucleotide variants: SNV)の系統的解析は、細胞の不均一性や系統的な関係を明らかにするための最も有望なアプローチの一つである<ref><pubmed>31744515</pubmed></ref>。
実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、[[細胞周期]]、[[概日リズム]]、発現変動が大きい破裂型プロモーターの作動などの理由で 変動が見られるものもある<ref><pubmed> 31217225 </pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上にある細胞系譜や細胞分化といった細胞の遷移状態の解析([[軌道推定]](Trajectory inference);[[擬時系列解析]](擬似時系列解析、偽時系列解析)、Pseudo-time analysis )には、scRNAseqデータを用いることが効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref>。しばしば用いられるMonocle3 <ref><pubmed>30787437</pubmed></ref>[https://cole-trapnell-lab.github.io/monocle3/]など、多くのコードを収集、比較しているサイトがある [https://dynverse.org][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといったスプライシングされていく転写産物の量から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref><ref><pubmed> 32747759</pubmed></ref>。しかし、これらの方法は、あくまで[[細胞系譜]]や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNAseqを行うことで、細胞タイプの系統関係を調べる方法として、CRISPR-Cas9を用いた[[ゲノム編集]]による痕跡追跡記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>、あるいはアデノシンデアミナーゼでRNA編集を行いタイムスタンプを入れる方法<ref><pubmed>33077959</pubmed></ref>がある。1塩基バリアント(Single-nucleotide variants: SNV)の系統的解析は、細胞の不均一性や系統的な関係を明らかにするための最も有望なアプローチの一つである<ref><pubmed>31744515</pubmed></ref>。