「シングルセルRNAシーケンシング」の版間の差分

編集の要約なし
編集の要約なし
編集の要約なし
25行目: 25行目:
 一方、CEL-seq(Cell Expression by Linear amplification and Sequencing)<ref><pubmed>22939981</pubmed></ref>、CEL-seq2<ref><pubmed> 27121950 </pubmed></ref> 、MARS-seq(Massively parallel single-cell RNA-seq)<ref><pubmed>24531970 </pubmed></ref>では、[[T7 RNAポリメラーゼ]]による[[in vitro転写]]を用いることにより、PCRによる増幅で見られるバイアスを低減させようとしている。
 一方、CEL-seq(Cell Expression by Linear amplification and Sequencing)<ref><pubmed>22939981</pubmed></ref>、CEL-seq2<ref><pubmed> 27121950 </pubmed></ref> 、MARS-seq(Massively parallel single-cell RNA-seq)<ref><pubmed>24531970 </pubmed></ref>では、[[T7 RNAポリメラーゼ]]による[[in vitro転写]]を用いることにより、PCRによる増幅で見られるバイアスを低減させようとしている。


 また、Quartz-SeqやQuartz-Seq2ではPCR用のアダプターを付加する反応にポリAテーリングを利用することで、他の手法と比較して1.5-5倍程度の遺伝子を検出できる<ref name=Mereu2020><pubmed> 32518403</pubmed></ref>。
 また、Quartz-SeqやQuartz-Seq2ではPCR用のアダプターを付加する反応にポリAテーリングを利用することで、他の手法と比較して1.5-5倍程度の遺伝子を検出できる<ref name=Mereu2020><pubmed>32518403</pubmed></ref>。
===バーコード技術 ===
===バーコード技術 ===
 増幅バイアス除去のアプローチとして特に重要なのは、2011年に発表された核酸配列バーコードを利用した方法で、分子識別子(unique molecular identifiers: UMI)を持つcDNAを増幅させ、NGS後の情報処理を用いるものであると考えられる<ref><pubmed>22101854</pubmed></ref>。この方法では逆転写反応の際、ランダム塩基配列から構成されるUMIをcDNA末端に付加した後、増幅反応、NGSを行い、cDNA配列とUMI配列の両方を読む。cDNAにはRNA1分子に1つのUMIが付加されるので、同一のUMIを持っていれば、逆転写時に同一のcDNA由来とカウントする。UMIをカウントすることで、増幅前のmRNAのコピー数を知ることができる<ref name=Islam2011><pubmed>21543516</pubmed></ref><ref><pubmed>24363023</pubmed></ref><ref name=Gierahn2017><pubmed>28192419</pubmed></ref> <ref><pubmed>29474909</pubmed></ref><ref name=Cao2017><pubmed> 28818938 </pubmed></ref><ref name=Rosenberg2018><pubmed>29545511</pubmed></ref>。
 増幅バイアス除去のアプローチとして特に重要なのは、2011年に発表された核酸配列バーコードを利用した方法で、分子識別子(unique molecular identifiers: UMI)を持つcDNAを増幅させ、NGS後の情報処理を用いるものであると考えられる<ref><pubmed>22101854</pubmed></ref>。この方法では逆転写反応の際、ランダム塩基配列から構成されるUMIをcDNA末端に付加した後、増幅反応、NGSを行い、cDNA配列とUMI配列の両方を読む。cDNAにはRNA1分子に1つのUMIが付加されるので、同一のUMIを持っていれば、逆転写時に同一のcDNA由来とカウントする。UMIをカウントすることで、増幅前のmRNAのコピー数を知ることができる<ref name=Islam2011><pubmed>21543516</pubmed></ref><ref><pubmed>24363023</pubmed></ref><ref name=Gierahn2017><pubmed>28192419</pubmed></ref> <ref><pubmed>29474909</pubmed></ref><ref name=Cao2017><pubmed> 28818938 </pubmed></ref><ref name=Rosenberg2018><pubmed>29545511</pubmed></ref>。
42行目: 42行目:


==実際==
==実際==
 ここでは主流になっている10x Genomics社のChromium controllerなどのドロップレットを用いた方法とSMART-seqなどを用いた他のプラットフォームに共通する方法の実際について概説する。scRNA-seqの利用には、4つのステップがある(図2)<ref name=Luecken2019><pubmed> 31217225</pubmed></ref><ref><pubmed>30089861</pubmed></ref>。
 ここでは主流になっている10x Genomics社のChromium controllerなどのドロップレットを用いた方法とSMART-seqなどを用いた他のプラットフォームに共通する方法の実際について概説する。scRNA-seqの利用には、4つのステップがある(図2)<ref name=Luecken2019><pubmed>31217225</pubmed></ref><ref><pubmed>30089861</pubmed></ref>。
[[ファイル:ScFig2d.jpg|サムネイル|500px|'''図2.scRNA-seqの実際のステップ '''<br>細胞の単離、ライブラリ作製とNGS、データの前処理から次元圧縮、データ解析。図の一部は2016 DBCLS TogoTV、あるいはSeuratを用いて10x Genomics社のPBMCデータ([https://support.10xgenomics.com/single-cell-gene-expression/datasets]から執筆者が作製。]]
[[ファイル:ScFig2d.jpg|サムネイル|500px|'''図2.scRNA-seqの実際のステップ '''<br>細胞の単離、ライブラリ作製とNGS、データの前処理から次元圧縮、データ解析。図の一部は2016 DBCLS TogoTV、あるいはSeuratを用いて10x Genomics社のPBMCデータ([https://support.10xgenomics.com/single-cell-gene-expression/datasets]から執筆者が作製。]]
# 個体や組織を採集し、そこから細胞あるいは細胞核を個別に解離された状態にすること。
# 個体や組織を採集し、そこから細胞あるいは細胞核を個別に解離された状態にすること。
63行目: 63行目:
 scRNA-seq解析のためには、数多くのツールが公開されている。これらのツールは、バージョンが更新されたり、新しいものに置き換えられることがあるので、実際に利用する場合は最新の動向に注意を払う必要がある。scRNA-seqの解析に必要なツールは、scRNA-tools [https://www.scrna-tools.org], Awesome single cell [https://github.com/seandavi/awesome-single-cell], Bioconductor[https://www.bioconductor.org]などで紹介されており、ほとんどがダウンロード可能である。また、bioRxivなどの査読前のプレプリントサーバで公開されて、随時試用、評価されていくものが多く、scRNA-seqのデータ(下記参考)とともに、オープンサイエンス実践の好例となっている。
 scRNA-seq解析のためには、数多くのツールが公開されている。これらのツールは、バージョンが更新されたり、新しいものに置き換えられることがあるので、実際に利用する場合は最新の動向に注意を払う必要がある。scRNA-seqの解析に必要なツールは、scRNA-tools [https://www.scrna-tools.org], Awesome single cell [https://github.com/seandavi/awesome-single-cell], Bioconductor[https://www.bioconductor.org]などで紹介されており、ほとんどがダウンロード可能である。また、bioRxivなどの査読前のプレプリントサーバで公開されて、随時試用、評価されていくものが多く、scRNA-seqのデータ(下記参考)とともに、オープンサイエンス実践の好例となっている。
====Seurat====
====Seurat====
 ここでは、scRNA-seqデータ解析のために最もよく利用されているRを用いたパッケージ「Seurat」<ref name=Butler2018><pubmed> 29608179 </pubmed></ref> <ref><pubmed> 31178118 </pubmed></ref>を中心に紹介しておきたい。なお、一部の解析操作は、University of WashingtonのCole Trapnell研究室で開発されてきた軌道推定(下記参考)によく使用されるMonocle3でも可能である([https://cole-trapnell-lab.github.io/monocle3/])。Pythonを利用したものでは、ドイツ・ミュンヘンInstitute of Computational Biologyの Fabian Theisらが開発しているScanpyが有名である<ref><pubmed> 29409532</pubmed></ref>。
 ここでは、scRNA-seqデータ解析のために最もよく利用されているRを用いたパッケージ「Seurat」<ref name=Butler2018><pubmed>29608179</pubmed></ref> <ref><pubmed> 31178118 </pubmed></ref>を中心に紹介しておきたい。なお、一部の解析操作は、University of WashingtonのCole Trapnell研究室で開発されてきた軌道推定(下記参考)によく使用されるMonocle3でも可能である([https://cole-trapnell-lab.github.io/monocle3/])。Pythonを利用したものでは、ドイツ・ミュンヘンInstitute of Computational Biologyの Fabian Theisらが開発しているScanpyが有名である<ref><pubmed> 29409532</pubmed></ref>。


 New York UniversityのRahul Satija研究室が開発しているSeurat(画家スーラに由来)は、scRNA-seqデータ解析のために広く利用されているRパッケージであり、2020年秋現在、Seurat4のβバージョンが公開されている。論文の正式発表前から、サポート情報提供やコード修正なども頻繁に行っており、Satija研究室のウェッブサイト( [http://satijalab.org/Seurat])、Github([https://github.com/satijalab/Seurat])、更にTwitterアカウント(@satijalab)などで最新情報を得ることできる。
 New York UniversityのRahul Satija研究室が開発しているSeurat(画家スーラに由来)は、scRNA-seqデータ解析のために広く利用されているRパッケージであり、2020年秋現在、Seurat4のβバージョンが公開されている。論文の正式発表前から、サポート情報提供やコード修正なども頻繁に行っており、Satija研究室のウェッブサイト( [http://satijalab.org/Seurat])、Github([https://github.com/satijalab/Seurat])、更にTwitterアカウント(@satijalab)などで最新情報を得ることできる。
83行目: 83行目:
[[ファイル:scFig4.jpg|サムネイル|300px|'''図4.scRNA-seqデータの可視化の例 '''<br>A. ドットプロット。B.ヴァイオリンプロット。C. リッジプロット。D. UMAP(灰色)に転写物量(青)をプロットした Featureプロット。網膜の視細胞のデータを用いて執筆者が作製[https://doi.org/10.1101/2020.10.09.333633]。]]
[[ファイル:scFig4.jpg|サムネイル|300px|'''図4.scRNA-seqデータの可視化の例 '''<br>A. ドットプロット。B.ヴァイオリンプロット。C. リッジプロット。D. UMAP(灰色)に転写物量(青)をプロットした Featureプロット。網膜の視細胞のデータを用いて執筆者が作製[https://doi.org/10.1101/2020.10.09.333633]。]]
===擬時系列解析===
===擬時系列解析===
 実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、[[細胞周期]]、[[概日リズム]]、発現変動が大きい破裂型プロモーターの作動などの理由で 変動が見られるものもある<ref name=Luecken2019><pubmed> 31217225 </pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上にある細胞系譜や細胞分化といった細胞の遷移状態の解析([[軌道推定]](Trajectory inference);[[擬時系列解析]](擬似時系列解析)、Pseudo-time analysis )には、scRNA-seqデータを用いることが効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref>。しばしば用いられるMonocle3 <ref><pubmed>30787437</pubmed></ref>[https://cole-trapnell-lab.github.io/monocle3/]など、多くのコードを収集、比較しているサイトがある [https://dynverse.org][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといったスプライシングされていく転写産物の量から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref><ref><pubmed> 32747759</pubmed></ref>。しかし、これらの方法は、あくまで[[細胞系譜]]や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNA-seqを行うことで、細胞タイプの系統関係を調べる方法として、CRISPR-Cas9を用いた[[ゲノム編集]]による痕跡追跡記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>、あるいはアデノシンデアミナーゼでRNA編集を行いタイムスタンプを入れる方法<ref><pubmed>33077959</pubmed></ref>がある。1塩基バリアント(Single-nucleotide variants: SNV)の系統的解析は、細胞の不均一性や系統的な関係を明らかにするための最も有望なアプローチの一つである<ref><pubmed>31744515</pubmed></ref>。
 実験的なノイズとは別に生物学的に意味のある遺伝子発現の変動には、位置情報、[[細胞周期]]、[[概日リズム]]、発現変動が大きい破裂型プロモーターの作動などの理由で 変動が見られるものもある<ref name=Luecken2019><pubmed>31217225</pubmed></ref><ref><pubmed> 26000846</pubmed></ref>。特に、刺激・薬剤処理やさまざまな病態の進行や治療に伴う細胞の変化、発生途上にある細胞系譜や細胞分化といった細胞の遷移状態の解析([[軌道推定]](Trajectory inference);[[擬時系列解析]](擬似時系列解析)、Pseudo-time analysis )には、scRNA-seqデータを用いることが効果的である<ref><pubmed>29576429</pubmed></ref><ref><pubmed>28813177</pubmed></ref><ref><pubmed>29565398</pubmed></ref>。しばしば用いられるMonocle3 <ref><pubmed>30787437</pubmed></ref>[https://cole-trapnell-lab.github.io/monocle3/]など、多くのコードを収集、比較しているサイトがある [https://dynverse.org][https://github.com/agitter/single-cell-pseudotime]。RNA velocityといったスプライシングされていく転写産物の量から細胞の分化状態を推定する方法もある<ref><pubmed>30089906</pubmed></ref><ref><pubmed> 32747759</pubmed></ref>。しかし、これらの方法は、あくまで[[細胞系譜]]や細胞分化の推定に過ぎない。細胞系譜を更に確実に観察しつつ、scRNA-seqを行うことで、細胞タイプの系統関係を調べる方法として、CRISPR-Cas9を用いた[[ゲノム編集]]による痕跡追跡記録法を導入したscGESTALT<ref><pubmed>29608178</pubmed></ref>、ScarTrace<ref><pubmed>29590089</pubmed></ref> 、LINNAEUS<ref><pubmed>29644996</pubmed></ref>、あるいはアデノシンデアミナーゼでRNA編集を行いタイムスタンプを入れる方法<ref><pubmed>33077959</pubmed></ref>がある。1塩基バリアント(Single-nucleotide variants: SNV)の系統的解析は、細胞の不均一性や系統的な関係を明らかにするための最も有望なアプローチの一つである<ref><pubmed>31744515</pubmed></ref>。
===遺伝子制御ネットワーク、パスウェイ解析など===
===遺伝子制御ネットワーク、パスウェイ解析など===
 また細胞分化や刺激などによる変動に伴う特徴的な遺伝子発現状態をscRNA-seqで観察することは、遺伝子制御ネットワーク(例、SCENIC<ref><pubmed>28991892</pubmed></ref>, [https://github.com/aertslab/SCENIC])、[[代謝経路]]や[[シグナル伝達系]]のための[[パスウェイ解析]](例、Metascape<ref><pubmed>30944313</pubmed></ref>, [http://metascape.org]、Gene Ontolgoy[http://geneontology.org])を理解するシステム生物学的な研究として有用である<ref><pubmed>32051003</pubmed></ref>。更に、scRNA-seqで得られた結果をもとに、細胞間相互作用の理解を深めるのを目的とするCellPhoneDB<ref><pubmed>32103204</pubmed></ref>[https://github.com/Teichlab/cellphonedb]、NicheNet<ref><pubmed>3181926</pubmed></ref>, SVCA<ref><pubmed>31577949</pubmed></ref>などがある。特に、Perturb-seq<ref><pubmed>27984732</pubmed></ref> やその変法<ref><pubmed> 32231336</pubmed></ref>は、CRISPRライブラリーによるゲノム編集を施した細胞をscRNA-seqで解析することで、ゲノム編集で破壊された遺伝子の機能や遺伝子間の相互作用の理解を可能にしている後述する複数モダリティ情報を取り込んだscRNA-seqの1つであり、注目されている。
 また細胞分化や刺激などによる変動に伴う特徴的な遺伝子発現状態をscRNA-seqで観察することは、遺伝子制御ネットワーク(例、SCENIC<ref><pubmed>28991892</pubmed></ref>, [https://github.com/aertslab/SCENIC])、[[代謝経路]]や[[シグナル伝達系]]のための[[パスウェイ解析]](例、Metascape<ref><pubmed>30944313</pubmed></ref>, [http://metascape.org]、Gene Ontolgoy[http://geneontology.org])を理解するシステム生物学的な研究として有用である<ref><pubmed>32051003</pubmed></ref>。更に、scRNA-seqで得られた結果をもとに、細胞間相互作用の理解を深めるのを目的とするCellPhoneDB<ref><pubmed>32103204</pubmed></ref>[https://github.com/Teichlab/cellphonedb]、NicheNet<ref><pubmed>3181926</pubmed></ref>, SVCA<ref><pubmed>31577949</pubmed></ref>などがある。特に、Perturb-seq<ref><pubmed>27984732</pubmed></ref> やその変法<ref><pubmed> 32231336</pubmed></ref>は、CRISPRライブラリーによるゲノム編集を施した細胞をscRNA-seqで解析することで、ゲノム編集で破壊された遺伝子の機能や遺伝子間の相互作用の理解を可能にしている後述する複数モダリティ情報を取り込んだscRNA-seqの1つであり、注目されている。
==神経科学研究への適用==
==神経科学研究への適用==
===神経系細胞ビッグデータとしてのscRNA-seq===
===神経系細胞ビッグデータとしてのscRNA-seq===
 様々な神経・精神疾患について理解しその診断や治療に役立てるためには、神経細胞、[[グリア細胞]]を中心にした神経系にある細胞の種類や状態を識別し、それぞれの細胞における分子的な変化を観察することが重要である <ref><pubmed>28775344</pubmed></ref><ref><pubmed>29738987</pubmed></ref>。本項目で解説してきたscRNA-seq技術は、神経系に見られるそれぞれの細胞のトランスクリプトームについて[[ビッグデータ]]を提供することで、この細胞の種類や状態の識別に新たな判断材料を与えつつある。近年、中枢神経系の[[アストロサイト]]、[[オリゴデンドロサイト]]、ミクログリアといったグリア細胞も均一ではなく、内在的な多様性や外部因子による状態の変動が報告されてきている。神経細胞は、著しく多様であり、この多様性が神経系の多彩で複雑な機能発現の基盤となっている。従来の神経科学では、神経細胞の多様性は、それぞれの神経細胞の解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきている。こうした神経細胞の多様性を便宜的に記述するのに、タイプ(type)、クラス(class)、サブクラス(subclass)、サブタイプ(subtype) というような用語が用いられてきた。しかし、ここでは混乱を防ぐため、Masland(2004)<ref><pubmed>15242626</pubmed></ref>が提唱し、広く受けいれられている「クラス」と「タイプ」という単語を用いることとする<ref name=Yuste2020><pubmed> 32839617
 様々な神経・精神疾患について理解しその診断や治療に役立てるためには、神経細胞、[[グリア細胞]]を中心にした神経系にある細胞の種類や状態を識別し、それぞれの細胞における分子的な変化を観察することが重要である <ref><pubmed>28775344</pubmed></ref><ref><pubmed>29738987</pubmed></ref>。本項目で解説してきたscRNA-seq技術は、神経系に見られるそれぞれの細胞のトランスクリプトームについて[[ビッグデータ]]を提供することで、この細胞の種類や状態の識別に新たな判断材料を与えつつある。近年、中枢神経系の[[アストロサイト]]、[[オリゴデンドロサイト]]、ミクログリアといったグリア細胞も均一ではなく、内在的な多様性や外部因子による状態の変動が報告されてきている。神経細胞は、著しく多様であり、この多様性が神経系の多彩で複雑な機能発現の基盤となっている。従来の神経科学では、神経細胞の多様性は、それぞれの神経細胞の解剖学的な位置、発現している分子、電気生理学、結合性、形態、神経伝達物質、神経伝達物質受容体とシグナル伝達によって識別されてきている。こうした神経細胞の多様性を便宜的に記述するのに、タイプ(type)、クラス(class)、サブクラス(subclass)、サブタイプ(subtype) というような用語が用いられてきた。しかし、ここでは混乱を防ぐため、Masland(2004)<ref><pubmed>15242626</pubmed></ref>が提唱し、広く受けいれられている「クラス」と「タイプ」という単語を用いることとする<ref name=Yuste2020><pubmed>32839617</pubmed></ref>。タイプは、これ以上分類することができないとされる階層であり、共通性を持つタイプの集団がクラスである。例えば、大脳皮質の錐体細胞、網膜神経節細胞といった大雑把な区分はクラスである。大脳皮質の錐体細胞というクラスは、層や領野によって異なるタイプ、網膜神経節細胞には視覚情報に対して応答が異なるタイプが存在する。scRNA-seqは、「タイプ」の理解に新たな視点を提供している。
</pubmed></ref>。タイプは、これ以上分類することができないとされる階層であり、共通性を持つタイプの集団がクラスである。例えば、大脳皮質の錐体細胞、網膜神経節細胞といった大雑把な区分はクラスである。大脳皮質の錐体細胞というクラスは、層や領野によって異なるタイプ、網膜神経節細胞には視覚情報に対して応答が異なるタイプが存在する。scRNA-seqは、「タイプ」の理解に新たな視点を提供している。
===神経系へのscRNA-seqの適用===
===神経系へのscRNA-seqの適用===
 scRNA-seqの神経系での利用については、次々と新しい論文やプレプリントが発表されており、ここではscRNA-seqで得られてきた情報の典型例を紹介することにとどめる。
 scRNA-seqの神経系での利用については、次々と新しい論文やプレプリントが発表されており、ここではscRNA-seqで得られてきた情報の典型例を紹介することにとどめる。