現役の腸内細菌研究者がお届けする、腸内細菌相談室。
室長の鈴木大輔です。毎日夜7:30に、腸内細菌にまつわるエピソードをお届けしております🦠
腸内環境を理解するために必要な、生物学的な基礎知識から応用までをお届けする本シリーズ。前回までに、サンガー法の応用例としてのヒトゲノム計画や、そこで繰り広げられた研究コンソーシアムと民間企業のセレラ社のドラマについてお話しました。今回は、ヒトゲノム計画以後にバイオインフォマティクスの分野が盛り上がるきっかけとなった次世代シーケンサーについてのお話をします。
このお話は、聴いて楽しむポッドキャストでも公開しております!ぜひ遊びに来てください!
https://open.spotify.com/show/5cg5yMYD7FA9NQSSbksEVx
まずは、次世代シーケンサーとは何かお話します。感覚的な説明をすると、次世代シーケンサーとは、サンガー法と比較して膨大な塩基配列を解読できる装置です。サンガー法を旧来の方法として、新しいシーケンシング技術を次世代と称することで対比させています。しかし、次世代の次世代はどうなるかなど呼称上の問題があるので、超並列シーケンサーや超高速シーケンサーと呼ばれたりもします。ここでは、次世代シーケンサーと呼ぶことにします。
次世代シーケンサーには、短い塩基配列を並列的にシーケンシングする装置や、サンガー法などと比較して非常に長い塩基配列をシーケンスする装置など様々な種類が存在します。よく使う用語の紹介として、短い塩基配列のシーケンシング結果をショートリード、長い塩基配列のシーケンシング結果をロングリードと呼びます。ショートリードのシーケンシングに強いのは、アメリカ、サンディエゴの会社であるillumina、ロングリードのシーケンシングに強いのは、アメリカ、メンローパークの会社であるPacBioや、イギリスのOxford Nanopore Technologies社です。
2006年、次世代シーケンサーの世界的なリーディングカンパニーであるillumina、正確にはilluminaが後ほど買収することになったSolexa社が次世代シーケンサーを開発しました1*。2006年以降、シーケンシングコストは指数関数的に減少し、2021年ではヒトゲノムのシーケンシングに1000$程度のコストのみが必要です2*。ヒトゲノム計画においては30億$が投じられていた20年前からの、大幅な技術革新とコストカットを読み取ることができます。
続いて、次世代シーケンサーがシーケンシングを行う原理についてお話します。蛍光分析やDNAポリメラーゼを伴う点は、サンガー法と同じであると言えるでしょう。
シーケンシング技術について、illumina社が公式に解説動画も公開しているので、ぜひ御覧ください。これを見たあとであれば、このあとのお話も頭に入りやすいと思います。
https://jp.illumina.com/science/technology/next-generation-sequencing/sequencing-technology.html
このように、製品以外のサービスなど、カスタマーサービスが充実しているのも、業界におけるシェアが大きい理由の一つだと私は考えています。
illumina社のシーケンシングでは、Sequence by Synthesis (SBS)という方法を取ります。合成によってシーケンシングするということです。illuminaの公開資料に記されている具体的な方法は以下の通りです3*。
必要なものは、次の通りです。
サンプル中に含まれるゲノム
アダプターと呼ばれるDNA断片配列
ブリッジPCRなどの実験に使用する試薬
保護基と蛍光分子がついたヌクレオチド:保護基とは化学反応を進行しないようにするための分子構造になります。
シーケンスプライマー
フローセルと呼ばれるDNA配列の増幅および検出を行う基盤
シーケンサー
まずは、解析対象となる配列=ライブラリーの調製を行います。まずは、サンプル中に含まれるゲノムDNAを断片化します。断片化されたDNAの両端に、2種類の異なるアダプターを結合させます。
アダプターの結合したDNA断片をフローセルに結合させて固定します。その後、ブリッジPCRと呼ばれる手法により配列を増幅します。ブリッジPCRにより増幅したDNA断片は、一番最初にDNA断片が結合した場所の周辺にまとめるので、このような増幅された均質なDNA断片のことをクラスターと呼びます。ブリッジPCRを経て、少ないDNA断片でも検出可能な量にするのが狙いです。
続いて、シーケンスプライマーと呼ばれるDNA断片の結合を、増幅されたDNA断片に対して行います。ここから、DNA合成が行われる際に蛍光色素のついたヌクレオチドを用いることで、1塩基が付加するごとに蛍光を発して配列の読み取りを行います。ここで、使用するヌクレオチドには保護基がついているので、1塩基ごとに反応を制御してシーケンシングを行うことが可能です。
サンガー法とは異なり、基板上に無数のDNA断片がついており、これらを並列的にシーケンシングできることが、SBS法の強みになります。これがilluminaの次世代シーケンサーで使用されている技術です。
ここまでお話した内容の操作や反応は、次世代シーケンサーにより自動で行われます。シーケンシングの自動化と得られるデータ量の増大は、バイオインフォマティクスの分野を活気づけました。
なぜなら、サンプルのデータを大規模に集めることができるようになるため、様々な仮説検証ができるようになるためです。この動きは、計算機のスペックが劇的に向上を続けていることにも関係しています。
また、次世代シーケンサーを始めとしたデータ収集能力の向上により、データが豊富に手に入るようになったことで、新しい研究のスタイルも確立されました。それは、生物学のデータ駆動型研究です。従来の研究は仮説駆動型の研究であり、仮説検証のために実験を通してデータを生み出すという流れでした。データ駆動型の研究では、膨大なデータから仮説を生み出します。仮説駆動型とデータ駆動型の研究の両輪が回ることで、バイオインフォマティクスが成果を挙げています。
このように、流通するデータ量の増大は、新しい研究スタイルをも生み出してしまいました。これは、元を正せば次世代シーケンサーが登場したからでした。新しい測定方法の確立は、世界の見方を与えるだけでなく、それによって大きなパラダイムシフトを起こす可能性を内包しているといえます。
次回は、次世代シーケンサーの登場の末に見えてきた、メタゲノム解析のお話をしていきます!
腸内細菌の分からないに答えるために、腸内細菌相談室は存在します!わからないこと、難しいこと、紹介してほしいことがあれば、TwitterやInstagram、Noteコメント欄にてメッセージお待ちしております。読んでほしい論文リクエストも待っています!
こちらがTwitterです!
https://twitter.com/chonai_saikin
インスタグラムはこちらです!
https://www.instagram.com/chonai_saikin
本日も一日、お疲れさまでした。
1* Sequencing by Synthesisの歴史, illumina, Access: 2022/11/10.
2* DNA Sequencing Costs: Data, National Human Genome Research Institute, Access: 2022/11/10.
https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data
3* NGSをはじめよう!これだけは知っておきたいMiSeq ~
解析原理と必要な試薬キット、装置の使い方~, illumina, Access: 2022/11/10.