バイオインフォマティクスの観点から、ゲノム、RNA、タンパク、代謝について、今進められている研究、まだ何が分かっていないのかなどについて解説されている本
また、タイトルに「デジタル」とあるが、ゲノムを中心とした生命機構をデジタル処理装置と見なして説明している(このデジタル処理装置としてのゲノムをDIGIOMEと呼んでいるが、あくまでもこの本の中での造語で、なんかカッコよく呼んでみたという程度のもの)
ブルーバックスはカバー折り返しに、類書の紹介があるが、創薬系の本が多く紹介されている。最初は何故と思ったが、読んでみたらこの本では研究の具体例として結構創薬関係の話題が出てくる。
筆者は、物理学専攻出身で、今も物理学科の教授ということだが、researchmapを見た感じ機械学習を用いたゲノムなどの解析を研究していて、創薬研究にも関わっているという人らしい。ちなみに、researchmapでは、「情報通信/生命、健康、医療情報学」を研究分野として記載している。
生物学関係の本、特に進化論や生命の起源、アストロバイオロジー あたりの本をちょいちょい読んでいるが、最近、そろそろ生化学やタンパク質についても軽くでいいから勉強すべきなのでは、と思っていたところ、新刊として並んでいたこの本の目次を確認してみたら、タンパク質についても章を割いているようだったので読んでみることにした。
バイオインフォマティクスも気にならないこともなかったので。
実際読んでみたら、予想以上に面白く、特に意外だったのがRNAのあたり。
ノンコーディングDNAと見かけて、「なるほど、プロモーターやエンハンサーの話するんだな」と早合点していたら、全然違う話であった。
研究分野としての歴史がまだ10年もない、という領域の話も結構あったり、上に述べたように、まだ分かっていないことについてもポロポロ出てきたり、新しい研究分野の話なんだなーというのが感じられて、楽しい。
話し言葉に近い平易な文体で、プログラミングや身近なデジタル機器を喩えに用いながら書かれており、スルスルと読める。
一方、そういう意味ではある種の「読み物」ではある。
(参考文献一覧などは特にない)
あとがきで、計測技術については書かなかった、とあるが、本書がいうデジタルとか情報とかいった視点を可能にしたのは、おそらく、この計測なのだろうな、というのを伺わせる記述がチラホラある。
ゲノム、トランスクリプトーム、プロテオーム、メタボロームと接尾辞-omeのついた概念が順に出てきているが、例えばプロテオームが「タンパクのすべて」と訳されている通り、これは、すべてとか全体とかいった意味で、とにかくまるっと全部調べてみることで、色んなことが分かってきて、新しい研究分野が立ち上がってきた、という話でもある。
代謝物の章で出てくるか、代謝物を全部測定することで意外な事実が分かったとあり、「〜のすべて」という概念と計測・測定とが深く関わっていることが示されている。
ゲノムについても、DNA配列をとりあえず全部読む、というヒトゲノムプロジェクトの重要性が指摘されている。本書では立ち入った記述はないが、それを可能にしたのもやはり、測定技術あってのことだろう。
とにかく全部測る、データ化する、解析する、というあたりが、研究手法における、デジタルで情報としての生命なのかなと思う。
第1章 ゲノムー38億年前に誕生した驚異のデジタル生命分子
1・1 セントラルドグマ
1・2 なぜ、セントラルドグマ、なのか?
1・3 デジタル処理系としてのセントラルドグマ
1・4 コンピュータで挑む
第2章 RNAのすべて(トランスクリプトーム)ータンパク質にならない核酸分子のミステリー
2・1 ジャンクじゃなかったジャンクDNA
2・2 SNP=バグ
2・3 AI=機械学習
2・4 RNAの機能
2・5 マイクロRNA
2・6 エンリッチメント解析という考え方
2・7 マイクロRNAを用いたiPS細胞作製
2・8 マイクロRNAスポンジという技術~デコイ戦略~
2・9 まだまだ発見、新種のRNA
2・10 環状RNA
2・11 RNA編集
2・12 技術の対象としてのDIGIOME
第3章 タンパクのすべて(プロテオーム)ー組成を変えずに性質を変える魔法のツール
3・1 デジタルとアナログを繋ぐ
3・2 進化とRNAワールド仮説
3・3 タンパクの構造
3・4 タンパクの立体構造
3・5 タンパクの機能と構造
3・5・1 受容体
3・5・2 酵素
3・5・3 抗体
3・6 薬とは何か?
3・6・1 オプジーボ(ニボルマブ)
3・6・2 アレグラ(フェキソフェナジン塩酸塩)
3・6・3 ペプチド創薬
3・6・4 核酸創薬
3・7 プロテオームの今後
第4章 代謝物のすべて(メタボローム)ー見過ごされていた重要因子
4・1 代謝物とは何か
4・2 がんと回虫の意外な関係
4・3 バイオマーカー
4・3・1 老化
4・3・2 飢餓
4・3・3 メタボロゲノミクス
第5章 マルチオミックス 立ちはだかるゲノムの暗黒大陸
5・1 エピジェネティクス
5・1・1 ゲノム刷り込み(インプリンティング)
5・1・2 がんのメチル化――がんによるDIGIOMEへのクラッキング
5・1・3 神経変性疾患とDNAメチル化
5・1・4 神経変性疾患とヒストン修飾
5・2 エピトランスクリプトーム
5・3 マルチオミックス解析
5・4 AI=機械学習でも困難な因果関係の推定
第1章 ゲノムー38億年前に誕生した驚異のデジタル生命分子
主にセントラルドグマの説明
あと、ヒトゲノムプロジェクトについて、とりあえず全部読むことは、情報科学的には当たり前の方針、だけど当初は受けが良くなかった。が、やってみてよかった、というようなことが書いてある。
第2章 RNAのすべて(トランスクリプトーム)ータンパク質にならない核酸分子のミステリー
RNAというと、生命の起源話の中では結構重要だが、現生生物の中では、DNAとタンパク質の間の仲介してるだけの、地味な奴というイメージが何となくあったが、実はいまだよく分かってない様々な機能がありそうだということで、驚いた。
ゲノムの中には、タンパクをコードしているDNA配列の領域の他に、タンパク質をコードしていない領域がある。というか、そういう領域の方が圧倒的に多い。
その中に、RNAを合成するが、そのRNAがタンパク質に合成されない領域がある。
タンパク質にならないノンコーディングRNAがこの章の主役である。
まず取り上げられるのが、マイクロRNA
25塩基程度の短いRNAで、タンパク質をコードしているRNAにくっつくことで、合成を阻害する。
という、わりとシンプルな奴だが、実際にそれでどのような機能を実現しているのか、まだはっきりとは分かっていないらしい。
というのも、あるマイクロRNAがどのRNAをターゲットとしているのか、組み合わせが膨大でこれを調べるのがとても大変だから。
統計的に機能を推測するという手法も紹介されている。
また、マイクロRNAの仕組みを利用して、人為的に特定のタンパク質の合成を阻害する技術も開発されている。
ゲノムをいじらずにリプログラミングできる。
RNAスポンジというのもある。
これは、マイクロRNAとくっつく配列のRNAで、マイクロRNAをスポンジが水を吸い込むが如く取り込んで、その働きを阻害してしまう。
これは、研究用に作られた技術でもあるし、実際の細胞の中にもこの働きをするRNAが存在すている。
臓器特異的なプロモーター領域をターゲットにすれば、臓器ごとに操作できる。
長い塩基のノンコーディングRNAもあって、これを調べるのはマイクロRNA以上に大変、というか、計算量が爆発してしまう。純粋に計算科学的には解けなくて、生物学の知識により、現実に起こってるであろう制限を織り込んで調べることになるらしい。これを「面白い」と思うか「ズルい」と思うかで性格(?)が出るようだ。
そんなわけで、長いノンコーディングRNAの働きは全然よくわかっていないらしいが、RNAスポンジとしての働きを持っていることは分かってきたとか。
環状RNAというのもある
これは実は存在自体は古くから知られていたが、注目されていなかった。
というのは、スプライシングの際に捨てられるゴミだと思われていたから
しかし、これもどうも機能を持っていて、それもRNAスポンジらしいというのが分かってきていると。
とまあ、ノンコーディングRNAは、どうも機能を持っているのだが、具体的にどの遺伝子に対してどのような働きをするのかとかは、まだ分かっていないことがとても多くて、まだまだこれからの分野らしくて、面白い。
ところで、内容とはあんまり関係ないのだが、この章の文章的に気になったことで
2・2節のタイトルが「SNP=バグ」なのだが、あまり適切な節タイトルに思えない。
確かに、SNPはバグだ、という話は書かれているのだが、この話、本書全体の中での重要性はあまりない。
対して、この節では、フラジャイルとロバストという概念について説明している。
フラジャイルは、脆弱という意味だが、きっちりしている、という意味ももつという。
一方、ロバストは、頑強という意味だが、いい加減、という意味ももつという。
そして、人間の作るプログラムはフラジャイルだが、生命はロバストだということが、本書では繰り返し出てくる。
生命の仕組みを、機械やコンピュータプログラムに喩える一方で、違いとして、フラジャイルかロバストかという点で比較している。
なので、節タイトルもロバストかフラジャイルか、みたいな方が良かったのではないか、というのが読んでて気になってしまった。
第3章 タンパクのすべて(プロテオーム)ー組成を変えずに性質を変える魔法のツール
タンパクは、デジタルとアナログをつなぐインターフェースの役割をしている、と。
タンパクは、アミノ酸がたくさん並んで折り畳まれて立体的な構造をとる。
それぞれのアミノ酸の電荷による相性で、どう折り畳まれるかが決まってくるが、電子がクーロン力でどのように引き合うか、というのは量子力学でまだ解けていない問題で、タンパクの構造がどのように決まるのか、もまだまだ未知
タンパクの機能について、クーロン力を使って「特異的に弱くくっつく」ことが特徴であるとまとめ、具体的には受容体、酵素、抗体について、全て「特異的に弱くくっつく」ことをうまく使った仕組みであると説明している。
また、薬というのは、この「特異的に弱くくっつく」ことを阻害する化合物のことだとして、
一酸化炭素(猛毒であるが、毒も薬の一種であり、働き方としては薬)、オプジーボ(がん治療薬)、アレグラ(花粉症薬)について説明し、さらに、近い将来実現するだろうものとして、ペプチド創薬、核酸創薬を挙げている。
第4章 代謝物のすべて(メタボローム)ー見過ごされていた重要因子
代謝物は、デジタルではないし、また古くから知られていたものでもある。
しかし、DNA、RNA、タンパクの研究が、計測技術と解析技術によって進展したように、代謝物研究も、計測技術と解析技術により新しくなった、という。
特に、代謝物の計測技術では、日本の研究が進んでいるらしい。
例えば、がん細胞の代謝物のすべてを計測したところ、フマル酸呼吸のコハク酸が見つかった、と。フマル酸呼吸というのは、TCA回路(クエン酸回路)の左側だけを逆回転させて、酸素を使わずにATPを合成する呼吸。回虫がこの呼吸をしていて、虫下しはこの呼吸を阻害するのだが、がんを死滅させたいう報告があるらしい。
バイオマーカー
例えば、血糖値は糖尿病のバイオマーカーだが、メタボローム計測・解析により、より精度の高いバイオマーカーを見つける研究が進んでいる、とか。
また、メタボロゲノミクスというのが出てくる。
腸内細菌叢のメタゲノミクスとメタボローム解析を合わせた研究のことで、これが最近進んでいる、と。
精神疾患とも関わっているかもしれないとか
腸内細菌叢はすごいらしいぞ、ってことしか書いてないんだけど、確かに噂に聞いたことはあるし、ちょっと気になってきた。
第5章 マルチオミックス 立ちはだかるゲノムの暗黒大陸
接尾辞として使われているオームの総称としてオミックスというらしい。
ゲノム、トランスクリプトーム、プロテオーム、メタボロームを総合的に捉えるのが、マルチオミックス。
しかし、ここまで読んできて分かる通り、一つ一つだけでも解析がめちゃ大変であり、ましてやマルチオミックスをや、というところであり、この章でもマルチオミックスの具体的なことはあまり語られていない。
その代わり(?)、エピジェネティクスについて解説されている
エピジェネティクスで使われる「修飾」というのは大きな分子に小さな分子がつくこと
がんや神経変性疾患(パーキンソン病やアルツハイマーなどの総称)でDNAのメチル化が発見され始めている、と。ここらへんもまだ研究が始まったばかりのようだが、これらの病気についてより詳しいことが分かってくるかもしれない
がんはすでに述べた通りメタボロームとの関わりもあり、マルチオミックスの出番かも、とか。
それから、ヒストン修飾について
エピジェネティクスについては、以前本を読んでいたが、もう結構時間が経って理解があやふやになってたところで、ヒストンの説明がわかりやすかった。
ゲノムというのは記録媒体だが、コンピュータではテープが記録媒体として使われていた。その際、絡まらないように保存するためにはリールに巻いておく必要があったが、順番に回していかないと目当ての場所が読み込めない。
ヒストンは、絡まらないように巻きつけつつ、どの場所にでもすぐにアクセスできる(ランダムアクセスできる)ための構造、と。
RNAにも修飾が起きている
エピゲノムにならって、エピトランスクリプトームと呼ばれている。
特に、m^6A修飾という、脳内RNAのアデニンのメチル化について、概日リズム、ドーパミン、学習、海馬などに関係していることが分かってきており、セントラルドグマのライン外に、何らかのメモリー空間を持っているのかもしれないとか。
研究分野としてまだ10年経っていないという。
10年後にまた本を書く際には、これについてもっと分かってるはずたがら、これについて書きたいとも。
この第5章、これだけでブルーバックスが一冊書けると言ってる箇所が3回くらいあったw