メンバー募集
エピゲノム、ゲノム立体構造、シングルセルの情報解析に興味がある方、一緒に中戸研で研究しませんか?
中戸研究室では、「データ駆動型大規模NGS解析」を実現するための技術開発と、そのような大規模解析でしか得ることのできない「高次ゲノム情報に関する新規知見獲得」を目標にしています。どうすれば大量のNGSデータからそのような重要な発見ができるのでしょうか?たくさん得られた結果の中でどれが生物学的に面白いのか?解析を更に深めていくには何をすればよいのか?得られた知見はどうやって実証すればよいのか?そもそも入力データの品質を無条件に信頼してもよいのか、個人差やノイズなどは考慮すべきか?などなど、実際に生データを解析していると次々に疑問が湧き出てきます。当研究室に所属する方には上記のような疑問に答えられる知識と経験を培ってもらい、玉石混交のデータの海から真に重要な発見ができる次世代の人材になれるようにサポートします。
ウェット系・ドライ系いずれの方も入学可能です。情報解析に専門的に取り組みたい生物系の方、ウェットに近い環境で生命情報を扱ってみたい情報系の方、いずれも歓迎します。(現在は「ウェット系のラボで独自にNGS解析を学んでいたけれども、もっと専門的に情報解析を学びたい!」というモチベーションの学生が多いです。)
このページでは、中戸研の研究スタイルや普段の生活などについて色々紹介しています。私たちの研究室に興味を持ってもらえた方は、ぜひ直接研究室に見学に来てください。実際に研究室を目で見て、ラボメンバーと話をして、みなさんのイメージと一致しているかどうか、充実した時間を過ごせそうかどうかを確認してみてください。学部生の方は、1ヶ月程度の研究体験をすることもできます(インターン)。一同、みなさんとお会いできることを楽しみにしています。
研究室は東京大学弥生キャンパスにある定量生命科学研究所本館にあります。
目次
多くの項目がありますので、好きなものをクリックして読んでください。
中戸研の研究
中戸研究室では、計算ゲノム学(Computational genomics)を扱います。様々な実験手法、情報解析手法を用いて、未だ明らかになっていないゲノムの謎を解き明かすことが目標です。解くことが難しい問題をいかに精度良く・効率的に解くかという「情報学」と、まだ世界で誰も知らない新たな知見を色々な実験で明らかにするという「生命科学」の両方の側面を持っていることが、われわれの研究分野の大きな特徴のひとつです。
たとえば、シングルセルデータを用いて遺伝子共発現ネットワークを推定する研究に興味があるとしましょう。「より高精度にネットワークを推定する方法はないかな?」「共発現ネットワークには枝の向き(因果関係)が含まれていないが、因果関係も推定することはできるだろうか?」というような問いが情報学(Bioinformatics)です。これに対し、「得られたネットワークはサンプルのどのような機能・性質を反映しているのか?」「幹細胞のシングルセルデータと分化刺激後のデータからネットワークをそれぞれ推定し、ネットワーク比較することで、細胞分化に重要な新規の遺伝子を発見できるのでは?」というような問いが生命科学(Computational biology)になります。中戸研ではどちらの研究も可能です。
現在の研究テーマ
現在我々は特にエピゲノム状態(ChIP-seq)、ゲノム立体構造(Hi-C, Micro-C)と遺伝子発現状態(RNA-seq)の関係性に興味を持っており、それらが疾患や細胞分化過程においてどのように変動するのかについて知りたいと考えています。また、シングルセルデータ(scRNA-seq)を用いた細胞分化軌道解析、遺伝子ネットワーク解析にも注力しています。より詳しい研究内容や過去の成果については、Researchのページも参考にしてください。
具体的な研究テーマには以下のようなものがあります。より理論的なもの、プログラミングをより必要とするもの・あまりしないものなど、バリエーションには富んでいます。他にも色々なトピックがありますので、「こういうことをやってみたい」というアイデアを持っている人はどんどん提案してみてください。
- 大規模エピゲノムデータを入力とした新規の機能性制御領域の同定:我々が参加する国際ヒトエピゲノムコンソーシアム (IHEC) では1000種以上の細胞種から成るエピゲノムデータベースを構築しています。このリソースを用いて、ゲノムの重要な機能領域を推定します。
- エンハンサー領域を対象とした大規模解析:遺伝子の活性を規定するエンハンサー領域は細胞種特異性が高く、ひとつの遺伝子に複数のエンハンサーが作用することもあり、かつスーパーエンハンサーと呼ばれる特殊な制御領域もあるなど、様々な特徴を持つ魅力的な研究対象です。大規模解析を用いてエンハンサーの機能と疾患などとの関わりを明らかにします。
- ゲノム立体構造データと遺伝子発現の関係、コヒーシンの機能解析:ゲノムの立体構造はエピゲノムや転写制御に重要と言われており、そこでは「コヒーシン」というタンパク質が重要な役割を果たしています。コヒーシンの機能は多岐にわたり、その詳細は未解明な点がたくさんあります。コヒーシンのノックダウン実験やコヒーシン病患者細胞の解析を通して、立体構造の重要性、コヒーシンによる制御メカニズムを解明します。
- シングルセルデータを入力とした遺伝子共発現ネットワーク解析と細胞分化軌道解析:シングルセルデータは非常に様々な活用法がありますが、我々は特に遺伝子ネットワーク解析と細胞分化軌道解析に興味を持ち、新規技術の開発と知見獲得を行っています。
求める人材
◆ 生命科学、理論系両方に興味がある人
我々が研究を通して知りたい「問い」は生命科学に密接に関わりますので、生命科学そのものに興味を持っていることは中戸研で研究するうえで重要な要素になります。一方、解析手法の論文を読む時には数式や理論の内容にも踏み込みますので、非情報系の人でも理論を学び、チャレンジする気持ちが重要です。
◆ 自発的に学ぶ姿勢がある人
入学時点で全てを理解している必要は全くありません。プログラミング経験の全く無い人、ゲノムの知識が無い人が入学することもあります。全てのことは、入学してから学ぶことができます。
しかし、入学しただけで自動的に知識が身につく訳ではありません。必要な知識は、自分で勉強して身につける必要があります。他の人が既に習得している知識を身に着けていない場合、その人の倍くらい努力する覚悟がないとついていけないでしょう。「それでも頑張りたい!」という情熱がある人には最大限のサポートをすることを約束します。
必要な知識を自ら積極的に獲得していく姿勢は、中戸研においてとても重要な資質になります。逆に、質問しないと基本的に誰も教えてくれませんので、誰かが教えてくれるのを待っているという受け身の姿勢だとうまくいかないかもしれません。
◆ 色々な分野に興味が持てる人
中戸研の研究は複数の分野にまたがる分野融合的なものが多いです。したがって、これまで学んでいなかった新しい技術・知識に接する機会が多くなります。今わからないことをわかるようになりたいという気持ち、専門外の内容にも興味を持って話を聞く姿勢は、中戸研においてとても重要な資質になります。「慣れてない分野なので詳細は全然わかんないけど、でも面白い!」と思える人、かなり有望です。
◆ コミュニケーションに積極的な人
ラボメンバーの研究テーマは多彩で、それぞれが自分の得意分野を活かして議論しています。他の人から学ぶことは多いでしょうし、貴方が得意とする分野については他メンバーに教える機会もあると思います(中戸もよくメンバーから色々なことを教えてもらっています)。従って、周囲の人と関わることが好きなことも中戸研での重要な要素になります。周囲と一切関わりを持ちたくない人でも自分の責任において研究を進めることは可能ですが、研究室から得られるメリットは少なくなるかもしれません。
中戸研で得られるリソース
◆ 潤沢な計算機資源があります
◇ 研究室で管理している共用解析サーバがあります(メニーコア、GPU, ストレージサーバなど)。研究室メンバーは無条件で全てのサーバを利用できます。スーパーコンピューターは通常使いませんが、使うことは可能です。
◇ サーバ上にはたくさんの解析ツールがインストールされており、様々なNGS解析を実行可能です。一般公開されているNGSデータベースのデータの他、共同研究で生成されたデータ、未発表データなど、たくさんの貴重なデータがあり、我々の研究で利用可能です。
◆ NGS解析に関する幅広い研究テーマを持っています
◇ 中戸研ではNGSを用いたほぼ全ての解析法が研究対象であり、それぞれの分野に強い人がメンバーまたは共同研究者にいます。他のメンバーのサポートを受けることによって、複数の異なるNGSアッセイを研究に取り入れることが比較的容易です。
◆ 分厚い研究者コネクションを持っています
◇ 定量生命科学研究所にはたくさんの素晴らしいウェット系ラボがあり、所内の学生発表会など、日常的にラボ間交流があります。他研究室との合同ラボセミナーなどもあります。中戸が企画好きのため、新しいイベントがちょいちょい入ります。
◇ また、中戸研では研究費のプロジェクトなどを通じた他研究機関との交流、共同研究が多数ありますので、生命系・医学系・情報系・物理系・数理系など問わず最先端で活躍する先生たちと仲良くなり交流を広げる機会を多く提供できます。海外進出の野望がある方であれば、国際共同プロジェクトに関連があるテーマ等を特に与えることもできます。
◆ 研究予算を用いた多くの支援があります
◇ 全ラボメンバーにラップトップPCや外付けHDDなど支給しています(必要があれば個人用ワークステーション)。ラップトップPCはデュアルモニタ利用可能です。
◇ 学会は国内外問わず全て研究室費用で参加可能です(遠方への出張の場合は、自分が発表することが参加条件になります)。また、東京は近郊で開かれる学会が多いという大きな地の利がありますので、たくさんの学会に気軽に参加することができます。
◇ ChatGPT有料版、Office, Adobeなどの有償ツールも研究費から支給しています。
◇ 博士課程学生にはRAの給与を支給しています。
◆ 英語を話せる(練習できる)環境があります
◇ 中戸研には様々な国籍の人が在籍しています。また定量研では海外の先生が来訪しセミナーを開くイベントが年にいくつもありますので、英語を話す機会がたくさんあります。英語力を伸ばすには日常的に英語でお話しすることが一番です。つたない英語でも全く構いません(中戸もそんなにうまくありません)。相手とコミュニケーションを取りたいという気持ちがあれば十分です。How was your weekend?の時間や(Q&A参照)、ランチの時間を利用して(ランチは皆で一緒に食べています)、ぜひチャレンジしてみてください。
中戸研で必要となる知識・スキル
◆ Linuxコマンドライン(Mac terminal, WSL含む)、プログラミング(Python)の知識・経験
◇ 解析未経験者を歓迎していますが、いずれにしても入学してからはこれらの技術をたくさん使うことになります。全く未経験であると入学してから苦労することになるので、事前にある程度独習しておくことを強くお薦めします。
◇ (中戸の経験上、「解析を学びたい」と思っている人の中にも、実際にやってみると「やはりデータ分析は自分に向いていない」と感じる人もいます。毎日PCと向き合う生活が楽しめるかどうか、研究室に入る前に試しておくのが良いと思います。)
◇ ラボの推奨第一言語にPythonを指定していますので、最初に学ぶのはPythonが望ましいですが、Rでも構いません。
◇ 最近では無料で閲覧できる入門サイトや動画資料もたくさん増えましたので、まずはそれらを参考にしてみてください。Pythonであれば、例えば東京大学 数理・情報教育研究センターのPythonプログラミング入門が公開されています。
◇ VSCode, Git, Jupyter Notebook, Rstudio, Dockerなども使えるようになっておくと更に素晴らしいですが、入学してからでも問題はありません。
◆ NGS解析の経験
◇ 中戸研では全員NGS解析を扱うことになります。NGS解析も事前にある程度試しておくことが望ましいです。NGSアッセイにはどんな種類があって、何を観測するものか、NGS解析とは具体的にどんなステップがあるのか、ということを事前に予習しておいてください(入試の面接では必ずその点を質問するようにしています)。
◇ 中戸研で主に用いるNGSアッセイは、ChIP-seq, RNA-seq, Hi-C, scRNA-seqです。中でも簡単に試せるのは、RNA-seq, scRNA-seqでしょう。
◇ 中戸の解析ブログでは、ChIP-seqとRNA-seqなどをコマンドライン上で解析する方法を簡単に紹介しています。シングルセル解析は1細胞解析技術講習会資料に詳しく紹介しています。中戸研を志望する人は、最低限こちらはチェックしておいてください。
◇ 参考図書としては、DRY解析教本、バイオインフォマティクスデータスキルなどが入門としておすすめです。
◇ 他にも、解析方法をわかりやすく説明してくれる動画サイトや(たとえばTogoTV)、ツールをインストールせずにブラウザ上で解析できるツールもありますので(iDEPでの遺伝子発現量解析など)、トライしてみてください。
◆ データ分析の知識
◇ 中戸研ではデータ駆動型解析、すなわち探索的解析 (Exploratory Data Analysis)を扱います。これは、データに関する事前知識が無いか、不足している状態から、データに含まれる特徴を分析することでデータの重要な情報を取り出そうとするアプローチです。データ分析には様々な「あるある」の落とし穴があります。事前にそれらを学んでおくと、研究をよりスムーズに進めることができるようになるでしょう。
◇ 参考図書としては、分析者のためのデータ解釈学入門、ダメな統計学などが入門としておすすめです。
研究の流れのイメージ(これから研究を始める方向け)
◆ 第1ステップ:解きたい「問い」を立てよう
上の例のように、研究は問いを立てるところからスタートします。この問いがすなわち貴方の研究のオリジナリティであり、研究の本体です(大事なのは実験結果ではありません)。したがって、問いが面白いことは大事です。論文や参考書を読んだり、メンバーとの議論を通じて「よい問いの立て方」を学ぶことが、中戸研での研究における最初のステップになります。
知りたい問いを決めることは、すなわち自分の学術的興味がどこにあるのかを知るということでもあります。そのためにも、論文サーベイは重要です。新しいテーマを発見した時の「こんな世界があるなんて知らなかった!」という興奮は研究の醍醐味のひとつです。
◆ 第2ステップ:既存論文を読もう
問いに基づいて研究テーマを立てたなら、関連する既存論文をサーベイすることになります。これが第2ステップです。計算ゲノム学は世界的に競争が激しい分野なので、どのようなテーマを選んでもたくさんの既存論文が見つかります。最初のうちは、とにかく量を読むことが重要です。翻訳ツールを利用してでも何でもよいので、とにかく読みましょう。論文を読んでいく中で、一部の問題は既に解決していることに気づくこともあるでしょうし、関連する新しい問いを思いつくこともあるでしょう。Discussionの項で何が未解決問題として述べられているかをチェックするのも良い方法です。そのようなサーベイを通じて「自分の問いを問い直す」ことを繰り返すうち、自分の問いが更に詳細になり、洗練されていくことがわかるはずです。
◆ 第3ステップ:実験をして、自分の問いを問い直そう
次に、自分の問いを明らかにするための実験を行います。どう実験すればいいのかわからない・どんなデータを使えばいいのかわからないということもあるでしょうが、そんな時はひとまず教員や先輩に聞きましょう。みんな喜んで教えてくれます(皆同じ苦労をしていますから)。実験の結果、期待していた素晴らしい結果になることもあるかもしれませんが、たいていの実験は失敗します。しかし失敗から学ぶことは多いのです。頭で考えてもわからなかったことが、実際に実験してみて、結果を眺めた結果わかることはたくさんあります。「何故うまくいかなかったのだろう?」「次はどう実験するべきだろう?」と「問い直す」ことが、研究の第3ステップになります。研究は、手を動かしている時間よりも考える時間の方が長いものです。長時間の思考ができるようにトレーニングしましょう。
◆ 最終ステップ:論文を書き、口頭発表する
最終的には、研究を論文にまとめ、口頭発表で成果を報告することがひとまずのゴールになります。ここまで作り上げてきた研究の問い、実験手法、得られた結果、考察(自分の意見)をわかりやすくまとめるテクニカルライティング・テクニカルプレゼンテーションは、研究室で学べる重要なスキルです。まずはラボセミナーの発表で練習しましょう。中戸研のメンバーは様々な異なる専門分野を持っていますので、違う分野の人にでも面白さが伝わるプレゼンにしなければなりません。学会でのポスター発表も非常に重要な経験になります。このようにして鍛えられたスキルは、卒業後にもあなたの強力な武器になってくれるでしょう。
ラボについてのQ&A
◆ セミナーはいつありますか。発表言語は英語ですか。
毎週月曜日の午前10時半~12時半頃にラボセミナーがあり、研究の進捗報告、ジャーナルクラブ(論文紹介)のどちらかを行います。発表言語は英語推奨ですが、日本語を禁止している訳ではなく、複雑な議論では日本語と英語が入り乱れています。
また、セミナーの開始前には毎回 "How was your weekend?" と言って、週末にあった出来事を英語で一人ずつ紹介する時間を設けています。英語の練習と、他のメンバーの好きなものや普段何しているのかを知る機会になっています。
ラボセミナーとは別に、シングルセルチーム、立体構造解析チームなどに分かれてチームミーティングを行っています(月1程度)。ラボセミナーよりも突っ込んだ議論(解析でのパラメータ調整の議論など)や新しい研究のアイデアなどを話し合います。
◆ コアタイムはありますか。
ラボセミナー以外には明確なコアタイムはありませんので、時間の融通はききます。自立した研究生活を送れていれば問題ありません。自宅からサーバに接続できる環境を整えており、たとえば台風や大雪などの時には在宅勤務を推奨しています。中戸も絶賛育児中のため(3人子供がいます)、在宅勤務したり早く帰ったりします。とはいえ、実際にはほとんどの人が毎日ラボに来ています(ラボの研究環境が良いので)。全体連絡や出欠連絡はSlackで管理しています。
◆ ラボイベントにはどのようなものがありますか。
新しく来た人の歓迎会、卒業する人の送別会などをやっています。これからは年に1回ラボ旅行をしようと思っています(先日ラボ初の旅行で高尾山に行きました:写真)。他にも色々な写真をGalleryページで紹介していますので是非見てみてください。
◆ 学会には参加できますか。
年に1度は外部で研究発表できる機会を作ります(口頭発表 or ポスター)。国内で主に参加する学会は、日本分子生物学会年会(MBSJ)、日本バイオインフォマティクス学会年会(JSBi)、日本エピジェネティクス学会年会、国際ゲノム会議などです。学会に参加した後にはラボセミナーで簡単な参加報告をしてもらいます。
◆ 奨学金や給与などのサポートはありますか。
学振等の応募はテーマ決めや申請書の書き方含め積極的に支援します。その他、卓越大学院プログラム、財団系の奨学金、新領域メディカル情報生命専攻から提供されるDSTEPなど、様々な研究費・支援制度があります。
◆ 卒業後の進路は?
アカデミア・民間企業問わず、本人の希望を尊重・支援します。本研究室で研究する中で学ぶ、問いの立て方、研究の進め方、データの分析方法、他のメンバーとの議論の仕方、発表の仕方、文章の書き方などは、どのような職種に就職しても強力な武器になります。
入試情報
新領域創成科学研究科メディカルゲノム専攻、医学研究科分子細胞生物学専攻から入学可能です。
◆ 新領域メディカル情報生命専攻:試験はTOEFL iBTのスコアシート及び筆記試験・口述試験です。願書提出期間は6月中旬、試験日は8月上旬です。正確な情報は、入試案内のページを参照してください。
◆ 医学研究科・分子細胞生物学専攻:医学研究科は博士課程前期・後期合わせて6年制となります。入試ガイダンスは例年5月に開催されます。志望される方は個別にご相談ください。
修士、博士、社会人博士いずれも入学可能です
◆ 修士課程は本人の興味を聞きつつテーマを設定します。博士進学希望の人と就職予定の人とで研究の強度は若干変わります。
◆ 博士課程入学では独自の研究アイデアを持っている方も歓迎します。DC1の申請も全面的に支援していますので、気軽に相談ください。
◆ 社会人博士の受け入れ実績はまだありませんが、受け入れ可能です。ご自身の研究テーマを持っての参加が望ましいです。
インターンの募集
期間限定(2週間~数ヶ月)で中戸研に参加し、研究をするインターン(給与なし)を不定期で募集しています。個別にテーマが与えられ、ジャーナルクラブを1回~数回、最後に研究成果発表を行います。その研究成果が論文になる場合は著者としてリストに載ります。中戸研に興味がある学部生・修士学生や、ドライの技術を期間限定で集中的に学びたい博士の方が対象です。興味がある人は中戸までご連絡ください。
特任研究員の募集
大規模NGSデータを入力とする情報解析システム構築に関して、以下の研究を行う特任研究員を募集しています。データ解析や機械学習、統計学のバックグラウンドを持つ方、または大規模なNGSデータセットの生成または解析の実質的な経験を持つ方が望ましいです。興味のある方は、履歴書と、これまでの研究内容及び中戸研究室で期待する研究内容について記した簡単な研究計画書を添えて、中戸までメールをください。
学振PDで来られる方も申請書の作成など全面的に支援しますので、希望される方は中戸までご連絡ください。
- 複数のNGSアッセイ(マルチオミクスデータ)の統合解析手法。特に、複数の細胞種から成るデータを統合する解析手法。
- 深層学習を用いたデータ補完(Data imputation)によるエピゲノム・立体構造データのノイズ除去及び疑似データ生成。
- RNAポリメラーゼ2の遺伝子内伸長を対象とした、時系列ChIP-seq・Hi-Cデータの数理モデリング。