きのこ×フロンティア

第6回:ハイスループット・フィールド・フェノタイピング

2019.04.25 Thu

菌類・植物

前回のコラムは、菌類の量的形質を知る上で、現状の計測数ではデータが不足しているのではないか、という問題提起で締めくくりました。これは個別の形質の情報量についてのみならず、形質の種類という観点でも当てはまると思います。記載文にはその分類群のエッセンスが詰まっており、分類学者は長年の経験からそれに載せる形質の種類および情報量を取捨選択していますが、それは裏を返せば、その過程で相当のバイアスがかかっているということでもあります。

前回までの議論は、「種概念は高次元の特徴空間上においてその種の形質の分布が占める領域として規定されうる」との想定で進めてきましたが、単一の標本から現状の手法で得られるデータを空間上にプロットすることを考えると、本来の領域を正確に「塗りつぶす」には程遠く、大抵はごく限られた部分に「点を打っている」に過ぎないのではないかと思います。これはいわば、本来天球に占める一定の領域を指す概念である「星座」が、実際にはその領域において目立って見えるごく少数の星々の配置によって認識されているようなものではないかと思います。同定の話に戻りますと、同定の唯一無二のエビデンスはタイプ標本であるとは言いつつも、実際の同定の場面ではその情報がフルに参照できることはなく、星座のようなごく僅かな点(=形質)の特徴的な位置関係を見比べた上で、人間の主観を基に異同が判断されてきたといえるのではないでしょうか。

第3回のコラムで、「同じ種の標本を多数収集し、何らかの統合解析を行うことで質の高い同定根拠が得られるか」という問いに対して、私は「答えはYESでもあり、NOでもあると思います」という回答を提示しました。そして、後者の根拠は「同定の唯一無二の根拠はタイプ標本だから」であることも既に述べました。しかし、「原記載はその種全体の情報のごく一部を表現しているに過ぎない」という事実を踏まえると、新たにその種と同定された標本を用いて、その種の情報を「肉付け」していくことに意義が見出されます。その過程ではもちろん、新たな標本をその種に同定するに至った十分な根拠を提示する必要があります。

筆者はその具体的手段としては、今後はクラシカルな形態学的検討のやり方を超えるものが必要だと考えています。いかに目の前の標本から形質データを「手軽」かつ「正確」に、「短時間」で「大量」に取得するかが鍵になってくると思います。すなわち、形質情報抽出のスループットを高める方向性が必要です。話は変わりますが、モンテカルロ法で円周率を近似的に計算できることをご存知でしょうか。ある正方形の範囲に無作為に点をプロットしていき、その正方形の一辺を直径とする円の中にいくつの点が入ったかを計数し、全ての点の数に占める割合を算出することで、円周率の近似値が求められるというものです。この時、点の数を数万、数十万と増やすほど、円周率の近似値は正確になっていきます。これと同様に、仮に飽和するほど大量に、様々な形質の測定値が手に入れば、種概念を構成する情報の密度が高まるとともに、「輪郭」もまた特徴空間中にくっきりと浮き上がってくるのではないか、と期待されます。

それを実現しうる一つのアプローチとして私が以前から注目しているのは、画像認識に基づく形態計測です。写真はあるサルノコシカケの仲間の傘の裏のUSB顕微鏡写真から、孔口という円形に近い穴の部分を自動認識させて色をつけたものです。余計な箇所を認識しないようにサイズや真円度で絞り込む必要がありますが、色がついた部分の面積や形状、座標などのデータは一瞬で取得されます。測定精度は別途検証が必要ですが、ウチワタケというきのこでは約500万個の孔口の計測値を、ものの数十秒で得ることができました。「ビッグデータ」という呼称が適切かどうかは分かりませんが、少なくとも従来扱ってきた量とは比べものにならないデータを分類や同定に利用できるようになってきたわけです。ただし、それに伴い、これまで以上にデータ分析の知識や技量が要求されることは言うまでもありません。

また、ハイスループットな形質情報抽出に向けての課題は山積しています。例えば遺伝子の発現解析に関しては、DNAマイクロアレイを用いて数万~数十万のデータを一度に得ることができ、メタゲノム解析では環境中の試料に含まれる大量の遺伝子情報を取得することができます。タンパク質や代謝物質についても同様です。一方、形態形質、生態形質、生理形質などの形質データを網羅的に取得することは容易ではありません。遺伝子が発現した結果生じたものという文脈では、形質は「表現型(フェノタイプ)」とよばれることも多いのですが、生物の全データの網羅的解析、すなわち「オミクス(オーミクス)」を構成する諸分野のうち、表現型を扱う「フェノミクス」はしばしばボトルネック(律速段階)として言及されます。先ほどの孔口の測定の例はうまくいったように見えましたが、その他の形質データが同様に容易に得られるわけではなく、形質ごとに最適なアプローチを検討していく必要があります。

現在、表現型データの取得(フェノタイピング)において最もハイスループット化を達成しているのは、育種や精密農業の分野ではないかと思います。栽培植物から草丈、葉面積、病徴などの形質データを得るためには、従来は物差しなどを用いて目視でデータを集め、野帳に手書きで記入していくという、多大な労力を要する非効率的な方法がとられてきました(筆者も学生実験で大変な思いをしました)。この分野では画像認識の応用の幅が広がっており、植物工場のような管理下の栽培環境では様々なセンサーを用いて、例えば大量の苗の草丈の経時変化のような大規模データを自動的に得ることができるほか、ドローンなどの無人航空機 (UAV) を用いて圃場全体から遠隔で大規模データを取得する(リモートセンシング)研究も盛んです。温度、風速、降雨などの気象データと組み合わせたシミュレーションにより、最適な栽培条件の検討や品種の選抜なども行われています。

栽培植物と同じ手法を神出鬼没の野生きのこに適用することは困難ですが、形質情報抽出のハイスループット化という観点ではヒントになることがあると思います。例えば、様々な角度から撮影した写真を基に対象の3Dデータを作成する「フォトグラメトリ」という手法がありますが、近年ではスマートフォンカメラで撮影した写真でも(精度には未だ難ありですが)試すことができます。このようなポータブルツールにより、誰もが高精度の3Dモデルを容易に作成できるようになれば、非専門家でも分類や同定に役立つ客観的な観察データを得ることができ、生物多様性市民科学の活性化に繋がるのではないかと期待されます。フェノミクスをフィールド(圃場)からフィールド(野外)へ、というスローガンを思いついたのですが、いかがでしょうか。

中島 淳志 (なかじま・あつし)

1988年生。2014年4月IMIC入職。安全性情報部所属。
学生時代には菌類分類学を専攻。現在は業務の傍ら、アマチュア菌類愛好家(マイコフィ
ル)として、地域のきのこの会等で菌類の面白さを伝える"胞子"活動を行う。
夢は地球上の全菌類の情報を網羅した電子図鑑を作ること。