• ホーム
  • 研究紹介
  • AIST-MeRAM搭載データベースとグラフ理論に基づいた機械学習による有害性補完手法開発
  • AIST-MeRAM搭載データベースとグラフ理論に基づいた機械学習による有害性補完手法開発

    林彬勒(排出暴露解析グループ)

    • 高田道義(東京農工大学)
    • 寺田昭彦(東京農工大学)
    • 細見正明(東京農工大学)

    【背景・経緯】

    国内外の化学物質法規制では「すべての化学物質をリスクが許容レベルで管理しながら使う」としています。しかし、膨大な数の化学物質のリスクを1つずつ適切に評価して管理するには、多大な社会コストを要するほか、システム作りなど幾つもの技術課題があります。そのため、我々は2010年から8年間一般社団法人日本化学工業協会のLRI(Long-Range Research Initiative)研究支援を受け、自主管理や規制対応の実務的なリスク評価の省力化・加速化を支援することを目的として、高度なリスク評価技術および膨大な評価用データを搭載したツール(AIST-MeRAM日本語版と英語版)を開発し無料公開してきました。

     

    【2019年度の取組みと成果】

    2019年度は、新規物質や混合物のリスク評価に対応可能な高度化システムの構築をめざして、機械学習等の手法による有害性補完手法を開発しました。これまで、化学物質の構造情報から経験的に化学物質をグループ化し、logP(オクタノール/水分配係数)などを説明変数とした線形回帰モデル(QSAR式)を用いて生態毒性予測を行う手法が一般的でした。本研究では、国内外のデータベースおよび行政文書から集めた膨大な毒性試験データ情報(AIST-MeRAMのデータベース)と化学物質の構造情報に基づいた特徴ベクトル(MACCS Keys)情報を基に、グラフ理論を応用したうえ、各種教師なしの機械学習手法を用いて、既存手法の様々な課題を克服したQSAR式を持たない斬新な予測手法を開発しました(図)。その予測精度は既存手法のECOSAR(米国環境省の予測ツール)と同等以上であること、無機化合物やイオン化物質の毒性も精度よく予測できるなど、ECOSARより広範な化学物質の急性生態毒性値(魚類・ミジンコ類・藻類)を予測できることが明らかにされました(Takata et al., 2020)。

     

    【成果の意義・今後の展開】

    本研究はグラフ理論に基づいた機械学習手法によるAIST-MeRAMデータベース活用の研究成果です。開発した斬新な手法は、無機物質やイオン化物質を6割〜7割の予測精度で予測できること、能動的に新規追加データに対応し予測精度向上の自動化や予測結果の頑健さを視認可能であるなど、既存手法より優れています。今後、積極的に外部予算を取得して、この斬新な手法がだれでも簡単に使えるように、AIST-MeRAMの機能の一部としてツール化する予定です。

     

    ※本研究開発過程において、豊橋技術科学大学情報・知能工学専攻の高橋由雅先生、東京大学化学システム工学専攻庄野文章先生からご指導ご助言をいただきました。ここに記して謝意を表します。

    * Takata et al., Predicting the Acute Ecotoxicity of Chemical Substances by Machine Learning Based on Graph Theory, Chemosphere 238 (2020) 124604.

     

    2020年07月13日