2016/10/02

化合物の安全性評価と、最近の人工知能および化学多変量解析/パターン認識(ケモメトリックス)

  化合物の安全性評価や、インシリコスクリーニングに関する技術が大きく進歩しつつある。このように感じるのは、最近大きな話題になっている人工知能が様々な分野で急速に注目されるようになり、人工知能の適用が本研究分野に大きなブレークスルーをもたらすであろうという期待感が大きくなっているためと考える。


  もともと、化合物の安全性評価分野では人工知能技術の適用が積極的に行なわれてきた。 歴史的にみると、化合物の安全性評価は主として二種類のアプローチ(手法)が適用されてきた。一つは、多変量解析/パターン認識を適用するアプローチであり、残る一つが人工知能によるアプローチである。昔は、両方のアプローチが採用され、それぞれの機能的特徴を生かして展開されてきたが、最近では多変量解析/パターン認識手法が主体となっていた。これは、多変量解析/パターン認識がPCレベルでも支障なく扱えるようになり、またデータ解析手法も様々な手法が展開され、多種多様の安全性評価研究が出来るようになってきたことから、多変量解析/パターン認識手法が頻繁に適用される結果となっていたと考える。
 
  ここにきて再び人工知能手法が脚光を浴びてきたのは、情報に関するインフラの大きな変化があるためだろう。ICT、IoTさらにはビッグデータという言葉に代表されるような、従来とはスケールの異なるレベルでのデータの大規模化と多様性の拡大が大きな原因である。

  多変量解析/パターン認識を実施するとすぐわかるが、これらの手法では極めて大量のデータを扱う事はきわめて難しい。大数の変化や傾向をつかみ取る統計と異なり、多変量解析/パターン認識はそのデータ解析力が強いことから、サンプル中に潜むノイズに弱いのが特徴である。このため、データ量が多くなると、結果としてデータ中のノイズも増えてくるため、データ解析が切れ味の悪いものとなってしまう。

  このようなデータ量が急速に増大しているというインフラの大きな変化が、人工知能への期待度を急速に大きくしていると考える。また、人工知能自体も深層学習(ディープラーニング)という新たな機械学習法が開発され、画像処理や音声認識等の分野で素晴らしい成果を上げた。この事実から、ICT、IoTさらにはビッグデータで代表される新時代の要求に答える技術として、人工知能が期待されている。

  深層学習で代表される新時代の人工知能技術が、化合物の安全性評価問題に大きなブレークスルーを与えることが期待されるが、これが本当に実現するか否かは、今後の展開にかかっている。