close up photo of mining rig

東工大 データ・ドリブンな教学改革とは何か

データ・ドリブン型のアプローチとは

高松 この仮説駆動型のアプローチの対比として、現代の数理・データサイエンスのような分野では、データ駆動型(Data-driven)アプローチが存在します。データ駆動型アプローチでは、まずデータが存在することが、仮説駆動型アプローチと異なる点です。このデータをもとに仮説を立て、その仮説を検証するために解析を行うアプローチです。

従来の仮説駆動型アプローチしか知らない研究者が、データ駆動型アプローチを見た場合、「最初のデータを得る目的は何か?」という疑問を持ち、そこから先に進むことが難しい場合が多いです。私自身も、データ駆動型アプローチで行った研究論文が、仮説駆動型アプローチを主体とする研究者に査読された際、最初のデータを収集する目的について問われたことがありました。この指摘に対して、先ほど説明したような、研究アプローチが異なることを説明させていただきました。

実際、現在のIRの取り組みは、ほとんどがデータ駆動型(Data-driven)であると言えるでしょう。そのため、最初から多くのデータが存在するものの、そこからどのように仮説を立てればいいか分からずに困っている人が多いのではないかと思います。

実は、データ駆動型アプローチにおいても、仮説を立てた後には必ず検証を行う必要があります。検証の方法は色々とありますが、可能であれば、その仮説を検証するために新たなデータを収集することが望ましいです。そのためデータ駆動型アプローチと仮説駆動型アプローチは相反するものではなく、むしろ連続したサイクルの中でつながっているアプローチです。どこからスタートするのか、データからなのか、仮説からなのか、という点が異なるだけです。

関連記事一覧