今回は、西内啓さんの『統計学が最強の学問である データ社会を行きぬくための武器と教養』を読んだ感想を書きます。
統計学が最強の学問である
西内 啓 ダイヤモンド社 2013-01-24
|
下記クリックで好きな項目に移動
研究とは何か。
研究と聞くと難しいイメージを持ちがちです。高度な技術と高度な知識を用いて新たな技術や方法を開発している、というような想像をしてしまいます。
確かに高度な技術や高度な知識を用いているのは事実です。しかし、研究の本質はもっと単純です。ほぼ全ての研究は同じやり方に収束します。
研究とは比較である。
それは「比較」です。研究とは比較なのです。
だが、実際に研究や調査をしようとすれば、「どのようなデータを収集し解析するか」という点のほうが重要になる。
略
では、私たちはいったいどのようなデータを比較し、その違いを生み出しうる要因を探し当てればよいのだろうか。
略
その答えを一言で言えばごく簡単だ。「目指すゴールを達成したもの」と「そうでないもの」の違いを比較すれさえすればいい。あるいはゴールを達成するという表現は「自分にとってより理想的」とか「より好都合」と言い換えてもいい。
どの研究にも背景や目的が存在します。今までの技術や方法に不満や不備、不十分なところがあるために、それを解決しようとするのが研究の大義名分です。そして、その技術や方法を開発したことによって、それを使う前と後でどれほど良くなったのかを比較します。
最終的に、研究は必ず比較をします。比較をすることでその研究の存在意義を証明します。
「適切な比較を行うこと」、そして「ただの集計ではなくてその誤差とp値についても明らかにすること」。この2点さえ意識すれば、経験と勘を超えて裏ワザを見つけることが容易になる。
比較をした後はその違いを見つける必要があります。そして特徴を見出します。しかし、ただ特徴を見つけただけではいけません。その違いがたまたま偶然で生じた可能性があるからです。そこで重要になってくるのがp値です。
この「実際には何の差もないのに誤差や偶然によってたまたまデータのような差(正確にはそれ以上に極端な差を含む)が生じる確立」のことを統計学の専門用語でp値という。
このp値が小さければ(慣例的には5%以下)、それに基づいて科学者たちは「この結果は偶然得られたとは考えにくい」と判断するわけである。
研究とは、「違いを見つけ、その特徴をp値で表してそれが偶然でないことを証明すること」なのです。
皆さんも機会があれば読んでみて下さい。
統計学が最強の学問である
西内 啓 ダイヤモンド社 2013-01-24
|