袋の中にりんごがいくつあり、みかんがいくつあるかを数えたい。
いちばん確実なのは、袋の中にあるものを全部出して、数えることです。
そうすれば、りんごが40個、みかんが40個ということがわかります。
袋から全部出さずに、いくつあるかを数えられないか?
一部をサンプル的に取り出して「推測する」という方法があります。
無作為に袋から8個取り出してみる。
りんごが5個、みかんが3個。
でも、これではわかりません。
推測するためには、全体がどれだけ(どのくらい)あるか?を知っておく必要があります。
この袋は、りんごとみかんが合わせて80個入る袋、であるなら、「割合から推測して」りんご50個、みかん30個が入っている。
いや、これは乱暴すぎます。
たまたまこの回はそういう割合だっただけ。
ということは、取り出す回数を増やさないといけないわけです。
じゃあ何回?10回?100回?
あるいは取り出す数はどうでしょう?
1個ではムリですけど、8個ならOK?
10個?、12個?、5個?
多いほうがいいと思いますが、それも限度があります。
サンプルの取り出し方はどう?
もしこの袋の中、右側にみかんが、左側にりんごが偏って入っていたとします。
もしそうだと、右側から取り出すことが多ければ、みかんの数は多くなりがちですし、左側からならりんごに偏る可能性があります。
袋の中の「どこから」取るかでも、「推測」にブレが出てくるわけです。
いずれにしても「推測」の域を出ません。
そして、全部を数えない限り実数はわからないし、割合もはっきりしません。
では、全部数えることができないなら、どうすればいいか。
どのような条件で、どういう方法で、どうやってサンプルを取ったか。
これをはっきりと示すことで、その数値を見る人は、判断がしやすくなります。
推定の質が上がってきます。
でも、それがあいまいなものなら、その数字はあまり意味を持たない数字となってしまうのです。