おはようございます!
ゆきちゃんママです✨
先週は、Rの基本的な使い方についてまとめました。
そこで「Rstudioを使えばいろんなことができる!」ということはわかったものの…
「で、私はこれをどう使えばいいの?」という気持ちが残っていました。
やりたいことと基本的な操作がまだつながっていない感じ。
そこで実はこの夏、子ども達の自由研究に付き合いながら、こっそり私自身の自由研究(=Rのお勉強)もしていました。
今日はその様子をご紹介します!

子どもの自由研究からヒントを得て
じろ子の自由研究は「車の中でゆで卵はできる?」という実験。
じろ子は、時間と温度を表にして記録していました。
それを見ていて思ったのです。
「ん?これってデータフレームにできるじゃん!」と(笑)
実験1は、パパが仕事のときに私の実家で実施。
私は結果を定期的にLINEでパパに送っていました。
すると途中でパパから「外の温度と車内の温度って、相関ありそうだね」とのコメント。
そこで「やってみよう!」とひらめいたのです。
Rでデータフレームを作ってみる
RstudioのSourceペインに、こんなコードを書きました。
SP1 <- data.frame(
時間 = c("9じ", "10じ", "11じ", "12じ", "1じ", "2じ", "3じ", "4じ"),
外の温度 = c(29, 41, 52, 46, 43, 42, 39, 39),
車内の温度 = c(34, 38, 52, 60, 55, 55, 55, 50)
)
SP1 #中身を確認
これで、時間と温度の情報をデータフレームにまとめることができました。
実際に実行すると、じろ子がレポートに書いていた表とほとんど同じ。

「おお、Rで再現できる!」とちょっと感動。
相関を調べてみる
さらに相関係数を求めるコードはこちら。
pearson_correlation <- cor(SP1$外の温度, SP1$車内の温度, method = "pearson")
print(paste("ピアソンの相関係数:", pearson_correlation))
実行結果は…

うん、そんなに相関高くない(笑)
外の気温と車内の気温に強い相関があろうがなかろうが、今回の実験には直接関係ありません。
でも、こうやって遊び感覚で手を動かしてみると、統計がぐっと身近に感じられました。
実験2のデータもRで
さらに実験2でもデータフレームを作成。
SP2 <- data.frame(
時間 = c("9じ", "10じ", "11じ", "12じ", "1じ", "2じ", "3じ", "4じ"),
外の温度 = c(32, 42, 42, 47, 48, 46, 43, 35),
車内の温度 = c(32, 55, 68, 71, 74, 74, 68, 49),
水の温度 = c(24, 38, 49, 52, 54, 54, 53, 48)
)
SP2 #中身を確認
このデータを使って、いろんな相関を調べてみました。
結果がこちら。

結果の一部を書き出すとこんな感じでした。
実験1では外気温と車内温度の相関がそんなに高くないのですが、実験2では新しい温度計を使ったこともありかなり高くなっていました。
そのため、この結果を見て、正しく温度を測ることができて、データの精度が上がったんじゃないかな?!と考えられますよね。
水温は外気温よりも「車内温度」に強く影響されていることも見えてきて、なるほど〜と納得。
まとめ
私の「自由研究」によって、
-
統計スキルがほんの少しUP
-
じろ子が実験2で条件をきちんと統制できていたことを発見
と、小さな成果がありました。
必要のない分析かもしれませんが(笑)、面白かったし勉強になったので良し!
身近なことと勉強中のことがつながると理解が深まるし、何より楽しいですね。
遠回りでも少しずつ前進して、子ども達の成長に負けないように、私も頑張りたいと思います!
今日も最後まで読んでいただき、ありがとうございました😊
