おはようございます!ゆきちゃんママです。
いよいよコードを書いて、RStudioを使ってみましょう!
その前に、RStudioのインストールや初期設定がまだと言う人は、以下の記事を読んでみてくださいね。
私がRStudioを始めたきっかけは、「大至急このデータを分析しなきゃ!」という切羽詰まった状況(笑)。
そのため、まずは必要最低限の方法だけを覚えて分析をしました。
でも、使い始めてから「そもそもRStudioで何ができるのか、先に知っておけばよかったなぁ」と思ったんです。
最初の山を越えると、あらためて基本を学ぶのが面倒に感じるかもしれませんが、ここでちょっとだけ一緒に見ていきましょう。

基本の使い方
まずはRStudioで新規ファイルを作ります。
-
左上のアイコンから 新規ファイル を選択
-
R Script をクリック(拡張子は .R)
このスクリプトファイルにRのコードを書いていきます。
四則演算をやってみよう
Rでは以下の記号で計算ができます。
-
足し算:+
-
引き算:-
-
掛け算:*
-
割り算:/
-
割り算の余り:%%
また、行の途中に # を入れるとコメント(メモ)が書けます。後から見返すときに便利です。
5 + 3 # 足し算
5 - 3 # 引き算
5 * 3 # 掛け算
5 / 3 # 割り算
5 %% 3 # 余り
コードを入力し、カーソルを行に置いて Run をクリックすると、左下のConsoleに結果が表示されます。

変数に値を入れる(代入)
Rでは <- という「矢印」で値を変数に入れます。
ショートカットは Alt + = です。
a <- 5 # aに5を入れる
a # 中身を確認
右上のEnvironmentペインにも、aの中に5が入ったことが表示されます。
= でも代入できますが、慣れるまでは <- のほうがわかりやすいです。

ベクトルを作る
ベクトルは「同じ種類のデータが並んだひとまとまり」。
c() 関数で作ります。
v1 <- c(2, 3, 6, 1, 5)
v2 <- c("ゆきちゃんママ", "ハズバンド", "たろ子", "じろ子", "チーズ")
要素を取り出すときは [ ] を使います。
最初の要素を取り出すときは [1] と指定すれば簡単です。
一方、要素の数が分からない場合は、まず関数でその数を調べる必要があります。
length() を使えば要素の数が分かるので、その結果を [ ] に入れれば、最後の要素を取り出すことができます。
v1[1] # 最初の要素
v1[length(v1)] # 最後の要素
⚠ Rは番号が1から始まります(PythonやC言語は0スタートなので要注意)。

行列(matrix)
行列はベクトルを縦または横に並べたものです。
m1 <- rbind(v1, v2) # 縦方向に連結
m2 <- cbind(v1, v2) # 横方向に連結
行数や列数が一致しないとエラーになります。

データフレーム(data.frame)
データ分析では、matrixよりもdata.frameがよく使われます。
データフレームであれば、列ごとに型が違ってもOK、ラベルもつけられます。
df <- data.frame(
名前 = c("たろ子", "じろ子", "チーズ"),
年齢 = c(7, 7, 4),
学年 = c("小2", "小2", "年少")
)
df$名前 # 列名でアクセス

パッケージを使う
パッケージはRの機能を増やすツールです。
インストールは1回だけ、使用時は毎回読み込みます。
install.packages("psych") # インストール
library(psych) # 読み込み
データの読み込み
data <- read.csv("sample.csv")
str(data) # 構造をチェック
まとめ
Rだけでも分析はできますが、RStudioを使うと作業がグンと楽でわかりやすいです。
使い慣れている人に教わると突然「パッケージ入れたら?」なんて言われることもありますが、最初に基本用語を知っておくと混乱が減ります。
私の場合、夫に言われて「パッケージって何!?」と喧嘩腰になったこともありますが(笑)、この記事を読んでから始めれば、家庭内の平和も保てる…かもしれません。
今日も最後まで読んでくださり、ありがとうございました!
次回は、いろんな分析の紹介に戻ります♪
