作成日 2015-08-08
最終更新日
概要
R言語で、分類情報を格納するための手段です。ファクタを作成するには、factor関数に、アトミックベクトルを渡します。
C#で用いられる列挙型と異なるのは、列挙型が、自分でその内容を用意する必要があるのに対して、
R言語でのファクタは、ベクトル内のデータを認識し、整数として符号化した後、整数ベクトルにその結果を格納します。つまり、正規化を行ってくれます。
> gender <- factor(c("male", "female", "female", "male")) > typeof(gender) [1] "integer" > attributes(gender) $levels [1] "female" "male" $class [1] "factor" >
ファクタを使用すると、変数が数値に変換されているため、分類変数を統計モデルに導入するのが簡単になります。 しかし、文字列のように見えるのに、整数のようにふるまうので混乱することがあります。
「as.character」関数で、文字列に変換できます。
> as.character(gender) [1] "male" "female" "female" "male" >