R

Rで(ソース)ファイル読み込み

R

Rで外部ファイルを読み込む方法。 sourceか load か、ごっちゃになるのでメモ 1. 外部のソースファイルを読み込む場合 source("file_name.r") 2. saveで保存したデータを読み込む場合 load("file.rda")

ランダムフォレスト、サポートベクターマシン の Rでの書き方メモ

R

ランダムフォレスト、サポートベクターマシン の Rでの書き方メモ○ RnadomForest randomForestパッケージを使う。 ランダムフォレストは、decision tree を沢山取って、集団学習するものだそうだ。 randomForest関数で、 1. サンプルをブートストラップして…

ブートストラップ法 (Rでの書き方メモ)

R

ブートストラップ法に関して 今日学んだことについて、まとめておく。 初学者ですので間違えていたらすみません。 ○ bootstrap ブートストラップは、ある統計量が、どういう分布をとるか調べるのに使います。 なお、その統計量自体は、標本集団から不偏統計…

Bias and Variance tradeoff がわからない。

R

Bias and Variance tradeoff という話がよくわからない。 なんとなく、いろいろ調べてわかったことは、 「教師つき学習」において、 training set が大きいと、 Biasは小さくなる(モデルは真実をとらえるようになる)、一方で、 Varianceは大きくなる(出力さ…

DataFrameに対して、TrainingSetとTestSetに分けて、Predictionの前処理を行う

R

Predictionを行う際に、DataFrameを training set と test set に分ける必要がある。 よく使う方法なので、コピペできるようにメモしておく。 dfというデータフレームがあるとする。 train_index = sample(1:nrow(df), size=nrow(df)/2 , replace=F) trainDf…

Re-think confusing Factor functions

R

Re-think confusing Factor functions. I feel Factor manipulating functions in R are confusing. It got easier , however, after I recognized that the Factor object consists of the actual data vector & the levels vector. (* I don't know the ri…

RのVector(マイナスのインデックス negative index , 配列の長さ以上 out of range)

R

RのVector(マイナスのインデックス negative index , 配列の長さ以上 out of range) RのVectorで、タイトルの通りのインデックスを指定した場合の挙動に関して。 このあたりの挙動は言語によって全くことなりますね。 〇 マイナスのインデックス そのインデ…

Rのグラフ描画常套手段 (?)

R

Rのグラフ描画常套手段 (?) 「Factorデータを色に変換して描画する」 というのは、常套手段のようなので、以下に自分でデータを作ってメモしてみました。 例) 各行に、各Sampleの各時刻でのデータが入っているデータを想定する。(dfとする。) データの1列目…

Lagrangeの乗数法 (ラグランジュの乗数法)

R

主成分分析の本を読んでいると、Lagrange乗数法というものが登場。 はじめて聞いてわからなかったので色々ネットで調べてみる。 2変数の問題なのに、もう一変数導入するという、不思議なことをしているのだけど、 最終的に、この方法を使うことで、固有値、…

knitr でREPLの記録 (on RStudio )

R

Rの knitr というものを始めて知った。 一見、RのREPLのコマンドをどんどん記録して、ドキュメントにできるのかと思って、 色々ウエブで資料を探しているとどうも、少し違うようだ。 どちらかというと、ドキュメント(拡張子 .Rmd : R markdown の略 )を書き…

RでVectorを作る基本

R

Rのソースを読んでいると、いろいろなvectorの作り方をしているものがありますが、 3つの関数を押さえておくと良さそうです。 c, rep, seq 色々キーワード引数を指定できますが、 キーワード引数は読むときは、みればわかるので、 (キーワードなし)引数だ…

Rでの並び: rank と order を適応する際の注意事項

R

rankは、小さいものから順に番号を返して、 orderは、index vector を返して、もとの配列を並べ替えるために使う。 もちろん、結果は違うので注意。 同じ結果を返すことがあるので要注意。 ○ 同じ結果を返す > order(c("D","B","C","A")) [1] 4 2 3 1 > rank…

RでFactorsのレベル順を変更する。

R

ここに書いたことは、混乱まねきそうなので削除。 こちらにまとめなおしました。 ↓ New version : http://d.hatena.ne.jp/t_ume_tky/20130217 1. CHANGE LEVEL OF FACTORS (use "levels" function) levels(factor) = c ("Sun", "Mon" ....) 2. REORDER LEVEL…

RでDataFrameからFactorに基づいて、特定のインデックスや、ローを抽出する

R

○ Extracting indices from data frame by factor. which(df$b %in% factor(c("a","e")) ○ subset data frame by factor. subset(df , b %in% c("a","e")) # b : column name, a,e : factors you want to select %in% operator is useful in this case. %in%…

RでFactorの頻度(度数)順にFactorの順を並べ替える。

R

Sorting factor levels by data frequency of levels table function (arg:factors) returns table class (which seems to be based on numeric vector. Check mode(table(factor(c(1,2,3))))) order function (arg:vector) returns index vector (whose num…

Rで表示したグラフをやはりファイルに保存する場合

R

Rでグラフを書く場合 通常は、はじめに出力する devise を指定する。 しかしウインドウシステムに表示していたが やはり、ファイルに保存したいという場合は、 dev.print(file="2-2.svg", device=svg) とするとよい。 JPEGなどに出力するのもいいが、フォン…

Rの read.table の使い方。

R

今回はデータファイルを、データフレームとして読み込む方法まとめ。 はじめに、よく文字列をFactorでなく、Character vectorで読み込んで欲しい時があるが、 stringsAsFactors = TRUE を使うべき。 colClasses でもできるが、数字も文字列になったりして、…

DataFrame & logical vector (GNU R)

R

In R you can extract elements from vector elegantly by using logical vector. eg) >|r| s = c("aa", "bb", "cc", "dd", "ee") L = c(FALSE, TRUE, FALSE, TRUE, FALSE) s[L] |

Rでインストールしたパッケージのソースを変更したい。

R

Rでインストールしたパッケージのソースを変更しようと思い、 インストールディレクトリをいろいろみたけど、 基本的にバイナリファイルしかない。。 なんとか元のソースへのアクセス方法を調べると、 同じ疑問が。 http://r.789695.n4.nabble.com/Convert-q…