R
Rで外部ファイルを読み込む方法。 sourceか load か、ごっちゃになるのでメモ 1. 外部のソースファイルを読み込む場合 source("file_name.r") 2. saveで保存したデータを読み込む場合 load("file.rda")
ランダムフォレスト、サポートベクターマシン の Rでの書き方メモ○ RnadomForest randomForestパッケージを使う。 ランダムフォレストは、decision tree を沢山取って、集団学習するものだそうだ。 randomForest関数で、 1. サンプルをブートストラップして…
ブートストラップ法に関して 今日学んだことについて、まとめておく。 初学者ですので間違えていたらすみません。 ○ bootstrap ブートストラップは、ある統計量が、どういう分布をとるか調べるのに使います。 なお、その統計量自体は、標本集団から不偏統計…
Bias and Variance tradeoff という話がよくわからない。 なんとなく、いろいろ調べてわかったことは、 「教師つき学習」において、 training set が大きいと、 Biasは小さくなる(モデルは真実をとらえるようになる)、一方で、 Varianceは大きくなる(出力さ…
Predictionを行う際に、DataFrameを training set と test set に分ける必要がある。 よく使う方法なので、コピペできるようにメモしておく。 dfというデータフレームがあるとする。 train_index = sample(1:nrow(df), size=nrow(df)/2 , replace=F) trainDf…
Re-think confusing Factor functions. I feel Factor manipulating functions in R are confusing. It got easier , however, after I recognized that the Factor object consists of the actual data vector & the levels vector. (* I don't know the ri…
RのVector(マイナスのインデックス negative index , 配列の長さ以上 out of range) RのVectorで、タイトルの通りのインデックスを指定した場合の挙動に関して。 このあたりの挙動は言語によって全くことなりますね。 〇 マイナスのインデックス そのインデ…
Rのグラフ描画常套手段 (?) 「Factorデータを色に変換して描画する」 というのは、常套手段のようなので、以下に自分でデータを作ってメモしてみました。 例) 各行に、各Sampleの各時刻でのデータが入っているデータを想定する。(dfとする。) データの1列目…
主成分分析の本を読んでいると、Lagrange乗数法というものが登場。 はじめて聞いてわからなかったので色々ネットで調べてみる。 2変数の問題なのに、もう一変数導入するという、不思議なことをしているのだけど、 最終的に、この方法を使うことで、固有値、…
Rの knitr というものを始めて知った。 一見、RのREPLのコマンドをどんどん記録して、ドキュメントにできるのかと思って、 色々ウエブで資料を探しているとどうも、少し違うようだ。 どちらかというと、ドキュメント(拡張子 .Rmd : R markdown の略 )を書き…
Rのソースを読んでいると、いろいろなvectorの作り方をしているものがありますが、 3つの関数を押さえておくと良さそうです。 c, rep, seq 色々キーワード引数を指定できますが、 キーワード引数は読むときは、みればわかるので、 (キーワードなし)引数だ…
rankは、小さいものから順に番号を返して、 orderは、index vector を返して、もとの配列を並べ替えるために使う。 もちろん、結果は違うので注意。 同じ結果を返すことがあるので要注意。 ○ 同じ結果を返す > order(c("D","B","C","A")) [1] 4 2 3 1 > rank…
ここに書いたことは、混乱まねきそうなので削除。 こちらにまとめなおしました。 ↓ New version : http://d.hatena.ne.jp/t_ume_tky/20130217 1. CHANGE LEVEL OF FACTORS (use "levels" function) levels(factor) = c ("Sun", "Mon" ....) 2. REORDER LEVEL…
○ Extracting indices from data frame by factor. which(df$b %in% factor(c("a","e")) ○ subset data frame by factor. subset(df , b %in% c("a","e")) # b : column name, a,e : factors you want to select %in% operator is useful in this case. %in%…
Sorting factor levels by data frequency of levels table function (arg:factors) returns table class (which seems to be based on numeric vector. Check mode(table(factor(c(1,2,3))))) order function (arg:vector) returns index vector (whose num…
Rでグラフを書く場合 通常は、はじめに出力する devise を指定する。 しかしウインドウシステムに表示していたが やはり、ファイルに保存したいという場合は、 dev.print(file="2-2.svg", device=svg) とするとよい。 JPEGなどに出力するのもいいが、フォン…
今回はデータファイルを、データフレームとして読み込む方法まとめ。 はじめに、よく文字列をFactorでなく、Character vectorで読み込んで欲しい時があるが、 stringsAsFactors = TRUE を使うべき。 colClasses でもできるが、数字も文字列になったりして、…
In R you can extract elements from vector elegantly by using logical vector. eg) >|r| s = c("aa", "bb", "cc", "dd", "ee") L = c(FALSE, TRUE, FALSE, TRUE, FALSE) s[L] |
Rでインストールしたパッケージのソースを変更しようと思い、 インストールディレクトリをいろいろみたけど、 基本的にバイナリファイルしかない。。 なんとか元のソースへのアクセス方法を調べると、 同じ疑問が。 http://r.789695.n4.nabble.com/Convert-q…