勉強会の話なので丁寧語で。2/28にKobe.R #15があったので参加してきました。今回は三宮で開かれました。今回は珍しく(?)Rの話題が多いR勉強会でした。抜けてる点もちょいちょいあると思いますが、覚えている限りの感想を書いておきます。
Rによるデータ処理入門
Kobe Rの主催者の河原さん(@h_kawahara)による発表でした。 データ読み込み、加工、表示までのRで解析する前に絶対必要な操作をまとめてくれました。大事なことはデータ加工≠データ整形ということかなと。何となく突っ込みどころを箇条書きにします
- strがstructureの略称とか、stringの略称じゃないんだ!
- 何度も言うけどforは遅い
- db接続がodbcだけだとちょっと今後辛い気がする
- 大きいファイルはRDataファイルにしておくと容量小さい
- データ加工に便利なのはdplyr(でぃーぷらいやーと読むらしい)
- dplyrのソート命令がarrange!sortとかorderじゃないのか。
- dplyrだとカラムの結合や分解も手軽に出来そう
- 自分でちょっといじって、packageとかfunctionを探す方法を掴まないと、関数名に略称とか使ってるケースが結構あって、探しにくいかも。使ってみないと何とも言えないけど
- 発表でちょっと気になったけど、同じ書式の演算子でパッケージによって違う意味になったりするの?
データの前処理ってとても大事なので、参考にしてちょっと練習出来たらなと思います。
R in Life Science
Tomitaさんの発表。生物系の学生さんだそうで、研究で使いそうなヒートマップ表示について教えてくれました。 車のデータを利用して燃費をベースにしてグルーピングしながら、各項目についてヒートマップ表示して傾向が見やすくなってました。 最初バイオ系なのでSDS-PAGEか何かかと思いましたががが。あと、ggplot(だったかな?)でのヒートマップ関数としてheatmap.2ってのを紹介されていましたが、関数名に2とか入るの久しぶりに見ました。これはん〜〜〜〜〜〜、ちょっとな〜〜〜。でも機能は多いみたいです。
Incanterチョットシッテル
@tnoda_さんの発表 スライドはこちら。 Twitterでインなんとかとか言っちゃいましたが、インキャンターです。「ノリを間違えたかも!(意訳)」とおっしゃっていましたが、とても楽しい発表でした。リアルタイムに突っ込み入れたかったのですが、出来なかったので、ここで突っ込みしておきます。
- Clojureってカッコだらけだ!Lis(ry (*)
- 3D pie chart以外はRと同じことは出来るらしい
- インストールはLeiningen(らいにんげん)からやるらしい。プロジェクト作ったりライブラリ管理とかやってくれるらしい。pipとかmagage.pyみたいなもん?
- Incanterの公式ダウンロードリンクからインストールしてはいけない。インストールしてしまった後のことは知らない。
- Rの話は8ページ目で終了と言ってたけど、dplyr出て来たよ(25ページ目)
- マクロという言葉に拒否感ががが(C的Excel的意味で)。でもきっと慣れると便利なんだろう。きっと。多分。
- Clojureが並列処理に向いているらしいので、並列処理+統計処理に良さげ
- javaベースなので、javaベースのものと統合しやすいらしい。javaで開発してないからさっぱり分かんないけど。
- Incanterで3D pie chart書きたかったら、RserveってのでIncanterとRをつないだらいいらしい。3D pie chartの為だけにそこまでやるとか変態すぐる
分析実践
残った時間で実際にやってみましょうということで、弁当屋のデータを元にして売り上げ予測をやるという目的でRを触ってみるということをやっていました。R勉強会とは言え、実際にRをバリバリ使ってる人とかほとんど居ないと思うので、とても良い試みだと思いました。が、私はパソコン持ってなかったので読書しながら他の人がハマっているのを見たりしてました(悪趣味)。どうも文字コード周りでハマるケースが結構あるっぽいです。うむむむむ。ハマりポイントはハッキリさせたいところです。