cucumber flesh

Rを中心としたデータ分析・統計解析らへんの話題をしていくだけ

rvest

📈企業内で利用されるサービス・ツールのアソシエーション分析

先日、ビジネスSNSとして有名なWantedlyが、企業に対して利用しているサービスやツールについての調査を行った結果をcompany toolsとして公開しました。 www.wantedly.com このページでは9つのカテゴリーについて、Wantedlyに登録されているすべての企業で…

💮【簡易版】RからGoogle Books APIを叩いてブクログに書籍登録する

読んだり買ったりした本の記録をEvernoteにとっているのだけど、きちんとしたサービスを使うか、という気になってブクログを選んだ。しばらく使ってみて思ったのだが、キーワードから本を探して「本棚」に登録するという過程をとるのが面倒。ちまちま入力し…

😎毎朝の習慣としてRパッケージの監視をしています

タイトルに偽りあり。これからやっていこう、という話です。 Rの機能を拡張する便利なパッケージはRそのものやRのパッケージを管理するCRANに登録されています。私は、パッケージの読み込み時にパッケージがインストールされていないためにthere is no packa…

🌴{rvest}を使って植物の学名をYListから取得する

一人Rアドベントカレンダーの3日目。何日まで続くかわからないが、@dichika さんを見習って続ける。 今日は仕事の話だ。植物生態学、特に群集データを扱う時のtipsについて書いてみたい。 群集を対象にした調査を行った場合、1種だけが出現した、というこ…

🍵MEEに掲載されたRパッケージのAdevent Calendarは実現可能なのか?

"Methods in Ecology and Evolution"(以下MEE)というジャーナルがあります。イギリス生態学会が刊行している生態学及び進化学系の学術誌で、ISIでの2014年の生態学分野におけるインパクトファクターの順位が9位(IF 6.554)であるそうです(すごい)。 こ…

☠webスクレイピングする際にページ番号をさくっと把握したい人生だった

前回の記事でも書いたが、webスクレイピングを行う際に、取得したいデータが複数のページに分割されて(いわゆるpagination)表示されていることがしばしばある。 対象のページがどれくらいあるのかを把握しておくと便利だよなと思ったので、paginationが行…

💮RSSっぽいものを自作してIFTTTに通知を飛ばす

日々のあれこれを記録しておきたい性分なせいもあって、最近IFTTTを活用しまくっている。基本的には、各種のサービスをIFTTTを経由してEvernoteに記録する、という過程をとっている。twitterの一日のつぶやきとか、YouTubeのお気に入りなんかをEvernoteに記…

💮StackoverflowやGitHubに書かれているコードを手元で検証する

最近、ggplot2逆引きプロジェクトが熱い。これは、プログラミン関係のお悩み相談所として有名なStackoverflowに寄せられるRの作図パッケージ{ggplot2}に関する質問を翻訳して整理しようという企画。 それをきっかけに、Stackoverflowを定期的に覗くようにな…