cucumber flesh

Rを中心としたデータ分析・統計解析らへんの話題をしていくだけ

🌱Google Cloud Vision API で生物の同定は可能?

機械学習ベースで画像認識・分類を行うGoogle Cloud Vision APIをR上で利用するコードをdichikaさんが書いてくれたので、それを使って手持ちの写真からいろいろな分類群の生物(主に植物)を同定することが可能なのかを検証してみたい

d.hatena.ne.jp

  • 🌿 植物編
  • 🐄 植物以外の分類群編
    • 🐝 昆虫綱
    • 🍄 菌類
    • 🐟 魚類
    • 🐓 鳥類
    • 🐶 哺乳類
  • 👻 擬態編
  • 🍵 所感

🌿 植物編

まずは簡単そうなものから。

f:id:u_ribo:20090814164226j:plain

画像は基本的にFlickrにアップロードしたものを表示しているが、実際に使ったのはすべてローカルにあるファイル。あと、出力した結果を見やすくするために{formattable}を使って、ちょっと手を加えた。

library(magrittr)
library(formattable)
library(jsonlite)
library(dplyr)
getResult("watermelon.jpg", "LABEL_DETECTION") %>% 
    content(as = "text") %>% fromJSON() %$% 
    responses$labelAnnotations
description score
💮watermelon 0.94329876
produce 0.78450352
melon 0.78298116
flower 0.77830565
food 0.76912522
dish 0.74153781
fruit 0.67084348
vegetable 0.61176038
ingredient 0.56144458

お、すごい。正解。低スコアの候補にdishとかingredientがあるのも面白い。

続いてはこちら。イチョウの写真。

続きを読む

🍭ホクソエムのつながりをNeo4Jを使って確かめる

先日、Neo4Jというオープンソースで開発されるグラフデータベースの存在を知りました。恥ずかしながら、グラフデータベース?なにそれ美味しいの?という知識しかありませんでしたが、どうやらNoSQL(リレーショナルデータベースだけがデータベースではない)の流れを組んで誕生したものらしいです。グラフデータベースは、表形式で表現されるリレーショナルデータベースに対して、データ間の関係性を表現するのに向いています。

気になるものがあるとすぐにRパッケージを探し出してしまう性分なので調べてみると、すぐに {RNeo4j}というパッケージが見つかりました。というわけでこの{RNeo4j}パッケージを使ってNeo4Jの扱いについて慣れていこうというメモです。

今回は適当な例として来月に結成1周年を迎える匿名知的集団「ホクソエム」のメンバー間のTwitter上でのフォロー状況について整理してみることにします。

続きを読む

📈企業内で利用されるサービス・ツールのアソシエーション分析

先日、ビジネスSNSとして有名なWantedlyが、企業に対して利用しているサービスやツールについての調査を行った結果をcompany toolsとして公開しました

www.wantedly.com

このページでは9つのカテゴリーについて、Wantedlyに登録されているすべての企業ではないですが、該当するウェブサービスやアナログなツールを利用している企業の数や評価コメントを見ることができます。

これはこれで大変面白いのですが、いくつか気になったことがあります。それは

  1. どういうツールが人気なの?
  2. どういうツールを組み合わせて利用しているの?
  3. 企業の特徴(社員数や事業内容など)との関係はあるの?

ということです。1についてはWantedlyの以下のカテゴリーごとの集計ページをみればわかるのですが、どうせならRで図示してみたくなります。また2については「この商品を買った場合はこの商品も買う」といった関連性を調べるためのアソシエーション分析の手法が使えるような気がします。最後の点については、Wantedlyの募集ページにあるテキストをもとに企業を分類すれば良いかなと思いましたが、社員数とか事業内容のデータが取れそうになかったので保留中です。というわけで1と2についてRでやってみました。

続きを読む