cucumber flesh

Rを中心としたデータ分析・統計解析らへんの話題をしていくだけ

zipangu v0.3.0をCRANにリリースしました

日本人が扱う住所や年号、漢数字のデータ操作を楽にするRパッケージ {zipangu}の最新バージョン v0.3.0をCRANにリリースしました。前回のリリースに引き続き、多くの方が開発に協力してくださいました。ありがとうございます。この記事では新たに追加された…

改訂2版 RユーザのためのRStudio実践入門のおすすめポイント

「RユーザのためのRStudio[実践]入門」の改訂2版を執筆者の一人、湯谷さん(id:yutannihilation)から頂いた。ありがとうございます。感謝の言葉と合わせて、書籍の紹介と読んだ感想について書いておく。 改訂2版 RユーザのためのRStudio[実践]入門〜tidyver…

日本語プロットの文字化けストレスを低減する - RStudio v1.4とraggパッケージを使う

RStudio v1.4とraggパッケージの登場でRStudio上で日本語の作図が面倒な指定不要で行えるようになりました。記事中で紹介する方法をとれば、RStudioのPlotsパネルに出力する図が文字化けしなくなります。RStudioユーザで日本語での作図を行う方にはぜひ知っ…

タイル形式にデータを並べて表示するtabularmapsパッケージがCRANに登録されました

新しいパッケージをCRANに登録しました。tabularmapsパッケージです。このRパッケージは以前ブログ記事にも書いた、 カラム地図を作成するためのものです。カラム地図は、行政区などの配置を表状に敷き詰めて表示することで、それぞれの位置関係をわかりやす…

Tokyo.R#87でdata.tableパッケージの発表をしました

先日開催された第87回Tokyo.Rにおいてdata.tableパッケージに関する発表を行いました。 ここでは発表資料へのリンクと補足を書きます。 今回のスライド作成に関して、GitHubスポンサーの皆さんからの援助を受けています。 どうもありがとうございました。こ…

市区町村役所間の距離行列を求める~pdftoolsでのデータ抽出とsfによる算出編~

はじめに Qiitaのなかで@3tkyさんが、都道府県庁間の距離行列をRで求める記事を書かれていました。 qiita.com そして、挑戦状のような一文が残されています。 市区町村の役所の緯度経度は 国土地理院 がまとめているので、PDFを整形し、60進法表記を @uri さ…

kuniezu: 日本の国土地理を扱いやすくするRパッケージをCRANに登録しました

はじめに 使い方 parse_*_dohunbyo(): DMS表記を十進数表記に変換 日本測地系2011における平面直角座標系の特定 move_jpn_rs(): 南西諸島の一部・小笠原諸島を移動した日本地図の描画 地理院タイルをleafletで簡単に利用できるように 国土地理に関するデータ…

ある座標からの指定半径に含まれるメッシュコードを知る

新型コロナウイルスのデータを扱う際に、メッシュコード(標準地域メッシュ)が利用されることがあります。 特にNTTドコモ「モバイル空間統計」分析レポートのデータは、内閣官房の新型コロナウイルス感染症対策のページにも掲載されているように 全国各地の…

R Markdownでのハイライトを行うflairパッケージを使ってみた

R MarkdownによるHTML出力を行う時、コードのシンタックスハイライトを取り入れることができます。一方でコードの特定の箇所を強調したり装飾することは困難でした(xaringanパッケージでのプレゼンテーション用の出力では可能)。 ですがそれも過去の話。今日…

tabularmaps: カラム地図で行政区の大まかな配置を可視化する

カラム地図と呼ばれるものがあります。 これは日本の47都道府県をはじめとした行政区の配置を表上に圧縮表示することで、それぞれの位置関係をわかりやすく伝えるためのプロジェクトです。 最近では、カラム地図の開発者の一人、福野泰介さん (@taisukef) に…

気象庁提供の潮位表、過去の気象データをRで読み込む

最近、気象庁が提供する各種データをR上で取り扱うパッケージ、jmastatsに新しい関数を追加しました。 このパッケージはちまちまと更新しており、現在のところCRANへの登録は目指していません。 ですが便利なパッケージなのでこの場で宣伝しておきます。 htt…

jpmeshバージョン1.2.0をリリース

統計調査などで使われる標準地域メッシュをRで扱うjpmeshパッケージのバージョン1.2.0 をCRANにリリースしました。以前のバージョンは1.1.3でした。マイナーアップデートですがいくつかの変更点・新機能がありますので紹介します。 インストール 2020年3月28…

GitHub Sponsorsの募集を始めました、よろしくお願いします。

表題の通り、GitHub Sponsorsの審査を通過しましたので告知です。 要約 私のオープンソースソフトウェア(OSS)活動を支援するための寄付の受付を開始したので何卒一考ください。 GitHub を利用している方は https://github.com/sponsors/uribo をご覧くださ…

parzerパッケージで多様な緯度経度の表記を十進数に変換する

信頼と実績のrOpenSciから新しいパッケージがCRANに登録されました。parzerパッケージです。 このパッケージは多種多様な緯度経度の表記形式を処理し、十進数での表記(DEG: Degree)に変換してくれるものです。 (例えば「139°44’28.8869」を「139.7414」にす…

データフレーム上の緯度と経度を空間オブジェクトに変換する-🦉sfと🐍geopandasの例-

地理空間データを取り扱う際は、はじめにgeojsonやshapeファイルで受け取ることが一般的かと思います。 あるいはポイントデータの場合には、緯度と経度の値が各列に記録されるcsvなどの表形式のテキストファイルを起点とすることもあります。 前者のような地…

郵便番号データの操作と祝日判定の機能を追加したzipangu v0.2.0を公開

昨年バージョン0.1.0をリリースした、日本人が扱う住所や年号、漢数字のデータ操作を楽にするRパッケージ、{zipangu}に新しい機能を追加し、バージョン0.2.0としてCRANに登録しました。この記事では0.2.0で扱える新機能を紹介します。表題の通り、郵便番号デ…

郵便番号データをtidyにする挑戦

日本人が頻繁に遭遇するデータ操作を効率的に行うための{zipangu}パッケージ、想定よりも多くの人が喜んでくれたようで、私としても嬉しく思っています。 はてなブログに投稿しました #はてなブログ住所や年号、漢数字のデータ操作を楽にするRパッケージをCR…

ハドリーに倣い、コンソールにブランチ名を表示&フォントを変える

何事も形から入るタイプの @u_ribo です。ネットストーキングに定評があります。 皆さんには憧れの人はいますか? 憧れの人が使っているものは、なぜか格好良く見えたり、自分も興味を抱くようになった経験はないでしょうか。 さて、憧れの人であるHadleyが…

ggplot2の凡例を制御するためのオプション show.legend

ggplot2の凡例に関する小話を2つ。べ、別に最近知ったわけじゃないんだからね! geom_*(show.legend = FALSE) で凡例を非表示にする ggplot2での作図で凡例を制御する関数として guides()があります。この関数内でグラフに使われる凡例のタイトルや並びを調…

標準的な公共交通機関の情報形式 GTFS をRで処理する: gtfsrouter編

この記事はRアドベントカレンダー2019の5日目の投稿です。昨日は id:ando_Roid さんの投稿でした。 はじめに 今回で4回目となる「東京公共交通オープンデータチャレンジ」の応募が始まりました。これは公共交通オープンデータやその他のオープンデータを活用…

住所や年号、漢数字のデータ操作を楽にするRパッケージをCRANに登録しました

副題「失われた『Nippon』を求めて」(仰々しい)。 Kajikazawa in Kai Province (Koshu Kajikazawa), from the series “Thirty-six Views of Mount Fuji (Fugaku sanjurokkei)”, 1825–1838 by Katsushika Hokusai. Image via Art Institute of Chicago Nipp…

Fukuoka.R#15でtidymodelsについての発表を行いました

先週末(2019年8月31日)に開催されたFukuoka.R#15 へ参加・発表してきました。Fukuoka.Rはその名の通り、九州・博多を中心として活動するRコミュニティです。私は茨城県つくば市に住んでいるので、会場のLINE Fukuokaまでは直線距離でおよそ928km離れた場所…

ggplot2::geom_sf()での緯度経度のラベルを調整する

要約 ggplot2::geom_sf()のデフォルトで表示される緯度経度の軸は桁数が揃っていないことがある scales::degree_format()で桁数の調整が可能 最新のバージョン(1.0.0)では実装されておらず、開発版をインストールして利用する scalesを使わない方法も紹介 は…

ggplot2でのfacetした図のstripを下部に配置する方法と注意点

ggplot2のfacet_wrap()やfacet_grid()で、ある変数の水準ごとにパネルを分割した描画を行うと、分割の基準となっている変数名がパネルの上部に表示されます。これにはstripという名前がついています。“strip”の辞書を引くと「(金属の)薄板」の意味だそうです…

否定条件: stringr 1.4.0で追加された引数negageとpurrrを使った文字列以外のさまざまなデータへの適用例

要約 条件に一致しない要素に対してTRUEを返す否定条件をさまざまなデータ型に適用する例を紹介します 文字列データに対しては stringrパッケージ(バージョン1.4.0以降)またはstringiのnegate引数を利用する purrrパッケージのnegate()、compose()を用いるこ…

DockerイメージでGitHub上のRパッケージのインストールを行う際の注意: GitHub Personal Access Tokenの設定

前回の記事では、CRANやそれ以外のGitリポジトリからRパッケージのインストールを行うremotesパッケージの特徴と、GitHubで管理されたパッケージのインストールを行う際のAPIに関する注意を書きました。 uribo.hatenablog.com 今回はさらにニッチな内容だと…

RパッケージをGitHubからインストールする場合はPersonal Access Tokenを取得・設定しておきましょう

RのパッケージはCRANやBioconductorといったリポジトリに加えて、GitHubやGitLab、Bitbucketといった分散型Gitリポジトリサービス(リモートリポジトリ)からインストールすることが可能です。リモートリポジトリには開発版のものや、CRAN等に公開されていな…

Rで国土地理院 基盤地図情報データを扱う

この記事は、FOSS4Gアドベントカレンダー2018の16日目の記事です。タイトルにある通り、Rから国土地理院 基盤地図情報ダウンロードサービスでダウンロードしたファイルを扱う方法について書きます。 基盤地図情報が提供するデータはXMLファイルとなっており…

国土地理院の数値標高モデルデータをラスタとしてRで扱う

国土地理院が提供している「基盤地図情報ダウンロードサービス」の中に「数値標高モデル」データがあります。このデータは、標高のメッシュデータです。標高点格子(メッシュサイズ)が5m、10mのものがそれぞれあります。利用登録をすればデータをダウンロー…

名前空間の衝突をconflictedパッケージで防ぐ

R

要約 パッケージを複数利用すると関数名等の衝突が発生し、意図しない振る舞いを取ることがある conflictedパッケージは、こうした衝突を防ぐための機能を提供する 多少の手間を惜しんでも、衝突の恐れのある関数については名前空間を指定することを勧める