PostgreSQL

BIツール「metabase」でサンプルDB「dvdrental」をグラフ化する

投稿日:2019年7月30日

「売り上げやユーザ増加傾向をDBから抽出して上役に報告したりチームで共有したい」

資料を作る為にSQLを流して、結果をコピーして、Excelに張り付けて、グラフ化して・・・結構面倒で骨が折れます。間違いがあるからもう一回やって、とか嫌ですね。

そんな時BIツールを使えばワンストップでDB内容をグラフ化出来て効率化出来ます。

無料のBIツールとして「Re:dash」がメジャーですが、インストールが手間で導入で詰まるパターンがあるかも知れません。

その点今回のテーマのmetabaseは実行するPCにJavaさえ入っていれば一瞬で導入することが出来ます。物の試しにインストールして動作確認していきましょう。

実行環境

  • Windows 10
  • Java 8
  • サンプルDB「dvdrental」が入ったPostgreSQL

postgresqlにdvdrentalを入れる手順は以下で行なっています。

dvdrentalやpostgresqlがなくても、metabaseが内包するh2データベースにsampleデータベースが入っているのでそれを使って検証することも出来ます。

インストール手順

metabase.jarをダウンロード

metabase公式サイトからmetabase.jarをダウンロードしてきます。

Webアプリを起動

ダウンロードしたjarを実行するとhttp://localhost:3000でWebアプリが起動します。

java -jar metabase.jar

接続先DBをセットアップ

http://localhost:3000にアクセス、セットアップを行います。

名前やメールアドレスを適当に設定した後、分析するデータの入ったDBを設定します。今回はPostgreSQLを選択。

PostgreSQLに接続する為の情報を入力。

Googleアナリティクスで情報収集されるそうなので、それが嫌な場合はオフにしておきましょう。

セットアップ終了です。Re:dashのインストールと比べると手軽過ぎ。

動かしてみる

初期画面はこんな感じ。dvdrentalのテーブルが表示されていてクリックすると様々なデフォルト分析結果を見せてくれるのでポチポチしてみましょう。

グラフ化してみる

「照会する」→「ネイティブクエリ」を選択。

dvdrentalでは既に集計ビュー「sales_by_store」が作られているのでこれをグラフ化してみます。

select * from sales_by_store;

を実行してビジュアライゼーションを棒グラフに設定。
細かい設定は「棒」の右のアイコンで設定ができます。

うーん、集計されすぎていて可視化するにはちょっと寂しいですね。

レンタル数の時間単位集計をしてみる

2005/05/23~25日の三日間で、時間帯毎のレンタル数を集計してみます。

SELECT
    DATE_TRUNC('hour',rental_date) AS rental_date_hour,
    COUNT(*) AS レンタル数
FROM
    rental
WHERE
    rental_date BETWEEN '2005-05-23 00:00:00' AND '2005-05-26 00:00:00'
GROUP BY
    rental_date_hour
ORDER BY
    rental_date_hour;

良くレンタルされている時間帯を可視化出来ました。マウスカーソルを合わせると詳細も見れます。

同じSQL結果を円グラフにしてみます。何も処理を書いていないのにパーセンテージも出してくれます。

グラフの種類は他にも沢山用意されています。好きな分析方法で見える化してみてください。

metabaseはコストパフォーマンス高い

インストール、設定が簡単、グラフ化もSQLを考えれば融通が利きます。

ある程度成長しているデータベースを運用していて、かつ可視化をしていないなら、metabaseは最初のBIツールとして打ってつけかも知れません。

本番でもがっつり使って行く場合は、metabaseのDBを内包のh2からPostgreSQLやMySQLにしておけば運用もし易いです。

有料のBIツールだとスクラッチ代も含めてウン千万するものもあります。良し悪しを比較出来るように、まずはこういった無料オープンソースで事足りないか試してみることをお勧めします。

-PostgreSQL
-,

執筆者:

関連記事

pgadmin4をCentOS7にインストールしてサーバモードで起動する手順

目次1 はじめに1.1 pgadmin3時代1.2 pgadmin4時代2 前提3 環境4 手順4.1 1.yumリポジトリ追加。pgdg(ポスグレ本家)、epel(python関連用)4.2 2.p …

開発用PostgreSQLをインストールした後の外部接続、ユーザ作成、認証周りの設定

ローカル開発用にPostgreSQLを入れた後、開発や分析をし易くする為に外部ホストからパスワード付き接続出来るようにしていきます。 また、postgresスーパーユーザは権限が強すぎて開発アプリから …

SSHトンネルを使ってリモートデータベースをBI

クラウド上のDBを分析する為、ローカルPCにSSHトンネル(ポートフォワード)環境を作ります。 リモートDBポートにクラウド外からセキュアに接続できれば、クラウドにBIツールを入れる手間が省けます。 …

PostgreSQL エポックタイムカラムを今月初~今月末で範囲検索

エポックタイムは1970年1月1日 0時0分0秒から現在までの秒数。 PostgreSQLではこれを人間に読みやすいTIMESTAMP型(’2019-09-04 00:00:00&#821 …

GitLab Omunibus版のPostgreSQLに普通のpsqlコマンドで接続

GitLab Omunibus版でインストールされるビルトインPostgreSQLは、 TCP:5432ではなくホスト内でしか接続出来ないUnix Domain Socketで待機ローカルホストからO …

 

shingo.nakanishi
 

東京在勤、1977年生まれ、IT職歴2n年、生涯現役技術者を目指しています。健康第一。