PostgreSQL

BIツール「metabase」でサンプルDB「dvdrental」をグラフ化する

投稿日:2019年7月30日 更新日:

「売り上げやユーザ増加傾向をDBから抽出して上役に報告したりチームで共有したい」

こういった時、SQL結果をExcelでグラフ化、とかしていませんか?

SQLを流して結果をコピーしてExcelに張り付けて・・・結構面倒で骨が折れます。そんな時はBIツールを使えばワンストップでDB内容をグラフ化出来て効率化出来ます。

無料のBIツールとして「Re:dash」がメジャーですが、インストールが手間で導入で詰まる方も結構居らっしゃるんじゃないかな、と思います。

その点今回のテーマのmetabaseは実行するPCにJavaさえ入っていれば一瞬で導入することが出来ます。インストールして動作確認していきましょう。

実行環境

  • Windows 10
  • Java 8
  • サンプルDB「dvdrental」が入ったPostgreSQL

postgresqlにdvdrentalを入れる手順は以下の記事を参照してください。

dvdrentalやpostgresqlがなくても、metabaseが内包するh2データベースにsampleデータベースが入っているのでそれを使って検証することも出来ます。

インストール手順

metabase.jarをダウンロード

metabase公式サイトからmetabase.jarをダウンロードしてきます。

Webアプリを起動

ダウンロードしたjarを実行するとhttp://localhost:3000でWebアプリが起動します。

java -jar metabase.jar

接続先DBをセットアップ

http://localhost:3000にアクセス、セットアップを行います。

名前やメールアドレスを適当に設定した後、分析するデータの入ったDBを設定します。今回はPostgreSQLを選択。

PostgreSQLに接続する為の情報を入力。

Googleアナリティクスで情報収集されるそうなので、それが嫌な場合はオフにしておきましょう。

セットアップ終了です。Re:dashのインストールと比べると手軽過ぎ。

動かしてみる

初期画面はこんな感じ。dvdrentalのテーブルが表示されていてクリックすると様々なデフォルト分析結果を見せてくれるのでポチポチしてみましょう。

グラフ化してみる

「照会する」→「ネイティブクエリ」を選択。

dvdrentalでは既に集計ビュー「sales_by_store」が作られているのでこれをグラフ化してみます。

select * from sales_by_store;

を実行してビジュアライゼーションを棒グラフに設定。
細かい設定は「棒」の右のアイコンで設定ができます。

うーん、集計されすぎていて可視化するにはちょっと寂しいですね。

レンタル数の時間単位集計をしてみる

2005/05/23~25日の三日間で、時間帯毎のレンタル数を集計してみます。

SELECT
    DATE_TRUNC('hour',rental_date) AS rental_date_hour,
    COUNT(*) AS レンタル数
FROM
    rental
WHERE
    rental_date BETWEEN '2005-05-23 00:00:00' AND '2005-05-26 00:00:00'
GROUP BY
    rental_date_hour
ORDER BY
    rental_date_hour;

良くレンタルされている時間帯を可視化出来ました。マウスカーソルを合わせると詳細も見れます。

同じSQL結果を円グラフにしてみます。何も処理を書いていないのにパーセンテージも出してくれます。

グラフの種類は他にも沢山用意されています。好きな分析方法で見える化してみてください。

metabaseはコストパフォーマンス高い

インストール、設定が簡単、グラフ化もSQLを考えれば融通が利きます。

ある程度成長しているデータベースを運用していて、かつ可視化をしていないなら、metabaseは最初のBIツールとして打ってつけかも知れません。

本番でもがっつり使って行く場合は、内包DBをh2からPostgreSQLやMySQLにしておけば運用もし易いです。

有料のBIツールだとウン千万するものもあります。販売営業に騙されず、良し悪しを比較出来るように、まずはこういった無料オープンソースを試してみることをお勧めします。

-PostgreSQL
-,

執筆者:

関連記事

pgcryptoで公開鍵暗号の動作確認

共通鍵暗号で暗号化されたデータはパスワードが漏洩すると復号される危険が高まるのに対し、公開鍵暗号で暗号化されたデータは秘密鍵とパスワードの二つが漏洩しないと復号できません。 APサーバとDBサーバ通信 …

PostgreSQL エポックタイムカラムを今月初~今月末で範囲検索

エポックタイムは1970年1月1日 0時0分0秒から現在までの秒数。 PostgreSQLではこれを人間に読みやすいTIMESTAMP型(’2019-09-04 00:00:00&#821 …

開発用PostgreSQLをインストールした後の外部接続、ユーザ作成、認証周りの設定

ローカル開発用にPostgreSQLを入れた後、開発や分析をし易くする為に外部ホストからパスワード付き接続出来るようにしていきます。 また、postgresスーパーユーザは権限が強すぎて開発アプリから …

Omnibus版のGitLab、Mattermostデータベースに外部ホストからJDBCで接続

Omnibusで入れたPostgreSQLは、 Unix Domainソケットで接続待機Peer認証で認証 していて外部からの接続は出来ないことが前回分かりました。One IT Thing  …

GitLab Omunibus版のPostgreSQLに普通のpsqlコマンドで接続

GitLab Omunibus版でインストールされるビルトインPostgreSQLは、 TCP:5432ではなくホスト内でしか接続出来ないUnix Domain Socketで待機ローカルホストからO …

 

shingo.nakanishi
 

東京在勤、職歴2n年中年ITエンジニアです。まだ開発現場で頑張っています。

19歳(1996年)から書き始めたアウトプット用プライベートWeb日記数が5,000日を超え、残りの人生は発信をして行きたいと思い、令和元日からこのサイトを開始しました。勉強と試行錯誤をしながら、自分が経験したIT関連情報を投稿しています。

私と同じく、今後IT業界で生計を立てて行きたいと考えている方や、技術共有したいけど仲間が居なくて孤独、といった方と一緒に成長、知識共有して行けたら楽しいな、と思っています。