データの可視化に便利なツール「Tableau」。
このTableauで生成されるファイルには複数ありますが、意外と違いが判らないという方が多いのではないでしょうか?
とくにどちらも作成したチャートを開くことができる「.twb」「.twbx」の違いは、Tableauをはじめられた方にとって最初に???となるところです。
ここではTablaeuでよく使用するファイルやその違いを紹介していきます。
Tableauの基礎から学習したい方はこちらのテキストも参考にしてください。
目次
Tableauのファイル
ワークブック(.twb)
Tableauのワークシート、ダッシュボード、ストーリーを含むファイルが「ワークブック」でその拡張子が「.twb」になります。
パッケージドワークブック(.twbx)
Tableauのワークブックとローカルデータソース、背景イメージを含むファイルが「パッケージドワークブック」でその拡張子が「.twbx」となります。
ファイルについてはZip圧縮でまとめられています。
抽出ファイル(.hyper)
大規模なデータに対して、抽出をかけたファイルをTableauでは拡張子「.hyper」のファイルとして取り扱うことがあります。
主に前処理を担当するTableau Prepで出力されます。
現在の抽出ファイルは「.hyper」ですが、少し前までは「.tde」ファイルでしたので、「.hyper」以外にも「.tde」があることをご認識ください。
データソースファイル(.tds)
データソースへの接続情報や、Tableauのデータソース上での変更(既定のプロパティに行った変更、計算フィールドの作成、グループの追加など)をまとめたファイルをデータソースファイルと呼び、その拡張子が「.tds」です。
ワークブックとパッケージドワークブックの違い
前章で紹介したファイルの中でも、よく使用するのはワークシートやダッシュボードが含まれるワークブックとパッケージドワークブックになります。
どちらを利用すればいいのか?という疑問がみなさんでると思います。
こちらはどちらが優れているというわけではなく、ケースバイケースとなります。
大きな違いは「ローカルのデータソースを含む」ことになります。
そのためTableau全体の運用がローカルメインであれば、パッケージドワークブックの方が使い勝手がいいです。
データソースを持っているため、ネットワークに接続していなくても使用できます。
一方で、データを直接持っていることから、セキュリティ上の心配があります。
ワークシート上はデータを表示させていなくても、データソースを除けば重要な情報が入っていて、それを開示したくない方に送ってしまうというケースもあります。
さらに、データの鮮度をどう保つかも課題です。
一方でワークブックはライブ接続で使用するので、上記のような問題は起こりづらいです。
しかしながら、データ量が多くになるにつれ、データを読み込む速度に時間がかかるのでデータ量と利便性がトレードオフになります。
また、ここでは深く踏み込みませんが、Tableau Serverの有無の運用もどちらを選ぶかの重要なファクターになります。
一例ではありますが、常時オンラインで閲覧し、データソースも1日1回の更新でよければ、パッケージドワークブックにして1日1回の更新設定をしておけば、利便性も保たれた形で利用できるよと思います(Tableau Server側でセキュリティの設定はいろいろと必要です)。
まとめ:Tableauのファイル拡張子
Tableauの各ファイルについて紹介しました。
特にワークブックとパッケージドワークブックはしっかりと理解して使い分けが必要になります。
このファイルの拡張子はTableauの資格試験でも頻出のものになります。
Tablaeuの資格「Tableau Desktop Specialist」について興味がある方はこちらをご覧ください。