Amazon Redshift Data Sharing 完全ガイド

一言でいうと：データをコピーせずに、別のRedshiftクラスターとリアルタイムでデータを共有できる機能！
図書館で例えると：本を複製せずに、他の図書館の利用者にも同じ本を読めるようにする仕組み📖

📦 コピー不要

データを物理的にコピーする必要がない。元データへの「読み取りアクセス」を許可するだけ！

⚡ リアルタイム

Producer（提供者）がデータを更新すると、Consumer（利用者）も即座に最新データを参照可能！

💰 コスト削減

ストレージの重複がないため、保存コストを大幅削減。ETLパイプラインも不要！

🔒 セキュア

細かい権限管理が可能。誰に・どのデータを・どこまで共有するか完全にコントロール！

Redshift Data Sharing = 「図書館ネットワーク」
あなたの街の図書館が持っている貴重な本を、他の街の図書館でも読めるようにする仕組みです！

🏛️

従来の方法
「本をコピーして送る」

📋 やり方：
他の図書館が本を読みたいと言ったら、その本を全部コピーして郵送する。

😰 問題点：
• コピー代と郵送代がかかる（💸 コスト増）
• コピーに時間がかかる（⏰ 遅延）
• 原本が更新されてもコピーは古いまま（📅 データの鮮度低下）
• 各図書館に本の保管場所が必要（📦 ストレージ重複）

✨

Data Sharing
「閲覧カードを発行する」

📋 やり方：
他の図書館に「うちの本を読める特別閲覧カード」を発行する。本自体は動かさない！

🎉 メリット：
• コピー不要（💰 コスト削減）
• 即座にアクセス可能（⚡ リアルタイム）
• 原本が更新されれば最新を読める（🔄 常に最新）
• 保管場所は1箇所だけ（📦 ストレージ効率UP）

🏢

Producer

データを持っている側
（本を所有する図書館）

➡️

📋

Datashare

共有の設定・許可証
（特別閲覧カード）

➡️

👥

Consumer

データを利用する側
（閲覧カードで読む人）

📦 主要コンポーネント

🏢

Producer クラスター

Producer Cluster

データを所有し、共有を提供するRedshiftクラスター。

図書館で言うと：貴重な本を所蔵している「本館」

📋

Datashare

Datashare Object

共有するデータの「コンテナ」。テーブル、ビュー、スキーマなどを含む。

図書館で言うと：「この棚の本は共有OK」というリスト

👥

Consumer クラスター

Consumer Cluster

共有されたデータにアクセスするRedshiftクラスター。

図書館で言うと：閲覧カードで本を読める「分館」

🏷️

Namespace

Namespace (Account + Region)

クラスターを識別するための一意の識別子。

図書館で言うと：各図書館の「会員番号」

❌ 従来のデータ共有方法

📦 データをS3にエクスポートしてコピー
⏰ ETLパイプラインの構築・管理が必要
💾 各クラスターにデータを重複保存
📅 データの鮮度に遅延が発生
💸 ストレージコストが2倍、3倍に
🔧 同期処理の運用・監視が必要
🐛 データ不整合のリスク

✅ Redshift Data Sharing

🚀 SQLコマンド数行で共有設定完了
⚡ ETL不要、リアルタイムアクセス
💰 データは1箇所のみ保存
🔄 常に最新データにアクセス可能
📉 ストレージコストを大幅削減
🎯 運用コストほぼゼロ
✨ データの一貫性を保証

共有タイプ	説明	同一アカウント	クロスアカウント	クロスリージョン
🏠 同一アカウント共有	同じAWSアカウント内のクラスター間で共有	✅	❌	❌
🔗 クロスアカウント共有	異なるAWSアカウントのクラスターと共有	✅	✅	❌
🌍 クロスリージョン共有	異なるリージョンのクラスターと共有	✅	✅	✅
🛒 AWS Data Exchange	マーケットプレイスでデータを販売・購入	✅	✅	✅

💼 こんな時に使おう！ユースケース

🏢

マルチテナントSaaS

複数の顧客（テナント）に、それぞれ専用のデータアクセスを提供。各顧客は自分のデータだけを見られる！

👥 顧客ごとに独立した分析環境を提供

📊

部門間データ共有

営業部門のデータを、マーケティング部門やファイナンス部門と安全に共有。部門ごとに必要なデータだけを許可！

🔒 最小権限の原則でセキュアに共有

🌐

グローバル展開

本社（東京リージョン）のデータを、海外拠点（US、EU）のクラスターと共有。グローバルレポートが瞬時に！

🌍 クロスリージョンでリアルタイム分析

🤝

パートナー連携

取引先やパートナー企業と、必要なデータだけを安全に共有。機密データは隠しつつ、協業を促進！

🛡️ クロスアカウントで外部企業と連携

💹

データ収益化

AWS Data Exchangeを通じて、自社のデータセットを販売。新しい収益源を創出！

💰 データをマネタイズ

🔬

開発・本番環境の分離

本番データを開発環境と共有して、リアルなデータでテスト。ただしコピーは作らない！

⚡ 即座に本番同等のテスト環境を構築

📋 Datashare を作成する（Producer側）

共有するデータの「入れ物」を作成します。これが閲覧カードの発行準備です。

-- Datashareを作成 CREATE DATASHARE sales_datashare;

📦 共有するオブジェクトを追加（Producer側）

スキーマやテーブルなど、共有したいデータを Datashare に追加します。

-- スキーマを追加 ALTER DATASHARE sales_datashare ADD SCHEMA public; -- テーブルを追加 ALTER DATASHARE sales_datashare ADD TABLE public.sales_data;

🔑 Consumer に権限を付与（Producer側）

どのアカウント/クラスターがアクセスできるかを指定します。

-- 同一アカウントの別クラスターに付与 GRANT USAGE ON DATASHARE sales_datashare TO NAMESPACE 'xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx'; -- 別アカウントに付与 GRANT USAGE ON DATASHARE sales_datashare TO ACCOUNT '123456789012';

📖 データベースを作成（Consumer側）

Consumer側で、Datashareからデータベースを作成してアクセスできるようにします。

-- Datashareからデータベースを作成 CREATE DATABASE sales_db FROM DATASHARE sales_datashare OF NAMESPACE 'producer-namespace-id';

🎉 データにアクセス！（Consumer側）

通常のSQLクエリでデータにアクセスできます。データはコピーされていません！

-- 共有されたデータにクエリ SELECT * FROM sales_db.public.sales_data WHERE region = 'Tokyo';

💰 料金の考え方

🏢

Producer側

ストレージ費用：データを保存しているので、通常通りストレージ料金が発生

👥

Consumer側

コンピュート費用：クエリを実行するための計算リソース料金のみ。ストレージ費用は不要！

🌍

クロスリージョン

データ転送費用：リージョン間でデータを読み取る場合、データ転送料金が発生

🛒

Data Exchange

サブスクリプション費用：マーケットプレイスでデータを購入する場合、販売者が設定した料金

💡 ベストプラクティス & Tips

🔒 最小権限の原則

必要なテーブルだけを共有しましょう。スキーマ全体ではなく、特定のテーブルのみを追加することをおすすめします。

👁️ ビューを活用

機密列を除外したビューを作成して共有すれば、データのマスキングが可能。Consumer には見せたくない情報を隠せます。

📊 監視を忘れずに

CloudWatchでData Sharingのメトリクスを監視。誰がいつアクセスしたかを追跡しましょう。

🏷️ 命名規則を統一

Datashare名には目的や内容がわかる名前をつけましょう。例：`sales_team_datashare`、`marketing_reports_share`

⚡ Serverlessも対応

Redshift ServerlessでもData Sharingは利用可能！プロビジョンドクラスターとServerless間でも共有できます。

🔄 定期的な見直し

不要になったDatashareは削除しましょう。アクセス権限も定期的に棚卸しすることをおすすめします。

🎓 まとめ

本をコピーせずに「閲覧カード」で共有するように
データをコピーせずに「Datashare」でリアルタイム共有！

💰

コスト削減 データの重複保存が不要
ETLパイプラインも不要

⚡

リアルタイム 常に最新のデータに
即座にアクセス可能

🔒

セキュア きめ細かい権限管理
監査ログも完備

🎯 覚えておくべきキーポイント：

Producer = データを持っている側（本を所有する図書館）
Consumer = データを利用する側（閲覧カードで読む人）
Datashare = 共有設定の入れ物（特別閲覧カード）

同一アカウント・クロスアカウント・クロスリージョンで柔軟に共有可能！🎉

目次

📚 Amazon Redshift Data Sharing

🎯 30秒でわかる！Redshift Data Sharing とは

📦 コピー不要

⚡ リアルタイム

💰 コスト削減

🔒 セキュア

📖 図書館で理解するData Sharing

従来の方法「本をコピーして送る」

Data Sharing「閲覧カードを発行する」

🔄 Data Sharing の仕組み

Producer

Datashare

Consumer

📦 主要コンポーネント

Producer クラスター

Datashare

Consumer クラスター

Namespace

⚡ 従来の方法 vs Data Sharing

❌ 従来のデータ共有方法

✅ Redshift Data Sharing

📊 Data Sharing のタイプ比較

💼 こんな時に使おう！ユースケース

マルチテナントSaaS

部門間データ共有

グローバル展開

パートナー連携

データ収益化

開発・本番環境の分離

🛠️ Data Sharing 設定の流れ

📋 Datashare を作成する（Producer側）

📦 共有するオブジェクトを追加（Producer側）

🔑 Consumer に権限を付与（Producer側）

📖 データベースを作成（Consumer側）

🎉 データにアクセス！（Consumer側）

💰 料金の考え方

Producer側

Consumer側

クロスリージョン

Data Exchange

🔒 最小権限の原則

👁️ ビューを活用

📊 監視を忘れずに

🏷️ 命名規則を統一

⚡ Serverlessも対応

🔄 定期的な見直し

🎓 まとめ

📚 図書館 = Redshift Data Sharing

従来の方法
「本をコピーして送る」

Data Sharing
「閲覧カードを発行する」