Amazon OpenSearch Service 完全ガイド

📌 結論：OpenSearch Serviceは「超高速で何でも見つける図書館」

大量のデータから瞬時に必要な情報を検索・分析できるフルマネージドサービス。
ログ分析、アプリ内検索、セキュリティ監視など幅広く活躍します！

⚡

超高速検索

数十億件のデータから
ミリ秒で結果を返す

📊

リアルタイム分析

ログやメトリクスを
即座に可視化

🛠️

フルマネージド

インフラ管理不要で
すぐに使える

📚 巨大図書館で例えると超わかりやすい！

OpenSearch Service = 数億冊の本がある巨大図書館

普通の図書館では、司書さんが一人で本を探すので時間がかかります。
でもOpenSearchは数千人の超優秀な司書が並行して働いてくれるイメージ！

「○○について書かれた本は？」と聞けば、0.1秒で数億冊から該当する本を全部見つけてくれます✨

📖 図書館で理解するOpenSearch

あなたは世界最大の図書館の館長です。
毎日何百万冊もの本が追加され、世界中から「○○について調べたい」という問い合わせが殺到します。
どうすれば瞬時に正確な情報を届けられるでしょうか？

📝

データ

（蔵書・本）

➡️

🗂️

インデックス

（本棚・カタログ）

➡️

👨‍💼

OpenSearch

（超高速司書チーム）

➡️

🎯

検索結果

（見つかった本）

🏗️ OpenSearchの4つの構成要素

🏛️

ドメイン（Domain）

= 図書館の建物全体

📖 図書館のたとえ

図書館の建物全体がドメインです。
入口、受付、すべての本棚、司書さんたち、すべてが含まれます。
「東京中央図書館」のように名前をつけて識別します。

💻 技術的な説明

• OpenSearchクラスター全体を表す単位
• エンドポイントURL（アクセス先）を持つ
• セキュリティ設定、スケーリング設定を管理
• 複数のインデックスを含む

📚

インデックス（Index）

= 本棚・カテゴリ

📖 図書館のたとえ

「文学」「科学」「歴史」などの本棚（カテゴリ）です。
同じジャンルの本をまとめて整理することで、
探すときに効率よく見つけられます。

💻 技術的な説明

• データを論理的にグループ化する単位
• 例：logs-2024-01, products, users
• スキーマ（マッピング）を定義できる
• RDBの「テーブル」に近い概念

📦

シャード（Shard）

= 本棚の区画分け

📖 図書館のたとえ

巨大な本棚を区画に分けて、複数の司書が同時に探せるようにします。
「文学」の本棚を5区画に分ければ、5人の司書が並行して検索できて5倍速い！

💻 技術的な説明

• インデックスを分割した単位
• 並列処理でパフォーマンス向上
• プライマリシャード：元データ
• レプリカシャード：バックアップ用コピー

👨‍💼

ノード（Node）

= 司書さん（サーバー）

📖 図書館のたとえ

実際に本を探してくれる司書さんです。
司書が多いほど、たくさんの問い合わせを同時に処理できます。
「マスター司書」は全体の指揮、「データ司書」は検索を担当。

💻 技術的な説明

• クラスターを構成するサーバーインスタンス
• マスターノード：クラスター管理
• データノード：データ保存・検索処理
• インスタンスタイプで性能を調整

🔄 OpenSearchの検索フロー

📱

アプリから
検索リクエスト

➡️

🏛️

ドメイン
（受付）

➡️

📦

各シャードで
並列検索

➡️

🔗

結果を
マージ

➡️

🎯

検索結果
返却

複数のシャードで並列に検索することで、大量データでも高速に結果を返せます

💼 OpenSearch Serviceの主なユースケース

📝

ログ分析

アプリケーションやサーバーのログを収集・分析。エラーの原因特定やパフォーマンス監視に最適。

🔍

サイト内検索

ECサイトの商品検索、ドキュメント検索など。あいまい検索や類似検索も可能。

🛡️

セキュリティ分析

セキュリティイベントをリアルタイム分析。不正アクセスや異常検知に活用。

📊

ビジネス分析

売上データや顧客行動をリアルタイムで可視化。ダッシュボードで即座に確認。

🌐

IoTデータ分析

センサーデータを大量に収集・分析。異常検知やトレンド分析に対応。

🎯

レコメンデーション

ユーザーの行動履歴から類似商品を検索。パーソナライズされた提案を実現。

📊 OpenSearch vs 他のサービス比較

項目	OpenSearch	RDS/Aurora	DynamoDB
得意なこと	全文検索・ログ分析	トランザクション処理	キーベースアクセス
検索能力	⭐⭐⭐⭐⭐ 超高速	⭐⭐⭐ 普通	⭐⭐ 限定的
あいまい検索	✅ 得意	⚠️ 苦手	❌ 不可
データ整合性	結果整合性	強い整合性	選択可能
主な用途	検索・分析・可視化	業務システム	セッション管理など

🔥❄️🧊 ストレージティア完全解説

OpenSearchには3つのストレージ階層（ティア）があります！
データのアクセス頻度に応じて最適なティアを選ぶことで、
パフォーマンスとコストのバランスを取ることができます。

📚 図書館で例えると超わかりやすい！

図書館の本はどれくらい読まれるかによって、置く場所が違いますよね？

🔥 人気の本（ベストセラー） → 入口近くの目立つ棚（すぐ取れる）
🌡️ たまに読まれる本 → 地下の書庫（少し時間がかかる）
🧊 ほぼ読まれない古い本 → 外部の倉庫（取り寄せに時間がかかる）

OpenSearchのティアも同じ考え方です！

🔥

ホットティア

Hot Tier

📖 図書館のたとえ

入口すぐの目立つ本棚
ベストセラーや新刊など、
毎日たくさんの人が手に取る本。
すぐに取れて超便利！

💻 技術仕様

• ストレージ：EBS（SSD）
• レイテンシ：ミリ秒単位
• 用途：リアルタイム検索・分析
• コスト：最も高い 💰💰💰

直近7日間のログに最適

🌡️

ウォームティア

UltraWarm

📖 図書館のたとえ

地下の書庫
以前人気だった本、たまに調べる本。
取りに行くのに少し時間がかかるが、
保管コストは安い

💻 技術仕様

• ストレージ：S3 + キャッシュ
• レイテンシ：秒単位
• 用途：過去ログの調査・分析
• コスト：ホットの約1/10 💰

7日〜数ヶ月前のログに最適

🧊

コールドティア

Cold Storage

📖 図書館のたとえ

外部の倉庫
ほぼ誰も読まない古い本、資料。
取り寄せに時間がかかるが、
保管コストは激安！

💻 技術仕様

• ストレージ：S3のみ
• レイテンシ：分単位（要アタッチ）
• 用途：コンプライアンス保管
• コスト：ホットの約1/30 💵

数ヶ月〜数年前のログに最適

📊 ティア比較表

項目	🔥 ホット	🌡️ ウォーム	🧊 コールド
ストレージ	EBS (SSD)	S3 + ローカルキャッシュ	S3のみ
検索速度	⚡ 超高速（ミリ秒）	🚶 普通（秒単位）	🐢 遅い（要アタッチ）
書き込み	✅ 可能	❌ 読み取り専用	❌ 読み取り専用
コスト（GB）	💰💰💰 高い	💰 約1/10	💵 約1/30
主な用途	リアルタイム分析	過去データ調査	長期アーカイブ
推奨期間	直近7日間	7日〜数ヶ月	数ヶ月〜数年

🔄 データのライフサイクル

🔥

ホット

新しいデータ

7日後

➡️

自動移行

🌡️

ウォーム

過去データ

90日後

➡️

自動移行

🧊

コールド

アーカイブ

365日後

➡️

自動削除

🗑️

削除

保持期間終了

※ 移行タイミングはIndex State Management (ISM)ポリシーで自由にカスタマイズ可能

💡 ティア選択のベストプラクティス

1. コスト最適化の黄金比：
ホット（10%） : ウォーム（30%） : コールド（60%）を目安に設計。

2. ISMポリシーで自動化：
Index State Managementを使えば、ホット→ウォーム→コールド→削除を完全自動化！

3. コールドは「必要なときだけアタッチ」：
コールドストレージは普段は検索不可。必要なときにウォームにアタッチして検索。

4. UltraWarmの活用でコスト90%削減：
アクセス頻度の低いデータはUltraWarm（ウォームティア）に移行するだけで大幅コストダウン！

🔗 OpenSearchと連携する主なAWSサービス

🚿

Kinesis Data Firehose

ストリーミングデータを自動でOpenSearchに投入

Lambda

イベント駆動でデータを加工・投入

📋

CloudWatch Logs

ログをサブスクリプションで転送

🔐

IAM / Cognito

アクセス制御と認証

💡 OpenSearch Service 設計のベストプラクティス

1. シャード数は慎重に設計：
1シャードあたり10GB〜50GBが目安。多すぎるとオーバーヘッドが増え、少なすぎるとスケーラビリティが低下。

2. レプリカシャードで可用性確保：
本番環境では必ずレプリカを設定。ノード障害時もサービス継続可能に。

3. マスターノードは3台構成で：
スプリットブレイン防止のため、専用マスターノードを奇数台（3台推奨）で構成。

4. インデックスのライフサイクル管理：
古いログは自動でコールドストレージへ移動、一定期間後に削除するポリシーを設定。

5. UltraWarmでコスト最適化：
アクセス頻度の低いデータはUltraWarm（S3バックエンド）に移行してコストを90%削減！

❓ よくある質問（FAQ）

🤔 Q: ElasticsearchとOpenSearchの違いは？

A: OpenSearchはElasticsearchからフォークしたOSSです。
2021年にElastic社がライセンス変更したため、AWSがOpenSearchとしてフォーク。基本的な機能は同じですが、OpenSearchは独自機能（セキュリティプラグイン標準搭載など）も追加されています。AWS上では「Amazon OpenSearch Service」として提供されています。

🤔 Q: どのくらいのデータ量まで対応できる？

A: ペタバイト規模まで対応可能です！
適切なシャード設計とノード構成で、数十TB〜PB規模のデータも扱えます。UltraWarmを活用すれば、コストを抑えながら大量の過去データも保持できます。

🤔 Q: 料金はどのように計算される？

A: 主に3つの要素で課金されます：
1. インスタンス料金（ノードの台数×時間）
2. ストレージ料金（EBS/UltraWarm/Cold Storage）
3. データ転送料金（リージョン外への転送）
リザーブドインスタンスを使えば最大30%程度の割引も可能です。

🤔 Q: OpenSearch Dashboardsとは？

A: データを可視化するWebインターフェースです。
Kibanaからフォークした可視化ツールで、グラフやダッシュボードを作成できます。OpenSearch Serviceに標準で付属しており、追加料金なしで利用可能。ログの検索やリアルタイム監視に便利です。

🎓 まとめ

📚 図書館 = OpenSearch Service

大量のデータから必要な情報を瞬時に検索・分析できるサービス。
ログ分析、サイト内検索、セキュリティ監視など幅広く活躍します！

🏛️

ドメイン

図書館の建物全体
クラスター全体を表す

📚

インデックス

本棚（カテゴリ）
データの論理的なグループ

📦

シャード

本棚の区画分け
並列処理で高速化

🎯 ポイント：
検索が必要なら OpenSearch
トランザクションが必要なら RDS/Aurora
用途に応じて使い分けよう！🚀

目次

🔍 Amazon OpenSearch Service

📌 結論：OpenSearch Serviceは「超高速で何でも見つける図書館」

📚 巨大図書館で例えると超わかりやすい！

📖 図書館で理解するOpenSearch

🏗️ OpenSearchの4つの構成要素

🔄 OpenSearchの検索フロー

💼 OpenSearch Serviceの主なユースケース

ログ分析

サイト内検索

セキュリティ分析

ビジネス分析

IoTデータ分析

レコメンデーション

📊 OpenSearch vs 他のサービス比較

🔥❄️🧊 ストレージティア完全解説

📚 図書館で例えると超わかりやすい！

ホットティア

ウォームティア

コールドティア

📊 ティア比較表

🔄 データのライフサイクル

💡 ティア選択のベストプラクティス

🔗 OpenSearchと連携する主なAWSサービス

Kinesis Data Firehose

Lambda

CloudWatch Logs

IAM / Cognito

❓ よくある質問（FAQ）

🎓 まとめ

📚 図書館 = OpenSearch Service