第5章: どんなユースケースで使われているか
第3部の最初の章として、「Snowflake が実際にどう使われているか」を整理する。1つのDWH製品なのに、ユースケースは大きく9つに分かれる。第6章(最新機能)と第7章(ベストプラクティス)の前提として、まずこの地図を持っておく。
9つの代表ユースケース
mindmap
root((Snowflakeの<br/>9ユースケース))
伝統的DWH領域
中央DWH移行
ELT基盤
分析・可視化
リアルタイム<br/>ダッシュボード
データの流通
Data Sharing
Marketplace
AI/ML系
ML基盤
生成AI<br/>(Cortex)
プラットフォーム化
データアプリ<br/>(Streamlit/Native App)
Iceberg<br/>マルチエンジン共存
順に見ていく。
1. 中央DWH移行 ─ レガシーDWHからの脱出
最も伝統的かつ最も件数が多いユースケース。Teradata / Oracle / Netezza / Greenplum / SQL Server / Hadoop などのオンプレ DWH からの移行。
喜ばれている点
- インフラ管理が消える(チューニング・パッチ・容量計画が不要に)
- スケーリングが分単位(ノード追加が秒)
- TCO の削減(Pfizer 公式事例で TCO 57%減)
移行支援ツール(第9章で詳しく)
- SnowConvert AI(2025 GA、無料化):Oracle / SQL Server / Teradata / Redshift / BigQuery / Greenplum / Sybase / Synapse / Netezza / Postgres / Databricks SQL に対応
- スキーマ・procedure 変換、データ移行・検証まで一気通貫
- AI 支援で従来数ヶ月→数週間に短縮、コスト30%減事例あり
代表事例
- PayPal / Penske / Siemens / Guitar Center:レガシーDWH 移行成功(Snowflake 公式「Secrets of Snowflake Migration Success」)
- Pfizer:Snowpark で処理4倍・TCO 57%減
- 大手建材メーカー(米):Oracle ADW → Snowflake + Matillion、コスト30%減
2. ELT基盤 ─ モダンデータスタックの中心
Fivetran / Airbyte で取り込み → dbt で変換 → Snowflake で保管、いわゆるモダンデータスタックの中心。
graph LR
Src[Source<br/>SaaS/RDB/Files] --> EL[Fivetran/Airbyte<br/>Extract & Load]
EL --> Raw[Raw / Bronze]
Raw --> Stg[Staging / Silver<br/>dbt + SQL]
Stg --> Mart[Mart / Gold<br/>dbt + SQL]
Mart --> BI[Tableau/Looker/PowerBI/Sigma]
喜ばれている点
- near-infinite scale:Fivetran が大量データを load しても、Snowflake は VWH を増やせば済む
- dbt との相性:Snowflake がデフォルトとして扱われている
- Dynamic Tables(第3章・第6章)で増分パイプラインが宣言的に書ける
注意点(2025-10 ニュース)
Fivetran と dbt Labs が全株式合併(年商 約$600M)。「ELT は Fivetran、変換は dbt」のスタックがついに同じ会社の製品になった。今後は統合がより緊密になる一方、ベンダー集中リスクも意識する。
3. リアルタイムダッシュボード ─ Snowpipe Streaming で接近
「Snowflake はバッチ向き、リアルタイムは別ツール」と言われていた時代は終わった。Snowpipe Streaming 高性能アーキテクチャ(2025-09 GA) で:
| 指標 | 数字 |
|---|---|
| スループット | テーブル毎 10 GB/秒 |
| Ingest-to-query レイテンシ | 10秒未満 |
| 整合性 | PIPE オブジェクトで exactly-once |
graph LR
K[Kafka/Kinesis] --> SP[Snowpipe Streaming]
SP --> T[(Snowflake Table)]
T --> DT[Dynamic Tables<br/>差分集計]
DT --> BI[Tableau/Sigma/PowerBI]
Note[Latency<br/>< 10s] -.-> BI
喜ばれている点
- 既存のSnowflakeにそのまま乗る(別製品に切り替える必要がない)
- Dynamic Tables と組合せで「rawストリーム → 集計 → ダッシュボード」が宣言的に書ける
- Tableau / Looker / Power BI / Sigma などBIツールのネイティブコネクタがある
サブ秒が必要なら依然 ClickHouse
本物のリアルタイム(サブ秒)が必要なログ分析・可観測性では、ClickHouse がまだ強い。Snowflake は「near-real-time(10秒前後)」のスイートスポット。
4. Data Sharing ─ コピーを作らないでデータを渡す
Snowflake が他DWHと最も差別化できる機能の1つ。Secure Data Sharing で、データをコピーせず、読み取り専用のライブ参照として組織間で共有できる。
仕組み
graph LR
P[Provider Account<br/>本社] -->|Share| S{(Shared Data<br/>メタデータのみ)}
S --> C1[Consumer Account<br/>子会社A]
S --> C2[Consumer Account<br/>子会社B]
S --> C3[Reader Account<br/>パートナー]
- Provider が
CREATE SHAREで公開、Consumer がCREATE DATABASE … FROM SHAREで参照 - データの実体は Provider 側にあり、Consumer はメタデータ経由で読むだけ
- Provider 側で更新すれば、即座に Consumer 側でも反映
- Reader Account を発行すれば、Snowflake アカウントを持たない相手にも共有可
喜ばれている点
- M&A 後の統合で、データ統合プロジェクトをスキップできる
- 子会社・パートナー間で最新データが常に同期
- 過剰権限のセキュリティリスクが低い(読み取り専用)
典型ユースケース
- JPX 総研:証券会社向け取引データ配信(コピーなしで参照)
- JAバンク:系統データ基盤
- 金融機関グループ:本社 → 子会社への規制報告データ
- 小売チェーン:本部 → 加盟店への売上・在庫データ
5. Data Marketplace ─ サードパーティデータをSQLで買う
Snowflake Marketplace で、天気・人口統計・金融市場・地理空間・広告データなどをSQLで即座に購入・参照できる。
流れ
- Marketplace で必要なデータセット(例:気象データ)を見つける
- 購入手続き(または無料データなら request)
- 自分のアカウント内で
CREATE DATABASE FROM SHARE - すぐ
SELECTできる
-- 購入後すぐ使える
SELECT region, AVG(temperature_c) AS avg_temp
FROM weather_data.public.daily_temperature
WHERE date >= '2026-04-01'
GROUP BY region;
データを CSV でダウンロード → ロード → 更新追従 という従来のフローが消える。
喜ばれている点
- 外部データを「ダウンロード → 取り込み」する手間がゼロ
- 提供者側のアップデートが自動反映
- マスターデータの一元管理(人口統計、地理空間など)
6. ML基盤 ─ Snowpark ML + Notebooks Container Runtime
Snowflake の上で機械学習モデルを訓練・推論する。
構成
graph TB
D[(データ)] --> N[Snowflake Notebooks<br/>Container Runtime]
N --> SM[Snowpark ML<br/>scikit-learn / xgboost / lightgbm]
N --> GPU[GPU 訓練<br/>PyTorch / TensorFlow]
SM --> Reg[Snowflake Model Registry]
GPU --> Reg
Reg --> Inf[推論<br/>SQL UDF / Snowpark]
Inf --> A[(アプリ / BI)]
喜ばれている点
- データ移動なし:データを Snowflake から取り出さず、データの近くで訓練・推論
- GPU 訓練が Container Runtime で可能
- モデルレジストリで版数管理
PREDICTを SQL UDF として呼べる
Pfizer の事例
Snowpark で処理4倍、TCO 57%減(公式 case study)。データを別環境にコピーせずに ML パイプラインを完結させたことが効いている。
7. 生成AI ─ Cortex でドキュメントQA・要約・RAG
第6章で詳しく扱うが、ここでもユースケースとして整理する。
Cortex の主な使い道
-- 要約
SELECT SNOWFLAKE.CORTEX.SUMMARIZE(comment) AS summary
FROM customer_feedback;
-- 翻訳
SELECT SNOWFLAKE.CORTEX.TRANSLATE(text, '', 'en') FROM articles;
-- センチメント分析
SELECT SNOWFLAKE.CORTEX.SENTIMENT(review) FROM reviews;
-- 任意の質問(COMPLETE)
SELECT SNOWFLAKE.CORTEX.COMPLETE(
'mistral-large2',
'次の問い合わせを3カテゴリ(請求・技術・要望)に分類: ' || ticket_text
) FROM tickets;
喜ばれている点
- データを外部LLMに送らない:データはSnowflakeのガバナンス境界内
- SQL から直接呼べる:別 API を立てる必要がない
- Cortex Analyst:ビジネスユーザーが自然言語で質問 → SQL生成
- Cortex Search:RAG用のマネージドハイブリッド検索
注意点(第8章のアンチパターン)
Cortex 関数を毎行で呼ぶとコストが爆発する。1クエリで $5,000 を消費した実例(11.8億行を処理)あり。バッチ処理 + 小型モデルでの実験 + COUNT_TOKENS 事前確認が公式推奨。
8. データアプリ ─ Streamlit + Native App
データの近くでアプリを動かす。
Streamlit in Snowflake
Pythonでデータアプリを書いて、Snowflake内でホストする。Container Runtime GA(2026-03-09)で GPU / 長時間実行サービスにも対応。
# streamlit_app.py(Snowflake 内で実行される)
import streamlit as st
from snowflake.snowpark.context import get_active_session
session = get_active_session()
df = session.sql("SELECT * FROM sales_summary").to_pandas()
st.line_chart(df.set_index('date')['revenue'])
Native App Framework
作ったアプリを Snowflake Marketplace で配布できる。購入者は自分のSnowflakeアカウント内でアプリを実行 ─ データ持ち出し不要だから、SaaS提供者にとっても顧客にとっても安全。
Marketplace には 90+ Native Apps がすでに登録されている(2026年時点)。
喜ばれている点
- データアプリの dev → 本番が同じSnowflake内で完結
- 認証・RBAC・監査が Snowflake のガバナンス層を再利用
- アプリの配布先でデータを持ち出さない
9. Iceberg + マルチエンジン共存 ─ オープンレイクハウス
2024-10 の Apache Iceberg ネイティブ + Snowflake Open Catalog(旧 Polaris) GA で実現したユースケース。
構成
graph TB
OC[Snowflake Open Catalog<br/>旧 Polaris<br/>Apache 寄贈]
OC --> SF[Snowflake]
OC --> SP[Apache Spark]
OC --> TR[Trino]
OC --> FL[Apache Flink]
OC --> DR[Dremio]
OC --> ST[StarRocks]
SF --> S3[(S3 / Blob / GCS<br/>Iceberg/Delta)]
SP --> S3
TR --> S3
FL --> S3
DR --> S3
ST --> S3
同じデータを、複数のエンジンが好きなように読める。Iceberg REST 仕様準拠で、Snowflakeの Horizon ガバナンス(RBAC / マスキング / Tag)も Iceberg にも適用される。
喜ばれている点
- ベンダーロックインの懸念に正面から答える選択肢
- 既存のSpark / Trino資産を捨てなくていい
- データ移行・複製のコストがゼロ
Apache 寄贈の意味
Snowflake は Polaris Catalog を Apache Software Foundation に寄贈した(Apache Polaris incubating)。ベンダー独自仕様ではなくコミュニティ標準として育てる宣言。Databricks の Unity Catalog(自社所有)と対照的。
国内外の代表事例
事例を9ユースケース横断で整理する。Snowflake 公式 case study に裏取りできているもののみ列挙。
海外
| 事例 | ユースケース | 主な成果 |
|---|---|---|
| Capital One | 中央DWH + ML + アプリ | 戦略パートナー、Capital One Slingshot として外販 |
| PayPal / Penske / Siemens / Guitar Center | レガシーDWH移行 | Snowflake 公式「Secrets of Snowflake Migration Success」 |
| Pfizer | ML 基盤 | Snowpark で処理4倍・TCO 57%減 |
| BlackRock | 中央DWH | Aladdin Data Cloud |
国内
| 事例 | ユースケース | 主な成果 |
|---|---|---|
| NTTデータ | パートナー | APJ Partner of the Year 4年連続 |
| 京都銀行(2024-05) | 金融機関基盤 | Service Innovation Core (SIC) on Snowflake |
| 西日本シティ銀行(2025-04) | 金融機関基盤 | SIC on Snowflake |
| JAバンク | データ共有 | 系統データ基盤 |
| JPX総研 | データ配信 | 証券会社向け取引データ配信 |
| NTTドコモ | 分散・自律型データ活用 | DATA INSIGHT 2026-03 |
| SBIホールディングス AlpacaTech(2025-04) | パートナー | Snowflake SELECT パートナー認定 |
金融・社会インフラまで届いた段階で、もはや「新興DWH」ではない。
本章の要点
| # | 要点 |
|---|---|
| 1 | Snowflake のユースケースは大きく9つ:中央DWH / ELT / リアルタイム / Data Sharing / Marketplace / ML / 生成AI / データアプリ / Iceberg共存 |
| 2 | 中央DWH移行は SnowConvert AI でレガシー(Teradata/Oracle/Redshift/BigQuery)から数週間レベルに短縮 |
| 3 | ELT は Fivetran + dbt + Snowflake が定番。2025-10 に Fivetran と dbt Labs が合併 |
| 4 | Snowpipe Streaming 高性能アーキテクチャで 10秒未満レイテンシ。サブ秒は依然 ClickHouse |
| 5 | Data Sharing はコピーなしの組織間共有。Snowflake が他DWHと最も差別化できる機能 |
| 6 | Marketplace は外部データを SQL で即購入。ダウンロード → 取り込みのフローが消える |
| 7 | ML は Snowpark + Notebooks(GPU)でデータ移動なし。生成AI は Cortex Functions / Analyst / Search |
| 8 | Streamlit + Native App でデータの近くにアプリ。Marketplace 配布で データ持ち出し不要 |
| 9 | Iceberg + Open Catalog で Snowflake/Spark/Trino/Flink/Dremio/StarRocks が共存。Apache 寄贈でコミュニティ標準化 |
| 10 | 国内では NTTデータ・京都銀行・西日本シティ銀行・JAバンク・JPX総研・NTTドコモ。社会インフラまで届いた |
効いている根本原理
本章では4原理がすべて顔を出した:
- 原理1(3層分離):ワークロード分離(ETL / BI / ML / Cortex 別 VWH)の前提
- 原理2(Consumption-based Pricing):使った分だけ課金、9ユースケースが共存できる経済モデル
- 原理3(コピーを作らない):Data Sharing / Marketplace / Iceberg は全部この派生
- 原理4(SQL から AI/Apps への拡張):ML / 生成AI / データアプリは全部この方向
次章では、2024-2026 に GA した最新機能(Cortex / Iceberg + Polaris / Dynamic Tables / Snowpipe Streaming / Snowflake Intelligence / Cortex Code)を機能側から詳しく見る。