目次を表示する

Snowflake 入門 2026 ─ DWHから AI Data Cloud までの全体像

どんなユースケースで使われているか

第5章: どんなユースケースで使われているか

9つの代表ユースケース

第3部の最初の章として、「Snowflake が実際にどう使われているか」を整理する。1つのDWH製品なのに、ユースケースは大きく9つに分かれる。第6章(最新機能)と第7章(ベストプラクティス)の前提として、まずこの地図を持っておく。

9つの代表ユースケース

mindmap
  root((Snowflakeの<br/>9ユースケース))
    伝統的DWH領域
      中央DWH移行
      ELT基盤
    分析・可視化
      リアルタイム<br/>ダッシュボード
    データの流通
      Data Sharing
      Marketplace
    AI/ML系
      ML基盤
      生成AI<br/>(Cortex)
    プラットフォーム化
      データアプリ<br/>(Streamlit/Native App)
      Iceberg<br/>マルチエンジン共存

順に見ていく。

1. 中央DWH移行 ─ レガシーDWHからの脱出

最も伝統的かつ最も件数が多いユースケース。Teradata / Oracle / Netezza / Greenplum / SQL Server / Hadoop などのオンプレ DWH からの移行。

喜ばれている点

  • インフラ管理が消える(チューニング・パッチ・容量計画が不要に)
  • スケーリングが分単位(ノード追加が秒)
  • TCO の削減(Pfizer 公式事例で TCO 57%減

移行支援ツール(第9章で詳しく)

  • SnowConvert AI(2025 GA、無料化):Oracle / SQL Server / Teradata / Redshift / BigQuery / Greenplum / Sybase / Synapse / Netezza / Postgres / Databricks SQL に対応
  • スキーマ・procedure 変換、データ移行・検証まで一気通貫
  • AI 支援で従来数ヶ月→数週間に短縮、コスト30%減事例あり

代表事例

  • PayPal / Penske / Siemens / Guitar Center:レガシーDWH 移行成功(Snowflake 公式「Secrets of Snowflake Migration Success」)
  • Pfizer:Snowpark で処理4倍・TCO 57%減
  • 大手建材メーカー(米):Oracle ADW → Snowflake + Matillion、コスト30%減

2. ELT基盤 ─ モダンデータスタックの中心

Fivetran / Airbyte で取り込み → dbt で変換 → Snowflake で保管、いわゆるモダンデータスタックの中心。

graph LR
    Src[Source<br/>SaaS/RDB/Files] --> EL[Fivetran/Airbyte<br/>Extract & Load]
    EL --> Raw[Raw / Bronze]
    Raw --> Stg[Staging / Silver<br/>dbt + SQL]
    Stg --> Mart[Mart / Gold<br/>dbt + SQL]
    Mart --> BI[Tableau/Looker/PowerBI/Sigma]

喜ばれている点

  • near-infinite scale:Fivetran が大量データを load しても、Snowflake は VWH を増やせば済む
  • dbt との相性:Snowflake がデフォルトとして扱われている
  • Dynamic Tables(第3章・第6章)で増分パイプラインが宣言的に書ける

注意点(2025-10 ニュース)

Fivetran と dbt Labs が全株式合併(年商 約$600M)。「ELT は Fivetran、変換は dbt」のスタックがついに同じ会社の製品になった。今後は統合がより緊密になる一方、ベンダー集中リスクも意識する。

3. リアルタイムダッシュボード ─ Snowpipe Streaming で接近

「Snowflake はバッチ向き、リアルタイムは別ツール」と言われていた時代は終わった。Snowpipe Streaming 高性能アーキテクチャ(2025-09 GA) で:

指標数字
スループットテーブル毎 10 GB/秒
Ingest-to-query レイテンシ10秒未満
整合性PIPE オブジェクトで exactly-once
graph LR
    K[Kafka/Kinesis] --> SP[Snowpipe Streaming]
    SP --> T[(Snowflake Table)]
    T --> DT[Dynamic Tables<br/>差分集計]
    DT --> BI[Tableau/Sigma/PowerBI]
    Note[Latency<br/>< 10s] -.-> BI

喜ばれている点

  • 既存のSnowflakeにそのまま乗る(別製品に切り替える必要がない)
  • Dynamic Tables と組合せで「rawストリーム → 集計 → ダッシュボード」が宣言的に書ける
  • Tableau / Looker / Power BI / Sigma などBIツールのネイティブコネクタがある

サブ秒が必要なら依然 ClickHouse

本物のリアルタイム(サブ秒)が必要なログ分析・可観測性では、ClickHouse がまだ強い。Snowflake は「near-real-time(10秒前後)」のスイートスポット。

4. Data Sharing ─ コピーを作らないでデータを渡す

Snowflake が他DWHと最も差別化できる機能の1つ。Secure Data Sharing で、データをコピーせず、読み取り専用のライブ参照として組織間で共有できる。

仕組み

graph LR
    P[Provider Account<br/>本社] -->|Share| S{(Shared Data<br/>メタデータのみ)}
    S --> C1[Consumer Account<br/>子会社A]
    S --> C2[Consumer Account<br/>子会社B]
    S --> C3[Reader Account<br/>パートナー]
  • Provider が CREATE SHARE で公開、Consumer が CREATE DATABASE … FROM SHARE で参照
  • データの実体は Provider 側にあり、Consumer はメタデータ経由で読むだけ
  • Provider 側で更新すれば、即座に Consumer 側でも反映
  • Reader Account を発行すれば、Snowflake アカウントを持たない相手にも共有可

喜ばれている点

  • M&A 後の統合で、データ統合プロジェクトをスキップできる
  • 子会社・パートナー間で最新データが常に同期
  • 過剰権限のセキュリティリスクが低い(読み取り専用)

典型ユースケース

  • JPX 総研:証券会社向け取引データ配信(コピーなしで参照)
  • JAバンク:系統データ基盤
  • 金融機関グループ:本社 → 子会社への規制報告データ
  • 小売チェーン:本部 → 加盟店への売上・在庫データ

5. Data Marketplace ─ サードパーティデータをSQLで買う

Snowflake Marketplace で、天気・人口統計・金融市場・地理空間・広告データなどをSQLで即座に購入・参照できる。

流れ

  1. Marketplace で必要なデータセット(例:気象データ)を見つける
  2. 購入手続き(または無料データなら request)
  3. 自分のアカウント内で CREATE DATABASE FROM SHARE
  4. すぐ SELECT できる
-- 購入後すぐ使える
SELECT region, AVG(temperature_c) AS avg_temp
FROM weather_data.public.daily_temperature
WHERE date >= '2026-04-01'
GROUP BY region;

データを CSV でダウンロード → ロード → 更新追従 という従来のフローが消える。

喜ばれている点

  • 外部データを「ダウンロード → 取り込み」する手間がゼロ
  • 提供者側のアップデートが自動反映
  • マスターデータの一元管理(人口統計、地理空間など)

6. ML基盤 ─ Snowpark ML + Notebooks Container Runtime

Snowflake の上で機械学習モデルを訓練・推論する。

構成

graph TB
    D[(データ)] --> N[Snowflake Notebooks<br/>Container Runtime]
    N --> SM[Snowpark ML<br/>scikit-learn / xgboost / lightgbm]
    N --> GPU[GPU 訓練<br/>PyTorch / TensorFlow]
    SM --> Reg[Snowflake Model Registry]
    GPU --> Reg
    Reg --> Inf[推論<br/>SQL UDF / Snowpark]
    Inf --> A[(アプリ / BI)]

喜ばれている点

  • データ移動なし:データを Snowflake から取り出さず、データの近くで訓練・推論
  • GPU 訓練が Container Runtime で可能
  • モデルレジストリで版数管理
  • PREDICT を SQL UDF として呼べる

Pfizer の事例

Snowpark で処理4倍、TCO 57%減(公式 case study)。データを別環境にコピーせずに ML パイプラインを完結させたことが効いている。

7. 生成AI ─ Cortex でドキュメントQA・要約・RAG

第6章で詳しく扱うが、ここでもユースケースとして整理する。

Cortex の主な使い道

-- 要約
SELECT SNOWFLAKE.CORTEX.SUMMARIZE(comment) AS summary
FROM customer_feedback;

-- 翻訳
SELECT SNOWFLAKE.CORTEX.TRANSLATE(text, '', 'en') FROM articles;

-- センチメント分析
SELECT SNOWFLAKE.CORTEX.SENTIMENT(review) FROM reviews;

-- 任意の質問(COMPLETE)
SELECT SNOWFLAKE.CORTEX.COMPLETE(
  'mistral-large2',
  '次の問い合わせを3カテゴリ(請求・技術・要望)に分類: ' || ticket_text
) FROM tickets;

喜ばれている点

  • データを外部LLMに送らない:データはSnowflakeのガバナンス境界内
  • SQL から直接呼べる:別 API を立てる必要がない
  • Cortex Analyst:ビジネスユーザーが自然言語で質問 → SQL生成
  • Cortex Search:RAG用のマネージドハイブリッド検索

注意点(第8章のアンチパターン)

Cortex 関数を毎行で呼ぶとコストが爆発する。1クエリで $5,000 を消費した実例(11.8億行を処理)あり。バッチ処理 + 小型モデルでの実験 + COUNT_TOKENS 事前確認が公式推奨。

8. データアプリ ─ Streamlit + Native App

データの近くでアプリを動かす。

Streamlit in Snowflake

Pythonでデータアプリを書いて、Snowflake内でホストする。Container Runtime GA(2026-03-09)で GPU / 長時間実行サービスにも対応。

# streamlit_app.py(Snowflake 内で実行される)
import streamlit as st
from snowflake.snowpark.context import get_active_session

session = get_active_session()
df = session.sql("SELECT * FROM sales_summary").to_pandas()
st.line_chart(df.set_index('date')['revenue'])

Native App Framework

作ったアプリを Snowflake Marketplace で配布できる。購入者は自分のSnowflakeアカウント内でアプリを実行 ─ データ持ち出し不要だから、SaaS提供者にとっても顧客にとっても安全。

Marketplace には 90+ Native Apps がすでに登録されている(2026年時点)。

喜ばれている点

  • データアプリの dev → 本番が同じSnowflake内で完結
  • 認証・RBAC・監査が Snowflake のガバナンス層を再利用
  • アプリの配布先でデータを持ち出さない

9. Iceberg + マルチエンジン共存 ─ オープンレイクハウス

2024-10 の Apache Iceberg ネイティブ + Snowflake Open Catalog(旧 Polaris) GA で実現したユースケース。

構成

graph TB
    OC[Snowflake Open Catalog<br/>旧 Polaris<br/>Apache 寄贈]
    OC --> SF[Snowflake]
    OC --> SP[Apache Spark]
    OC --> TR[Trino]
    OC --> FL[Apache Flink]
    OC --> DR[Dremio]
    OC --> ST[StarRocks]
    SF --> S3[(S3 / Blob / GCS<br/>Iceberg/Delta)]
    SP --> S3
    TR --> S3
    FL --> S3
    DR --> S3
    ST --> S3

同じデータを、複数のエンジンが好きなように読める。Iceberg REST 仕様準拠で、Snowflakeの Horizon ガバナンス(RBAC / マスキング / Tag)も Iceberg にも適用される。

喜ばれている点

  • ベンダーロックインの懸念に正面から答える選択肢
  • 既存のSpark / Trino資産を捨てなくていい
  • データ移行・複製のコストがゼロ

Apache 寄贈の意味

Snowflake は Polaris Catalog を Apache Software Foundation に寄贈した(Apache Polaris incubating)。ベンダー独自仕様ではなくコミュニティ標準として育てる宣言。Databricks の Unity Catalog(自社所有)と対照的。

国内外の代表事例

事例を9ユースケース横断で整理する。Snowflake 公式 case study に裏取りできているもののみ列挙。

海外

事例ユースケース主な成果
Capital One中央DWH + ML + アプリ戦略パートナー、Capital One Slingshot として外販
PayPal / Penske / Siemens / Guitar CenterレガシーDWH移行Snowflake 公式「Secrets of Snowflake Migration Success」
PfizerML 基盤Snowpark で処理4倍・TCO 57%減
BlackRock中央DWHAladdin Data Cloud

国内

事例ユースケース主な成果
NTTデータパートナーAPJ Partner of the Year 4年連続
京都銀行(2024-05)金融機関基盤Service Innovation Core (SIC) on Snowflake
西日本シティ銀行(2025-04)金融機関基盤SIC on Snowflake
JAバンクデータ共有系統データ基盤
JPX総研データ配信証券会社向け取引データ配信
NTTドコモ分散・自律型データ活用DATA INSIGHT 2026-03
SBIホールディングス AlpacaTech(2025-04)パートナーSnowflake SELECT パートナー認定

金融・社会インフラまで届いた段階で、もはや「新興DWH」ではない。

本章の要点

#要点
1Snowflake のユースケースは大きく9つ:中央DWH / ELT / リアルタイム / Data Sharing / Marketplace / ML / 生成AI / データアプリ / Iceberg共存
2中央DWH移行は SnowConvert AI でレガシー(Teradata/Oracle/Redshift/BigQuery)から数週間レベルに短縮
3ELT は Fivetran + dbt + Snowflake が定番。2025-10 に Fivetran と dbt Labs が合併
4Snowpipe Streaming 高性能アーキテクチャで 10秒未満レイテンシ。サブ秒は依然 ClickHouse
5Data Sharing はコピーなしの組織間共有。Snowflake が他DWHと最も差別化できる機能
6Marketplace は外部データを SQL で即購入。ダウンロード → 取り込みのフローが消える
7ML は Snowpark + Notebooks(GPU)でデータ移動なし。生成AI は Cortex Functions / Analyst / Search
8Streamlit + Native App でデータの近くにアプリ。Marketplace 配布で データ持ち出し不要
9Iceberg + Open Catalog で Snowflake/Spark/Trino/Flink/Dremio/StarRocks が共存。Apache 寄贈でコミュニティ標準化
10国内では NTTデータ・京都銀行・西日本シティ銀行・JAバンク・JPX総研・NTTドコモ。社会インフラまで届いた

効いている根本原理

本章では4原理がすべて顔を出した:

  • 原理1(3層分離):ワークロード分離(ETL / BI / ML / Cortex 別 VWH)の前提
  • 原理2(Consumption-based Pricing):使った分だけ課金、9ユースケースが共存できる経済モデル
  • 原理3(コピーを作らない):Data Sharing / Marketplace / Iceberg は全部この派生
  • 原理4(SQL から AI/Apps への拡張):ML / 生成AI / データアプリは全部この方向

次章では、2024-2026 に GA した最新機能(Cortex / Iceberg + Polaris / Dynamic Tables / Snowpipe Streaming / Snowflake Intelligence / Cortex Code)を機能側から詳しく見る。