第1章: Snowflake とは何か ─ AI Data Cloud までの来歴
第1部の最初の章として、Snowflake が「何を解こうとして生まれたのか」「いまどこにいるのか」を整理する。具体的なアーキテクチャは第2章、独自概念は第3章で扱う。本章はその前提となる設計思想と歴史的経緯を押さえる。
創業 ─ なぜクラウド前提のカラムナDWHを作ろうとしたのか
Snowflake は 2012年7月、米国カリフォルニア州サンマテオで3名のエンジニアによって設立された。
| 創業者 | 出身 | 持ち込んだもの |
|---|---|---|
| Benoît Dageville | Oracle のデータアーキテクト | エンタープライズDWHの実装ノウハウ |
| Thierry Cruanes | Oracle のデータアーキテクト | クエリ最適化・並列処理 |
| Marcin Żukowski | カラムナDB「Vectorwise」共同創業者 | カラムナ実行エンジンの設計 |
3名の出自がそのまま「クラウド前提のカラムナDWH」という設計思想に直結している。
当時(2012年)、データウェアハウスの主流は Teradata、Netezza、Oracle Exadata などのオンプレ・専用ハードウェアだった。Amazon Redshift がクラウドDWHとして登場したのもちょうど2012年だが、Redshift はストレージとコンピュートが密結合したクラスター型だった。
3名は次の問いを立てた:「もし、ストレージとコンピュートを完全に切り離して、それぞれ独立にスケールさせたらどうなるか?」
答えは「同じデータに、互いに干渉しない複数の処理クラスターが同時にアクセスできる」だった。これが第2章で扱う3層分離アーキテクチャの出発点であり、Snowflake が他の DWH と決定的に違う理由になっている。
シードラウンドは Sutter Hill Ventures の Mike Speiser が初代CEO兼出資者として5百万ドルでリード。製品の一般提供は2014年から始まった。
IPO(2020年9月)─ 史上最大級のソフトウェアIPO
Snowflakeは 2020年9月16日、ニューヨーク証券取引所に SNOW ティッカーで上場した。
| 項目 | 数字 |
|---|---|
| 公開価格 | 120ドル |
| 初日終値 | 254ドル(+112%) |
| 調達額 | 34億ドル超 |
| 当日時価総額 | 約700億ドル |
当時史上最大級のソフトウェアIPOとして記録された。Berkshire Hathaway と Salesforce が事前にプライベート購入したことでも話題になり、Warren Buffet が「テックIPO参加は珍しい」と業界紙が騒いだ。
呼称の変遷 ─ 同じ製品が3度名前を変えた
Snowflake は製品の中身を進化させながら、自社の呼び方を3度大きく変えている。
timeline
title Snowflakeの呼称変遷
2012-2018 : Cloud Data Warehouse
: (Redshift対抗の純粋なDWH)
2019-2021 : Data Cloud
: (Data Sharing / Marketplace で「DWH」を超える)
2023- : AI Data Cloud
: (Cortex AI / Snowpark / Native App)
Cloud DWH時代(2012-2018):純粋に「クラウド上でカラムナDWHを動かす」プロダクト。Redshift・BigQuery と直接競合。
Data Cloud時代(2019-2021):「Snowflake Data Sharing」(2018-)、「Snowflake Data Marketplace」(2019-)で「コピーを作らずにデータを組織間で共有する」コンセプトを打ち出し、単なるDWHから「データプラットフォーム」へ位置づけが変わった。IPO もこの呼称のとき。
AI Data Cloud時代(2023-):Snowpark(Python/Java/Scala の埋め込み実行)、Snowflake Cortex AI(LLM 関数)、Native App Framework(Snowflakeをアプリ配信プラットフォームに)が出揃い、「データの近くで何でもやる」プラットフォームへ完成形の輪郭を描いた。
呼称変遷の各段階で、Snowflake は新機能を「オプション」ではなく「製品の中核」として位置づけ直してきた。だから2025年の「Snowflake」と2018年の「Snowflake」は、同じ名前でも全く違う製品として認識する必要がある。
いま(FY2026)の Snowflake ─ 業績で見る現在地
「はじめに」で示した数字を、ここでもう一度しっかり並べる。
FY2026 Q4(2026年1月期)
- 製品売上 $1.226B(YoY +30%)
- RPO(残存契約額)$9.77B(YoY +42%)─ record $400M 契約を含む
- Net Revenue Retention 125%
- $1M+ 顧客 733社、Forbes Global 2000 顧客 790社
FY2026 通期
- 製品売上 $4.47B(YoY +29%)
- FY2027 ガイダンス $5.66B(+27%)
AI関連の比率
- Q3 ブッキングの 50%が AI 関連
- 顧客調査では「72%が今年中に自律AI実装を予定」(2025年)
成長率がIPO直後(FY2021 +124%)と比べると鈍化したように見えるが、絶対額が桁違いに大きくなったうえで**+30% 維持**は珍しい。AI 機能群(Cortex Agents / AI Functions / Snowflake Intelligence / Cortex Code)の GA が立て続けに来た2025年下半期から、再加速の兆候がある。
なぜ今流行っているのか ─ 複合要因の整理
「最近Snowflakeの話をよく聞くようになった」という感覚には、複数の要因が同時に効いている。
mindmap
root((なぜ今<br/>流行っているか))
AI機能の出揃い
Cortex AI Functions
Cortex Agents GA 2025-11
Snowflake Intelligence
Cortex Code
オープン化戦略
Iceberg ネイティブ対応
Open Catalog (Polaris)
Apache 寄贈
開発者プラットフォーム化
Snowpark Container Services
Notebooks
Streamlit in Snowflake
Native App Framework
エコシステム再編
dbt + Fivetran 合併
モダンデータスタックの統合
エンタープライズ採用
金融・小売・製造の事例蓄積
国内大手の本格導入
成長率の再加速
AI関連がブッキング50%
RPO YoY +42%
それぞれを軽く解説する:
(a) AI機能が一気に GA
- Cortex AI Functions(COMPLETE / SUMMARIZE / TRANSLATE / SENTIMENT / EMBED 等)
- Cortex Agents(自律エージェント、MCP連携)
- Snowflake Intelligence(自然言語BI)
- Cortex Code(AIコーディングエージェント)
2025-11-04 に主要な3つが同日 GA したことが象徴的。「いつかGAしたら使う」の段階から「いま使える」段階へ移った。
(b) オープン化戦略
- 2024-10-18 Apache Iceberg ネイティブ対応 + Snowflake Open Catalog GA
- Open Catalog(旧 Polaris Catalog)を Apache Software Foundation に寄贈
「Snowflake にロックインされる」という長年の懸念に対する正面からの回答。Spark、Trino、Flink、Dremio などが同じデータを共有して使える。
(c) 開発者プラットフォーム化
- Snowpark Container Services(任意コンテナ実行、GPU対応)
- Snowflake Notebooks(Jupyter互換、Container Runtime)
- Streamlit in Snowflake(データアプリホスティング)
- Native App Framework(Marketplace でアプリ配布)
「Snowflake にデータを出し入れする」のではなく「Snowflake の中で全部やる」が現実的になってきた。
(d) モダンデータスタックの統合
- 2025-10-13 Fivetran と dbt Labs が全株式合併(年商約 $600M)
- 「ELT は Fivetran、変換は dbt、保管は Snowflake」というスタック自体が再編フェーズ
(e) エンタープライズ採用の深化
- 国内:NTTデータが APJ Partner of the Year 4年連続、京都銀行(2024-05)、西日本シティ銀行(2025-04)、JAバンク、JPX総研、NTTドコモが採用
- 海外:Capital One、PayPal、Penske、Siemens、Pfizer(処理4倍・TCO 57%減)、BlackRock(Aladdin Data Cloud)
金融・社会インフラまで届いた段階で、もはや「新興DWH」ではない。
ライバルとの位置関係
第4章で詳しく比較するが、現時点での相対的位置を簡潔に書く。
| 関係 | プレイヤー | 一言で |
|---|---|---|
| 直接競合 | Databricks | 旧来「DWH=Snowflake / Lakehouse=Databricks」の棲み分けは2025年で消滅。両者ともIceberg + 自社カタログでオープン化、機能収束フェーズ |
| クラウド純正 | BigQuery(GCP)/ Redshift(AWS)/ Fabric(Azure) | 各クラウド前提なら強い。マルチクラウド要件があるとSnowflakeへ |
| 軽量・特化 | DuckDB / ClickHouse | 個人・小チーム / リアルタイム特化。Snowflakeの代替ではなく補完 |
旧来の業界地図は「DWH vs Lakehouse」だったが、2025年以降は「両者ともIceberg対応のオープンレイクハウスを名乗り、上に AI / アプリ / エージェント機能を積む」という同じ方向に収束している。
本章の要点
| # | 要点 |
|---|---|
| 1 | Snowflake は2012年創業、Oracle出身2名 + Vectorwise創業者の3名による設計。「ストレージとコンピュートを完全に切り離す」がコア発想 |
| 2 | 2020-09 IPO で史上最大級のソフトウェアIPO(調達 $3.4B超) |
| 3 | 呼称は 2012-2018 Cloud DWH → 2019-2021 Data Cloud → 2023- AI Data Cloud と3段階で進化、それぞれの段階で製品の中核機能が変わった |
| 4 | FY2026 通期 製品売上 $4.47B(+29%)、RPO $9.77B、AI関連が Q3 ブッキングの50% |
| 5 | 流行っている理由は複合:AI機能GA / オープン化(Iceberg+Polaris)/ 開発者プラットフォーム化 / モダンデータスタック統合 / エンタープライズ採用深化 |
| 6 | Databricksとは機能収束フェーズ。クラウド純正DWH(BigQuery/Redshift/Fabric)とはマルチクラウド要件で住み分け |
効いている根本原理
本章は 原理1(3層分離) と 原理3(コピーを作らない) が中心 ─ 創業からの設計思想が、20年経ってもそのままプロダクトの差別化要因として機能していることを確認した。次章では、その3層分離アーキテクチャを技術的に分解する。