目次を表示する

Snowflake 入門 2026 ─ DWHから AI Data Cloud までの全体像

2024-2026 の最新機能 ─ Cortex / Iceberg / Polaris / Snowpipe Streaming

第6章: 2024-2026 の最新機能

2024-2026 主要機能GAタイムラインとCortexスタック

第5章で9つのユースケースを地図として描いた。本章では、その地図を支えている2024-2026 の最新機能を1つずつ深掘りする。なぜここに章を割くかというと、「2年前のSnowflake」の知識でいると半分くらい間違うほど、この期間に大きな変化が起きたからだ。

主要な GA タイムライン:

timeline
    title 2024-2026 主要機能GA
    2024-06 : Polaris Catalog 発表
    2024-10-18 : Iceberg ネイティブ + Open Catalog GA
    2024-Q4 : Dynamic Tables GA
    2025-02 : SPCS Azure GA
    2025-08 : SPCS GCP GA
    2025-09-23 : Snowpipe Streaming 高性能 GA (AWS)
    2025-11-04 : Cortex Agents / AI Functions / Snowflake Intelligence GA
    2025-11 : Cortex Code 発表
    2026-03-09 : Streamlit Container Runtime GA
    2026-04 : Cortex AI Credits 切替

順に見ていく。

Cortex AI ─ Snowflake の AI スタック

Snowflake の AI 機能は Cortex ブランドに統合されている。SQL や Python から関数として呼べる。

Cortex AI Functions

LLM 機能をSQL関数として提供する。GA 2025-11-04(一斉GA)。

関数用途
COMPLETE任意のプロンプト → 応答
SUMMARIZE要約
TRANSLATE翻訳
SENTIMENTセンチメント分析
EXTRACT_ANSWERコンテキストから質問への回答抽出
EMBED_TEXT_768 / EMBED_TEXT_1024埋め込みベクトル生成
AI_CLASSIFY分類(2025-11 新版GA)
AI_TRANSCRIBE音声→テキスト
AI_SIMILARITY類似度計算
-- 例:問い合わせを5カテゴリに分類
SELECT
  ticket_id,
  AI_CLASSIFY(
    body,
    ARRAY_CONSTRUCT('billing', 'technical', 'feature_request', 'complaint', 'other')
  ) AS category
FROM tickets;

モデルラインナップ

  • Mistral Large、Mistral 7B
  • Meta Llama 3.x、Llama 4
  • Google Gemini
  • Anthropic Claude(プレビュー)
  • OpenAI GPT-5.2(2026年に Snowflake と $200M 提携で利用可能に
  • Snowflake Arctic(自社モデル)

価格(2026-04 の大変更)

2026年4月から AI Credits(edition 非依存・$2.00/credit 固定)に分離された。Generative 系は input + output 両方トークン課金、モデル別に:

  • 大型(Claude-4-opus 級):12 credits / M tokens
  • 中型:数 credits / M tokens
  • 小型:数分の1 credit

これによりAIコストを通常のVWHコストから分離して可視化できるようになった。

Cortex Analyst ─ NL2SQL

ビジネスユーザーが自然言語で質問 → SQL 生成 → 結果を返す。Semantic View を経由するため、データはガバナンス境界を出ない。

-- Semantic View を定義
CREATE SEMANTIC VIEW sales_semantic
  TABLES (orders, customers, products)
  RELATIONSHIPS (...)
  METRICS (total_revenue = SUM(orders.amount));

-- Cortex Analyst が自然言語クエリを SQL に変換
-- ユーザー入力:"今月の地域別売上トップ5を見せて"
-- → 自動で SQL 生成・実行

社内 BI ツールに Cortex Analyst を組み込めば、SQL を書けない営業・マーケが直接データに聞ける

Cortex Search ─ RAG用ハイブリッド検索

ベクトル + キーワードのハイブリッド検索をマネージドサービスとして提供。RAG(Retrieval-Augmented Generation)で社内ドキュメントQA を作るときの中核。

-- 検索サービスを作る
CREATE CORTEX SEARCH SERVICE company_docs
  ON content
  ATTRIBUTES title, department
  WAREHOUSE = search_wh
  TARGET_LAG = '1 hour'
  AS SELECT title, content, department FROM internal_docs;

-- 検索 + COMPLETE で RAG
WITH retrieved AS (
  SELECT * FROM TABLE(
    company_docs.SEARCH_PREVIEW(
      QUERY => 'リモートワーク制度について教えて',
      COLUMNS => ['title', 'content'],
      LIMIT => 5
    )
  )
)
SELECT SNOWFLAKE.CORTEX.COMPLETE(
  'mistral-large2',
  '次の社内ドキュメントを参考に回答してください: ' ||
  LISTAGG(content, '\n\n') ||
  '\n\n質問: リモートワーク制度について教えて'
) FROM retrieved;

Dynamic Tables 同等のリフレッシュ特性で、ドキュメントが更新されたら自動で検索インデックスも更新される。

Cortex Agents / Snowflake Intelligence(GA 2025-11-04)

**エージェント型エンタープライズの「コントロールプレーン」**を標榜する最新機能。

機能内容
MCP連携Gmail / Salesforce / Jira / Slack / Google Docs と接続
Skills自然言語のマルチステップ自動化
Mobile Appスマホから Snowflake Intelligence を使う(プレビュー)
Artifacts分析結果を共有
Deep Research複数ソース横断の長尺調査

「Snowflake が社内データのコントロールプレーンになる」という戦略的位置づけ。Cortex Analyst(NL2SQL)+ Cortex Search(RAG)+ ツール群(MCP)を Cortex Agents がオーケストレーションする。

Cortex Code(2025-11発表)

エンタープライズデータコンテキストを理解する AIコーディングエージェント

  • VS Code拡張、Claude Codeプラグイン(プレビュー)
  • AWS Glue / Databricks / Postgres など外部データソースも理解
  • MCP / ACP(Agent Communication Protocol)対応
  • 発表時点で Snowflake 顧客の50%以上が利用

「コードを書きながら、社内データのスキーマやセマンティクスを Cortex Code が把握している」状態を作る。

Apache Iceberg + Open Catalog(旧 Polaris)

Snowflake のオープン化戦略の中核

Iceberg ネイティブテーブル(GA 2024-10-18)

Apache Iceberg 形式のテーブルを Snowflake のテーブルとして扱える。S3 / Blob / GCS 上に Iceberg として保管され、他のエンジン(Spark / Trino / Flink)からも同じデータを読める

-- Snowflake-managed Iceberg テーブル(性能最適)
CREATE ICEBERG TABLE orders_iceberg (
  order_id NUMBER,
  customer_id NUMBER,
  amount NUMBER
)
EXTERNAL_VOLUME = 'my_s3_volume'
CATALOG = 'SNOWFLAKE'
BASE_LOCATION = 'orders/';

-- Externally-managed Iceberg テーブル(他エンジン主軸)
-- 2025-10 から書き込みもGA
CREATE ICEBERG TABLE orders_external (
  ...
)
EXTERNAL_VOLUME = 'my_s3_volume'
CATALOG = 'my_catalog_integration'
CATALOG_TABLE_NAME = 'orders';

Snowflake Open Catalog(旧 Polaris Catalog)

GA 2024-10-18。Apache Software Foundation に Apache Polaris incubating として寄贈済み

  • Iceberg REST 仕様準拠
  • Iceberg + Delta Lake 両対応(2025)
  • Spark / Flink / Trino / Dremio / StarRocks と相互運用
  • Snowflake Horizon の RBAC / マスキング / Tag が Iceberg にも適用可能
graph TB
    OC[Snowflake Open Catalog<br/>旧 Polaris<br/>Apache 寄贈]
    OC --> SF[Snowflake]
    OC --> SP[Apache Spark]
    OC --> TR[Trino]
    OC --> FL[Apache Flink]
    SF --> S3[(S3 / Iceberg)]
    SP --> S3
    TR --> S3
    FL --> S3
    H[Horizon ガバナンス] --> OC

これにより「Snowflake にロックインされる」という長年の懸念に対する正面からの回答ができた。Databricks の Unity Catalog(自社所有)と対照的に、Snowflake はコミュニティ標準化に賭けている。

Dynamic Tables ─ 宣言的データパイプライン

GA 2024-Q4。「目標鮮度(target lag)を指定すれば、Snowflake が裏で差分リフレッシュする」マテリアライズ機構。

-- 5分以内の鮮度を保つ集計テーブル
CREATE OR REPLACE DYNAMIC TABLE customer_stats
  TARGET_LAG = '5 minutes'
  WAREHOUSE = mart_wh
AS
  SELECT
    customer_id,
    COUNT(*) AS total_orders,
    SUM(amount) AS total_revenue,
    MAX(order_date) AS last_order_date
  FROM orders
  WHERE order_date >= DATEADD(year, -1, CURRENT_DATE())
  GROUP BY customer_id;

Streams + Tasks との関係

第3章で見た Streams + Tasks の組合せを、Dynamic Tables が置き換える位置づけになりつつある。

観点Streams + TasksDynamic Tables
記述スタイル命令的(手続き)宣言的(SQL)
ロジック分離別オブジェクト単一オブジェクト
増分処理手動自動
複雑分岐 / API呼び出し
Sub-minute latency◎(手動制御)△(最低 1 分)
推奨上記が必要なときのみ新規開発のデフォルト

2025年のアップデート

  • 2025-05:時刻フィルタ対応
  • 2025-09:Cortex AI Functions のインクリメンタルリフレッシュ対応

Dynamic Tables の中で Cortex を呼ぶ」が現実的になった。ストリームに対する継続的な要約・分類・センチメント分析が宣言的に書ける。

Snowpipe Streaming 高性能アーキテクチャ

GA 2025-09-23(AWS)/ 2025-11(Azure・GCP)。

スペック

  • スループット:テーブル毎 10 GB/秒
  • Ingest-to-query:10秒未満
  • 整合性:PIPE オブジェクトで exactly-once

旧 Snowpipe Streaming(行単位 API)から、PIPE オブジェクトベースの新アーキテクチャへ。Apache Kafka 連携も KAFKA_CONNECTOR_VERSION=2 で統一。

-- PIPE オブジェクトを定義
CREATE PIPE my_streaming_pipe
  AS COPY INTO orders
  FROM @my_stage
  FILE_FORMAT = (TYPE = 'JSON');

-- 外部から Snowflake Streaming Ingest API で行をプッシュ
-- → ingest-to-query 10秒未満で SELECT 可能になる

Openflow(Summit 2025発表)

Apache NiFi ベースのマネージド多モーダル取り込み。SharePoint / Slack / Google Drive / 主要RDBMS から取り込み、ストリーミング 10GB/s、レイテンシ5秒。

Snowpipe Streaming は API、Openflow は GUI/コネクタ」と覚えると整理しやすい。

Snowpark Container Services(SPCS)

任意コンテナを Snowflake 内で実行できる。

進化時期
AWS GA既に
Azure GA2025-02
GCP GA2025-08
インスタンスコスト50%削減2025
-- Service を作る
CREATE SERVICE my_app
  IN COMPUTE POOL my_gpu_pool
  FROM SPECIFICATION_FILE='@stage/spec.yaml';

GPU プール対応で、ML / 推論 / 任意のWebサービスを Snowflake 内に置ける。Streamlit / Notebooks / Native App のバックエンドにも内部で使われている

Snowflake Notebooks

Jupyter互換。2025年に**Warehouse Runtime(SQL/軽量Python)Container Runtime(GPU/ML/分散学習)**が両方GA。Notebooks in Workspaces(2025-12-16プレビュー)で開発体験統合。

# Notebook セル例
from snowflake.snowpark.context import get_active_session
session = get_active_session()

df = session.sql("SELECT * FROM customer_stats WHERE total_orders > 10").to_pandas()
df.plot(x='last_order_date', y='total_revenue', kind='scatter')

データ・モデル・コードが同じ場所にある状態が標準になった。

Streamlit in Snowflake / Native App Framework

第5章でも触れたが、Container Runtime GA(2026-03-09)以降は長時間実行サービスにも対応。Marketplaceには 90+ Native Apps が登録済み。

まとめ表 ─ 2024-2026 機能群とユースケース対応

機能主に効くユースケースGA
Cortex AI Functions生成AI、ML2025-11-04
Cortex AnalystBI、NL2SQL2025-11-04
Cortex SearchRAG、ドキュメントQA(継続GA)
Cortex Agentsエージェント、自動化2025-11-04
Cortex Code開発支援2025-11発表
Snowflake IntelligenceNL BI、Mobile2025-11-04
Iceberg + Open Catalogオープンレイクハウス2024-10-18
Dynamic TablesELT、ストリーミング2024-Q4
Snowpipe Streaming v2リアルタイム取り込み2025-09-23
Openflowコネクタ取り込み2025-Q3
SPCS GCPコンテナ実行2025-08
Streamlit Container Runtimeデータアプリ2026-03-09
AI Credits 切替コスト管理2026-04

本章の要点

#要点
1Cortex AI Functions / Analyst / Search / Agents / Snowflake Intelligence が 2025-11-04 一斉GA。AI機能が「いつか使える」から「いま使える」段階へ
2Cortex Code は2025-11発表、顧客の50%以上が利用
3Cortex AI Credits(2026-04)でAIコストを通常VWHから分離可視化
4Apache Iceberg + Open Catalog(旧Polaris)GA 2024-10-18、Apache 寄贈でコミュニティ標準化に賭けた
5Dynamic Tables が新規開発のデフォルト。Streams + Tasks は sub-minute / 複雑分岐のみに残す
6Snowpipe Streaming 高性能GA で 10秒未満レイテンシ、テーブル毎10GB/秒
7SPCS / Notebooks / Streamlit / Native App でデータの近くにアプリを置ける
82024-2026 の機能群は4原理にきれいにマップ:3層分離(SPCS)、Pricing(AI Credits)、コピーなし(Iceberg / Dynamic Tables)、SQL→AI/Apps(Cortex全般)

効いている根本原理

本章は 原理4(SQL から AI / Apps への拡張) が最も濃く効いた章だった。Cortex / SPCS / Streamlit / Native App / Cortex Code はすべて「データの近くで全部やる」という戦略の現出。原理3(コピーを作らない) は Iceberg + Open Catalog / Dynamic Tables で、原理2(Pricing) は AI Credits 切替で、原理1(3層分離) は SPCS の独立 compute pool で姿を見せた。

次章では、これらの機能を実運用に落とすときのベストプラクティスを扱う。