Gemini 3.1 UltraのCode Execution機能とは|コード実行で計算結果を信用できるようになった

AI活用術

このページでわかること

  • Gemini 3.1 UltraのCode Execution機能の概要と使える場面
  • データ分析・文字列処理・可視化での活用Tips
  • 使う上での注意点と制限事項

Gemini 3.1 UltraにCode Executionが搭載された

Googleが今年リリースしたGemini 3.1 Ultra、200万トークンのコンテキストウィンドウがでかすぎて話題になってたようですが、個人的にもっと地味に便利だと思ってるのがCode Executionという機能です。

読んで字のごとく、モデルがPythonコードを書いてサンドボックス上で実際に実行してくれる機能です。「AIがコードを生成して動かす」自体は珍しくなくなってきてますが、Geminiの場合は会話の流れの中でシームレスにやってくれるのがポイントかなと。実行結果がすぐに返ってくるので、ローカル環境にいちいち手を動かさなくても検証できます。

Code Executionが活躍するシーン

データ集計・計算タスク

CSVっぽいデータを貼り付けて「月別の合計を出して」と言うと、Pythonコードを書いて実行し、その結果をそのまま返してくれます。今まではLLMに「計算は苦手なので怪しい」という前提があったんですが、実際にコードを実行して返してくれるのでハルシネーションの心配がかなり減ります。

余談ですが、LLMに四則演算させるのが怖くて毎回Wolfram Alphaに飛んでた時代が懐かしい。あれはあれで時間かかってたんですよね。

文字列処理・正規表現の検証

「このログのフォーマットから日付だけ抜き出す正規表現を書いて、ちゃんと動くか確認してほしい」みたいなリクエストも一発でこなしてくれます。コードが正しく動くことを確認した上で出力してくれるので、ローカルで試す前の一次検証として使いやすいです。

グラフ・データ可視化

matplotlibでグラフを生成させて画像で返してもらう、という使い方もできるっぽいです(自分はまだそこまで試せてないんですが)。コンテキストに数値データをドカッと食わせてビジュアライズ、という流れが完結するなら普通に業務で使えそうです。

Code Execution使用時の注意点

コードが実行されるのはサンドボックス環境で、実行時間の上限や利用できるライブラリの制限があります。なので、外部APIやネットワークにどこまで触れるかは、使っているGeminiの環境やプロダクト仕様に依存する感じです。あくまで「Geminiとの会話内で完結する計算・変換処理」という位置づけで使うのが無難かなと。

また、コード実行が走るぶん応答に少し時間がかかる場面があります。単純な質問のたびに実行されるわけじゃなく、モデルが「これは実行が必要だ」と判断したタイミングで走る感じです。その判断がたまにズレることもあるので、「実行しなくていいよ」と明示するプロンプトを書くのも手かもしれません。

※この記事にはプロモーションが含まれます

ちなみに、Aiarty Image Enhancer(AI画像高画質化ツール。ノイズ除去・8倍拡大に対応)も気になっています。Aiarty Image Enhancer

まとめ

Gemini 3.1 UltraのCode Execution機能、地味ですが個人的にはかなり刺さりました。「LLMの計算は信用できない」という前提が崩れてきてるのを感じます。データ集計・文字列処理・簡単なスクリプト検証あたりをAIに任せたい人は一度試してみる価値があると思います。

コンテキストが大きい環境とセットで使えば、大きめのログファイルをそのまま食わせて分析させる、みたいなことも現実的になってきます。Claude APIとの使い分けがまた難しくなってきた…という感じですが、それはまた別の話ですね。

参考になったらクリックしてもらえると嬉しいです!

Blogmura AIAI Ranking
タイトルとURLをコピーしました