OpenAI Responses APIのbuilt-in toolsで複雑なエージェント構築が1回のAPIで完結

Responses APIのbuilt-in toolsが地味にすごい
実装イメージ：最小構成でエージェントを動かす
o3 / o4-miniとの組み合わせが特に便利
どんな用途に向いてるか（試してみた感想）
まとめ

Responses APIのbuilt-in toolsが地味にすごい

最近、OpenAIのResponses APIにbuilt-in toolsが追加されたので試してみたんですが、これがなかなか面白かったので軽くまとめておきます。

built-in toolsとして今使えるのは、たとえばこんなものがあります。

web_search：最新情報をその場で検索してくれる
file_search：アップロードしたファイルをベクトル検索で参照する
computer_use：画面を見てブラウザやアプリを操作する（提供状況は環境・モデルによって異なる可能性があります）

これ単体で見ると「前からあったやつでは？」って思うかもしれないんですが、ポイントは1回のAPIコールの中で複数ツールを組み合わせて呼べるようになったことで、しかもo3やo4-miniはタスクに応じてツールを呼ぶタイミングを自己判断できるようになってます。検索が必要なら検索、ファイル参照が必要なら参照、という切り替えが自動で入ります。

そういえば、自分がAWS LambdaでOpenAIのAPIを叩くたびに「ツール呼び出しのループ処理、毎回同じコード書いてるな……」と感じていたので、これは素直に助かりました。

実装イメージ：最小構成でエージェントを動かす

Pythonだとざっくりこんな感じで書けます。

from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="o4-mini",
    tools=[
        {"type": "web_search"},
        {"type": "file_search", "vector_store_ids": ["vs_xxxxxxxx"]},
    ],
    input="最新のAWS Lambda料金を調べて、社内ドキュメントの利用方針と照らし合わせて教えて"
)

print(response.output_text)

これだけで「検索→ドキュメント参照→回答」という一連のフローが1回のAPIコールで完結します。以前はツール呼び出しのループ処理とステート管理を自前で書く必要があったので、コード量がかなり減る印象。