Azure OpenAI チャット

ChatGPT を搭載した Azure の OpenAI 製品は、従来の OpenAI 機能を超え、強化された機能を備えた AI 駆動型テキスト生成を提供します。Azure は、最近のアップデートで強調されているように、追加の AI 安全性と責任ある AI 機能を提供します。

Azure は、Azure 上の Vector ストアなどの AI 関連リソースを含む一連の Azure サービスと AI を統合することで、Java 開発者に AI の可能性を最大限に活用する機会を提供します。

前提条件

Azure OpenAI クライアントには、Azure API キーを使用するか、OpenAI API キーを使用するか、Microsoft Entra ID を使用するかの 3 つの接続オプションがあります。

Azure API キーとエンドポイント

API キーを使用してモデルにアクセスするには、Azure ポータル (英語) の Azure OpenAI サービスセクションから Azure、OpenAI、endpoint、api-key を取得します。

Spring AI は 2 つの構成プロパティを定義します。

spring.ai.azure.openai.api-key: これを Azure から取得した API Key の値に設定します。
spring.ai.azure.openai.endpoint: Azure でモデルをプロビジョニングするときに取得したエンドポイント URL に設定します。

application.properties または application.yml ファイルで次の構成プロパティを設定できます。

spring.ai.azure.openai.api-key=<your-azure-api-key>
spring.ai.azure.openai.endpoint=<your-azure-endpoint-url>

API キーなどの機密情報を扱う際のセキュリティを強化するために、Spring 式言語 (SpEL) を使用してカスタム環境変数を参照できます。

# In application.yml
spring:
  ai:
    azure:
      openai:
        api-key: ${AZURE_OPENAI_API_KEY}
        endpoint: ${AZURE_OPENAI_ENDPOINT}

# In your environment or .env file
export AZURE_OPENAI_API_KEY=<your-azure-openai-api-key>
export AZURE_OPENAI_ENDPOINT=<your-azure-openai-endpoint-url>

OpenAI キー

OpenAI サービス (Azure ではない) で認証するには、OpenAI API キーを指定します。これにより、エンドポイントが自動的に api.openai.com/v1 (英語) に設定されます。

この方法を使用する場合は、spring.ai.azure.openai.chat.options.deployment-name プロパティを、使用する OpenAI モデル (英語) の名前に設定します。

アプリケーション構成では次のようになります。

spring.ai.azure.openai.openai-api-key=<your-azure-openai-key>
spring.ai.azure.openai.chat.options.deployment-name=<openai-model-name>

SpEL で環境変数を使用する:

# In application.yml
spring:
  ai:
    azure:
      openai:
        openai-api-key: ${AZURE_OPENAI_API_KEY}
        chat:
          options:
            deployment-name: ${AZURE_OPENAI_MODEL_NAME}

# In your environment or .env file
export AZURE_OPENAI_API_KEY=<your-openai-key>
export AZURE_OPENAI_MODEL_NAME=<openai-model-name>

マイクロソフトエントラ ID

Microsoft Entra ID (旧称 Azure Active Directory) を使用したキーレス認証の場合は、上記の api-key プロパティではなく、spring.ai.azure.openai.endpoint 構成プロパティのみを設定します。

エンドポイントプロパティのみを検索すると、アプリケーションは資格情報を取得するためのいくつかの異なるオプションを評価し、トークン資格情報を使用して OpenAIClient インスタンスが作成されます。

TokenCredential Bean を作成する必要はなくなりました。自動的に構成されます。

デプロイ名

Azure AI アプリケーションを使用するには、Azure AI ポータル (英語) を介して Azure AI デプロイを作成する必要があります。Azure では、各クライアントが Deployment Name を指定して Azure OpenAI サービスに接続する必要があります。Deployment Name は、デプロイするモデルとは異なることに注意してください。例: 'MyAiDeployment' という名前のデプロイは、GPT 3.5 Turbo モデルまたは GPT 4.0 モデルのいずれかを使用するように構成できます。

まず、次の手順に従って、デフォルト設定でデプロイを作成します。

Deployment Name: `gpt-4o`
Model Name: `gpt-4o`

この Azure 構成は、Spring Boot Azure AI スターターとその自動構成機能のデフォルト構成と一致しています。別のデプロイ名を使用する場合は、それに応じて構成プロパティを更新してください。

spring.ai.azure.openai.chat.options.deployment-name=<my deployment name>

Azure、OpenAI、OpenAI の異なるデプロイ構造により、Azure、OpenAI クライアントライブラリに deploymentOrModelName というプロパティが作成されます。これは、OpenAI には Deployment Name がなく、Model Name のみがあるためです。

プロパティ spring.ai.azure.openai.chat.options.model の名前が spring.ai.azure.openai.chat.options.deployment-name に変更されました。

spring.ai.azure.openai.openai-api-key=<Your OpenAI Key> プロパティを設定して、Azure OpenAI ではなく OpenAI に接続する場合、spring.ai.azure.openai.chat.options.deployment-name は OpenAI モデル (英語) 名として扱われます。

OpenAI モデルにアクセス

デプロイされた Azure OpenAI モデルの代わりに、OpenAI を直接使用するようにクライアントを構成できます。このために、spring.ai.azure.openai.api-key=<Your Azure OpenAi Key> の代わりに spring.ai.azure.openai.openai-api-key=<Your OpenAI Key> を設定する必要があります。

リポジトリと BOM の追加

Spring AI アーティファクトは、Maven Central リポジトリと Spring スナップショットリポジトリに公開されています。これらのリポジトリをビルドシステムに追加するには、アーティファクトリポジトリセクションを参照してください。

依存関係の管理を支援するために、Spring AI は BOM (部品表) を提供し、一貫したバージョンの Spring AI がプロジェクト全体で使用されるようにします。Spring AI BOM をビルドシステムに追加するには、"依存関係管理" セクションを参照してください。

自動構成

Spring AI 自動構成、スターターモジュールのアーティファクト名に大きな変更がありました。詳細については、アップグレードノートを参照してください。

Spring AI は、Azure OpenAI チャットクライアント用の Spring Boot 自動構成を提供します。これを有効にするには、プロジェクトの Maven pom.xml または Gradle build.gradle ビルドファイルに次の依存関係を追加します。

Maven
Gradle

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-starter-model-azure-openai</artifactId>
</dependency>

dependencies {
    implementation 'org.springframework.ai:spring-ai-starter-model-azure-openai'
}

Spring AI BOM をビルドファイルに追加するには、"依存関係管理" セクションを参照してください。

Azure OpenAI チャットクライアントは、Azure SDK によって提供される OpenAI クライアントビルダー [GitHub] (英語) を使用して作成されます。Spring AI では、AzureOpenAIClientBuilder カスタマイザー [GitHub] (英語) Bean を提供することでビルダーをカスタマイズできます。

カスタマイザーは、たとえばデフォルトのレスポンスタイムアウトを変更するために使用できます。

@Configuration
public class AzureOpenAiConfig {

	@Bean
	public AzureOpenAIClientBuilderCustomizer responseTimeoutCustomizer() {
		return openAiClientBuilder -> {
			HttpClientOptions clientOptions = new HttpClientOptions()
					.setResponseTimeout(Duration.ofMinutes(5));
			openAiClientBuilder.httpClient(HttpClient.createDefault(clientOptions));
		};
	}

}

チャットのプロパティ

プレフィックス spring.ai.azure.openai は、Azure OpenAI への接続を構成するプロパティプレフィックスです。

プロパティ説明デフォルト

プロパティ	説明	デフォルト
spring.ai.azure.openai.api-key	`Resource Management` の Azure AI OpenAI `Keys and Endpoint` セクションのキー	-
spring.ai.azure.openai.endpoint	`Resource Management` の Azure AI OpenAI `Keys and Endpoint` セクションからのエンドポイント	-
spring.ai.azure.openai.openai-api-key	（Azure 以外）OpenAI API キー。Azure または OpenAI ではなく、OpenAI サービスの認証に使用します。これにより、エンドポイントは自動的に api.openai.com/v1 (英語) に設定されます。`api-key` または `openai-api-key` プロパティを使用してください。この設定では、`spring.ai.azure.openai.chat.options.deployment-name` は OpenAi モデル (英語) 名として扱われます。	-
spring.ai.azure.openai.custom-headers	API リクエストに含めるカスタムヘッダーのマップ。マップ内の各エントリはヘッダーを表します。キーはヘッダー名、値はヘッダー値です。	空の地図

spring.ai.azure.openai.api-key

Resource Management の Azure AI OpenAI Keys and Endpoint セクションのキー

spring.ai.azure.openai.endpoint

Resource Management の Azure AI OpenAI Keys and Endpoint セクションからのエンドポイント

spring.ai.azure.openai.openai-api-key

（Azure 以外）OpenAI API キー。Azure または OpenAI ではなく、OpenAI サービスの認証に使用します。これにより、エンドポイントは自動的に api.openai.com/v1 (英語) に設定されます。api-key または openai-api-key プロパティを使用してください。この設定では、spring.ai.azure.openai.chat.options.deployment-name は OpenAi モデル (英語) 名として扱われます。

spring.ai.azure.openai.custom-headers

API リクエストに含めるカスタムヘッダーのマップ。マップ内の各エントリはヘッダーを表します。キーはヘッダー名、値はヘッダー値です。

空の地図

チャットの自動構成の有効化と無効化は、プレフィックス spring.ai.model.chat を持つ最上位プロパティを介して設定されるようになりました。

有効にするには、spring.ai.model.chat=azure-openai (デフォルトで有効になっています)

無効にするには、spring.ai.model.chat=none (または azure-openai に一致しない値)

この変更は、複数のモデルの構成を可能にするために行われます。

プレフィックス spring.ai.azure.openai.chat は、Azure OpenAI の ChatModel 実装を構成するプロパティプレフィックスです。

プロパティ説明デフォルト

プロパティ	説明	デフォルト
spring.ai.azure.openai.chat.enabled (削除され、無効になりました)	Azure OpenAI チャットモデルを有効にします。	true
spring.ai.model.chat	Azure OpenAI チャットモデルを有効にします。	azure-openai
spring.ai.azure.openai.chat.options.deployment-name	Azure で使用する場合、これはモデルの「デプロイ名」を指し、oai.azure.com/portal (英語) で確認できます。Azure、OpenAI、デプロイ内では、「デプロイ名」はモデル自体とは異なることに注意してください。これらの用語に関する混乱は、Azure、OpenAI クライアントライブラリを元の OpenAI エンドポイントと互換性を持たせる意図から生じています。Azure、OpenAI、Sam Altman の OpenAI によって提供されるデプロイ構造は大きく異なります。この補完リクエストの一部として提供するデプロイモデル名。	gpt-4o
spring.ai.azure.openai.chat.options.maxTokens	チャット補完で生成するトークンの最大数。入力トークンと生成トークンの合計長は、モデルのコンテキスト長によって制限されます。非推論モデル（例: gpt-4o、gpt-3.5-turbo）に使用します。maxCompletionTokens では使用できません。。	-
spring.ai.azure.openai.chat.options.maxCompletionTokens	表示可能な出力トークンと推論トークンを含む、完了に対して生成できるトークンの数の上限。推論モデル（例: o1、o3、o4-mini シリーズ）に必要です。maxTokens では使用できません。。	-
spring.ai.azure.openai.chat.options.temperature	生成される補完の見かけの創造性を制御するために使用するサンプリング温度。値を高くすると出力がよりランダムになり、値を低くすると結果がより集中的で決定的になります。これら 2 つの設定の相互作用を予測するのは難しいため、同じ完了リクエストに対して温度と top_p を変更することはお勧めできません。	0.7
spring.ai.azure.openai.chat.options.topP	温度によるサンプリングの代替方法は、核サンプリングと呼ばれます。この値により、モデルは指定された確率質量を持つトークンの結果を考慮します。	-
spring.ai.azure.openai.chat.options.logitBias	GPT トークン ID とバイアススコア間のマップ。完了レスポンスに特定のトークンが現れる確率に影響します。トークン ID は外部トークナイザーツールを介して計算されますが、バイアススコアは -100 ～ 100 の範囲内にあり、最小値と最大値はそれぞれトークンの完全な禁止または排他的選択に対応します。特定のバイアススコアの正確な動作はモデルによって異なります。	-
spring.ai.azure.openai.chat.options.user	操作の呼び出し元またはエンドユーザーの識別子。これは、追跡またはレート制限の目的で使用される場合があります。	-
spring.ai.azure.openai.chat.options.stream-usage	(ストリーミングのみ) リクエスト全体のトークン使用統計を含む追加のチャンクを追加するように設定します。このチャンクの `choices` フィールドは空の配列であり、他のすべてのチャンクにも使用状況フィールドが含まれますが、値は null になります。	false
spring.ai.azure.openai.chat.options.n	チャット補完レスポンスに対して生成する必要があるチャット補完の選択肢の数。	-
spring.ai.azure.openai.chat.options.stop	補完の生成を終了するテキストシーケンスのコレクション。	-
spring.ai.azure.openai.chat.options.presencePenalty	生成されたテキスト内の既存の存在に基づいて、生成されたトークンが出現する確率に影響を与える値。正の値を指定すると、トークンがすでに存在する場合にトークンが表示される可能性が低くなり、モデルが新しいトピックを出力する可能性が高くなります。	-
spring.ai.azure.openai.chat.options.responseFormat.type	`GPT-4o`、`GPT-4o mini`、`GPT-4 Turbo` および `gpt-3.5-turbo-1106` より新しいすべての `GPT-3.5 Turbo` モデルと互換性があります。`JSON_OBJECT` 型は JSON モードを有効にし、モデルが生成するメッセージが有効な JSON であることを保証します。`JSON_SCHEMA` 型は構造化出力を有効にし、モデルが指定された JSON スキーマと一致することを保証します。`JSON_SCHEMA` 型では、`responseFormat.schema` プロパティも設定する必要があります。	-
spring.ai.azure.openai.chat.options.responseFormat.schema	レスポンス形式 JSON スキーマ。`responseFormat.type=JSON_SCHEMA` にのみ適用可能	-
spring.ai.azure.openai.chat.options.frequencyPenalty	生成されたテキスト内の累積頻度に基づいて、生成されたトークンが出現する確率に影響を与える値。正の値を指定すると、トークンの頻度が増加するにつれてトークンが出現する可能性が低くなり、モデルが同じステートメントを逐語的に繰り返す可能性が低くなります。	-
spring.ai.azure.openai.chat.options.tool-names	単一のプロンプトリクエストで関数呼び出しを有効にするツールのリスト（名前で識別されます）。これらの名前のツールは、ToolCallback レジストリに存在している必要があります。	-
spring.ai.azure.openai.chat.options.tool-callbacks	ChatModel に登録するツールコールバック。	-
spring.ai.azure.openai.chat.options.internal-tool-execution-enabled	False の場合、Spring AI はツール呼び出しを内部で処理せず、クライアントにプロキシします。その後、ツール呼び出しを処理し、適切な関数にディスパッチして、結果を返すのはクライアントの責任です。True (デフォルト) の場合、Spring AI は関数呼び出しを内部で処理します。関数呼び出しをサポートするチャットモデルにのみ適用されます。	true

spring.ai.azure.openai.chat.enabled (削除され、無効になりました)

Azure OpenAI チャットモデルを有効にします。

true

spring.ai.model.chat

Azure OpenAI チャットモデルを有効にします。

azure-openai

spring.ai.azure.openai.chat.options.deployment-name

Azure で使用する場合、これはモデルの「デプロイ名」を指し、oai.azure.com/portal (英語) で確認できます。Azure、OpenAI、デプロイ内では、「デプロイ名」はモデル自体とは異なることに注意してください。これらの用語に関する混乱は、Azure、OpenAI クライアントライブラリを元の OpenAI エンドポイントと互換性を持たせる意図から生じています。Azure、OpenAI、Sam Altman の OpenAI によって提供されるデプロイ構造は大きく異なります。この補完リクエストの一部として提供するデプロイモデル名。

gpt-4o

spring.ai.azure.openai.chat.options.maxTokens

チャット補完で生成するトークンの最大数。入力トークンと生成トークンの合計長は、モデルのコンテキスト長によって制限されます。非推論モデル（例: gpt-4o、gpt-3.5-turbo）に使用します。maxCompletionTokens では使用できません。。

spring.ai.azure.openai.chat.options.maxCompletionTokens

表示可能な出力トークンと推論トークンを含む、完了に対して生成できるトークンの数の上限。推論モデル（例: o1、o3、o4-mini シリーズ）に必要です。maxTokens では使用できません。。

spring.ai.azure.openai.chat.options.temperature

生成される補完の見かけの創造性を制御するために使用するサンプリング温度。値を高くすると出力がよりランダムになり、値を低くすると結果がより集中的で決定的になります。これら 2 つの設定の相互作用を予測するのは難しいため、同じ完了リクエストに対して温度と top_p を変更することはお勧めできません。

0.7

spring.ai.azure.openai.chat.options.topP

温度によるサンプリングの代替方法は、核サンプリングと呼ばれます。この値により、モデルは指定された確率質量を持つトークンの結果を考慮します。

spring.ai.azure.openai.chat.options.logitBias

GPT トークン ID とバイアススコア間のマップ。完了レスポンスに特定のトークンが現れる確率に影響します。トークン ID は外部トークナイザーツールを介して計算されますが、バイアススコアは -100 ～ 100 の範囲内にあり、最小値と最大値はそれぞれトークンの完全な禁止または排他的選択に対応します。特定のバイアススコアの正確な動作はモデルによって異なります。

spring.ai.azure.openai.chat.options.user

操作の呼び出し元またはエンドユーザーの識別子。これは、追跡またはレート制限の目的で使用される場合があります。

spring.ai.azure.openai.chat.options.stream-usage

(ストリーミングのみ) リクエスト全体のトークン使用統計を含む追加のチャンクを追加するように設定します。このチャンクの choices フィールドは空の配列であり、他のすべてのチャンクにも使用状況フィールドが含まれますが、値は null になります。

false

spring.ai.azure.openai.chat.options.n

チャット補完レスポンスに対して生成する必要があるチャット補完の選択肢の数。

spring.ai.azure.openai.chat.options.stop

補完の生成を終了するテキストシーケンスのコレクション。

spring.ai.azure.openai.chat.options.presencePenalty

生成されたテキスト内の既存の存在に基づいて、生成されたトークンが出現する確率に影響を与える値。正の値を指定すると、トークンがすでに存在する場合にトークンが表示される可能性が低くなり、モデルが新しいトピックを出力する可能性が高くなります。

spring.ai.azure.openai.chat.options.responseFormat.type

GPT-4o、GPT-4o mini、GPT-4 Turbo および gpt-3.5-turbo-1106 より新しいすべての GPT-3.5 Turbo モデルと互換性があります。JSON_OBJECT 型は JSON モードを有効にし、モデルが生成するメッセージが有効な JSON であることを保証します。JSON_SCHEMA 型は構造化出力を有効にし、モデルが指定された JSON スキーマと一致することを保証します。JSON_SCHEMA 型では、responseFormat.schema プロパティも設定する必要があります。

spring.ai.azure.openai.chat.options.responseFormat.schema

レスポンス形式 JSON スキーマ。responseFormat.type=JSON_SCHEMA にのみ適用可能

spring.ai.azure.openai.chat.options.frequencyPenalty

生成されたテキスト内の累積頻度に基づいて、生成されたトークンが出現する確率に影響を与える値。正の値を指定すると、トークンの頻度が増加するにつれてトークンが出現する可能性が低くなり、モデルが同じステートメントを逐語的に繰り返す可能性が低くなります。

spring.ai.azure.openai.chat.options.tool-names

単一のプロンプトリクエストで関数呼び出しを有効にするツールのリスト（名前で識別されます）。これらの名前のツールは、ToolCallback レジストリに存在している必要があります。

spring.ai.azure.openai.chat.options.tool-callbacks

ChatModel に登録するツールコールバック。

spring.ai.azure.openai.chat.options.internal-tool-execution-enabled

False の場合、Spring AI はツール呼び出しを内部で処理せず、クライアントにプロキシします。その後、ツール呼び出しを処理し、適切な関数にディスパッチして、結果を返すのはクライアントの責任です。True (デフォルト) の場合、Spring AI は関数呼び出しを内部で処理します。関数呼び出しをサポートするチャットモデルにのみ適用されます。

true

spring.ai.azure.openai.chat.options というプレフィックスが付いたすべてのプロパティは、リクエスト固有のランタイムオプションを Prompt 呼び出しに追加することで実行時にオーバーライドできます。

トークン制限パラメーター: モデル固有の使用箇所

Azure OpenAI には、トークン制限パラメーターに関するモデル固有の要件があります。

モデルファミリー必須パラメーターノート

モデルファミリー	必須パラメーター	ノート
推論モデル (o1、o3、o4- ミニシリーズ)	`maxCompletionTokens`	これらのモデルは `maxCompletionTokens` のみを受け入れます。`maxTokens` を使用すると API エラーが発生します。
非推論モデル (gpt-4o、gpt-3.5-turbo など)	`maxTokens`	従来のモデルでは、出力制限に `maxTokens` を使用します。`maxCompletionTokens` を使用すると API エラーが発生する可能性があります。

推論モデル
(o1、o3、o4- ミニシリーズ)

maxCompletionTokens

これらのモデルは maxCompletionTokens のみを受け入れます。maxTokens を使用すると API エラーが発生します。

非推論モデル
(gpt-4o、gpt-3.5-turbo など)

maxTokens

従来のモデルでは、出力制限に maxTokens を使用します。maxCompletionTokens を使用すると API エラーが発生する可能性があります。

パラメーター maxTokens と maxCompletionTokens は相互に排他的です。両方のパラメーターを同時に設定すると、Azure、OpenAI から API エラーが発生します。Spring AI、Azure、OpenAI クライアントは、もう一方のパラメーターを設定すると、以前に設定されたパラメーターを自動的にクリアし、警告メッセージを表示します。

サンプル: 推論モデルに maxCompletionTokens を使用する

var options = AzureOpenAiChatOptions.builder()
    .deploymentName("o1-preview")
    .maxCompletionTokens(500)  // Required for reasoning models
    .build();

サンプル: 非推論モデルに maxTokens を使用する

var options = AzureOpenAiChatOptions.builder()
    .deploymentName("gpt-4o")
    .maxTokens(500)  // Required for non-reasoning models
    .build();

ランタイムオプション

AzureOpenAiChatOptions.java [GitHub] (英語) は、使用するモデル、温度、周波数ペナルティなどのモデル構成を提供します。

起動時に、AzureOpenAiChatModel(api, options) コンストラクターまたは spring.ai.azure.openai.chat.options.* プロパティを使用してデフォルトのオプションを構成できます。

実行時に、新しいリクエスト固有のオプションを Prompt 呼び出しに追加することで、デフォルトのオプションをオーバーライドできます。たとえば、特定のリクエストのデフォルトのモデルと温度をオーバーライドするには、次のようにします。

ChatResponse response = chatModel.call(
    new Prompt(
        "Generate the names of 5 famous pirates.",
        AzureOpenAiChatOptions.builder()
            .deploymentName("gpt-4o")
            .temperature(0.4)
        .build()
    ));

モデル固有の AzureOpenAiChatOptions.java [GitHub] (英語) に加えて、ChatOptions#builder() [GitHub] (英語) で作成されたポータブル ChatOptions [GitHub] (英語) インスタンスを使用できます。

関数呼び出し

カスタム Java 関数を AzureOpenAiChatModel に登録すると、登録された関数の 1 つまたは複数を呼び出すための引数を含む JSON オブジェクトの出力をモデルがインテリジェントに選択できます。これは、LLM 機能を外部ツールや API に接続するための強力な手法です。ツール呼び出しについて詳しく参照してください。

マルチモーダル

マルチモーダル性とは、テキスト、イメージ、音声、その他のデータ形式など、さまざまなソースからの情報を同時に理解して処理するモデルの機能を指します。現在、Azure、OpenAI、gpt-4o モデルはマルチモーダルサポートを提供しています。

Azure OpenAI は、メッセージに base64 でエンコードされたイメージのリストまたはイメージ URL を組み込むことができます。Spring AI のメッセージ [GitHub] (英語) インターフェースは、メディア [GitHub] (英語) 型を導入することで、マルチモーダル AI モデルをサポートします。この型には、メッセージ内のメディア添付ファイルに関するデータと詳細が含まれており、Spring の org.springframework.util.MimeType と、生のメディアデータ用の java.lang.Object が使用されます。

以下は、OpenAiChatModelIT.java [GitHub] (英語) から抜粋したコード例であり、GPT_4_O モデルを使用してユーザーテキストとイメージを融合する方法を示しています。

URL url = new URL("https://docs.spring.io/spring-ai/reference/_images/multimodal.test.png");
String response = ChatClient.create(chatModel).prompt()
        .options(AzureOpenAiChatOptions.builder().deploymentName("gpt-4o").build())
        .user(u -> u.text("Explain what do you see on this picture?").media(MimeTypeUtils.IMAGE_PNG, this.url))
        .call()
        .content();

複数のイメージを渡すこともできます。

入力イメージ multimodal.test.png :

"Explain what do you see on this picture?" というテキストメッセージで、次のようなレスポンスが生成されます。

This is an image of a fruit bowl with a simple design. The bowl is made of metal with curved wire edges that
create an open structure, allowing the fruit to be visible from all angles. Inside the bowl, there are two
yellow bananas resting on top of what appears to be a red apple. The bananas are slightly overripe, as
indicated by the brown spots on their peels. The bowl has a metal ring at the top, likely to serve as a handle
for carrying. The bowl is placed on a flat surface with a neutral-colored background that provides a clear
view of the fruit inside.

以下の例に示すように、URL の代わりにクラスパスリソースを渡すこともできます。

Resource resource = new ClassPathResource("multimodality/multimodal.test.png");

String response = ChatClient.create(chatModel).prompt()
    .options(AzureOpenAiChatOptions.builder()
    .deploymentName("gpt-4o").build())
    .user(u -> u.text("Explain what do you see on this picture?")
    .media(MimeTypeUtils.IMAGE_PNG, this.resource))
    .call()
    .content();

サンプルコントローラー

新しい Spring Boot プロジェクトを作成し、spring-ai-starter-model-azure-openai を pom (または gradle) の依存関係に追加します。

src/main/resources ディレクトリに application.properties ファイルを追加して、OpenAi チャットモデルを有効にして構成します。

spring.ai.azure.openai.api-key=YOUR_API_KEY
spring.ai.azure.openai.endpoint=YOUR_ENDPOINT
spring.ai.azure.openai.chat.options.deployment-name=gpt-4o
spring.ai.azure.openai.chat.options.temperature=0.7

api-key と endpoint を Azure OpenAI の資格情報に置き換えます。

これにより、クラスに挿入できる AzureOpenAiChatModel 実装が作成されます。以下は、テキスト生成にチャットモデルを使用する単純な @Controller クラスの例です。

@RestController
public class ChatController {

    private final AzureOpenAiChatModel chatModel;

    @Autowired
    public ChatController(AzureOpenAiChatModel chatModel) {
        this.chatModel = chatModel;
    }

    @GetMapping("/ai/generate")
    public Map generate(@RequestParam(value = "message", defaultValue = "Tell me a joke") String message) {
        return Map.of("generation", this.chatModel.call(message));
    }

    @GetMapping("/ai/generateStream")
	public Flux<ChatResponse> generateStream(@RequestParam(value = "message", defaultValue = "Tell me a joke") String message) {
        Prompt prompt = new Prompt(new UserMessage(message));
        return this.chatModel.stream(prompt);
    }
}

手動構成

AzureOpenAiChatModel [GitHub] (英語) は ChatModel および StreamingChatModel を実装し、Azure OpenAI Java クライアント (英語) を使用します。

これを有効にするには、プロジェクトの Maven pom.xml ファイルに spring-ai-azure-openai 依存関係を追加します。

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-azure-openai</artifactId>
</dependency>

または、Gradle build.gradle ビルドファイルに保存します。

dependencies {
    implementation 'org.springframework.ai:spring-ai-azure-openai'
}

Spring AI BOM をビルドファイルに追加するには、"依存関係管理" セクションを参照してください。

spring-ai-azure-openai 依存関係により、AzureOpenAiChatModel へのアクセスも提供されます。AzureOpenAiChatModel の詳細については、Azure OpenAI チャットセクションを参照してください。

次に、AzureOpenAiChatModel インスタンスを作成し、それを使用してテキストレスポンスを生成します。

var openAIClientBuilder = new OpenAIClientBuilder()
  .credential(new AzureKeyCredential(System.getenv("AZURE_OPENAI_API_KEY")))
  .endpoint(System.getenv("AZURE_OPENAI_ENDPOINT"));

var openAIChatOptions = AzureOpenAiChatOptions.builder()
  .deploymentName("gpt-5")
  .temperature(0.4)
  .maxCompletionTokens(200)
  .build();

var chatModel = AzureOpenAiChatModel.builder()
				.openAIClientBuilder(openAIClientBuilder)
				.defaultOptions(openAIChatOptions)
				.build();

ChatResponse response = chatModel.call(
  new Prompt("Generate the names of 5 famous pirates."));

// Or with streaming responses
Flux<ChatResponse> streamingResponses = chatModel.stream(
  new Prompt("Generate the names of 5 famous pirates."));

gpt-4o は、Azure AI ポータルで示されているように、実際には Deployment Name です。