Cohere チャット

Bedrock Cohere チャットモデルを提供します。ビジネス成果を向上させる重要なアプリとワークフローに生成 AI 機能を統合します。

AWS Bedrock Cohere モデルページ [Amazon] および Amazon Bedrock ユーザーガイド には、AWS ホストモデルの使用方法に関する詳細情報が含まれています。

前提条件

API アクセスの設定については、Spring Amazon Bedrock に関する AI ドキュメントを参照してください。

リポジトリと BOM の追加

Spring AI アーティファクトは、Spring マイルストーンおよびスナップショットリポジトリで公開されます。これらのリポジトリをビルドシステムに追加するには、リポジトリセクションを参照してください。

依存関係の管理を支援するために、Spring AI は BOM (部品表) を提供し、一貫したバージョンの Spring AI がプロジェクト全体で使用されるようにします。Spring AI BOM をビルドシステムに追加するには、"依存関係管理" セクションを参照してください。

自動構成

spring-ai-bedrock-ai-spring-boot-starter 依存関係をプロジェクトの Maven pom.xml ファイルに追加します。

<dependency>
  <groupId>org.springframework.ai</groupId>
  <artifactId>spring-ai-bedrock-ai-spring-boot-starter</artifactId>
</dependency>

または、Gradle build.gradle ビルドファイルに保存します。

dependencies {
    implementation 'org.springframework.ai:spring-ai-bedrock-ai-spring-boot-starter'
}
Spring AI BOM をビルドファイルに追加するには、"依存関係管理" セクションを参照してください。

Cohere チャットサポートを有効にする

デフォルトでは、Cohere モデルは無効になっています。これを有効にするには、spring.ai.bedrock.cohere.chat.enabled プロパティを true に設定します。環境変数のエクスポートは、この構成プロパティを設定する 1 つの方法です。

export SPRING_AI_BEDROCK_COHERE_CHAT_ENABLED=true

チャットのプロパティ

プレフィックス spring.ai.bedrock.aws は、AWS Bedrock への接続を設定するためのプロパティプレフィックスです。

プロパティ 説明 デフォルト

spring.ai.bedrock.aws.region

使用する AWS リージョン。

米国東部 -1

spring.ai.bedrock.aws.timeout

使用する AWS タイムアウト。

5 分

spring.ai.bedrock.aws.access-key

AWS アクセスキー。

-

spring.ai.bedrock.aws.secret-key

AWS の秘密鍵。

-

プレフィックス spring.ai.bedrock.cohere.chat は、Cohere のチャットモデル実装を構成するプロパティプレフィックスです。

プロパティ 説明 デフォルト

spring.ai.bedrock.cohere.chat.enabled

Cohere のサポートを有効または無効にする

false

spring.ai.bedrock.cohere.chat.model

使用するモデル ID。対応モデルについては CohereChatModel [GitHub] (英語) を参照してください。

cohere.command-text-v14

spring.ai.bedrock.cohere.chat.options.temperature

出力のランダム性を制御します。値の範囲は [0.0,1.0] です

0.7

spring.ai.bedrock.cohere.chat.options.topP

サンプリング時に考慮するトークンの最大累積確率。

AWS Bedrock のデフォルト

spring.ai.bedrock.cohere.chat.options.topK

モデルが次のトークンを生成するために使用するトークンの選択肢の数を指定します

AWS Bedrock のデフォルト

spring.ai.bedrock.cohere.chat.options.maxTokens

生成されるレスポンスで使用するトークンの最大数を指定します。

AWS Bedrock のデフォルト

spring.ai.bedrock.cohere.chat.options.stopSequences

モデルが認識するシーケンスを最大 4 つ設定します。

AWS Bedrock のデフォルト

spring.ai.bedrock.cohere.chat.options.returnLikelihoods

トークンの可能性がレスポンスとともに返されます。

AWS Bedrock のデフォルト

spring.ai.bedrock.cohere.chat.options.numGenerations

モデルが返す最大世代数。

AWS Bedrock のデフォルト

spring.ai.bedrock.cohere.chat.options.logitBias

モデルが不要なトークンを生成するのを防ぐか、モデルに必要なトークンを含めるようにインセンティブを与えます。

AWS Bedrock のデフォルト

spring.ai.bedrock.cohere.chat.options.truncate

API が最大トークン長を超える入力を処理する方法を指定します

AWS Bedrock のデフォルト

他のモデル ID については、CohereChatModel [GitHub] (英語) を参照してください。サポートされている値は、cohere.command-light-text-v14 および cohere.command-text-v14 です。モデル ID 値は基本モデル ID に関する AWS Bedrock ドキュメント [Amazon] にもあります。

spring.ai.bedrock.cohere.chat.options というプレフィックスが付いたすべてのプロパティは、リクエスト固有のランタイムオプションを Prompt 呼び出しに追加することで実行時にオーバーライドできます。

ランタイムオプション

BedrockCohereChatOptions.java [GitHub] (英語) は、温度、topK、topP などのモデル構成を提供します。

起動時に、BedrockCohereChatModel(api, options) コンストラクターまたは spring.ai.bedrock.cohere.chat.options.* プロパティを使用してデフォルトのオプションを構成できます。

実行時に、新しいリクエスト固有のオプションを Prompt 呼び出しに追加することで、デフォルトのオプションをオーバーライドできます。たとえば、特定のリクエストのデフォルトの温度をオーバーライドするには、次のようにします。

ChatResponse response = chatModel.call(
    new Prompt(
        "Generate the names of 5 famous pirates.",
        BedrockCohereChatOptions.builder()
            .withTemperature(0.4)
        .build()
    ));
モデル固有の BedrockCohereChatOptions [GitHub] (英語) に加えて、ChatOptionsBuilder#builder() [GitHub] (英語) で作成されたポータブル ChatOptions [GitHub] (英語) インスタンスを使用できます。

サンプルコントローラー

新しい Spring Boot プロジェクトを作成し、spring-ai-bedrock-ai-spring-boot-starter を pom (または gradle) の依存関係に追加します。

src/main/resources ディレクトリに application.properties ファイルを追加して、Cohere チャットモデルを有効にして構成します。

spring.ai.bedrock.aws.region=eu-central-1
spring.ai.bedrock.aws.timeout=1000ms
spring.ai.bedrock.aws.access-key=${AWS_ACCESS_KEY_ID}
spring.ai.bedrock.aws.secret-key=${AWS_SECRET_ACCESS_KEY}

spring.ai.bedrock.cohere.chat.enabled=true
spring.ai.bedrock.cohere.chat.options.temperature=0.8
regionsaccess-keysecret-key を AWS 認証情報に置き換えます。

これにより、クラスに挿入できる BedrockCohereChatModel 実装が作成されます。以下は、テキスト生成にチャットモデルを使用する単純な @Controller クラスの例です。

@RestController
public class ChatController {

    private final BedrockCohereChatModel chatModel;

    @Autowired
    public ChatController(BedrockCohereChatModel chatModel) {
        this.chatModel = chatModel;
    }

    @GetMapping("/ai/generate")
    public Map generate(@RequestParam(value = "message", defaultValue = "Tell me a joke") String message) {
        return Map.of("generation", chatModel.call(message));
    }

    @GetMapping("/ai/generateStream")
	public Flux<ChatResponse> generateStream(@RequestParam(value = "message", defaultValue = "Tell me a joke") String message) {
        Prompt prompt = new Prompt(new UserMessage(message));
        return chatModel.stream(prompt);
    }
}

手動構成

BedrockCohereChatModel [GitHub] (英語) は ChatModel と StreamingChatModel を実装し、低レベル CohereChatBedrockApi クライアントを使用して Bedrock Cohere サービスに接続します。

spring-ai-bedrock 依存関係をプロジェクトの Maven pom.xml ファイルに追加します。

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-bedrock</artifactId>
</dependency>

または、Gradle build.gradle ビルドファイルに保存します。

dependencies {
    implementation 'org.springframework.ai:spring-ai-bedrock'
}
Spring AI BOM をビルドファイルに追加するには、"依存関係管理" セクションを参照してください。

次に、BedrockCohereChatModel [GitHub] (英語) を作成し、テキスト生成に使用します。

CohereChatBedrockApi api = new CohereChatBedrockApi(CohereChatModel.COHERE_COMMAND_V14.id(),
		EnvironmentVariableCredentialsProvider.create(),
		Region.US_EAST_1.id(),
		new ObjectMapper(),
		Duration.ofMillis(1000L));

BedrockCohereChatModel chatModel = new BedrockCohereChatModel(api,
	    BedrockCohereChatOptions.builder()
					.withTemperature(0.6f)
					.withTopK(10)
					.withTopP(0.5f)
					.withMaxTokens(678)
					.build()

ChatResponse response = chatModel.call(
    new Prompt("Generate the names of 5 famous pirates."));

// Or with streaming responses
Flux<ChatResponse> response = chatModel.stream(
    new Prompt("Generate the names of 5 famous pirates."));

低レベル CohereChatBedrockApi クライアント

CohereChatBedrockApi [GitHub] (英語) は、AWS Bedrock Cohere コマンドモデル [Amazon] 上にある軽量の Java クライアントを提供します。

次のクラス図は、CohereChatBedrockApi インターフェースと構成要素を示しています。

bedrock cohere chat low level api

CohereChatBedrockApi は、同期 (例: chatCompletion()) リクエストとストリーミング (例: chatCompletionStream()) リクエストの両方の cohere.command-light-text-v14 モデルと cohere.command-text-v14 モデルをサポートします。

API をプログラムで使用する方法の簡単なスニペットを次に示します。

CohereChatBedrockApi cohereChatApi = new CohereChatBedrockApi(
	CohereChatModel.COHERE_COMMAND_V14.id(),
	Region.US_EAST_1.id(),
	Duration.ofMillis(1000L));

var request = CohereChatRequest
	.builder("What is the capital of Bulgaria and what is the size? What it the national anthem?")
	.withStream(false)
	.withTemperature(0.5f)
	.withTopP(0.8f)
	.withTopK(15)
	.withMaxTokens(100)
	.withStopSequences(List.of("END"))
	.withReturnLikelihoods(CohereChatRequest.ReturnLikelihoods.ALL)
	.withNumGenerations(3)
	.withLogitBias(null)
	.withTruncate(Truncate.NONE)
	.build();

CohereChatResponse response = cohereChatApi.chatCompletion(request);

var request = CohereChatRequest
	.builder("What is the capital of Bulgaria and what is the size? What it the national anthem?")
	.withStream(true)
	.withTemperature(0.5f)
	.withTopP(0.8f)
	.withTopK(15)
	.withMaxTokens(100)
	.withStopSequences(List.of("END"))
	.withReturnLikelihoods(CohereChatRequest.ReturnLikelihoods.ALL)
	.withNumGenerations(3)
	.withLogitBias(null)
	.withTruncate(Truncate.NONE)
	.build();

Flux<CohereChatResponse.Generation> responseStream = cohereChatApi.chatCompletionStream(request);
List<CohereChatResponse.Generation> responses = responseStream.collectList().block();