OpenSearch
このセクションでは、ドキュメントの埋め込みを保存し、類似性検索を実行するための OpenSearchVectorStore
のセットアップについて説明します。
OpenSearch (英語) は、もともと Elasticsearch から分岐し、Apache License 2.0 として配布されたオープンソースの検索および分析エンジンです。AI 生成アセットの統合と管理を簡素化することで、AI アプリケーション開発を強化します。OpenSearch は、ベクトル、語彙、ハイブリッド検索機能をサポートし、ベクトルデータベースページ (英語) で詳しく説明されているように、高度なベクトルデータベース機能を活用して、低レイテンシのクエリと類似性検索を容易にします。
OpenSearch k-NN (英語) 機能を使用すると、ユーザーは大規模なデータセットからベクトル埋め込みをクエリできます。埋め込みとは、テキスト、イメージ、音声、ドキュメントなどのデータオブジェクトの数値表現です。埋め込みはインデックスに保存し、さまざまな類似性関数を使用してクエリできます。
前提条件
実行中の OpenSearch インスタンス。次のオプションが利用可能です。
必要に応じて、EmbeddingModel が
OpenSearchVectorStore
によって保存される埋め込みを生成するための API キー。
自動構成
Spring AI は、OpenSearch ベクトルストア用の Spring Boot 自動構成を提供します。これを有効にするには、プロジェクトの Maven pom.xml
ファイルに次の依存関係を追加します。
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-opensearch-store-spring-boot-starter</artifactId>
</dependency>
または、Gradle build.gradle
ビルドファイルに次の内容を追加します。
dependencies {
implementation 'org.springframework.ai:spring-ai-opensearch-store-spring-boot-starter'
}
Spring AI BOM をビルドファイルに追加するには、"依存関係管理" セクションを参照してください。 |
Amazon OpenSearch サービスの場合は、代わりに次の依存関係を使用します。
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-aws-opensearch-store-spring-boot-starter</artifactId>
</dependency>
または Gradle の場合:
dependencies {
implementation 'org.springframework.ai:spring-ai-aws-opensearch-store-spring-boot-starter'
}
デフォルト値と構成オプションについては、ベクトルストアの構成パラメーターのリストを参照してください。
さらに、設定済みの EmbeddingModel
Bean が必要です。詳細については、"EmbeddingModel" セクションを参照してください。
これで、アプリケーションで OpenSearchVectorStore
をベクトルストアとして自動的に接続できるようになりました。
@Autowired VectorStore vectorStore;
// ...
List<Document> documents = List.of(
new Document("Spring AI rocks!! Spring AI rocks!! Spring AI rocks!!", Map.of("meta1", "meta1")),
new Document("The World is Big and Salvation Lurks Around the Corner"),
new Document("You walk forward facing the past and you turn back toward the future.", Map.of("meta2", "meta2")));
// Add the documents to OpenSearch
vectorStore.add(documents);
// Retrieve documents similar to a query
List<Document> results = vectorStore.similaritySearch(SearchRequest.build().query("Spring").topK(5).build());
プロパティの構成
OpenSearch に接続して OpenSearchVectorStore
を使用するには、インスタンスのアクセス詳細を提供する必要があります。Spring Boot の application.yml
を介して簡単な構成を提供できます。
spring:
ai:
vectorstore:
opensearch:
uris: <opensearch instance URIs>
username: <opensearch username>
password: <opensearch password>
index-name: spring-ai-document-index
initialize-schema: true
similarity-function: cosinesimil
batching-strategy: TOKEN_COUNT
aws: # Only for Amazon OpenSearch Service
host: <aws opensearch host>
service-name: <aws service name>
access-key: <aws access key>
secret-key: <aws secret key>
region: <aws region>
spring.ai.vectorstore.opensearch.*
で始まるプロパティは、OpenSearchVectorStore
を構成するために使用されます。
プロパティ | 説明 | デフォルト値 |
---|---|---|
| OpenSearch クラスターエンドポイントの URI | - |
| OpenSearch クラスターにアクセスするためのユーザー名 | - |
| 指定されたユーザー名のパスワード | - |
| ベクトルを格納するインデックスの名前 |
|
| 必要なスキーマを初期化するかどうか |
|
| 使用する類似度関数 |
|
| 埋め込みを計算するときにドキュメントをバッチ処理する戦略。オプションは |
|
| OpenSearch インスタンスのホスト名 | - |
| AWS サービス名 | - |
| AWS アクセスキー | - |
| AWS 秘密鍵 | - |
| AWS リージョン | - |
次の類似度関数が利用可能です。
cosinesimil
- デフォルト。ほとんどのユースケースに適しています。ベクトル間のコサイン類似度を測定します。l1
- ベクトル間のマンハッタン距離。l2
- ベクトル間のユークリッド距離。linf
- ベクトル間のチェビシェフ距離。
手動構成
Spring Boot の自動構成を使用する代わりに、OpenSearch ベクトルストアを手動で構成できます。そのためには、プロジェクトに spring-ai-opensearch-store
を追加する必要があります。
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-opensearch-store</artifactId>
</dependency>
または、Gradle build.gradle
ビルドファイルに次の内容を追加します。
dependencies {
implementation 'org.springframework.ai:spring-ai-opensearch-store'
}
Spring AI BOM をビルドファイルに追加するには、"依存関係管理" セクションを参照してください。 |
OpenSearch クライアント Bean を作成します。
@Bean
public OpenSearchClient openSearchClient() {
RestClient restClient = RestClient.builder(
HttpHost.create("http://localhost:9200"))
.build();
return new OpenSearchClient(new RestClientTransport(
restClient, new JacksonJsonpMapper()));
}
次に、ビルダーパターンを使用して OpenSearchVectorStore
Bean を作成します。
@Bean
public VectorStore vectorStore(OpenSearchClient openSearchClient, EmbeddingModel embeddingModel) {
return OpenSearchVectorStore.builder(openSearchClient, embeddingModel)
.index("custom-index") // Optional: defaults to "spring-ai-document-index"
.similarityFunction("l2") // Optional: defaults to "cosinesimil"
.initializeSchema(true) // Optional: defaults to false
.batchingStrategy(new TokenCountBatchingStrategy()) // Optional: defaults to TokenCountBatchingStrategy
.build();
}
// This can be any EmbeddingModel implementation
@Bean
public EmbeddingModel embeddingModel() {
return new OpenAiEmbeddingModel(new OpenAiApi(System.getenv("OPENAI_API_KEY")));
}
メタデータフィルタリング
OpenSearch でも、汎用的でポータブルなメタデータフィルターを活用できます。
例: 次のいずれかのテキスト式言語を使用できます。
vectorStore.similaritySearch(
SearchRequest.builder()
.query("The World")
.topK(TOP_K)
.similarityThreshold(SIMILARITY_THRESHOLD)
.filterExpression("author in ['john', 'jill'] && 'article_type' == 'blog'").build());
または、Filter.Expression
DSL を使用してプログラム的に次のようにします。
FilterExpressionBuilder b = new FilterExpressionBuilder();
vectorStore.similaritySearch(SearchRequest.builder()
.query("The World")
.topK(TOP_K)
.similarityThreshold(SIMILARITY_THRESHOLD)
.filterExpression(b.and(
b.in("author", "john", "jill"),
b.eq("article_type", "blog")).build()).build());
これらの (ポータブル) フィルター式は、独自の OpenSearch クエリ文字列クエリ (英語) に自動的に変換されます。 |
例: この移植可能なフィルター式:
author in ['john', 'jill'] && 'article_type' == 'blog'
独自の OpenSearch フィルター形式に変換されます。
(metadata.author:john OR jill) AND metadata.article_type:blog