クラス JsoupDocumentReader
java.lang.ObjectSE
org.springframework.ai.reader.jsoup.JsoupDocumentReader
- 実装されたすべてのインターフェース:
SupplierSE<ListSE<Document>>
,DocumentReader
JSoup を使用して HTML ドキュメントを読み取り、テキストコンテンツを抽出します。このリーダーは、抽出する HTML 要素の選択、リンクの処理、メタデータの抽出などのオプションを提供します。HTML の解析には JSoup ライブラリを活用しています。
- 作成者:
- Alexandros Pappas
- 関連事項:
コンストラクターの概要
コンストラクターコンストラクター説明JsoupDocumentReader
(StringSE htmlResource) JsoupDocumentReader
(StringSE htmlResource, JsoupDocumentReaderConfig config) JsoupDocumentReader
(org.springframework.core.io.Resource htmlResource) JsoupDocumentReader
(org.springframework.core.io.Resource htmlResource, JsoupDocumentReaderConfig config) メソッドのサマリー
クラス java.lang.ObjectSE から継承されたメソッド
clone, equalsSE, finalize, getClass, hashCode, notify, notifyAll, toString, wait, waitSE, waitSE
インターフェース org.springframework.ai.document.DocumentReader から継承されたメソッド
read
コンストラクターの詳細
JsoupDocumentReader
JsoupDocumentReader
public JsoupDocumentReader(org.springframework.core.io.Resource htmlResource) JsoupDocumentReader
JsoupDocumentReader
public JsoupDocumentReader(org.springframework.core.io.Resource htmlResource, JsoupDocumentReaderConfig config)
メソッドの詳細
get
- 次で指定:
- インターフェース
SupplierSE<ListSE<Document>>
のget