クラス JsoupDocumentReader

java.lang.ObjectSE
org.springframework.ai.reader.jsoup.JsoupDocumentReader
実装されたすべてのインターフェース:
SupplierSE<ListSE<Document>>DocumentReader

public class JsoupDocumentReader extends ObjectSE implements DocumentReader
JSoup を使用して HTML ドキュメントを読み取り、テキストコンテンツを抽出します。このリーダーは、抽出する HTML 要素の選択、リンクの処理、メタデータの抽出などのオプションを提供します。HTML の解析には JSoup ライブラリを活用しています。
作成者:
Alexandros Pappas
関連事項:
  • コンストラクターの詳細

    • JsoupDocumentReader

      public JsoupDocumentReader(StringSE htmlResource)
    • JsoupDocumentReader

      public JsoupDocumentReader(org.springframework.core.io.Resource htmlResource)
    • JsoupDocumentReader

      public JsoupDocumentReader(StringSE htmlResource, JsoupDocumentReaderConfig config)
    • JsoupDocumentReader

      public JsoupDocumentReader(org.springframework.core.io.Resource htmlResource, JsoupDocumentReaderConfig config)
  • メソッドの詳細