構造認識型RAGを実装してみる(LandingAI ADEを使った検証)
AI要約
PDFの図・表・テキストが混在した場合、従来のRAGは「意味のまとまり」と「検索単位」がズレて失敗します。LandingAIのADE(Agentic Document Extraction)を使うと、単にテキスト抽出するのではなく、ページレイアウト解析→要素分類→chunk化という流れで、構造を保ったまま抽出できます。最小コード+実装例で、日本語ドキュメント対応の検証結果も紹介されており、実践的なRAG改善手法として参考価値が高いです。



