Skip to main content

Doctran

Doctran 是一个 Python 包。它利用 LLMs 和开源 NLP 库将原始文本转换为干净、结构化、信息密集的文档,这些文档经过优化以便于向量空间检索。你可以将 Doctran 想象成一个黑匣子,杂乱的字符串输入后,会输出整洁、干净、带标签的字符串。

安装与设置

pip install doctran

文档变换器

文档审问器

查看 DoctranQATransformer 的使用示例

from langchain_community.document_loaders import DoctranQATransformer

属性提取器

查看 DoctranPropertyExtractor 的使用示例.

from langchain_community.document_loaders import DoctranPropertyExtractor

文档翻译器

查看 DoctranTextTranslator 的使用示例

from langchain_community.document_loaders import DoctranTextTranslator

此页面是否有帮助?


您还可以留下详细的反馈 在 GitHub 上