Skip to main content

HTML 转文本

html2text 是一个 Python 包,它将一页 HTML 转换为干净、易读的纯 ASCII 文本

ASCII 也恰好是有效的 Markdown(一种文本到 HTML 的格式)。

安装与设置

pip install html2text

文档转换器

查看 使用示例

from langchain_community.document_loaders import Html2TextTransformer

此页面是否有帮助?


您还可以留下详细的反馈 在 GitHub 上