Skip to main content

Beautiful Soup

Beautiful Soup 是一个用于解析 HTML 和 XML 文档的 Python 包(包括处理格式不正确的标记,即未闭合的标签,因此被称为标签汤)。它为解析后的页面创建解析树,可以用于从 HTML 中提取数据,这对于网络爬虫非常有用。

安装和设置

pip install beautifulsoup4

文档转换器

查看 使用示例

from langchain_community.document_loaders import BeautifulSoupTransformer

此页面是否有帮助?


您还可以留下详细的反馈 在 GitHub 上