Vectara

Vectara 提供一个可信的生成式AI平台，使组织能够快速创建类似ChatGPT的体验（一个AI助手），该体验基于他们拥有的数据、文档和知识（从技术上讲，它是检索增强生成即服务）。

Vectara 概述： Vectara 是RAG即服务，提供所有RAG组件，并通过易于使用的API进行访问，包括：

从文件中提取文本的方法（PDF、PPT、DOCX等）
基于机器学习的分块，提供最先进的性能。
Boomerang 嵌入模型。
自有的内部向量数据库，用于存储文本块和嵌入向量。
一个查询服务，自动将查询编码为嵌入，并检索最相关的文本段落（包括对混合搜索和MMR的支持）
一个LLM，用于根据检索到的文档（上下文）创建生成性摘要，包括引用。

更多信息：

安装与设置

要将 Vectara 与 LangChain 一起使用，无需特殊的安装步骤。要开始使用，请注册一个免费的 Vectara 账户（如果您还没有），并按照快速入门指南创建一个语料库和 API 密钥。一旦您有了这些，您可以将它们作为参数提供给 Vectara vectorstore，或者您可以将它们设置为环境变量。

export VECTARA_CUSTOMER_ID="your_customer_id"
export VECTARA_CORPUS_ID="your_corpus_id"
export VECTARA_API_KEY="your-vectara-api-key"

Vectara 作为向量存储

存在一个围绕 Vectara 平台的包装器，使您可以在 LangChain 中将其用作 vectorstore：

要导入此向量存储：

from langchain_community.vectorstores import Vectara

要创建 Vectara 向量存储的实例：

vectara = Vectara(
    vectara_customer_id=customer_id, 
    vectara_corpus_id=corpus_id, 
    vectara_api_key=api_key
)

customer_id、corpus_id 和 api_key 是可选的，如果未提供，将分别从环境变量 VECTARA_CUSTOMER_ID、VECTARA_CORPUS_ID 和 VECTARA_API_KEY 中读取。

添加文本或文件

在您拥有 vectorstore 之后，您可以根据标准 VectorStore 接口使用 add_texts 或 add_documents，例如：

vectara.add_texts(["to be or not to be", "that is the question"])

由于 Vectara 在平台上支持文件上传，我们还添加了直接上传文件（PDF、TXT、HTML、PPT、DOC 等）的功能。使用此方法时，每个文件会直接上传到 Vectara 后端，在那里进行处理并进行最佳切分，因此您无需使用 LangChain 文档加载器或切分机制。

举个例子：

vectara.add_files(["path/to/file1.pdf", "path/to/file2.pdf",...])

当然，您不必添加任何数据，而是可以直接连接到一个现有的 Vectara 语料库，其中数据可能已经被索引。

查询 VectorStore

要查询 Vectara 的 vectorstore，您可以使用 similarity_search 方法（或 similarity_search_with_score），该方法接受一个查询字符串并返回结果列表：

results = vectara.similarity_search_with_score("what is LangChain?")

结果以相关文档的列表形式返回，并包含每个文档的相关性评分。

在这种情况下，我们使用了默认的检索参数，但您也可以在 similarity_search 或 similarity_search_with_score 中指定以下附加参数：

k：返回的结果数量（默认为 5）
lambda_val：混合搜索的词汇匹配因子（默认为 0.025）
filter：应用于结果的过滤器（默认为 None）
n_sentence_context：返回结果时包含实际匹配段落前后的句子数量。默认为 2。
rerank_config：可用于指定结果的重新排序器
- reranker：mmr、rerank_multilingual_v1 或 none。请注意，“rerank_multilingual_v1”是仅限 Scale 的功能
- rerank_k：用于重新排序的结果数量
- mmr_diversity_bias：0 = 无多样性，1 = 完全多样性。这是 MMR 公式中的 lambda 参数，范围为 0...1

要获取没有相关性评分的结果，您可以简单使用 'similarity_search' 方法：

results = vectara.similarity_search("what is LangChain?")

Vectara用于检索增强生成（RAG）

Vectara提供了一个完整的RAG管道，包括生成摘要。要将其用作完整的RAG解决方案，可以使用as_rag方法。可以在VectaraQueryConfig对象中指定一些额外的参数来控制检索和摘要：

k：返回的结果数量
lambda_val：混合搜索的词汇匹配因子
summary_config（可选）：可用于请求RAG中的LLM摘要
- is_enabled：True或False
- max_results：用于摘要生成的结果数量
- response_lang：响应摘要的语言，采用ISO 639-2格式（例如'en'，'fr'，'de'等）
rerank_config（可选）：可用于指定结果的Vectara重新排序器
- reranker：mmr，rerank_multilingual_v1或none
- rerank_k：用于重新排序的结果数量
- mmr_diversity_bias：0 = 无多样性，1 = 完全多样性。这是MMR公式中的lambda参数，范围为0...1

例如：

summary_config = SummaryConfig(is_enabled=True, max_results=7, response_lang='eng')
rerank_config = RerankConfig(reranker="mmr", rerank_k=50, mmr_diversity_bias=0.2)
config = VectaraQueryConfig(k=10, lambda_val=0.005, rerank_config=rerank_config, summary_config=summary_config)

然后可以使用as_rag方法创建RAG管道：

query_str = "what did Biden say?"

rag = vectara.as_rag(config)
rag.invoke(query_str)['answer']

as_rag方法返回一个VectaraRAG对象，其行为与任何LangChain可运行对象相同，包括invoke或stream方法。

Vectara 聊天

RAG 功能可用于创建聊天机器人。例如，您可以创建一个简单的聊天机器人来响应用户输入：

summary_config = SummaryConfig(is_enabled=True, max_results=7, response_lang='eng')
rerank_config = RerankConfig(reranker="mmr", rerank_k=50, mmr_diversity_bias=0.2)
config = VectaraQueryConfig(k=10, lambda_val=0.005, rerank_config=rerank_config, summary_config=summary_config)

query_str = "what did Biden say?"
bot = vectara.as_chat(config)
bot.invoke(query_str)['answer']

主要区别在于：使用 as_chat 时，Vectara 会内部跟踪聊天历史，并根据完整的聊天历史对每个响应进行条件处理。无需将该历史记录保存在 LangChain 本地，因为 Vectara 将在内部管理它。

Vectara 作为 LangChain 的检索器

如果您只想将 Vectara 用作检索器，可以使用 as_retriever 方法，该方法返回一个 VectaraRetriever 对象。

retriever = vectara.as_retriever(config=config)
retriever.invoke(query_str)

与 as_rag 一样，您需要提供一个 VectaraQueryConfig 对象来控制检索参数。在大多数情况下，您不会启用 summary_config，但它仍然作为向后兼容的选项保留。如果未请求摘要，响应将是相关文档的列表，每个文档都有一个相关性评分。如果请求了摘要，响应将与之前一样是相关文档的列表，并附加一个包含生成摘要的文档。

幻觉检测分数

Vectara 创建了 HHEM - 一个开源模型，可用于评估 RAG 响应的事实一致性。
作为 Vectara RAG 的一部分，“事实一致性分数”（或 FCS），这是开源 HHEM 的改进版本，通过 API 提供。
这会自动包含在 RAG 流水线的输出中。

summary_config = SummaryConfig(is_enabled=True, max_results=7, response_lang='eng')
rerank_config = RerankConfig(reranker="mmr", rerank_k=50, mmr_diversity_bias=0.2)
config = VectaraQueryConfig(k=10, lambda_val=0.005, rerank_config=rerank_config, summary_config=summary_config)

rag = vectara.as_rag(config)
resp = rag.invoke(query_str)
print(resp['answer'])
print(f"Vectara FCS = {resp['fcs']}")

示例笔记本

有关使用 Vectara 与 LangChain 的更详细示例，请参见以下示例笔记本：

这个笔记本显示了如何使用 Vectara：使用完整的 RAG 或仅作为检索器。
这个笔记本显示了 Vectara 的自查询功能。
这个笔记本显示了如何使用 Langchain 和 Vectara 构建聊天机器人。

Vectara

安装与设置

Vectara 作为向量存储

添加文本或文件

查询 VectorStore

Vectara用于检索增强生成（RAG）

Vectara 聊天

Vectara 作为 LangChain 的检索器

幻觉检测分数

示例笔记本

此页面是否有帮助？

您还可以留下详细的反馈在 GitHub 上

Vectara

安装与设置​

Vectara 作为向量存储​

添加文本或文件​

查询 VectorStore​

Vectara用于检索增强生成（RAG）​

Vectara 聊天​

Vectara 作为 LangChain 的检索器​

幻觉检测分数​

示例笔记本​

此页面是否有帮助？

您还可以留下详细的反馈 在 GitHub 上

安装与设置

Vectara 作为向量存储

添加文本或文件

查询 VectorStore

Vectara用于检索增强生成（RAG）

Vectara 聊天

Vectara 作为 LangChain 的检索器

幻觉检测分数

示例笔记本

您还可以留下详细的反馈在 GitHub 上