Skip to main content

MyScale

本页介绍如何在 LangChain 中使用 MyScale 向量数据库。 它分为两个部分:安装和设置,以及对特定 MyScale 包装器的引用。

使用 MyScale,您可以管理结构化和非结构化(向量化)数据,并使用 SQL 对这两种类型的数据执行联合查询和分析。此外,MyScale 的云原生 OLAP 架构建立在 ClickHouse 之上,使得即使在海量数据集上也能实现闪电般快速的数据处理。

介绍

MyScale 和高性能向量搜索概述

您现在可以在我们的 SaaS 上注册并 立即启动集群!

如果您也对我们如何将 SQL 和向量集成感兴趣,请参考 此文档 以获取更多语法参考。

我们还提供了在 huggingface 上的实时演示!请查看我们的 huggingface 空间!他们在眨眼之间搜索数百万个向量!

安装与设置

  • 使用 pip install clickhouse-connect 安装 Python SDK

设置环境

有两种方法可以为 myscale 索引设置参数。

  1. 环境变量

    在运行应用程序之前,请使用 export 设置环境变量: export MYSCALE_HOST='<your-endpoints-url>' MYSCALE_PORT=<your-endpoints-port> MYSCALE_USERNAME=<your-username> MYSCALE_PASSWORD=<your-password> ...

    您可以轻松地在我们的 SaaS 上找到您的帐户、密码和其他信息。有关详细信息,请参阅 此文档 MyScaleSettings 下的每个属性都可以使用前缀 MYSCALE_ 设置,并且不区分大小写。

  2. 使用参数创建 MyScaleSettings 对象

```python
from langchain_community.vectorstores import MyScale, MyScaleSettings
config = MyScaleSettings(host="<your-backend-url>", port=8443, ...)
index = MyScale(embedding_function, config)
index.add_documents(...)
```

包装器

支持的功能:

  • add_texts
  • add_documents
  • from_texts
  • from_documents
  • similarity_search
  • asimilarity_search
  • similarity_search_by_vector
  • asimilarity_search_by_vector
  • similarity_search_with_relevance_scores
  • delete

VectorStore

存在一个围绕 MyScale 数据库的封装,使您可以将其用作向量存储,无论是用于语义搜索还是类似示例的检索。

要导入此向量存储:

from langchain_community.vectorstores import MyScale

有关 MyScale 封装的更详细指南,请参见 此笔记本


此页面是否有帮助?


您还可以留下详细的反馈 在 GitHub 上