Databricks

Databricks 湖仓平台将数据、分析和人工智能统一在一个平台上。

本笔记本提供了关于如何开始使用 Databricks LLM 模型的快速概述。有关所有功能和配置的详细文档，请访问 API 参考。

概述

Databricks LLM 类封装了作为以下两种端点类型之一托管的完成端点：

Databricks 模型服务，推荐用于生产和开发，
集群驱动程序代理应用，推荐用于交互式开发。

本示例笔记本展示了如何封装您的 LLM 端点并在您的 LangChain 应用中将其用作 LLM。

限制

Databricks LLM 类是遗留实现，具有多个功能兼容性限制。

仅支持同步调用。不支持流式或异步 API。
不支持 batch API。

要使用这些功能，请改用新的 ChatDatabricks 类。ChatDatabricks 支持 ChatModel 的所有 API，包括流式、异步、批处理等。

设置

要访问 Databricks 模型，您需要创建一个 Databricks 账户，设置凭据（仅在您不在 Databricks 工作区外时），并安装所需的包。

凭证（仅在您不在 Databricks 内部时）

如果您在 Databricks 内部运行 LangChain 应用程序，可以跳过此步骤。

否则，您需要手动将 Databricks 工作区主机名和个人访问令牌分别设置为 DATABRICKS_HOST 和 DATABRICKS_TOKEN 环境变量。有关如何获取访问令牌，请参见身份验证文档。

import getpass
import os

os.environ["DATABRICKS_HOST"] = "https://your-workspace.cloud.databricks.com"
os.environ["DATABRICKS_TOKEN"] = getpass.getpass("Enter your Databricks access token: ")

或者，您可以在初始化 Databricks 类时传递这些参数。

from langchain_community.llms import Databricks

databricks = Databricks(
    host="https://your-workspace.cloud.databricks.com",
    # 我们强烈建议不要在代码中硬编码您的访问令牌，而是使用秘密管理工具
    # 或环境变量安全存储您的访问令牌。以下示例使用 Databricks Secrets
    # 来检索在 Databricks 笔记本中可用的访问令牌。
    token=dbutils.secrets.get(scope="YOUR_SECRET_SCOPE", key="databricks-token"),  # noqa: F821
)

安装

LangChain Databricks 集成位于 langchain-community 包中。此外，运行本笔记本中的代码需要 mlflow >= 2.9。

%pip install -qU langchain-community mlflow>=2.9.0

包装模型服务端点

前提条件：

已经在 Databricks 服务端点注册并部署了 LLM。
你对该端点拥有 "Can Query" 权限。

预期的 MLflow 模型签名为：

输入：[{"name": "prompt", "type": "string"}, {"name": "stop", "type": "list[string]"}]
输出：[{"type": "string"}]

调用

from langchain_community.llms import Databricks

llm = Databricks(endpoint_name="YOUR_ENDPOINT_NAME")
llm.invoke("How are you?")

'I am happy to hear that you are in good health and as always, you are appreciated.'

llm.invoke("How are you?", stop=["."])

'Good'

转换输入和输出

有时您可能希望包装一个具有不兼容模型签名的服务端点，或者您想插入额外的配置。您可以使用 transform_input_fn 和 transform_output_fn 参数来定义额外的预处理/后处理。

# Use `transform_input_fn` and `transform_output_fn` if the serving endpoint
# expects a different input schema and does not return a JSON string,
# respectively, or you want to apply a prompt template on top.


def transform_input(**request):
    full_prompt = f"""{request["prompt"]}
    Be Concise.
    """
    request["prompt"] = full_prompt
    return request


def transform_output(response):
    return response.upper()


llm = Databricks(
    endpoint_name="YOUR_ENDPOINT_NAME",
    transform_input_fn=transform_input,
    transform_output_fn=transform_output,
)

llm.invoke("How are you?")

'I AM DOING GREAT THANK YOU.'

Databricks

概述

限制

设置

凭证（仅在您不在 Databricks 内部时）

安装

包装模型服务端点

前提条件：

调用

转换输入和输出

相关

此页面是否有帮助？

您还可以留下详细的反馈在 GitHub 上

Databricks

概述​

限制​

设置​

凭证（仅在您不在 Databricks 内部时）​

安装​

包装模型服务端点​

前提条件：​

调用​

转换输入和输出​

相关​

此页面是否有帮助？

您还可以留下详细的反馈 在 GitHub 上

概述

限制

设置

凭证（仅在您不在 Databricks 内部时）

安装

包装模型服务端点

前提条件：

调用

转换输入和输出

相关

您还可以留下详细的反馈在 GitHub 上