Flyte

Flyte 是一个开源的调度器，旨在构建生产级别的数据和机器学习管道。它构建于可扩展性和可重复性之上，利用 Kubernetes 作为其基础平台。

本笔记本的目的是演示如何将 FlyteCallback 集成到您的 Flyte 任务中，使您能够有效地监控和跟踪您的 LangChain 实验。

安装与设置

通过运行命令 pip install flytekit 安装 Flytekit 库。
通过运行命令 pip install flytekitplugins-envd 安装 Flytekit-Envd 插件。
通过运行命令 pip install langchain 安装 LangChain。
在您的系统上安装 Docker。

Flyte 任务

Flyte 任务是 Flyte 的基础构建块。要执行 LangChain 实验，您需要编写定义特定步骤和操作的 Flyte 任务。

注意：入门指南提供了详细的逐步说明，介绍如何在本地安装 Flyte 并运行您的初始 Flyte 管道。

首先，导入必要的依赖项以支持您的 LangChain 实验。

import os

from flytekit import ImageSpec, task
from langchain.agents import AgentType, initialize_agent, load_tools
from langchain.callbacks import FlyteCallbackHandler
from langchain.chains import LLMChain
from langchain_openai import ChatOpenAI
from langchain_core.prompts import PromptTemplate
from langchain_core.messages import HumanMessage

设置必要的环境变量以使用 OpenAI API 和 Serp API：

# Set OpenAI API key
os.environ["OPENAI_API_KEY"] = "<your_openai_api_key>"

# Set Serp API key
os.environ["SERPAPI_API_KEY"] = "<your_serp_api_key>"

用您从 OpenAI 和 Serp API 获得的相应 API 密钥替换 <your_openai_api_key> 和 <your_serp_api_key>。

为了确保管道的可重复性，Flyte 任务是容器化的。每个 Flyte 任务必须与一个镜像相关联，该镜像可以在整个 Flyte 工作流中共享，或者为每个任务单独提供。

为了简化为每个 Flyte 任务提供所需依赖项的过程，您可以初始化一个 ImageSpec 对象。这种方法会自动触发 Docker 构建，减轻用户手动创建 Docker 镜像的需要。

custom_image = ImageSpec(
    name="langchain-flyte",
    packages=[
        "langchain",
        "openai",
        "spacy",
        "https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-3.5.0/en_core_web_sm-3.5.0.tar.gz",
        "textstat",
        "google-search-results",
    ],
    registry="<your-registry>",
)

您可以将 Docker 镜像推送到您选择的注册表。 Docker Hub 或 GitHub 容器注册表 (GHCR) 是一个方便的起点。

一旦您选择了一个注册表，您就可以继续创建 Flyte 任务，将 LangChain 指标记录到 Flyte Deck。

以下示例演示了与 OpenAI LLM、链和带工具的代理相关的任务：

LLM

@task(disable_deck=False, container_image=custom_image)
def langchain_llm() -> str:
    llm = ChatOpenAI(
        model_name="gpt-3.5-turbo",
        temperature=0.2,
        callbacks=[FlyteCallbackHandler()],
    )
    return llm.invoke([HumanMessage(content="Tell me a joke")]).content

链

@task(disable_deck=False, container_image=custom_image)
def langchain_chain() -> list[dict[str, str]]:
    template = """You are a playwright. Given the title of play, it is your job to write a synopsis for that title.
Title: {title}
Playwright: This is a synopsis for the above play:"""
    llm = ChatOpenAI(
        model_name="gpt-3.5-turbo",
        temperature=0,
        callbacks=[FlyteCallbackHandler()],
    )
    prompt_template = PromptTemplate(input_variables=["title"], template=template)
    synopsis_chain = LLMChain(
        llm=llm, prompt=prompt_template, callbacks=[FlyteCallbackHandler()]
    )
    test_prompts = [
        {
            "title": "documentary about good video games that push the boundary of game design"
        },
    ]
    return synopsis_chain.apply(test_prompts)

代理

@task(disable_deck=False, container_image=custom_image)
def langchain_agent() -> str:
    llm = OpenAI(
        model_name="gpt-3.5-turbo",
        temperature=0,
        callbacks=[FlyteCallbackHandler()],
    )
    tools = load_tools(
        ["serpapi", "llm-math"], llm=llm, callbacks=[FlyteCallbackHandler()]
    )
    agent = initialize_agent(
        tools,
        llm,
        agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
        callbacks=[FlyteCallbackHandler()],
        verbose=True,
    )
    return agent.run(
        "Who is Leonardo DiCaprio's girlfriend? Could you calculate her current age and raise it to the power of 0.43?"
    )

这些任务为在Flyte中运行您的LangChain实验提供了起点。

在 Kubernetes 上执行 Flyte 任务

要在配置的 Flyte 后端上执行 Flyte 任务，请使用以下命令：

pyflyte run --image <your-image> langchain_flyte.py langchain_llm

此命令将启动在 Flyte 后端上执行 langchain_llm 任务。您可以以类似的方式触发其余两个任务。

指标将在 Flyte UI 上显示，如下所示：

Flyte Deck 显示 LangChain 指标和依赖树可视化的截图。

Flyte

安装与设置

Flyte 任务

LLM

链

代理

在 Kubernetes 上执行 Flyte 任务

此页面是否有帮助？

您还可以留下详细的反馈在 GitHub 上

Flyte

安装与设置​

Flyte 任务​

LLM​

链​

代理​

在 Kubernetes 上执行 Flyte 任务​

此页面是否有帮助？

您还可以留下详细的反馈 在 GitHub 上

安装与设置

Flyte 任务

LLM

链

代理

在 Kubernetes 上执行 Flyte 任务

您还可以留下详细的反馈在 GitHub 上