当前位置:首页 > 科技  > 软件

使用LangChain和LangGraph大幅提升RAG效果

来源: 责编: 时间:2024-03-26 17:43:36 303观看
导读一、简介LangGraph是LangChain、LangServe和LangSmith系列的最新成员,旨在使用LLM构建生成式人工智能应用程序。请记住,所有这些都是独立的包,必须单独进行pip安装。在深入学习LangGraph之前,需要了解LangChain的两个主要

一、简介

LangGraph是LangChain、LangServe和LangSmith系列的最新成员,旨在使用LLM构建生成式人工智能应用程序。请记住,所有这些都是独立的包,必须单独进行pip安装。0Bj28资讯网——每日最新资讯28at.com

在深入学习LangGraph之前,需要了解LangChain的两个主要概念。0Bj28资讯网——每日最新资讯28at.com

1. 链:围绕LLM编写的程序,用于执行任务,例如自动SQL编写或NER提取链等。请注意,链不能用于任何其他任务(甚至不能用于一般用例),如果尝试这样做,可能会损坏链。链中要遵循的步骤是预定义的,不可灵活调整。0Bj28资讯网——每日最新资讯28at.com

2. 代理:链的更加灵活版本,代理通常是启用第三方工具(例如谷歌搜索、YouTube)的LLM,由LLM本身决定下一步如何解决给定的查询。0Bj28资讯网——每日最新资讯28at.com

现在,当处理现实世界的问题时,一个常见的问题是希望找到介于链和代理之间的解决方案。即不像链那样硬编码,但也不像代理那样完全由LLM驱动。0Bj28资讯网——每日最新资讯28at.com

二、LangGraph

LangGraph是以LangChain为核心,用于创建工作流程中的循环图的工具。因此,我们假设以下示例:0Bj28资讯网——每日最新资讯28at.com

你希望在知识库上搭建一个基于RAG的检索系统。现在,你希望引入这样一种情况:如果RAG的输出未满足特定质量要求,代理/链应该再次检索数据,但这次是自行更改提示。并且重复此过程,直到达到质量阈值为止。0Bj28资讯网——每日最新资讯28at.com

使用LangGraph可以实现这种循环逻辑。这只是一个示例,使用LangGraph还可以做更多事情。0Bj28资讯网——每日最新资讯28at.com

注:可以将其视为向链中引入循环逻辑,使其成为循环链。0Bj28资讯网——每日最新资讯28at.com

  • LangGraph对于构建Autogen或MetaGPT等多代理应用程序至关重要。

顾名思义,LangGraph具有一般图形所具有的所有组件,例如节点、边等,接下来通过一个示例来了解。0Bj28资讯网——每日最新资讯28at.com

三、使用LangGraph改善RAG

在此示例中,希望将RAG系统在数据库中的最终输出减少到不超过30个字符。如果输出长度大于30个字符,则希望引入循环,使用不同的提示再次尝试,直到长度小于30个字符为止。这是一个演示目的的基本逻辑。你甚至可以实现复杂的逻辑来改善RAG结果。0Bj28资讯网——每日最新资讯28at.com

我们将创建的图形如下所示。0Bj28资讯网——每日最新资讯28at.com

图片图片0Bj28资讯网——每日最新资讯28at.com

此处使用的版本为 langchain===0.0.349, openai===1.3.8, langgraph===0.0.26。0Bj28资讯网——每日最新资讯28at.com

3.1 首先,让我们导入重要的内容并初始化LLM。这里使用的是OpenAI API,但你也可以使用其他LLM。

from typing import Dict, TypedDict, Optionalfrom langgraph.graph import StateGraph, ENDfrom langchain.vectorstores import Chromafrom langchain.chains import RetrievalQAfrom langchain.llms import OpenAIfrom langchain.embeddings.openai import OpenAIEmbeddingsllm = OpenAI(openai_api_key='your API')

接下来,我们将定义一个StateGraph。0Bj28资讯网——每日最新资讯28at.com

class GraphState(TypedDict):    question: Optional[str] = None    classification: Optional[str] = None    response: Optional[str] = None    length: Optional[int] = None    greeting: Optional[str] = Noneworkflow = StateGraph(GraphState)

什么是StateGraph?0Bj28资讯网——每日最新资讯28at.com

StateGraph是任何LangGraph流程的核心,它存储了在执行工作流程时我们将存储的各种变量的状态。在本例中,我们有5个变量,其值在执行图形时将进行更新,并将与所有边和节点共享。0Bj28资讯网——每日最新资讯28at.com

3.2 接下来,让我们从现有向量数据库中初始化一个RAG检索链。代码已在以下视频中进行了解释。

def retriever_qa_creation():        embeddings = OpenAIEmbeddings()        db = Chroma(embedding_functinotallow=embeddings,persist_directory='/database',collection_name='details')        qa = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=db.as_retriever())        return qarag_chain = retriever_qa_creation()

3.3 接下来,我们将向该图形添加节点。

def classify(question):    return llm("classify intent of given input as greeting or not_greeting. Output just the class.Input:{}".format(question)).strip()def classify_input_node(state):    question = state.get('question', '').strip()    classification = classify(question)     return {"classification": classification}def handle_greeting_node(state):    return {"greeting": "Hello! How can I help you today?"}def handle_RAG(state):    question = state.get('question', '').strip()    prompt = question    if state.get("length")<30:         search_result = rag_chain.run(prompt)    else:         search_result = rag_chain.run(prompt+'. Return total count only.')    return {"response": search_result,"length":len(search_result)}def bye(state):    return{"greeting":"The graph has finished"}workflow.add_node("classify_input", classify_input_node)workflow.add_node("handle_greeting", handle_greeting_node)workflow.add_node("handle_RAG", handle_RAG)workflow.add_node("bye", bye)

这需要一些解释。0Bj28资讯网——每日最新资讯28at.com

  • 每个节点都是一个Python函数,它可以:

①读取任何状态变量。0Bj28资讯网——每日最新资讯28at.com

②更新任何状态变量。在这种情况下,每个节点的返回函数都会更新某个或某些状态变量的状态/值。0Bj28资讯网——每日最新资讯28at.com

  • 使用state.get()来读取任何状态变量。
  • handle_RAG节点可以帮助我们实现我们希望的循环自定义逻辑。如果输出的长度<30,则使用提示符A;否则使用提示符B。对于第一种情况(当RAG节点尚未执行时),我们将传递length=0,并提供一个提示。

3.4 接下来,我们将添加入口点和边缘。

workflow.set_entry_point("classify_input")workflow.add_edge('handle_greeting', END)workflow.add_edge('bye', END)

在上述的代码片段中,0Bj28资讯网——每日最新资讯28at.com

  • 我们向图中添加了一个入口点,即无论输入提示是什么,都会执行的第一个节点函数。
  • A节点和B节点之间的边界定义了在节点A之后执行节点B。在这种情况下,如果在我们的工作流中出现了handle_greeting或bye,则图形应该END(一个特殊的节点来终止工作流)。

3.5 接下来,让我们添加条件边界。

def decide_next_node(state):    return "handle_greeting" if state.get('classification') == "greeting" else "handle_RAG"def check_RAG_length(state):    return "handle_RAG" if state.get("length")>30 else "bye"workflow.add_conditional_edges(    "classify_input",    decide_next_node,    {        "handle_greeting": "handle_greeting",        "handle_RAG": "handle_RAG"    })workflow.add_conditional_edges(    "handle_RAG",    check_RAG_length,    {        "bye": "bye",        "handle_RAG": "handle_RAG"    })

条件边界可根据条件(例如if-else)在两个节点之间进行选择。在创建的两个条件边界中:0Bj28资讯网——每日最新资讯28at.com

第一个条件边界0Bj28资讯网——每日最新资讯28at.com

当遇到classify_input时,根据decide_next_node函数的输出选择handle_greeting或handle_RAG。0Bj28资讯网——每日最新资讯28at.com

第二个条件边界0Bj28资讯网——每日最新资讯28at.com

如果遇到handle_RAG,则根据check_RAG_length条件选择handle_RAG或bye。0Bj28资讯网——每日最新资讯28at.com

3.6 编译并调用提示。初始时保持length变量设置为0。

app = workflow.compile()app.invoke({'question':'Mehul developed which projects?','length':0})
# 输出{'question': 'Mehul developed which projects?', 'classification': 'not_greeting', 'response': ' 4', 'length': 2, 'greeting': 'The graph has finished'}

对于上述提示,图形流程如下所示:0Bj28资讯网——每日最新资讯28at.com

classify_input: 情感将为not_greeting。0Bj28资讯网——每日最新资讯28at.com

由于第一个条件边界,移至handle_RAG。0Bj28资讯网——每日最新资讯28at.com

由于length=0,使用第一个提示并检索答案(总长度将大于30)。0Bj28资讯网——每日最新资讯28at.com

由于第二个条件边界,再次移至handle_RAG。0Bj28资讯网——每日最新资讯28at.com

由于length>30,使用第二个提示符。0Bj28资讯网——每日最新资讯28at.com

由于第二个条件边界,移至bye。0Bj28资讯网——每日最新资讯28at.com

END。0Bj28资讯网——每日最新资讯28at.com

如果没有使用LangGraph:0Bj28资讯网——每日最新资讯28at.com

rag_chain.run("Mehul developed which projects?")# 输出"Mehul developed projects like ABC, XYZ, QWERTY. Not only these, he has major contribution in many other projects as well at OOO organization"

3.7 下一个输入。

app.invoke({'question':'Hello bot','length':0})# 输出{'question': 'Hello bot', 'classification': 'greeting', 'response': None, 'length': 0, 'greeting': 'Hello! How can I help you today?'}

这里的流程会更简单。0Bj28资讯网——每日最新资讯28at.com

classify_input: 情感将为greeting。0Bj28资讯网——每日最新资讯28at.com

由于第一个条件边界,移至handle_greeting。0Bj28资讯网——每日最新资讯28at.com

END。0Bj28资讯网——每日最新资讯28at.com

虽然我在这里应用的条件相当简单,但通过添加更复杂的条件,这个框架可以很容易地用于改进你的结果。0Bj28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-79462-0.html使用LangChain和LangGraph大幅提升RAG效果

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: C# 向下转型与 is 运算符:理解它们在类型安全中的角色

下一篇: 开发者齐聚英特尔 OpenVINO™ DevCon 2024,展望混合 AI 最前沿

标签:
  • 热门焦点
  • Raft算法:保障分布式系统共识的稳健之道

    1. 什么是Raft算法?Raft 是英文”Reliable、Replicated、Redundant、And Fault-Tolerant”(“可靠、可复制、可冗余、可容错”)的首字母缩写。Raft算法是一种用于在分布式系统
  • 不容错过的MSBuild技巧,必备用法详解和实践指南

    一、MSBuild简介MSBuild是一种基于XML的构建引擎,用于在.NET Framework和.NET Core应用程序中自动化构建过程。它是Visual Studio的构建引擎,可在命令行或其他构建工具中使用
  • 企业采用CRM系统的11个好处

    客户关系管理(CRM)软件可以为企业提供很多的好处,从客户保留到提高生产力。  CRM软件用于企业收集客户互动,以改善客户体验和满意度。  CRM软件市场规模如今超过580
  • 让我们一起聊聊文件的操作

    文件【1】文件是什么?文件是保存数据的地方,是数据源的一种,比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据,它既可以保
  • 如何通过Python线程池实现异步编程?

    线程池的概念和基本原理线程池是一种并发处理机制,它可以在程序启动时创建一组线程,并将它们置于等待任务的状态。当任务到达时,线程池中的某个线程会被唤醒并执行任务,执行完任
  • 破圈是B站头上的紧箍咒

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之每年的暑期档都少不了瞄准追剧女孩们的古偶剧集,2021年有优酷的《山河令》,2022年有爱奇艺的《苍兰诀》,今年却轮到小破站抓住了追
  • 腾讯盖楼,字节拆墙

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之&ldquo;想重温暴刷深渊、30+技能搭配暴搓到爽的游戏体验吗?一起上晶核,即刻暴打!&rdquo;曾凭借直播腾讯旗下代理格斗游戏《DNF》一
  • iQOO Neo8 Pro评测:旗舰双芯加持 最强性能游戏旗舰

    【Techweb评测】去年10月,iQOO推出了一款Neo7手机,该机搭载了联发科天玑9000+,配备独显芯片Pro+,带来了同价位段最佳的游戏体验,一经上市便受到了诸多用
  • 联想YOGA 16s 2022笔记本将要推出,屏幕支持触控功能

    联想此前宣布,将于11月2日19:30召开联想秋季轻薄新品发布会,推出联想 YOGA 16s 2022 笔记本等新品。官方称,YOGA 16s 2022 笔记本将搭载 16 英寸屏幕,并且是一
Top