(LangChain)RAG系统链路向量检索器之Retrievers(五)

张开发

• 2026/5/22 23:22:07 • 15 分钟阅读

分享文章

1.RAG数据流水线示意图构建RAG系统涉及的技术链路环节: 文档加载器-文档转换器-文本嵌入模型-向量存储-检索器2.Retriever是什么统一接口标准化检索流程无论数据来源如何最终输出Document对象列表。多源混合检索支持同时查询向量库、传统数据库和搜索引擎【提高召回率】与VectorStore的关系Retriever不直接管理存储依赖VectorStore如FAISS、Chroma实现向量化与检索。RAG中的角色作为检索增强生成RAG流程的“数据入口”为生成模型提供精准上下文有多个实现VectorStoreRetriever、MultiQueryRetriever、SelfQueryRetriever等特点模块化设计支持插件式扩展可自定义检索算法如混合搜索、重排序。异步支持通过async_get_relevant_documents实现高并发场景下的高效检索。链式调用可与LangChain的其他组件如Text Splitters、Memory无缝集成。# from langchain_core.retrievers import BaseRetriever3.similarity search as_retriever 检索实操from langchain_community.embeddings import DashScopeEmbeddings from langchain_milvus import Milvus from langchain_core.documents import Document # 初始化模型 embeddings DashScopeEmbeddings( modeltext-embedding-v2, # 第二代通用模型 max_retries3, dashscope_api_keysk-0011111111, ) document_1 Document( page_contentLangChain支持多种数据库集成, metadata{source: langchain.net/doc1}, ) document_2 Document( page_contentMilvus擅长处理向量搜索, metadata{source: langchain.net/doc2}, ) document_3 Document( page_content我要去学AI课程, metadata{source: langchain.net/doc3}, ) document_4 Document( page_content今天天气不错, metadata{source: langchain.net/doc4}, ) documents [document_1, document_2, document_3, document_4] vector_store Milvus.from_documents( documentsdocuments, embeddingembeddings, collection_namennw_retriever_test, connection_args{uri: http://111.11.111.111:19530}, ) # 默认是 similarity search retriever vector_store.as_retriever(search_kwargs{k: 2}) results retriever.invoke(如何进行数据库操作) for result in results: print(f内容 {result.page_content} 元数据 {result.metadata})4.MultiQueryRetriever 提升召回率当原始查询不够明确时或者当文档库中的内容使用不同的术语表达同一概念时单一查询可能无法有效检案到所有相关内容;或者用户的问题可能有不同的表达方式导致的检索结果不理想需要从多个角度切入才能找到最相关的文档片段。这种情况下生成多个变体查询可以提高召回率确保覆盖更多相关文档。MultiQueryRetriever通过生成多个相关查询来增强检索效果解决单一查询可能不够全面或存在歧义的问题。原理查询扩展技术通过LLM生成N个相关查询如改写、扩展、翻译合并结果去重生成多个变体查询双重增强效果提升召回率25%↑和准确率18%↑的平衡代码:from langchain_community.embeddings import DashScopeEmbeddings # from langchain.vectorstores import Milvus from langchain_milvus import Milvus from langchain_openai import ChatOpenAI from langchain_community.document_loaders import TextLoader from langchain.retrievers.multi_query import MultiQueryRetriever from langchain_text_splitters import RecursiveCharacterTextSplitter import logging # 设置日志记录的基本配置 logging.basicConfig() # 设置多查询检索器的日志记录级别为INFO logging.getLogger(langchain.retrievers.multi_query).setLevel(logging.INFO) # 使用TextLoader加载文本数据 loader TextLoader(data/qa.txt, encodingutf-8) # 加载数据到变量中 data loader.load() # 初始化文本分割器将文本分割成小块 text_splitter RecursiveCharacterTextSplitter(chunk_size100, chunk_overlap10) # 执行文本分割 splits text_splitter.split_documents(data) # 初始化模型 embedding DashScopeEmbeddings( modeltext-embedding-v2, # 第二代通用模型 max_retries3, dashscope_api_keysk-005c3c2111xxxxx, ) # 初始化向量数据库 vector_store Milvus.from_documents( documentssplits, embeddingembedding, collection_namennw_mulit_retriever2, connection_args{uri: http://111.11.111.111:19530}, ) # 定义问题 question 不知道为啥抽筋了 # 初始化语言模型 llm ChatOpenAI( model_nameqwen-plus, base_urlhttps://dashscope.aliyuncs.com/compatible-mode/v1, api_keysk-005c111111111111, temperature0.7, ) # 从语言模型中创建多查询检索器 retriever_from_llm MultiQueryRetriever.from_llm( retrievervector_store.as_retriever(), llmllm ) # 使用检索器执行问题检索 results retriever_from_llm.invoke(question) # 打印检索到的结果数量 len(results) # 遍历并打印每个检索结果的内容和元数据 for result in results: print(f内容 {result.page_content} 元数据 {result.metadata})通过打印出来的log可以看到 ,将输入的一个问题,生成了3个不同角度的问题。通过生成多个相关查询来增强检索效果解决单一查询可能不够全面或存在歧义的问题。5.RAG综合查询from langchain_community.document_loaders import WebBaseLoader from langchain.text_splitter import RecursiveCharacterTextSplitter from langchain_milvus import Milvus from langchain.schema.runnable import RunnablePassthrough from langchain.prompts import PromptTemplate from langchain_community.embeddings import DashScopeEmbeddings from langchain_openai import ChatOpenAI from langchain_community.document_loaders import TextLoader # 设置Milvus Collection名称。 COLLECTION_NAME nnw_doc_qa_db # 使用TextLoader加载文本数据 loader TextLoader(data/qa.txt, encodingutf-8) # 加载数据到变量中 docs loader.load() # 初始化RecursiveCharacterTextSplitter用于切分文档。 text_splitter RecursiveCharacterTextSplitter(chunk_size1024, chunk_overlap0) # 使用LangChain将输入文档按照chunk_size切分。 all_splits text_splitter.split_documents(docs) # 初始化DashScopeEmbeddings设置embedding模型为DashScope的text-embedding-v2。 embeddings DashScopeEmbeddings( modeltext-embedding-v2, # 第二代通用模型 max_retries3, dashscope_api_keysk-005111111111108, ) # 创建connection为阿里云Milvus的访问域名。 connection_args {uri: http://111.11.111.111:19530} # 创建Collection。 vector_store Milvus( embedding_functionembeddings, connection_argsconnection_args, collection_nameCOLLECTION_NAME, drop_oldTrue, ).from_documents( all_splits, embeddingembeddings, collection_nameCOLLECTION_NAME, connection_argsconnection_args, ) # 初始化ChatOpenAI模型。 llm ChatOpenAI( model_nameqwen-plus, base_urlhttps://dashscope.aliyuncs.com/compatible-mode/v1, api_keysk-005c3c25f6dxxxxx, temperature0.7, ) # 将上述相似性检索的结果作为retriever提出问题输入到LLM之后获取检索增强之后的回答。 retriever vector_store.as_retriever() print(as_retriever, retriever) # 定义PromptTemplate用于构建输入给LLM的prompt。 template 你是AI文档助手使用以下上下文来回答最后的问题。如果你不知道答案就说你不知道不要试图编造答案。最多使用10句话并尽可能简洁地回答。总是在答案的末尾说“谢谢你的提问”. {context} 问题: {question} rag_prompt PromptTemplate.from_template(template) # 构建Retrieval-Augmented Generation链。 rag_chain {context: retriever, question: RunnablePassthrough()} | rag_prompt | llm result rag_chain.invoke(被宠物抓伤怎么办.) # 调用rag_chain回答问题。 print(回答, result.content)6.加入LangSmith查看log安装依赖:pip install langsmith0.3.19然后获取key 然后再加入下面这段内容import os import logging os.environ[LANGCHAIN_TRACING_V2] true os.environ[LANGCHAIN_API_KEY] lsv2_pt_111111942ca0 os.environ[LANGSMITH_ENDPOINT] https://api.smith.langchain.com os.environ[LANGSMITH_PROJECT] nnw_rag-retriever-demo logging.basicConfig(levellogging.DEBUG)RunnableParallel下面的2个是并行的,透传了用户输入检索根据log得知,最终我们的检索结果将会和输入的问题以及提示词一起发送给大模型,作为大模型的输入来源然后由大模型进行整理后输出。

更多文章

前端开发 2026/5/17 12:54:25

2025届最火的AI写作平台实际效果

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 当今，人工智能技术迅猛发展，在此情形下，AI论文网站已然成…

知识管理新范式：用kepano-obsidian打造专属知识网络【免费下载链接】kepano-obsidian My personal Obsidian vault template. A bottom-up approach to note-taking and organizing things I am interested in. 项目地址: https://gitcode.com/gh_mirrors/ke/kep…

张开发

前端开发 2026/5/20 16:33:06

效率飙升：基于快马平台秒级获取免安装的wsl开发脚手架

效率飙升：基于快马平台秒级获取免安装的wsl开发脚手架最近在Windows上折腾WSL开发环境时，发现wsl --install下载速度慢得让人抓狂。官方安装流程不仅耗时数小时，后续还要手动配置各种开发工具和环境变量，严重影响开发节奏。经过…

张开发

(LangChain)RAG系统链路向量检索器之Retrievers(五)

最新文章

.NET 11原生AI推理引擎深度解密：如何绕过ML.NET抽象层直驱ONNX Runtime 1.16 SIMD指令集？

告别BIGMAP水印！免费搭建GeoServer离线地图服务：从TIF/SHP数据到OpenLayers展示的保姆级教程

FPGA项目选RAM别纠结！单口、伪双口、真双口RAM性能实测对比（基于Artix-7开发板）

Day05：大模型生产环境常见问题与排障科普笔记

告别Makefile烦恼：用STM32CubeIDE一站式搞定ROS1 rosserial库的集成与编译

iOS企业应用分发太麻烦？手把手教你用MDM实现从上传IPA到员工手机自动安装的全链路

推荐文章

相关文章

分享文章

更多文章

2025届最火的AI写作平台实际效果

效率倍增器：利用快马AI自动生成网络设备批量巡检与健康报告脚本

Uncrustify测试框架：如何确保代码格式化质量

RecyclerListView性能监控终极指南：实时指标收集和异常告警

Thanos.sh快速入门：10分钟学会随机文件管理

OpenMS：生物质谱数据处理的开源神器，让科研更高效

CSDN首页发布文章基于Min-Max-Max-Min四层优化架构的多能源系统日前-实时两阶段鲁棒调度模型，结合了Wasserstein分布鲁棒优化(DRO)和CVaR风险管理，用于求解含高比例

Cockpit CMS终极扩展开发指南：7步创建自定义字段类型与组件

Vue Form Generator完全指南：从入门到精通的5个实用维度

别再只会colcon build了！这几个编译选项能让你的ROS2开发效率翻倍

知识管理新范式：用kepano-obsidian打造专属知识网络

效率飙升：基于快马平台秒级获取免安装的wsl开发脚手架