零基础搭建RAG系统：手把手教你用Qwen3-Embedding-4B构建知识库

张开发

• 2026/4/18 20:28:16 • 15 分钟阅读

分享文章

零基础搭建RAG系统手把手教你用Qwen3-Embedding-4B构建知识库1. 认识Qwen3-Embedding-4B你的智能语义理解助手想象一下你有一个能理解各种语言、能记住整本书内容、还能帮你快速找到相关资料的智能助手。这就是Qwen3-Embedding-4B能为你做的事情。作为阿里云通义千问家族的最新成员这个专门用于文本理解的AI模型有三大超能力语言大师能处理超过100种语言包括中文、英文和各种编程语言记忆超人可以一次性理解长达32,000个单词的内容相当于一本小册子搜索专家能把文字转换成精准的数字向量帮你快速找到相关内容最棒的是这个强大的工具现在可以通过简单的代码就能使用。接下来我会带你从零开始一步步搭建一个能自动整理和检索知识的智能系统。2. 准备工作搭建你的AI工作环境2.1 快速启动Qwen3-Embedding-4B服务让我们用最简单的方法启动这个AI模型。打开你的电脑终端Windows用户用CMD或PowerShellMac/Linux用户用Terminal输入以下命令# 拉取预装好的Docker镜像 docker pull qwen3-embedding-4b-mirror # 运行容器确保你已经安装了Docker docker run -d -p 30000:30000 --gpus all qwen3-embedding-4b-mirror这个命令会下载一个已经配置好的环境里面包含了运行Qwen3-Embedding-4B所需的一切。如果你的电脑有NVIDIA显卡建议RTX 3060或更高记得安装好显卡驱动和CUDA工具包。2.2 验证服务是否正常运行等待几分钟后服务就应该启动完成了。我们可以用Python代码来测试一下import openai # 连接到本地服务 client openai.Client( base_urlhttp://localhost:30000/v1, api_keyEMPTY # 不需要真正的API key ) # 测试一个简单的句子 response client.embeddings.create( modelQwen3-Embedding-4B, input如何学习人工智能, ) print(f生成的向量长度{len(response.data[0].embedding)})如果看到输出显示生成的向量长度2560恭喜你你的AI语义理解引擎已经准备就绪。3. 构建你的第一个知识库3.1 准备知识文档现在我们来创建一个简单的技术文档库。在你的工作目录下新建一个文件夹比如叫my_knowledge_base然后放入一些文本文件my_knowledge_base/ ├── 机器学习基础.txt ├── Python编程技巧.md └── 深度学习论文摘要.pdf每个文件可以包含相关主题的内容。比如机器学习基础.txt可能包含监督学习是指从标记数据中学习的机器学习方法常见算法包括 - 线性回归用于预测连续值 - 逻辑回归用于分类问题 - 支持向量机(SVM)强大的分类器3.2 将文档转换为向量我们需要写一个小程序把所有这些文档转换成Qwen3-Embedding-4B能理解的向量形式import os from openai import OpenAI import numpy as np client OpenAI(base_urlhttp://localhost:30000/v1, api_keyEMPTY) def process_documents(folder_path): knowledge_vectors {} for filename in os.listdir(folder_path): filepath os.path.join(folder_path, filename) with open(filepath, r, encodingutf-8) as f: content f.read() # 为检索生成向量 response client.embeddings.create( modelQwen3-Embedding-4B, inputf为检索生成向量{content}, ) knowledge_vectors[filename] { content: content, vector: response.data[0].embedding } return knowledge_vectors # 处理我们的知识库文件夹 knowledge_base process_documents(my_knowledge_base)这段代码会读取文件夹中的每个文件用Qwen3-Embedding-4B将其内容转换为2560维的向量并保存起来供后续检索使用。4. 实现智能检索功能4.1 构建简单的检索系统有了向量化的知识库我们现在可以创建一个检索功能from sklearn.metrics.pairwise import cosine_similarity def search_knowledge(query, knowledge_base, top_k3): # 将查询语句也转换为向量 response client.embeddings.create( modelQwen3-Embedding-4B, inputf为检索生成向量{query}, ) query_vector np.array(response.data[0].embedding).reshape(1, -1) # 计算与所有文档的相似度 results [] for filename, data in knowledge_base.items(): doc_vector np.array(data[vector]).reshape(1, -1) similarity cosine_similarity(query_vector, doc_vector)[0][0] results.append((filename, similarity, data[content])) # 按相似度排序返回最相关的几个结果 results.sort(keylambda x: x[1], reverseTrue) return results[:top_k]4.2 测试你的知识库现在让我们试试这个检索系统# 搜索关于分类算法的信息 results search_knowledge(有哪些常见的分类方法, knowledge_base) # 打印结果 for i, (filename, score, content) in enumerate(results, 1): print(f\n结果 {i}: {filename} (相似度: {score:.3f})) print(内容摘要:, content[:200] ...) # 只打印前200字符你应该能看到系统返回了与分类算法最相关的文档片段即使你的查询语句和文档中的原话并不完全一致。5. 进阶技巧提升你的RAG系统5.1 处理长文档的策略Qwen3-Embedding-4B支持长达32k的上下文但对于特别长的文档我们可以采用分段处理def split_text(text, max_length10000): 将长文本分割成适当大小的块 words text.split() chunks [] current_chunk [] current_length 0 for word in words: if current_length len(word) 1 max_length: chunks.append( .join(current_chunk)) current_chunk [] current_length 0 current_chunk.append(word) current_length len(word) 1 if current_chunk: chunks.append( .join(current_chunk)) return chunks # 使用分段处理长文档 long_document ... # 你的长文档内容 chunks split_text(long_document) chunk_vectors [client.embeddings.create(modelQwen3-Embedding-4B, inputchunk).data[0].embedding for chunk in chunks]5.2 使用指令优化检索质量Qwen3-Embedding-4B支持通过指令调整向量生成方式这在不同的应用场景中非常有用# 为不同任务使用不同指令 retrieval_vector client.embeddings.create( modelQwen3-Embedding-4B, input为检索生成向量机器学习入门, ).data[0].embedding classification_vector client.embeddings.create( modelQwen3-Embedding-4B, input为分类生成向量机器学习入门, ).data[0].embedding print(相同内容不同指令的向量相似度:, cosine_similarity([retrieval_vector], [classification_vector])[0][0])你会发现同样的内容在不同指令下生成的向量会有明显差异这使得模型能更好地适应各种任务。6. 总结与下一步恭喜你已经成功搭建了一个基于Qwen3-Embedding-4B的知识检索系统。让我们回顾一下关键步骤启动服务用Docker快速部署了Qwen3-Embedding-4B模型构建知识库将文本资料转换为语义向量实现检索通过余弦相似度找到最相关的内容优化系统学会了处理长文档和使用指令提升效果下一步你可以尝试接入真正的向量数据库如Chroma或Milvus管理大量文档将检索结果输入大语言模型如Qwen1.5生成更自然的回答为不同领域的知识创建专门的向量空间获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

更多文章

前端开发 2026/4/18 20:24:14

MaaYuan：基于图像识别的游戏自动化框架设计与实现

MaaYuan：基于图像识别的游戏自动化框架设计与实现【免费下载链接】MaaYuan 代号鸢 / 如鸢一键长草小助手项目地址: https://gitcode.com/gh_mirrors/ma/MaaYuan MaaYuan是一个基于MaaFramework开发的游戏自动化助手，专门为《代号鸢》和《如鸢》…

如何在Windows上轻松安装安卓应用？APK Installer终极解决方案来了！ 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否曾经在Windows电脑上收…

张开发

前端开发 2026/4/18 20:01:36

逆向思维：不写爬虫，用FFmpeg一键下载微信小程序里的M3U8视频流

逆向思维：用FFmpeg高效下载微信小程序M3U8视频流每次遇到需要保存微信小程序里的视频时，大多数开发者第一反应就是写爬虫——抓包分析、下载TS片段、合并文件，一套流程下来至少得折腾半小时。但今天我要分享一个更聪明的解决方案&#xff1a…

张开发

零基础搭建RAG系统：手把手教你用Qwen3-Embedding-4B构建知识库

最新文章

HWIOAuthBundle性能优化：大规模用户认证的5个最佳实践

从ViT到Swin：手把手教你理解Transformer在CV中的进化之路（附PyTorch代码解读）

CLIP ViT-H-14镜像免配置部署教程：7860端口Web界面快速启动详解

深入理解 Flink：现代实时数据处理引擎详解

终极指南：Python-Markdown如何完美支持多语言和双向文本处理

【SITS2026权威解码】：20年AGI实战专家亲授——3大未公开技术瓶颈与2026落地攻坚路线图

推荐文章

DE1-SoC实战指南：在Qsys/Platform中集成GHRD工程与扩展SPI外设——（de1教程2.5节）

5个核心技术维度解析Cursor Pro激活工具：从机器标识到订阅验证的完整技术栈

vLLM推理引擎教程7-CUDA Graph：从原理到实战的性能优化指南

Rust 泛型与特征约束的应用

利用 milvus-backup 完成从单机到分布式 Milvus 的无缝数据迁移实战

风险管理的识别评估与应对策略

相关文章

Java PTA练习避坑指南：如何避免PersonOverride类中的常见错误（含完整代码示例）

DanKoe 视频笔记：成为失败者：重新定义成功与快乐 [特殊字符]

Caxa二次开发环境配置避坑指南：从ObjectCRX安装到HelloWorld运行

5分钟极速部署：Sakura启动器如何让AI翻译变得像聊天一样简单？

LuckyLilliaBot深度解析：高性能NTQQ OneBot 11协议框架架构设计与实现

OpenClaw 2026年3月史诗级迭代全景深度分析报告：从危机到新生，从工具到生态操作系统

分享文章

更多文章

MaaYuan：基于图像识别的游戏自动化框架设计与实现

深入探索Midscene.js：解锁AI驱动跨平台自动化测试的7个高效技巧

统信UOS桌面版也能玩转经典街机？手把手教你用MAME模拟器搞定拳皇97

算法提高12.差分约束(一)

如何用LeRobot在3天内打造你的第一个智能机器人？

【奇点2026独家前瞻】：AI代码配额管理已成新“数字配给制”？解读ISO/IEC 23894-2:2026草案第4.2条强制条款

FanControl终极指南：3步打造你的个性化散热管理系统

别再为第三方变频器头疼了！西门子PLC PROFINET通讯的两种核心玩法：速度控制与参数读写

3步彻底解决Windows系统卡顿问题：Winhance中文版完全指南

【Python实战】Windows系统下ONNX Runtime环境搭建：从CPU到GPU推理的完整配置指南

如何在Windows上轻松安装安卓应用？APK Installer终极解决方案来了！

逆向思维：不写爬虫，用FFmpeg一键下载微信小程序里的M3U8视频流