大模型小白必看:一文读懂LLM、Agent、RAG等核心术语,速收藏![特殊字符]

张开发
2026/4/4 1:30:55 15 分钟阅读
大模型小白必看:一文读懂LLM、Agent、RAG等核心术语,速收藏![特殊字符]
大模型小白必看一文读懂LLM、Agent、RAG等核心术语速收藏本文系统梳理了AI领域的重要术语如LLM、Agent、RAG、Prompt等通过通俗比喻和场景串联深入浅出地解释了这些概念的定义、作用及相互关系。文章旨在帮助程序员扫除盲点理解大模型技术体系并提供了速查表。内容涵盖了AI、LLM、Prompt、Agent、Workflow、Skill、RAG、Fine-tuning、MVP等核心概念以及它们在AI发展中的角色和联系。对于想进入大模型领域的程序员和小白来说这是一份不可多得的入门指南助你快速掌握AI核心技术抢占未来职业机遇。01 什么是AI人工智能AI全称 Artificial Intelligence人工智能。简单说让机器表现出「类人智能」的技术总称。包括让机器看懂图像、听懂语音、读懂文字、做出决策……凡是原本需要人类智力才能完成的事AI都在尝试接管。AI不是一个单一技术它是一个大家族下面还有很多分支机器学习Machine Learning让机器从数据中自动学习规律深度学习Deep Learning用多层神经网络模拟人脑思维自然语言处理NLP让机器理解和生成人类语言计算机视觉CV让机器看懂图片和视频 一个比喻AI是一栋大楼机器学习是里面的一层楼深度学习是这层楼的一个房间而GPT、Claude这类大语言模型则是住在这个房间里的明星租客。我们现在热议的AI大多数时候指的是以大语言模型为代表的「生成式AI」——能聊天、能写作、能生成图片和代码的那种。02 什么是LLM大语言模型LLM Large Language Model大语言模型。它是当前AI浪潮的核心引擎。你每天用的ChatGPT、Claude、文心一言本质上都是LLM。LLM是怎么运作的LLM是用海量文本训练出来的。简单说就是让模型读完了互联网上绝大多数的文字——书籍、新闻、代码、论文——然后学会了预测「下一个词应该是什么」。训练结束后模型就有了惊人的能力回答问题、写代码、总结文档、翻译语言……但说到底它做的事是「非常高级的文字接龙」。几个关键概念Token词元LLM处理文字的最小单位。不是字不是词大约1个中文汉字 ≈ 1-2个Token。Context Window上下文窗口模型一次能「记住」的内容长度。越大越贵也越聪明。Hallucination幻觉模型自信地说了错误信息。这是LLM的天然局限要注意甄别。⚠️ 关于幻觉LLM不会「承认自己不知道」它会选择编一个听起来合理的答案。这就是为什么验证很重要尤其是在专业领域。03 什么是Prompt提示词Prompt就是你给AI的指令或问题——是你和AI对话的输入内容。听起来很简单但Prompt的质量直接决定AI输出的质量。Prompt Engineering提示工程围绕如何写出高质量Prompt已经发展出了一门学问叫「提示工程」。核心原则清晰具体不要说「帮我写篇文章」要说「帮我写一篇500字的科普文章面向中学生介绍黑洞」赋予角色「你是一位资深产品经理请帮我……」给出示例「按照这个格式输出……」分步引导「先分析再给出结论」System Prompt系统提示词这是藏在产品底层、用户看不到的Prompt。它决定了AI的角色设定、行为规则、回答风格。你用的每一个AI产品背后都有一段精心设计的System Prompt在控制它的行为。04 什么是Agent智能体Agent是当前AI领域最热的概念之一。简单定义一个能感知环境、自主决策、并采取行动以完成目标的AI系统。如果说LLM是一个「大脑」那Agent就是把这个大脑装进了一个能行动的身体里。 LLM vs Agent 的核心区别LLM你问一个问题它给一个答案就结束了。Agent你给它一个目标它会自己拆解任务、调用工具、循环执行直到完成目标。Agent有哪些核心能力感知Perception能读取文件、搜索网页、获取数据推理Reasoning能分析问题、制定计划、判断下一步行动Action能调用工具、写代码并执行、操作软件记忆Memory能记住上下文甚至跨会话保留信息Multi-Agent多智能体当一个任务太复杂单个Agent搞不定时就会出现Multi-Agent架构——多个专门的Agent分工协作就像一支团队。比如一个Agent负责搜索信息一个负责分析数据一个负责写报告最后一个负责审核质量。它们协作完成一个复杂任务。05 什么是工作流Workflow工作流是将一系列任务按逻辑顺序连接起来的执行流程。在AI语境里工作流通常描述AI完成一项复杂任务的步骤设计。为什么需要工作流因为现实中的任务很少是一步完成的。比如「分析一份竞品报告」搜索竞品官网和最新动态提取关键信息功能、价格、用户评价与自家产品进行对比分析生成结构化报告发送给指定人员把这五步串起来就是一个AI工作流。Workflow vs Agent 的关系两者经常一起出现但有所区别工作流更强调「流程的设计」是静态的步骤规划Agent更强调「自主的执行」是动态的决策过程现代AI应用往往是两者结合用工作流定义大框架在每个节点上跑一个Agent来完成具体工作。06 什么是Skill技能Skill指的是AI能调用的具体能力模块也常叫 Tool工具。你可以把它理解为Agent工具箱里的每一个工具。常见的Skill类型搜索技能让AI能实时上网搜索信息代码执行让AI能写代码并运行处理数据文件读取让AI能读取PDF、Excel、Word等文档API调用让AI能与外部系统对接如日历、邮件、CRM图像生成让AI能生成图片数据库查询让AI能从数据库中检索信息 一个类比如果Agent是一位全能助理那Skill就是他的技能列表。没有「联网搜索」这个Skill他就只能从记忆里说话有了「发邮件」这个Skill他才能真的帮你发出去。Function Calling 和 MCP这是两个和Skill密切相关的技术词Function CallingOpenAI提出的标准让LLM能准确地调用外部函数/APIMCPModel Context ProtocolAnthropic主导推出的开放协议让模型能以标准方式连接各种外部工具和数据源是未来Agent生态的重要基础07 什么是RAG检索增强生成RAG Retrieval-Augmented Generation检索增强生成。解决的问题LLM的知识是有截止日期的它不知道你公司的内部文件也不知道昨天的新闻。RAG的思路在AI回答问题之前先去外部知识库里搜索相关内容再把搜到的内容塞给AI让它基于这些内容来回答。 RAG工作流程用户提问 → 系统去知识库搜索相关片段 → 将片段和问题一起交给LLM → LLM基于这些资料生成回答RAG是企业落地AI最常用的方案之一尤其适合客服机器人基于产品手册回答、企业知识库问答、内部文件检索等场景。相关技术词Embedding向量化将文字转为数字向量Vector DB向量数据库存储和检索这些向量的专用数据库08 什么是Fine-tuning微调Fine-tuning是在一个已有的大模型基础上用特定领域的数据进行再训练让模型在这个领域表现更好。通俗比喻通用大模型就像一个「全科医生」经过Fine-tuning可以变成专业的「心脏科专家」。Fine-tuning vs RAG该怎么选RAG适合需要实时更新、内容经常变化的场景如产品文档、新闻资讯。成本低、实现快。Fine-tuning适合需要模型学习特定风格、语气、或高度专业知识的场景如特定行业的专业术语。成本高、效果稳。两者结合先Fine-tuning训练专业知识再用RAG补充实时信息——这是很多企业级AI产品的做法。09 什么是MVP最小可行产品MVP Minimum Viable Product最小可行产品。这是一个来自创业领域的经典概念在AI产品开发中被广泛使用。核心思想不要追求完美用最少的功能、最快的速度验证你的核心假设是否成立。 MVP不是「不完整的产品」MVP是「最精准验证核心价值的产品」。它的目标不是上线所有功能而是以最小成本找到答案用户真的需要这个吗为什么AI产品特别需要MVP思维AI功能开发成本高、周期长错误方向代价很大用户对AI能力的预期模糊必须用真实反馈校准AI能力边界不清晰需要在实际场景中迭代发现问题MVP的三个步骤定义核心假设「如果做了X功能用户会产生Y行为」最快速度验证砍掉一切不必要的功能上线核心功能收集真实反馈不是问卷而是真实使用数据和用户行为10 这些概念的关系是什么读完前面这些你可能会好奇这些概念怎么连在一起我用一个场景串联起来 场景一家公司要用AI自动处理客户投诉① AI技术底座整个系统建立在AI能力之上② LLM大脑选用一个大语言模型作为核心引擎③ Prompt指令为客服场景精心设计系统提示词④ RAG知识库接入公司产品手册让AI能准确回答⑤ Skill工具箱赋予AI查订单、发邮件、记录CRM的能力⑥ Agent执行者整合以上能力能自主完成投诉处理全流程⑦ Workflow流程设计设计「收到投诉→分类→查单→回复→记录」的步骤⑧ MVP验证方式先在一个城市试运行收集数据再迭代这些概念不是孤立的而是像乐高积木一样一层一层搭建出来的。11 AI当前有哪些主要发展方向 AI Native 产品不是给传统产品「加个AI功能」而是从一开始就以AI为核心来设计产品。代表CursorAI代码编辑器、Notion AI、PerplexityAI搜索引擎。 Autonomous AI自主AIAI能在几乎不需要人工干预的情况下独立完成长周期、复杂任务。这是Agent发展的终极形态也是当前最热的研究和创业方向。 Multimodal多模态AI不再只懂文字而是能同时处理图片、视频、语音、代码……GPT-4V、Gemini、Claude都是典型的多模态模型。 AI Ops 企业落地用AI优化企业内部运营自动化流程、智能客服、数据分析助手……这是当前AI商业化最成熟的路径。 AI Alignment对齐与 Guardrails护栏随着AI越来越强大如何确保它按人类意图行事对齐如何防止它输出有害内容护栏成为越来越重要的研究方向。 AGI通用人工智能AI的终极目标——一个能像人类一样完成任何智力任务的AI。我们还没到那一步但OpenAI、Anthropic、DeepMind都在朝这个方向努力。总结一张概念速查表名词英文一句话记住它人工智能AI让机器模拟人类智能的技术总称大语言模型LLM能理解和生成文字的AI核心引擎如GPT、Claude提示词Prompt你给AI的指令质量直接影响输出效果智能体Agent能自主感知、决策、行动以完成目标的AI系统多智能体Multi-Agent多个Agent分工协作完成复杂任务工作流Workflow将多步骤任务串联起来的执行流程设计技能/工具Skill / ToolAgent能调用的具体能力模块检索增强生成RAG先搜索知识库再回答让AI能用最新信息微调Fine-tuning在通用大模型上用专领域数据再训练最小可行产品MVP用最少功能最快速度验证核心假设的产品提示工程Prompt Engineering优化Prompt以获得更好AI输出的方法论幻觉HallucinationAI自信地说了错误信息是LLM的天然局限附录AI领域常见专业名词速查按方向分类整理可作为日常参考词典。 基础概念层名词英文简说人工智能AI机器模拟人类智能的技术大家族机器学习Machine Learning让机器从数据中自动学习规律深度学习Deep Learning基于多层神经网络的机器学习方法大语言模型LLM如GPT、Claude能理解和生成文字的大模型神经网络Neural Network模仿人脑神经元结构的计算模型参数Parameter模型的「知识容量」如「千亿参数」词元Token模型处理文本的最小单位训练Training用大量数据让模型学习的过程推理Inference模型实际运行、生成输出的过程 Agent与应用层名词英文简说智能体Agent能自主感知、决策、行动的AI系统多智能体Multi-Agent多个Agent协作完成任务的架构工作流Workflow任务的多步骤执行流程设计技能/工具Skill / ToolAgent能调用的具体能力模块提示词Prompt给AI的指令或输入提示工程Prompt Engineering优化Prompt以获得更好结果的方法检索增强生成RAG让AI结合外部知识库来回答问题微调Fine-tuning在基础模型上针对特定场景再训练函数调用Function Calling让LLM能准确调用外部函数/API的标准模型上下文协议MCP模型调用外部工具的开放标准协议 产品与开发层名词英文简说最小可行产品MVP用最少功能验证核心价值的产品版本接口API让不同系统互相调用能力的标准接口管道Pipeline数据或任务的多步骤处理流水线向量化Embedding将文字转化为数字向量以供模型处理向量数据库Vector DB专门存储和检索Embedding的数据库上下文窗口Context Window模型每次能「记住」的最大内容长度系统提示词System Prompt给AI设定角色和规则的底层隐藏指令幻觉HallucinationAI自信地生成了看似合理但实际错误的内容 行业趋势层名词英文简说基础模型Foundation Model大规模预训练的通用AI模型如GPT-4、deepseek多模态Multimodal同时处理文字、图片、语音等多种形式AI原生AI Native以AI为核心构建的产品或公司副驾驶Copilot辅助人类工作的AI助手产品形态自主AIAutonomous AI无需人类干预、独立完成任务的AI通用人工智能AGI能像人一样完成所有任务的AI未来目标AI对齐AI Alignment让AI行为符合人类价值观的研究方向护栏Guardrails防止AI输出有害内容的限制机制 商业与落地层名词英文简说用例Use CaseAI在具体场景中的应用案例投入产出比ROI衡量AI项目商业价值的核心指标人机协作Human-in-the-loop保留人工审核环节的AI执行流程自动化AutomationAI替代重复性人工操作AI运营AI Ops用AI工具优化企业内部运营的实践无代码/低代码No-code / Low-code无需编程即可搭建AI应用的工具平台 收藏这篇文章遇到不懂的AI词翻出来查一查。最后近期科技圈传来重磅消息行业巨头英特尔宣布大规模裁员2万人传统技术岗位持续萎缩的同时另一番景象却在AI领域上演——AI相关技术岗正开启“疯狂扩招”模式据行业招聘数据显示具备3-5年大模型相关经验的开发者在大厂就能拿到50K×20薪的高薪待遇薪资差距肉眼可见业内资深HR预判不出1年“具备AI项目实战经验”将正式成为技术岗投递的硬性门槛。在行业迭代加速的当下“温水煮青蛙”式的等待只会让自己逐渐被淘汰与其被动应对不如主动出击抢先掌握AI大模型核心原理落地应用技术项目实操经验借行业风口实现职业翻盘深知技术人入门大模型时容易走弯路我特意整理了一套全网最全最细的大模型零基础学习礼包涵盖入门思维导图、经典书籍手册、从入门到进阶的实战视频、可直接运行的项目源码等核心内容。这份资料无需付费免费分享给所有想入局AI大模型的朋友扫码免费领取全部内容部分资料展示1、 AI大模型学习路线图2、 全套AI大模型应用开发视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、 大模型学习书籍文档4、AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、大模型大厂面试真题整理了百度、阿里、字节等企业近三年的AI大模型岗位面试题涵盖基础理论、技术实操、项目经验等维度每道题都配有详细解析和答题思路帮你针对性提升面试竞争力。6、大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。学会后的收获• 基于大模型全栈工程实现前端、后端、产品经理、设计、数据分析等通过这门课可获得不同能力• 能够利用大模型解决相关实际项目需求 大数据时代越来越多的企业和机构需要处理海量数据利用大模型技术可以更好地处理这些数据提高数据分析和决策的准确性。因此掌握大模型应用开发技能可以让程序员更好地应对实际项目需求• 基于大模型和企业数据AI应用开发实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能 学会Fine-tuning垂直训练大模型数据准备、数据蒸馏、大模型部署一站式掌握• 能够完成时下热门大模型垂直领域模型训练能力提高程序员的编码能力 大模型应用开发需要掌握机器学习算法、深度学习框架等技术这些技术的掌握可以提高程序员的编码能力和分析能力让程序员更加熟练地编写高质量的代码。扫码免费领取全部内容这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多文章