1、核心名词解释 #
本节主要讲解 AI 相关的基础名词和核心概念。
1.1 大模型(Large Model) #
# 定义:
指通过海量数据训练、参数量庞大的机器学习模型,具备强大的泛化能力和复杂任务处理能力
# 作用:
作为底层技术支撑,为自然语言处理、计算机视觉等领域提供基础能力
可通过微调或提示工程(Prompt)适配多种下游任务
# 应用场景:
文本生成(如写作、代码生成)、智能问答、图像生成等
# 典型案例:
GPT 系列、LLaMA、PaLM、豆包 AI 、Deepseek 的底层模型1.2 LLM(Large Language Model,大型语言模型) #
# 定义:
大模型的子集,特指以 自然语言为核心处理对象的大模型。
特指专注于自然语言处理的大模型,通过海量文本数据训练。
与大模型的关系:LLM 是大模型中最成熟的分支,专注于语言理解与生成,而大模型还包括多模态模型。
# 作用:
理解和生成人类语言,实现对话交互、文本摘要、翻译等。
作为构建智能应用的核心引擎(如 ChatGPT、豆包 AI)。
# 应用场景:
对话机器人、内容创作、翻译、代码生成、智能客服、知识问答、代码辅助开发等。1.3 ChatGPT #
# 定义:
由 OpenAI 开发的对话式 LLM 应用,基于 GPT 模型,通过强化学习从人类反馈中优化,专注于自然语言交互。
# 特点:
提供自然流畅的人机对话,支持信息查询、创意生成、问题解答等。
依赖预训练数据,缺乏实时信息。
# 特点:
界面友好,开箱即用;需联网获取实时信息(部分版本)。
# 技术定位:
LLM 的 应用型产品,而非底层模型本身。1.4 DeepSeek #
# 定义:
中国公司深度求索开发的 LLM,涵盖代码模型(DeepSeek-Coder)和对话模型(DeepSeek-R1)。
# 特点:
支持中文语境,代码生成能力较强(如适配 Python、Java 等语言)。
开源部分模型(如 DeepSeek-LLM-7B),供开发者微调。
# 定位:
国产 LLM 的技术探索与商业化尝试。1.5 豆包AI #
# 定义:
字节跳动开发的对话式 AI 产品,基于自研大模型(如豆包内部使用的 LLM),主打多场景实用工具(如写作助手、知识问答、代码解释)。
# 特点:
整合字节生态资源(如抖音、今日头条的内容数据)。
强调轻量化交互,适合日常办公与生活场景。
# 应用场景:
个人用户的聊天陪伴、学习工作辅助;企业集成至 APP 或网站提供智能服务。1.6 LangChain #
# 定义:
一个 开发框架(Framework),用于连接 LLM 与外部工具、数据,构建智能体(AI Agent)或复杂应用。
用于开发 LLM 驱动应用的框架,通过 “链”(Chain)连接模型、数据和工具,实现复杂逻辑。
# 作用:
简化 LLM 应用开发流程,支持检索增强生成(RAG)、多工具调用、对话状态管理等。
管理 LLM 的提示词(Prompt)与上下文(Context)。
集成工具调用(如搜索引擎、数据库、API),实现 “LLM + 工具” 的闭环。
# 技术定位:
属于智能体开发的基础设施,而非模型本身。
# 应用场景:
构建需要结合外部数据(如数据库、文档)的智能应用(如企业知识库问答)。
# 核心能力:
提示词管理、工具集成(如 API 调用)、状态记忆。1.7 RAG(检索增强生成) #
# 定义:
一种 技术架构,通过检索外部知识库来增强 LLM 的回答准确性,解决其 “幻觉”(编造错误信息)和时效性不足的问题,让 LLM 在生成内容时参考外部知识库。
支持处理需要最新数据或私有数据的场景(如企业内部文档问答)。
# 核心流程:
用户提问 → 2. 检索相关文档(如企业知识库、实时新闻)→ 3. 将检索结果与 LLM 生成结合 → 4. 输出回答。
# 技术定位:
属于 LLM 的增强技术,常与智能体、LangChain 配合使用(如在企业问答系统中整合 RAG)。
# 应用场景:
客服系统(基于产品手册回答问题)、法律文书生成(引用法规条款)。1.8 提示工程(Prompt) #
# 定义:
通过设计高质量的提示词(Prompt),引导 LLM 生成符合预期的输出。
# 作用:
最大化挖掘 LLM 潜力,优化回答准确性、格式或风格。
# 应用场景:
所有 LLM 应用中,如 ChatGPT、豆包 AI 的交互,或 LangChain 的提示词模板设计。
# 核心技巧:
明确目标(如 “请用 Markdown 列出步骤”)、提供示例、约束输出格式。1.9 AI 智能体(AI Agent/AI Bot) #
# 定义:人工智能代理
能通过 感知 - 决策 - 行动循环 自主完成任务的程序,通常基于 LLM 构建,并集成记忆、工具调用、规划等能力。
具备自主决策能力的智能实体,能通过感知环境、规划任务、调用工具完成目标(如 Manus:曼纳斯、Coze 构建的智能体)。
# 作用:
自动化执行复杂任务(如数据分析、流程审批),减少人类干预。
# 关键组件:
LLM:理解指令与生成文本
记忆系统:存储历史对话或任务状态(如向量数据库)。
工具调用:通过 LangChain 等框架连接外部服务(如搜索天气、发送邮件)。
# 典型形态:
自主问答智能体(如自动生成报告的助手)、任务规划智能体(如旅行路线规划器)。1.10 AIGC(AI Generated Content) #
# 定义:
AI自动创作生成的内容 (AI Generated Content),即AI接收到人下达的任务指令,通过处理人的自然语言,自动生成图片、视频、音频等。
打个通俗点的比方,AIGC就像一支马良神笔,拥有的无尽创造力。 这支笔的特别之处在于,是由AI打造的。
来自AI的理解力、想象力和创作力的加持,它可以根据指定的需求和样式,创作出各种内容:文章、短篇小说、报告、音乐、图像,甚至是视频。
# 作用:
降低内容创作门槛,提升效率(如自动生成营销文案、设计草图)。
# 应用场景:
广告创意、游戏开发(生成 NPC 对话、场景素材)、教育(个性化学习内容)。
# 与 LLM 的关系:
LLM 是 AIGC 的一种实现方式(文本生成),AIGC 还包括多模态模型(如 Stable Diffusion 生成图像。1.11 Dify #
# 定义:
开源的 LLM 应用开发平台,支持可视化工作流编排、RAG 配置、Agent 开发。
# 作用:
帮助开发者快速搭建定制化 AI 应用(如企业客服机器人、文档问答系统),无需深厚编程基础。
# 应用场景:
企业自建智能客服、内部知识管理系统、垂直领域数据分析工具。
# 核心功能:
拖拽式工作流设计、多模型支持(GPT/LLaMA 等)、API 集成。1.12 Cursor #
# 定义:
集成 AI 的代码编辑器,结合聊天机器人与开发环境,辅助开发者写代码。
# 作用:
通过自然语言生成代码、自动修复错误、分析代码结构,提升开发效率。
# 应用场景:
软件开发全流程(需求分析→编码→调试→文档生成),支持 Python、JavaScript 等语言。
# 特点:
实时交互(边聊边改代码)、支持私有代码库分析、隐私模式保障数据安全1.13 NLP #
# NLP(自然语言处理)和 LLM(大型语言模型)是包含与被包含的关系,二者既有技术关联,又有范畴差异。以下是具体解析。
# NLP 是 “学科”,LLM 是 “工具”;
LLM 是 NLP 技术发展的里程碑,但 NLP 还包含大量非 LLM 的基础技术和应用方法。
# 未来趋势:
LLM 可能成为 NLP 的主流技术底座,但 NLP 仍需结合领域知识、多模态数据、边缘计算等技术实现全面落地。2、名词梳理 #
| 类别 | 核心区别 | 典型案例 / 工具 |
|---|---|---|
| 模型基础 | 大模型 / LLM 是底层技术,提供基础能力;ChatGPT / 豆包 AI 是终端应用。 | 大模型:LLaMA;应用:豆包 AI |
| 开发工具 | LangChain/Dify 用于开发 LLM 应用,前者偏框架逻辑,后者偏可视化低代码。 | LangChain(代码开发)、Dify(低代码) |
| 功能扩展 | RAG 增强 LLM 的外部数据能力;AI Agent 实现自主任务执行。 | RAG + 企业文档库、AI Agent 自动报税 |
| 用户群体 | 提示工程面向终端用户(优化交互);Cursor/LangChain 面向开发者(技术赋能)。 | 提示工程:ChatGPT 用户;Cursor:程序员 |
| 内容生产 | AIGC 涵盖文本、图像等多模态生成;LLM 专注于语言领域。 | AIGC:MidJourney(图像);LLM:DeepSeek |
├─ 底层技术:大模型/LLM(如GPT、豆包AI模型)
├─ 开发工具:LangChain(逻辑编排)、Dify(低代码平台)、提示工程(交互优化)
-LangChain:代码开发
-Dify:低代码
├─ 功能增强:RAG(外部数据接入)、AI Agent(自主任务执行)
-RAG + 企业文档库
-AI Agent 自动报税
├─ 终端应用:ChatGPT、豆包AI、Cursor(代码助手)、企业级智能体(如Manus)、图像生成(MidJourney)
├─ 用户群体:提示工程 面向ChatGPT 用户(优化交互),Cursor/LangChain 面向程序员(技术赋能)