1、核心名词解释 #

本节主要讲解 AI 相关的基础名词和核心概念。

1.1 大模型（Large Model) #

# 定义：
指通过海量数据训练、参数量庞大的机器学习模型，具备强大的泛化能力和复杂任务处理能力

# 作用：
作为底层技术支撑，为自然语言处理、计算机视觉等领域提供基础能力
可通过微调或提示工程(Prompt)适配多种下游任务

# 应用场景：
文本生成（如写作、代码生成）、智能问答、图像生成等

# 典型案例：
GPT 系列、LLaMA、PaLM、豆包 AI 、Deepseek 的底层模型

1.2 LLM（Large Language Model，大型语言模型） #

# 定义：
大模型的子集，特指以 自然语言为核心处理对象的大模型。
特指专注于自然语言处理的大模型，通过海量文本数据训练。
与大模型的关系：LLM 是大模型中最成熟的分支，专注于语言理解与生成，而大模型还包括多模态模型。

# 作用：
理解和生成人类语言，实现对话交互、文本摘要、翻译等。
作为构建智能应用的核心引擎（如 ChatGPT、豆包 AI）。

# 应用场景：
对话机器人、内容创作、翻译、代码生成、智能客服、知识问答、代码辅助开发等。

1.3 ChatGPT #

# 定义：
由 OpenAI 开发的对话式 LLM 应用，基于 GPT 模型，通过强化学习从人类反馈中优化，专注于自然语言交互。

# 特点：
提供自然流畅的人机对话，支持信息查询、创意生成、问题解答等。
依赖预训练数据，缺乏实时信息。

# 特点：
界面友好，开箱即用；需联网获取实时信息（部分版本）。

# 技术定位：
LLM 的 应用型产品，而非底层模型本身。

1.4 DeepSeek #

# 定义：
中国公司深度求索开发的 LLM，涵盖代码模型（DeepSeek-Coder）和对话模型（DeepSeek-R1）。

# 特点：
支持中文语境，代码生成能力较强（如适配 Python、Java 等语言）。
开源部分模型（如 DeepSeek-LLM-7B），供开发者微调。

# 定位：
国产 LLM 的技术探索与商业化尝试。

1.5 豆包AI #

# 定义：
字节跳动开发的对话式 AI 产品，基于自研大模型（如豆包内部使用的 LLM），主打多场景实用工具（如写作助手、知识问答、代码解释）。

# 特点：
整合字节生态资源（如抖音、今日头条的内容数据）。
强调轻量化交互，适合日常办公与生活场景。

# 应用场景：
个人用户的聊天陪伴、学习工作辅助；企业集成至 APP 或网站提供智能服务。

1.6 LangChain #

# 定义：
一个 开发框架（Framework），用于连接 LLM 与外部工具、数据，构建智能体（AI Agent）或复杂应用。
用于开发 LLM 驱动应用的框架，通过 “链”（Chain）连接模型、数据和工具，实现复杂逻辑。

# 作用：
简化 LLM 应用开发流程，支持检索增强生成（RAG）、多工具调用、对话状态管理等。
管理 LLM 的提示词（Prompt）与上下文（Context）。
集成工具调用（如搜索引擎、数据库、API），实现 “LLM + 工具” 的闭环。

# 技术定位：
属于智能体开发的基础设施，而非模型本身。

# 应用场景：
构建需要结合外部数据（如数据库、文档）的智能应用（如企业知识库问答）。

# 核心能力：
提示词管理、工具集成（如 API 调用）、状态记忆。

1.7 RAG(检索增强生成) #

# 定义：
一种 技术架构，通过检索外部知识库来增强 LLM 的回答准确性，解决其 “幻觉”（编造错误信息）和时效性不足的问题，让 LLM 在生成内容时参考外部知识库。
支持处理需要最新数据或私有数据的场景（如企业内部文档问答）。

# 核心流程：
用户提问 → 2. 检索相关文档（如企业知识库、实时新闻）→ 3. 将检索结果与 LLM 生成结合 → 4. 输出回答。

# 技术定位：
属于 LLM 的增强技术，常与智能体、LangChain 配合使用（如在企业问答系统中整合 RAG）。

# 应用场景：
客服系统（基于产品手册回答问题）、法律文书生成（引用法规条款）。

1.8 提示工程（Prompt） #

# 定义：
通过设计高质量的提示词（Prompt），引导 LLM 生成符合预期的输出。

# 作用：
最大化挖掘 LLM 潜力，优化回答准确性、格式或风格。

# 应用场景：
所有 LLM 应用中，如 ChatGPT、豆包 AI 的交互，或 LangChain 的提示词模板设计。

# 核心技巧：
明确目标（如 “请用 Markdown 列出步骤”）、提供示例、约束输出格式。

1.9 AI 智能体(AI Agent/AI Bot) #

# 定义：人工智能代理
能通过 感知 - 决策 - 行动循环 自主完成任务的程序，通常基于 LLM 构建，并集成记忆、工具调用、规划等能力。
具备自主决策能力的智能实体，能通过感知环境、规划任务、调用工具完成目标（如 Manus:曼纳斯、Coze 构建的智能体）。

# 作用：
自动化执行复杂任务（如数据分析、流程审批），减少人类干预。

# 关键组件：
LLM：理解指令与生成文本
记忆系统：存储历史对话或任务状态（如向量数据库）。
工具调用：通过 LangChain 等框架连接外部服务（如搜索天气、发送邮件）。

# 典型形态：
自主问答智能体（如自动生成报告的助手）、任务规划智能体（如旅行路线规划器）。

1.10 AIGC（AI Generated Content） #

# 定义：
AI自动创作生成的内容 （AI Generated Content），即AI接收到人下达的任务指令，通过处理人的自然语言，自动生成图片、视频、音频等。 
打个通俗点的比方，AIGC就像一支马良神笔，拥有的无尽创造力。 这支笔的特别之处在于，是由AI打造的。 
来自AI的理解力、想象力和创作力的加持，它可以根据指定的需求和样式，创作出各种内容：文章、短篇小说、报告、音乐、图像，甚至是视频。

# 作用：
降低内容创作门槛，提升效率（如自动生成营销文案、设计草图）。

# 应用场景：
广告创意、游戏开发（生成 NPC 对话、场景素材）、教育（个性化学习内容）。

# 与 LLM 的关系：
LLM 是 AIGC 的一种实现方式（文本生成），AIGC 还包括多模态模型（如 Stable Diffusion 生成图像。

1.11 Dify #

# 定义：
开源的 LLM 应用开发平台，支持可视化工作流编排、RAG 配置、Agent 开发。

# 作用：
帮助开发者快速搭建定制化 AI 应用（如企业客服机器人、文档问答系统），无需深厚编程基础。

# 应用场景：
企业自建智能客服、内部知识管理系统、垂直领域数据分析工具。

# 核心功能：
拖拽式工作流设计、多模型支持（GPT/LLaMA 等）、API 集成。

1.12 Cursor #

# 定义：
集成 AI 的代码编辑器，结合聊天机器人与开发环境，辅助开发者写代码。

# 作用：
通过自然语言生成代码、自动修复错误、分析代码结构，提升开发效率。

# 应用场景：
软件开发全流程（需求分析→编码→调试→文档生成），支持 Python、JavaScript 等语言。

# 特点：
实时交互（边聊边改代码）、支持私有代码库分析、隐私模式保障数据安全

1.13 NLP #

# NLP（自然语言处理）和 LLM（大型语言模型）是包含与被包含的关系，二者既有技术关联，又有范畴差异。以下是具体解析。

# NLP 是 “学科”，LLM 是 “工具”；
LLM 是 NLP 技术发展的里程碑，但 NLP 还包含大量非 LLM 的基础技术和应用方法。

# 未来趋势：
LLM 可能成为 NLP 的主流技术底座，但 NLP 仍需结合领域知识、多模态数据、边缘计算等技术实现全面落地。

2、名词梳理 #

类别	核心区别	典型案例 / 工具
模型基础	大模型 / LLM 是底层技术，提供基础能力；ChatGPT / 豆包 AI 是终端应用。	大模型：LLaMA；应用：豆包 AI
开发工具	LangChain/Dify 用于开发 LLM 应用，前者偏框架逻辑，后者偏可视化低代码。	LangChain（代码开发）、Dify（低代码）
功能扩展	RAG 增强 LLM 的外部数据能力；AI Agent 实现自主任务执行。	RAG + 企业文档库、AI Agent 自动报税
用户群体	提示工程面向终端用户（优化交互）；Cursor/LangChain 面向开发者（技术赋能）。	提示工程：ChatGPT 用户；Cursor：程序员
内容生产	AIGC 涵盖文本、图像等多模态生成；LLM 专注于语言领域。	AIGC：MidJourney（图像）；LLM：DeepSeek

├─ 底层技术：大模型/LLM（如GPT、豆包AI模型）  

├─ 开发工具：LangChain（逻辑编排）、Dify（低代码平台）、提示工程（交互优化）  
	-LangChain：代码开发
    -Dify：低代码
    
├─ 功能增强：RAG（外部数据接入）、AI Agent（自主任务执行）  
	-RAG + 企业文档库
    -AI Agent 自动报税
  
├─ 终端应用：ChatGPT、豆包AI、Cursor（代码助手）、企业级智能体（如Manus）、图像生成(MidJourney)

├─ 用户群体：提示工程 面向ChatGPT 用户（优化交互）,Cursor/LangChain 面向程序员（技术赋能）