乘风的人

# MCP上下文协议（Model Context Protocol）全面介绍 MCP（Model Context Protocol，模型上下文协议）是Anthropic于2024年底推出的开放标准，核心定位是统一大语言模型（LLM）与外部数据、工具的交互接口，打破模型与外部系统的连接壁垒，实现...

大模型基础理论

Function Call

2026-05-08 9 min

# Function Call（函数调用）全面介绍 ## 一、什么是Function Call 在大模型应用场景中，Function Call（函数调用）是指大模型根据用户的自然语言请求，主动生成结构化指令，调用外部工具、API或自定义函数的能力。它打破了大模型“仅能生成自然语言”的局限...

大模型基础理论

RAG

2026-05-08 8 min

# RAG（检索增强生成）全面介绍 RAG，全称Retrieval\-Augmented Generation（检索增强生成），是一种融合“信息检索”与“语言生成”的技术，核心作用是为大语言模型（LLM）提供实时、权威的外部知识支撑，解决大模型天然存在的知识短板，让生成的答案更准确、可追溯、有...

大模型基础理论

LoRA/QLoRA

2026-05-08 6 min

# LoRA与QLoRA详解 LoRA（Low\-Rank Adaptation，低秩适配）和QLoRA（Quantized LoRA，量化低秩适配）均是大模型微调的高效方法，核心目标是在降低显存消耗、控制训练成本的同时，保留模型原有能力并完成特定任务适配，二者本质是“基础方法\+优化升级”的...

大模型基础理论

模型微调（Fine-tuning）

2026-05-08 13 min

# 大模型微调核心知识文档 # 一、文档说明本文档系统性梳理大模型微调的基础概念、核心分类、主流技术方案、完整流程、硬件要求及常见问题，兼顾理论性与实用性，适合AI应用开发、模型落地相关从业者入门学习，也可作为技术参考与存档使用。文档内容通俗易懂，避免过度晦涩的专业术语，同时保留核心技...

大模型基础理论

Prompt 模板

2026-05-08 7 min

# Prompt 万能模板库 ## 一、通用万能黄金模板（所有场景通用） ```plain text 你现在扮演【专业角色】背景：【任务背景/需求场景】任务：【明确要做什么事】要求： 1. 【风格要求】 2. 【字数/篇幅要求】 3. 【输出格式：Markdown/列...

大模型基础理论

Prompt Engineering

2026-05-08 6 min

## 1. 什么是 Prompt Engineering？ **提示工程** 是设计和优化输入指令（Prompt），以引导大语言模型（如 GPT-4、Claude 等）生成**准确、相关、高质量**输出的实践科学。 > **通俗理解**：AI 像一个极度“字面”但知识渊博的助手。Prom...

大模型基础理论

LLM Token/上下文窗口/Embedding

2026-05-08 5 min

### 2\.1 什么是 Token？ Token 是大语言模型处理文本的最小基本单位。模型不直接识别原始字符，而是先将文本切分成一个个 Token，再进行后续的处理与理解。 **中文示例：** “我喜欢吃苹果” → ["我", "喜欢", "吃", "苹果"]（共4个Token）...

大模型基础理论

LLM

2026-05-08 9 min

# 什么是 LLM？ ## 一、定义 **LLM** 是 **Large Language Model** 的缩写，中文全称为 **大语言模型**。它是一类基于**深度学习**技术构建的、规模极其庞大的人工智能模型。其核心能力是**理解自然语言**、**生成自然语言文本**，并在...

大模型基础理论

Transformer

2026-05-08 8 min

# Transformer架构总结 # 一、概述 Transformer是由Google团队于2017年在论文《Attention Is All You Need》中提出的深度学习架构，其核心设计摒弃了传统循环神经网络（RNN）、长短期记忆网络（LSTM）的串行计算模式，以自注意力机制为...

大模型基础理论

上一页 1 2 345 6 7 8 9...25 下一页