最新文章

MCP(上下文协议)

# MCP上下文协议(Model Context Protocol)全面介绍 MCP(Model Context Protocol,模型上下文协议)是Anthropic于2024年底推出的开放标准,核心定位是统一大语言模型(LLM)与外部数据、工具的交互接口,打破模型与外部系统的连接壁垒,实现...

Function Call

# Function Call(函数调用)全面介绍 ## 一、什么是Function Call 在大模型应用场景中,Function Call(函数调用)是指大模型根据用户的自然语言请求,主动生成结构化指令,调用外部工具、API或自定义函数的能力。它打破了大模型“仅能生成自然语言”的局限...

RAG

# RAG(检索增强生成)全面介绍 RAG,全称Retrieval\-Augmented Generation(检索增强生成),是一种融合“信息检索”与“语言生成”的技术,核心作用是为大语言模型(LLM)提供实时、权威的外部知识支撑,解决大模型天然存在的知识短板,让生成的答案更准确、可追溯、有...

LoRA/QLoRA

# LoRA与QLoRA详解 LoRA(Low\-Rank Adaptation,低秩适配)和QLoRA(Quantized LoRA,量化低秩适配)均是大模型微调的高效方法,核心目标是在降低显存消耗、控制训练成本的同时,保留模型原有能力并完成特定任务适配,二者本质是“基础方法\+优化升级”的...

模型微调(Fine-tuning)

# 大模型微调核心知识文档 # 一、文档说明 本文档系统性梳理大模型微调的基础概念、核心分类、主流技术方案、完整流程、硬件要求及常见问题,兼顾理论性与实用性,适合AI应用开发、模型落地相关从业者入门学习,也可作为技术参考与存档使用。文档内容通俗易懂,避免过度晦涩的专业术语,同时保留核心技...

Prompt 模板

# Prompt 万能模板库 ## 一、通用万能黄金模板(所有场景通用) ```plain text 你现在扮演【专业角色】 背景:【任务背景/需求场景】 任务:【明确要做什么事】 要求: 1. 【风格要求】 2. 【字数/篇幅要求】 3. 【输出格式:Markdown/列...

Prompt Engineering

## 1. 什么是 Prompt Engineering? **提示工程** 是设计和优化输入指令(Prompt),以引导大语言模型(如 GPT-4、Claude 等)生成**准确、相关、高质量**输出的实践科学。 > **通俗理解**:AI 像一个极度“字面”但知识渊博的助手。Prom...

LLM Token/上下文窗口/Embedding

### 2\.1 什么是 Token? Token 是大语言模型处理文本的最小基本单位。模型不直接识别原始字符,而是先将文本切分成一个个 Token,再进行后续的处理与理解。 **中文示例:** “我喜欢吃苹果” → ["我", "喜欢", "吃", "苹果"](共4个Token)...

LLM

# 什么是 LLM? ## 一、定义 **LLM** 是 **Large Language Model** 的缩写,中文全称为 **大语言模型**。 它是一类基于**深度学习**技术构建的、规模极其庞大的人工智能模型。其核心能力是**理解自然语言**、**生成自然语言文本**,并在...

Transformer

# Transformer架构总结 # 一、概述 Transformer是由Google团队于2017年在论文《Attention Is All You Need》中提出的深度学习架构,其核心设计摒弃了传统循环神经网络(RNN)、长短期记忆网络(LSTM)的串行计算模式,以自注意力机制为...