标签大模型基础理论下的文章

Prompt Engineering

2026-05-08 4 min

1. 什么是 Prompt Engineering？提示工程是设计和优化输入指令（Prompt），以引导大语言模型（如 GPT-4、Claude 等）生成准确、相关、高质量输出的实践科学。通俗理解：AI 像一个极度“字面”但知识渊博的助手。Prompt Engineering 就是教会你如何写一份...

大模型基础理论

Prompt 模板

2026-05-08 5 min

Prompt 万能模板库一、通用万能黄金模板（所有场景通用）你现在扮演【专业角色】背景：【任务背景/需求场景】任务：【明确要做什么事】要求： 1. 【风格要求】 2. 【字数/篇幅要求】 3. 【输出格式：Markdown/列表/表格/分点】 4. 【禁止事项：不要废话、不要客套、不要解释原理...

大模型基础理论

LLM Token/上下文窗口/Embedding

2026-05-08 4 min

2.1 什么是 Token？Token 是大语言模型处理文本的最小基本单位。模型不直接识别原始字符，而是先将文本切分成一个个 Token，再进行后续的处理与理解。中文示例：“我喜欢吃苹果” → ["我", "喜欢", "吃", "苹果"]（共4个Token）英文示例：“ChatGPT” → 可能被拆...

大模型基础理论

LLM

2026-05-08 7 min

什么是 LLM？一、定义LLM 是 Large Language Model 的缩写，中文全称为大语言模型。它是一类基于深度学习技术构建的、规模极其庞大的人工智能模型。其核心能力是理解自然语言、生成自然语言文本，并在此基础之上展现出逻辑推理、知识问答、代码编写等复杂能力。可以用一句话概括：LLM ...

大模型基础理论

Transformer

2026-05-08 8 min

Transformer架构总结一、概述Transformer是由Google团队于2017年在论文《Attention Is All You Need》中提出的深度学习架构，其核心设计摒弃了传统循环神经网络（RNN）、长短期记忆网络（LSTM）的串行计算模式，以自注意力机制为核心，实现了并行计算，大...

大模型基础理论