大模型训练关键指标参数文档版本: v1.0 生成日期: 2026-05-25 说明: 本文档汇总了大语言模型(LLM)训练过程中的核心监控指标与关键参数,涵盖训练效率、模型质量、资源消耗等维度。目录训练效率指标模型质量指标资源消耗指标训练稳定性指标关键超参数配置监控面板推荐配置异常诊断速查表一、...
大模型基础理论
标签:大模型基础理论下的所有文章
AI Agent 驾驭工程(Harness Engineering)详解一、定义与核心定位Harness Engineering(驾驭工程)是2026年兴起的AI Agent工程新范式,核心是通过“外围管控系统”让原本不可控的大模型,稳定落地于企业生产环境,实现规模化商用。其核心公式清晰界定了各组件...
Agent Skill 完整介绍文档一、Agent Skill 定义Agent Skill(智能体技能) 是一种模块化、可复用、可共享的AI智能体能力包。它将完成某一类特定任务所需的领域知识、标准工作流程、外部工具调用逻辑、行为约束与输出规范,统一打包为标准化文件格式,可供大模型AI Agent 按...
AI智能体执行框架OpenClaw详细介绍OpenClaw(社区昵称“小龙虾AI”,曾用名ClawdBot、Moltbot)是由奥地利开发者Peter Steinberger于2025年底推出的开源、本地优先的AI智能体执行框架,其核心定位是为AI赋予“执行能力”,实现将自然语言指令转化为电脑、服务...
现代基于大模型的Agent介绍现代基于大模型的Agent(简称LLM-based Agent,即大模型智能体),是2022年底大语言模型(LLM)爆发后逐步成熟的新型智能系统,以大语言模型为核心“大脑”,整合感知、记忆、规划、工具调用、反思等能力,打破了传统AI的场景局限,实现了从“被动文本生成”到...
MCP上下文协议(Model Context Protocol)全面介绍MCP(Model Context Protocol,模型上下文协议)是Anthropic于2024年底推出的开放标准,核心定位是统一大语言模型(LLM)与外部数据、工具的交互接口,打破模型与外部系统的连接壁垒,实现“模型—数据...
Function Call(函数调用)全面介绍一、什么是Function Call在大模型应用场景中,Function Call(函数调用)是指大模型根据用户的自然语言请求,主动生成结构化指令,调用外部工具、API或自定义函数的能力。它打破了大模型“仅能生成自然语言”的局限,让AI从“被动应答”升级...
RAG(检索增强生成)全面介绍RAG,全称Retrieval-Augmented Generation(检索增强生成),是一种融合“信息检索”与“语言生成”的技术,核心作用是为大语言模型(LLM)提供实时、权威的外部知识支撑,解决大模型天然存在的知识短板,让生成的答案更准确、可追溯、有依据。简单来说...
LoRA与QLoRA详解LoRA(Low-Rank Adaptation,低秩适配)和QLoRA(Quantized LoRA,量化低秩适配)均是大模型微调的高效方法,核心目标是在降低显存消耗、控制训练成本的同时,保留模型原有能力并完成特定任务适配,二者本质是“基础方法+优化升级”的关系,下面分别详...
大模型微调核心知识文档一、文档说明本文档系统性梳理大模型微调的基础概念、核心分类、主流技术方案、完整流程、硬件要求及常见问题,兼顾理论性与实用性,适合AI应用开发、模型落地相关从业者入门学习,也可作为技术参考与存档使用。文档内容通俗易懂,避免过度晦涩的专业术语,同时保留核心技术细节,助力读者快速掌握...