分类大模型技术下的文章

LoRA/QLoRA

2026-05-08 5 min

LoRA与QLoRA详解LoRA（Low-Rank Adaptation，低秩适配）和QLoRA（Quantized LoRA，量化低秩适配）均是大模型微调的高效方法，核心目标是在降低显存消耗、控制训练成本的同时，保留模型原有能力并完成特定任务适配，二者本质是“基础方法+优化升级”的关系，下面分别详...

大模型基础理论

模型微调（Fine-tuning）

2026-05-08 12 min

大模型微调核心知识文档一、文档说明本文档系统性梳理大模型微调的基础概念、核心分类、主流技术方案、完整流程、硬件要求及常见问题，兼顾理论性与实用性，适合AI应用开发、模型落地相关从业者入门学习，也可作为技术参考与存档使用。文档内容通俗易懂，避免过度晦涩的专业术语，同时保留核心技术细节，助力读者快速掌握...

大模型基础理论

Prompt Engineering

2026-05-08 4 min

1. 什么是 Prompt Engineering？提示工程是设计和优化输入指令（Prompt），以引导大语言模型（如 GPT-4、Claude 等）生成准确、相关、高质量输出的实践科学。通俗理解：AI 像一个极度“字面”但知识渊博的助手。Prompt Engineering 就是教会你如何写一份...

大模型基础理论

Prompt 模板

2026-05-08 5 min

Prompt 万能模板库一、通用万能黄金模板（所有场景通用）你现在扮演【专业角色】背景：【任务背景/需求场景】任务：【明确要做什么事】要求： 1. 【风格要求】 2. 【字数/篇幅要求】 3. 【输出格式：Markdown/列表/表格/分点】 4. 【禁止事项：不要废话、不要客套、不要解释原理...

大模型基础理论

LLM Token/上下文窗口/Embedding

2026-05-08 4 min

2.1 什么是 Token？Token 是大语言模型处理文本的最小基本单位。模型不直接识别原始字符，而是先将文本切分成一个个 Token，再进行后续的处理与理解。中文示例：“我喜欢吃苹果” → ["我", "喜欢", "吃", "苹果"]（共4个Token）英文示例：“ChatGPT” → 可能被拆...

大模型基础理论

LLM

2026-05-08 7 min

什么是 LLM？一、定义LLM 是 Large Language Model 的缩写，中文全称为大语言模型。它是一类基于深度学习技术构建的、规模极其庞大的人工智能模型。其核心能力是理解自然语言、生成自然语言文本，并在此基础之上展现出逻辑推理、知识问答、代码编写等复杂能力。可以用一句话概括：LLM ...

大模型基础理论

Transformer

2026-05-08 8 min

Transformer架构总结一、概述Transformer是由Google团队于2017年在论文《Attention Is All You Need》中提出的深度学习架构，其核心设计摒弃了传统循环神经网络（RNN）、长短期记忆网络（LSTM）的串行计算模式，以自注意力机制为核心，实现了并行计算，大...

大模型基础理论

wechat_agent_ai - main.py

2026-04-09 26 min

import re import hashlib import xml.etree.ElementTree as ET from datetime import datetime from fastapi import FastAPI, Request, Response # RAG from l...

Agent-项目

微信公众号 RAG Agent 最终版 GitHub 文档

2026-04-09 15 min

微信公众号 RAG Agent 最终版 GitHub 文档（已补全：项目目录、requirements.txt、Modelfile、Nginx反向代理、微信配置全流程、完整启动命令）🚀 项目介绍本项目是一个专为微信公众号设计的轻量智能对话Agent，基于 FastAPI + LangGraph + ...

Agent-项目

code - 本地智能问答助手(Ollama + RAG)

2026-04-03 11 min

数据向量化#读取现有json文件，不需要分割的数据直接构建 import json from langchain_experimental.text_splitter import SemanticChunker from langchain_community.vectorstores impo...

大模型代码 LangChain Code