2.1 什么是 Token?Token 是大语言模型处理文本的最小基本单位。模型不直接识别原始字符,而是先将文本切分成一个个 Token,再进行后续的处理与理解。中文示例:“我喜欢吃苹果” → ["我", "喜欢", "吃", "苹果"](共4个Token)英文示例:“ChatGPT” → 可能被拆...
大模型文档
技术
什么是 LLM?一、定义LLM 是 Large Language Model 的缩写,中文全称为 大语言模型。它是一类基于深度学习技术构建的、规模极其庞大的人工智能模型。其核心能力是理解自然语言、生成自然语言文本,并在此基础之上展现出逻辑推理、知识问答、代码编写等复杂能力。可以用一句话概括:LLM ...
Transformer架构总结一、概述Transformer是由Google团队于2017年在论文《Attention Is All You Need》中提出的深度学习架构,其核心设计摒弃了传统循环神经网络(RNN)、长短期记忆网络(LSTM)的串行计算模式,以自注意力机制为核心,实现了并行计算,大...
14 - RAG Advanced (RAG 进阶)快速开始# 1. 安装额外依赖 pip install rank_bm25 chromadb langchain-classic # 2. 运行完整示例 cd phase2_practical python 14_rag_advanced/mai...
完整json对话日志注解{ "messages": [ // ============================================== // 1. 用户提问 // ==================================...
BaseLoader、Document源码分析BaseLoaderLangChain在设计时,要保证Source中多种不同的数据源,在接下来的流程中可以用一种统一 的形式读取、调用。 另一方面:为什么 PDFloader 和 TextLoader 等Document Loader 都使用 load...
大模型 RAG (检索增强生成) 详解RAG (Retrieval-Augmented Generation,检索增强生成) 是目前大语言模型(LLM)应用中最主流、最核心的架构模式之一。它巧妙地结合了检索系统(类似搜索引擎)和生成系统(大语言模型),旨在解决大模型固有的“幻觉”、知识滞后以及私有数...
尚硅谷-conda使用指南讲师:尚硅谷-宋红康官网:尚硅谷1. Conda 基本介绍1.1 什么是 Conda、MiniConda、AnacondaConda是一个包和环境管理的工具。支持 Windows、macOS和 Linux。Conda可以快速的安装、运行和更新包和相关的依赖。Conda也可以...
13 - RAG Basics (RAG 基础)快速开始# 1. 测试基础组件(无需 Pinecone API) python test.py # 2. 快速演示(非交互式,可选 Pinecone) python demo.py # 3. 完整示例(交互式,需要手动按 Enter) python...
12 - Validation & Retry (验证和重试)核心概念验证和重试 = 确保 LLM 应用的可靠性和数据质量在生产环境中,需要处理三类问题:网络错误 - 临时性连接问题(用 with_retry())模型故障 - 主模型不可用(用 with_fallbacks())输出质量 - LLM...