标签 Python 下的文章

2026-02-28 13 min

import requests import json import base64 from typing import List, Optional, Dict # 配置模型服务地址和参数 API_BASE_URL = "http://localhost:8000/v1" ...

Python Python Code

vLLm运行模型显存不够的问题

2026-02-28 12 min

vLLM运行模型显存不足的原因及解决方法在使用vLLM部署大语言模型时，显存不足是最常见的报错（如提示“Free memory on device cuda:0 is less than desired GPU memory utilization”），其核心是GPU显存无法满足模型运行、优化策略及...

Python AI-Python文档大模型应用

Hugging Face下载vLLm使用的模型

2026-02-28 2 min

Hugging Face 下载vLLm使用的模型前往Hugging Face 寻找自己需要的模型例如：下载这个模型 https://huggingface.co/Qwen/Qwen3-VL-4B-Instruct复制模型名称 Qwen/Qwen3-VL-4B-Instruct下载模型使用 huggi...

Python AI-Python文档大模型应用

vllm安装运行本地大模型 - windows篇

2026-02-28 9 min

vllm安装运行本地大模型 - windows篇前言目前 vLLM 对 Windows 的原生支持（Native Windows Support）非常有限且处于早期实验阶段，而在 WSL2 环境下则非常成熟和稳定，所以在windows电脑上运行vllm,尽可能的需要安装wsl2WSL安装及相关命令官...

Python AI-Python文档大模型应用

LangChain 1.0 + LangGraph 1.0 全栈学习指南

2026-02-27 90 min

LangChain 1.0 + LangGraph 1.0 全栈学习指南本指南面向有基础Python编程能力、希望系统掌握LangChain/LangGraph 1.0+生态的开发者，所有示例均基于2026年最新稳定版API，摒弃所有已废弃的旧写法（如langchain.chains、旧版Graph...

Python AI-Python文档 LangChain 1.0

vLLM 大模型开发全栈学习指南

2026-02-27 61 min

vLLM 大模型开发全栈学习指南本指南面向具备 Python 基础和大模型核心概念（Transformer、Attention、Quantization）的开发人员，旨在帮助大家从零开始掌握 vLLM 框架，实现高性能推理服务的搭建、二次开发与深度调优，全程注重实操性与实用性，避免冗余的学术化表述，...

Python AI-Python文档大模型应用

Ollama 本地大模型学习与实战指南

2026-02-27 48 min

Ollama 本地大模型学习与实战指南目标读者：有一定技术基础（了解终端/命令行、基本编程概念）但从未接触过 Ollama 的开发者1. 简介1.1 什么是 Ollama？Ollama 是一款轻量级的开源工具，专为在本地环境中轻松运行、管理和定制大型语言模型（LLM）而设计。它将复杂的大模型部署流程...

Python AI-Python文档大模型应用

Code - 异步批量分类+Excel保存

2026-02-10 14 min

import asyncioimport aiohttpimport timeimport osfrom anyio import Semaphorefrom openpyxl import Workbookfrom dotenv import load_dotenv1. 环境配置（复用之前的，无需...

Python Python Code

Code - aiohttp 异步调用API（关键优化，提升效率）

2026-02-10 9 min

异步调用API（关键优化，提升效率）import asynciofrom urllib import responseimport aiohttpimport osfrom dotenv import load_dotenv1. 环境配置（复用之前的，无需修改）load_dotenv()LLM_AP...

Python Python Code

Code -同步调用大模型API 处理文本

2026-02-09 7 min

核心第一步——同步调用大模型API（理解API交互）import requestsimport osfrom dotenv import load_dotenv1. 环境配置load_dotenv()LLM_API_KEY = os.getenv("LLM_API_KEY")if not LLM_A...

Python Python Code