最新文章

vLLm运行模型显存不够的问题

# vLLM运行模型显存不足的原因及解决方法 在使用vLLM部署大语言模型时,显存不足是最常见的报错(如提示“Free memory on device cuda:0 is less than desired GPU memory utilization”),其核心是GPU显存无法满足模型运行...

WSL 迁移到D盘

#WSL迁移到D盘 默认WSL安装的Ubuntu系统会放到c盘,由于我们还要安转vllm及大模型文件,所以我们把系统迁移到D盘,避免过多占用C盘文件 ##查看已安装的系统 PS C:\Users\T-mac> wsl -l 适用于 Linux 的 Windows 子系统分发: Ubun...

wsl 无法连接外部网络问题修复

#wsl 无法连接外部网络问题修复 ##切换 WSL 网络模式为 mirrored 镜像模式,直接共享 Windows 网络栈 WSL 2 默认使用 NAT 网络,容易被 Windows 防火墙 / 安全软件拦截。 在 Windows 管理员终端中执行: powe...

vLLM 大模型开发全栈学习指南

# vLLM 大模型开发全栈学习指南 本指南面向具备 Python 基础和大模型核心概念(Transformer、Attention、Quantization)的开发人员,旨在帮助大家从零开始掌握 vLLM 框架,实现高性能推理服务的搭建、二次开发与深度调优,全程注重实操性与实用性,避免冗余的...

Ollama 本地大模型学习与实战指南

# Ollama 本地大模型学习与实战指南 **目标读者**:有一定技术基础(了解终端/命令行、基本编程概念)但从未接触过 Ollama 的开发者 # 1. 简介 ## 1.1 什么是 Ollama? Ollama 是一款轻量级的开源工具,专为在本地环境中轻松运行、管理和定制...

AI编程项目 - 山东省企/央企/国企培训招标公示提醒平台

#使用Claude Code + qwen3-coder-plus 搭建一个 山东省企/央企/国企培训招标公示提醒平台 ##使用千问构建提示词 ###需求构建 我需要做一个山东省内省企 央企 国企培训招标公示提醒平台,需要采集最近企业发布的有关入职培训、团队建设、安全培训相关的指标公告,...