个人信息

Vincent

知易行难，唯知行合一方至始终

常用工具

MLX LangChain Qwen LlamaFactory RAGFlow Dify Cursor Claude Code ChatGPT LangGraph Vllm Ollama LM Studio GLM DeepSeek Llama.app LlamaIndex

技术

160 篇文章

0 min 平均阅读

python 爬虫进阶 selenium 基础&进阶操作

2022-11-25 7 min

爬虫利器selenium库基础from selenium import webdriver browser = webdriver.Chrome() url = 'https://www.baidu.com/' browser.get(url) data = browser.page_source ...

Python Python 爬虫

python 爬虫进阶 selenium 安装

2022-11-25 4 min

selenium简介什么是seleniumselenium最初是一个自动化测试工具，而爬虫中使用它主要是为了解决requests无法执行javaScript代码的问题。 selenium的用途　　（1）、selenium可以驱动浏览器自动执行自定义好的逻辑代码，也就是可以通过代码完全模拟成人类使用浏...

Python Python 爬虫

python + ffmepg 批量转换目录wma文件为MP3文件

2022-10-15 3 min

# change *.wma files to *.mp3 at current folder import os import subprocess def wma2mp3(wma_path,mp3_path=None): path, name = os.path.split(wma_...

Python Python 爬虫

FFmpeg -音频处理

2022-10-14 5 min

github： https://github.com/0voice/ffmpeg_develop_doc知乎：https://www.zhihu.com/question/436370508：https://www.cnblogs.com/DataBaker/p/15741463.html通用选项-...

FFmpeg

Python—beautifulsoup模块详解

2022-10-13 37 min

官方文档 https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/简单介绍Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.简单示例示例文章html_...

Python Python 爬虫

Python—requests 模块详解

2022-10-13 15 min

官方文档 https://docs.python-requests.org/zh_CN/latest/user/quickstart.html#id2文档来源：https://www.cnblogs.com/weifeng1463/p/15770132.htm模块说明requests是使用Apach...

Python Python 爬虫

python 批量采集历年的每日一图到库中

2022-05-11 9 min

python 批量采集历年的每日一图到库中批量采集历史所有的每日一词到库中完整代码# #采集词霸每日一句插入 from __future__ import print_function import requests from bs4 import BeautifulSoup import os, ...

Python Python 爬虫

Python 采集每日一词到博客中

2022-05-10 22 min

Python 采集每日一词到博客中每天将词霸的每日一句采集到自己的博客中接口地址及参数# 获取金山每日一词作为元数据并保存到MySQL import requests import pymysql from datetime import datetime, timedelta from concu...

Python Python 爬虫

freessl.cn 域名自动续签

2022-05-07 5 min

使用freessl.cn 域名自动续签官方演示：https://blog.freessl.cn/acme-quick-start/之前也是使用freessl.cn进行域名续签，但是不是自动续签，今天发现换了续签方式，记录一下添加域名，进行DCV配置添加要续签的域名，进行DCV配置，配置成功后就可以部...

域名

python 爬虫练习代码

2022-05-06 37 min

python 爬虫练习代码爬取豆瓣250代码#python 爬取豆瓣250电影 #拿到页面源代码 re提取内容 import re import requests import csv url="https://movie.douban.com/top250" header={ ...

Python Python 爬虫