Python爬虫简单运用爬取代理IP的实现

免费代理推荐 2025-08-21 19°

功能1：爬取西拉ip代理官网上的代理ip

环境：python3.8+pycharm
库：requests，lxml
浏览器：谷歌
IP地址：http://www.xiladaili.com/gaoni/

分析网页源码：

选中div元素后右键找到Copy再深入子菜单找到Copy Xpath点击一下就复制到XPath

Python爬虫简单运用爬取代理IP的实现

我们复制下来的Xpth内容为：/html/body/div/div[3]/div[2]/table/tbody/tr[50]/td[1]
虽然可以查出来ip，但不利于程序自动爬取所有IP，利用谷歌XpathHelp测试一下

从上图可以看出，只匹配到了一个Ip，我们稍作修改，即可达到目的
，有关xpath规则，可以参考下表;

经过上面的规则学习后，我们修改为：//*[@class=‘mt-0 mb-2 table-responsive']/table/tbody/tr/td[1]，再利用xpthhelp工具验证一下：

这样我们就可以爬取整个页面的Ip地址了，为了方便爬取更多的IP，我们继续往下翻页，找到翻页按钮：

找规律，发现每翻一页，a标签下的href连接地址加1即可，python程序可以利用for循环解决翻页问题即可。
为了提高IP代理的质量，我们爬取评分高的IP来使用。找到评分栏下的Xpath路径，这里不再做详细介绍，思路参考上面找IP地址的思路，及XPath规则，过程参考下图：

Python代码实现

代码可复制粘贴直接使用，如果出现报错，修改一下cookie。这里使用代理ip爬取，防止IP被封。当然这里的代码还是基础的，有空可以写成代理池，多任务去爬。当然还可以使用其它思路去实现，这里只做入门介绍。当有了这些代理IP后，我们可以用文件保存，或者保存到数据库中，根据实际使用情况而定，这里不做保存，只放到列表变量中保存。

阅读剩余 0%

本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体)，仅供学习参考。用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权，请联系我们反馈本站将在三个工作日内改正。

Reverse Proxy（反向代理）

Kotlin 学习笔记（三）—— Kotlin 的动态代理你会写吗

相关推荐

免费代理推荐

Reverse Proxy（反向代理）

发表于 2025-08-21

反向代理（reverse proxy）：是指以代理服务器来接受internet上的连接请求，然后将请求转发给内部网络上的服务器，并将从服务器上得到的结果返回给internet上请求连接的客户端，此时代理服务器对外就表现为一个反向代理服务器。正向代理正向代理（forward proxy）：是一个位于客户端和目标服务器之间的服务器(代理服务器)，为了从目标服务器取得内容

免费代理推荐

CentOS搭建tg的MTProxy代理

发表于 2025-08-22

1，MTProxy搭建 (已被识别) 搭建MTProxy # cat /etc/redhat-release CentOS Linux release 7.6.1810 (Core) # yum install openssl-devel zlib-devel # yum groupinstall "Development Tools" # git clone https

免费代理推荐

mtproxy代理服务器

发表于 2025-08-22

代理服务器的功能是代替网络用户去访问网络信息，并把获得的信息返回给用户，其工作步骤大致如下：（1）客户机向代理服务器发起访问互联网的请求（2）代理服务器收到请求后检查请求是否被允许，如果允许将会进行下一步处理，否则丢弃该请求。（3）代理服务器先查找本地缓存中是否有客户机请求的数据，如果有则直接返回给客户端，否则继续下一步。（4）如果没有找到数据缓存

免费代理推荐

Kotlin 学习笔记（三）—— Kotlin 的动态代理你会写吗

发表于 2025-08-20

最近在学 Kotlin 基础，发现动态代理这块之前还是没搞明白，所以就学了下 Kotlin 中的代理模式写法，发现东西有点多，遂独自成文，欢迎大家拍砖！引子动态代理主要是用来干什么的？通俗一点，就是你在调用其他类的一些方法时，想加入你自己的一些处理逻辑。比如说，统计这些方法的执行时长等，这也是面向切面编程的思想。代理模式动态代理，源自于设计模式中常见的一种模式：代理模式。在 Java

免费代理推荐

Meterpreter的代理详解

发表于 2025-08-20

0x01 meterpreter多级内网代理穿透 1.Pivoting 基本上可以概括为，在正常情况下仅仅只是通过利用被控制的计算机我们可能依旧无法进行网络访问。假设一台被控制的计算机连接有多个网络，将其作为我们的跳板，那么网络隔离的手段对我们来说就形同虚设。跟着这个思路，攻击者在被控制的跳板主机上执行路由操作，进而访问隐藏的网络。对新发现网络发起的每个请求都会通过中间的双网卡跳板传输

免费代理推荐

「Java 路线」| 动态代理 & 静态代理

发表于 2025-08-19

点赞关注，不再迷路，你的支持对我意义重大！ 🔥 Hi，我是丑丑。本文「Java 路线」| 导读 —— 梦开始的地方已收录，这里有 Android 进阶成长路线笔记 & 博客，欢迎跟着彭丑丑一起成长。（联系方式在 GitHub）前言代理模式（Proxy Pattern）也称委托模式（Delegate Pattern），是一种结构型设计模式，也是一项基础设计技巧。在日常应用中