PHP模拟百度蜘蛛,伪造IP爬行网站,附源代码
- 作者: 五速梦信息网
- 时间: 2026年03月19日 18:01
<?php
// 关闭 PHP 报错
error_reporting( E_ALL^E_NOTICE^E_WARNING );
//实现使用 curl 模拟百度 蜘蛛进行采集
function Go($url){
$ch = curl_init();
//随机生成 IP
$ip = rand(0,255).'.'.rand(0,255).'.'.rand(0,255).'.'.rand(0,255) ; // 百度 蜘蛛
$timeout = 15;
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch,CURLOPT_TIMEOUT,0);
//伪造百度 蜘蛛 IP
curl_setopt($ch,CURLOPT_HTTPHEADER,array('X-FORWARDED-FOR:'.$ip.'','CLIENT-IP:'.$ip.''));
//伪造百度 蜘蛛头部
curl_setopt($ch,CURLOPT_USERAGENT,"Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)");
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_HEADER,0);
curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout);
curl_setopt($ch,CURLOPT_SSL_VERIFYPEER,false);
curl_setopt($ch, CURLOPT_IPRESOLVE, CURL_IPRESOLVE_V4);
$content = curl_exec($ch);
}- 上一篇: 哪些程序员和你一样在围观 996.ICU?
- 下一篇: 搜索引擎中的你所不知道的搜索小技巧超实用
相关文章
-
哪些程序员和你一样在围观 996.ICU?
哪些程序员和你一样在围观 996.ICU?
- 技术栈
- 2026年03月19日
-
PHP未完全修复跨站脚本漏洞CVE
PHP未完全修复跨站脚本漏洞CVE
- 技术栈
- 2026年03月19日
-
php抓取一个页面的图片
php抓取一个页面的图片
- 技术栈
- 2026年03月19日
-
搜索引擎中的你所不知道的搜索小技巧超实用
搜索引擎中的你所不知道的搜索小技巧超实用
- 技术栈
- 2026年03月19日
-
php 如何禁用eval() 函数实例详解
php 如何禁用eval() 函数实例详解
- 技术栈
- 2026年03月19日
-
Linux下php安装suhosin
Linux下php安装suhosin
- 技术栈
- 2026年03月19日
