|
代码都加了注释,不收费了~ 但是大佬能打赏最好了~ 哈哈 原创
大佬们如果觉得不错 可以考虑搞个完整的系统,以下只采集的是活动线报模块 比较难理解的都加了注释~ 拿去学习吧
// 活动线报采集
public function daow()
{
//采集规则
$rules = [
'title' => array('.post-title a','text'),
'link' => array('.post-title a','href'),
'ptime' => array('.ptime span','text'),
];
//第一个参数为从第几页开始,第二个参数为采集几页
for($i = 1;$i<=2;$i++){
$url = 'https://www.xd0.com/i_wz.asp?id=306807&ageIndex=' . $i;//$i为页数
$html = @file_get_contents($url);//获取网页内容并不显示致命错误
//开始采集
$data = QueryList::html($html)
->encoding('GB2312')
->rules($rules)
->query()
->getData(function($item){
$info['title'] = $item['title'];
$info['link'] = 'https://www.xd0.com/' . $item['link'];//默认采集下来没有域名部分 重新拼装了一下
$info['ptime'] = $item['ptime'];
return $info;
})
->all();
$resAll[$i] = $data;
print_r($resAll);
}
}
复制代码
效果如下:
|
|