切换风格

默认晚霞 雪山 粉色心情 伦敦 花卉 绿野仙踪 加州 白云 星空 薰衣草 城市 简约黑色 简约米色 龙珠
回复 0

3819

主题

3821

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
12693
原创-25行代码采集刀网全部数据【火】[复制链接]
发表于 2022-4-8 20:29:51 | 显示全部楼层 |阅读模式
代码都加了注释,不收费了~ 但是大佬能打赏最好了~ 哈哈    原创
大佬们如果觉得不错 可以考虑搞个完整的系统,以下只采集的是活动线报模块    比较难理解的都加了注释~ 拿去学习吧

// 活动线报采集

      public function daow()

      {

              //采集规则

              $rules = [

                    'title' => array('.post-title a','text'),

                    'link' => array('.post-title a','href'),

                    'ptime' => array('.ptime span','text'),

              ];

              //第一个参数为从第几页开始,第二个参数为采集几页

              for($i = 1;$i<=2;$i++){

                    $url = 'https://www.xd0.com/i_wz.asp?id=306807&ampageIndex=' . $i;//$i为页数

                    $html = @file_get_contents($url);//获取网页内容并不显示致命错误

                    //开始采集

                    $data = QueryList::html($html)

                          ->encoding('GB2312')

                          ->rules($rules)

                          ->query()

                          ->getData(function($item){

                                  $info['title'] = $item['title'];

                                  $info['link'] = 'https://www.xd0.com/' . $item['link'];//默认采集下来没有域名部分 重新拼装了一下

                                  $info['ptime'] = $item['ptime'];

                                  return $info;

                          })

                          ->all();

                    $resAll[$i] = $data;

                    print_r($resAll);

              }

      }
复制代码
效果如下:
202950pm01wj7lkfukbd1g.jpg


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|不懂 ( 粤ICP备14042591号-1 )|网站地图

GMT+8, 2024-10-30 10:21 , Processed in 0.121398 second(s), 30 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

返回顶部