php写爬虫进行采集 QueryList的使用
介绍:
QueryList 是基于phpquery 发开的一个采集类
phpquery是老外开发的,querylist对其进行了更加人性化的封装,更方便,从而充满生命力
安装:
这里只介绍通过composer安装,更多详细内容可参考http://www.php.cn/php/php-QueryList-down.html
1、如果还没安装过composer请参照官网先进行composer安装:
https://pkg.phpcomposer.com/#how-to-install-composer
2、QueryList安装:
composer安装好后,在项目根目录新建一个 composer.json 文件,声明要安装的包,内容如下:
{ "require": { "jaeger/querylist": "^3.1", "jaeger/querylist-ext-request":"^1.0", "jaeger/querylist-ext-multi":"^1.0", "jaeger/querylist-ext-login":"^1.0" } }
在命令行运行 composer install
(如果之前install过,执行composer update更新命令,避免重复安装;
如果composer不是全局安装的而是局部安装的 请在composer.phar文件所在目录执行 php composer.phar install 【或者update命令】)
安装完成后通过
require "vendor/autoload.php";
引入我们的QueryList ( autoload.php 是composer 提供的自动引入类,帮我们自动引用安装的依赖)
执行测试代码:
<?php require "phpQuery.php"; require "QueryList.php"; use QLQueryList; $hj = QueryList::Query("http://mobile.csdn.net/",array("url"=>array(".unit h1 a","href"))); $data = $hj->getData(function($x){ return $x["url"]; }); print_r($data);
如果能正常打印出采集的内容,说明已经可以使用了
更多详细内容请参考: http://www.php.cn/php/php-QueyList-kaishi.html
声明:该文观点仅代表作者本人,入门客AI创业平台信息发布平台仅提供信息存储空间服务,如有疑问请联系rumenke@qq.com。
- 上一篇: php 去除小数点后面的0,保留非零
- 下一篇:没有了