php写爬虫进行采集 QueryList的使用
介绍:
QueryList 是基于phpquery 发开的一个采集类
phpquery是老外开发的,querylist对其进行了更加人性化的封装,更方便,从而充满生命力
安装:
这里只介绍通过composer安装,更多详细内容可参考http://www.php.cn/php/php-QueryList-down.html
1、如果还没安装过composer请参照官网先进行composer安装:
https://pkg.phpcomposer.com/#how-to-install-composer
2、QueryList安装:
composer安装好后,在项目根目录新建一个 composer.json 文件,声明要安装的包,内容如下:
{
"require": {
"jaeger/querylist": "^3.1",
"jaeger/querylist-ext-request":"^1.0",
"jaeger/querylist-ext-multi":"^1.0",
"jaeger/querylist-ext-login":"^1.0"
}
}
在命令行运行 composer install
(如果之前install过,执行composer update更新命令,避免重复安装;
如果composer不是全局安装的而是局部安装的 请在composer.phar文件所在目录执行 php composer.phar install 【或者update命令】)
安装完成后通过
require "vendor/autoload.php";
引入我们的QueryList ( autoload.php 是composer 提供的自动引入类,帮我们自动引用安装的依赖)
执行测试代码:
<?php
require "phpQuery.php";
require "QueryList.php";
use QLQueryList;
$hj = QueryList::Query("http://mobile.csdn.net/",array("url"=>array(".unit h1 a","href")));
$data = $hj->getData(function($x){
return $x["url"];
});
print_r($data);如果能正常打印出采集的内容,说明已经可以使用了
更多详细内容请参考: http://www.php.cn/php/php-QueyList-kaishi.html
声明:该文观点仅代表作者本人,入门客AI创业平台信息发布平台仅提供信息存储空间服务,如有疑问请联系rumenke@qq.com。
- 上一篇: php 去除小数点后面的0,保留非零
- 下一篇:没有了
