入门客AI创业平台(我带你入门,你带我飞行)
博文笔记

php写爬虫进行采集 QueryList的使用

创建时间:2017-12-22 投稿人: 浏览次数:1048

介绍:

QueryList 是基于phpquery 发开的一个采集类

phpquery是老外开发的,querylist对其进行了更加人性化的封装,更方便,从而充满生命力


安装:

这里只介绍通过composer安装,更多详细内容可参考http://www.php.cn/php/php-QueryList-down.html


1、如果还没安装过composer请参照官网先进行composer安装:

https://pkg.phpcomposer.com/#how-to-install-composer


2、QueryList安装:

composer安装好后,在项目根目录新建一个 composer.json 文件,声明要安装的包,内容如下:

{
    "require": {
        "jaeger/querylist": "^3.1",
        "jaeger/querylist-ext-request":"^1.0",
        "jaeger/querylist-ext-multi":"^1.0",
        "jaeger/querylist-ext-login":"^1.0"
    }
}

在命令行运行 composer install 

(如果之前install过,执行composer update更新命令,避免重复安装;

如果composer不是全局安装的而是局部安装的 请在composer.phar文件所在目录执行 php composer.phar install  【或者update命令】)


安装完成后通过 

require "vendor/autoload.php";

引入我们的QueryList ( autoload.php 是composer 提供的自动引入类,帮我们自动引用安装的依赖)


执行测试代码:

<?php
require "phpQuery.php";
require "QueryList.php";
use QLQueryList;
$hj = QueryList::Query("http://mobile.csdn.net/",array("url"=>array(".unit h1 a","href")));
$data = $hj->getData(function($x){
    return $x["url"];
});
print_r($data);

如果能正常打印出采集的内容,说明已经可以使用了


更多详细内容请参考: http://www.php.cn/php/php-QueyList-kaishi.html



声明:该文观点仅代表作者本人,入门客AI创业平台信息发布平台仅提供信息存储空间服务,如有疑问请联系rumenke@qq.com。