早上想写了一个抓取是京东618魅族专题页的抓取,然后想着自动下单购买,尼玛,算了,太多了,写到判断是否开始了,商品价格进行了变化,后边工程量有点大就懒的写了,如果要完善的话就需要写模拟登陆(这个不难)加入购物车,下单,下单的时候判断一下价格,如果价格个官方优惠价格相同就下单,不同就接着去抓。算了,懒的写了。下边是部分代码
代码如下 | 复制代码 |
$cookie_file = dirname(__FILE__)."/jd.cookie"; $tmp = pathinfo($data[1][0]); function get($url,$flag=true){
$return = curl_exec($ch); function getPrice($id){ $data = json_decode(get($priceUrl,false),true); echo get($addurl,false); |
php 在curl抓取的时候出现乱码
用站长工具查看我们抓取的网而不是使用了gzip压缩了,如果有返回"Accept-Encoding:gzip, deflate" 就是打开了gzip了,我们只要如下操作
代码如下 | 复制代码 |
$res=curl_exec($ch1); |
GBK或者UTF8汉字之类的乱码
代码如下 | 复制代码 |
mb_convert_encoding($str, 'utf-8', 'GBK,UTF-8,ASCII');就行了 |
我们设置页面为GBK兼容GB2312,GB2312是GBK的子集,所有GB2312编码的用GBK都能正确解出来