当前位置: 首页 > 新闻中心 > 打造高效稳定的php文章采集网站:数据库设计与功能实现全解析

打造高效稳定的php文章采集网站:数据库设计与功能实现全解析

发布时间:2024-03-28 11:31:10

  1. php curl 大量数据采集
  2. php 百度 知道数据采集

一、php curl 大量数据采集

这个需要配合js,打开一个html页面,首先js用ajax请求页面,返回第一个页面信息确定处理完毕(ajax有强制同步功能),ajax再访问第二个页面。(或者根据服务器状况,你可以同时提交几个url,跑几个相同的页面)

参数可以由js产生并传递url,php后台页面根据url抓页面。然后ajax通过php,在数据库或者是哪里设一个标量,标明检测到哪里。由于前台的html页面执行多少时候都没问题,这样php的内存限制和执行时间限制就解决了。

因为不会浪费大量的资源用一个页面来跑一个瞬间500次的for循环了。(你的500次for循环死了原因可能是获取的数据太多,大过了php限制的内存)

不过印象中curl好像也有强制同步的选项,就是等待一个抓取后再执行下一步。但是这个500次都是用一个页面线程处理,也就是说肯定会远远大于30秒的默认执行时间。

二、php 百度 知道数据采集

麻烦.采`纳·`··`··.