• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

这个如何采集,有点难倒小弟我了

php 搞代码 4年前 (2022-01-23) 9次浏览 已收录 0个评论

这个怎么采集,有点难倒我了
http://app.baidu.com/appweb/c?cid=1

我想得到小游戏的的连接地址,和图标连接,

还请指点一下。

——解决方案——————–
file_get_contents();把内容采集到本地。再通过正则过滤。。
——解决方案——————–
加个user-agent的header看看
——解决方案——————–
$con = file_get_contents(‘http://app.baidu.com/appweb/c?cid=1’);
preg_match_all(‘/class=”app-single-item”[\s\S来&源gao@dai!ma.com搞$代^码%网搞gaodaima代码]*?href=”([^”]*?)”[\s\S]*?src=”([^”]*?)”/’,$con,$match);
var_dump($match[2]);
——解决方案——————–
有变化啊。http://app.baidu.com/appweb/c?cid=1&leaf_cid=&sort=1&pn=2
pn代表页数
——解决方案——————–

探讨

不是的我要的是这个连接下面http://app.baidu.com/appweb/c?cid=1
打开网页最下面的页码数对应的内容,

也就是最新,最热的游戏 。
引用:

有变化啊。http://app.baidu.com/appweb/c?cid=1&leaf_cid=&sort=1&pn=2……

——解决方案——————–
不过我看了下他返回的好像是json数据。你再从json里面提取出规则就行了
——解决方案——————–
为什么叫我卧龙???
我是用firebug这个插件看的,是firefox上的一个插件,这个插件可以看到浏览器http连接的信息
你把http://app.baidu.com/appweb/getcathotlist?cid=1&leaf_cid=0&sort=1&pn=2这个直接在地址栏里请求看看就知道是json了
——解决方案——————–

探讨

因为知道很多。引用:

为什么叫我卧龙???
我是用firebug这个插件看的,是firefox上的一个插件,这个插件可以看到浏览器http连接的信息
你把http://app.baidu.com/appweb/getcathotlist?cid=1&leaf_cid=0&sort=1&pn=2这个……

——解决方案——————–

探讨

谢谢,谢谢

——解决方案——————–
卧龙大哥~


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:这个如何采集,有点难倒小弟我了

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址