从品牌网站建设到网络营销策划,从策略到执行的一站式服务
简单的分了几个步骤:
成都创新互联公司主营东西湖网站建设的网络公司,主营网站建设方案,成都app软件开发,东西湖h5小程序开发搭建,东西湖网站营销推广欢迎东西湖等地区企业咨询
1、确定采集目标
2、获取目标远程页面内容(curl、file_get_contents)
3、分析页面html源码,正则匹配你需要的内容(preg_match、preg_match_all),这一步最为重要,不同页面正则匹配规则不一样
4、入库
主要使用php抓取目标网页,然后进行字符串处理,分离出你想用的数据。
例如使用fopen()方法:
?php
$f = fopen($url,"r");
$html = "";
if($f){
while (!feof($f)) {
$html .= fgets($f);
}
//对$html进行处理,根据目标网页的结构,截取分离字符串
....
}
?
首先你是哪个步骤解决不了?
分析出谷歌图片地址路径
模拟用户请求下载图片保存到本地
对于第一个问题,就是 自己去看看源代码,有可能是ajax加载的,只要找到返回的html内容 分析出 图片地址即可。
第二个问题,php中可以直接用socket访问 也可以直接用curl库,推荐用curl库 比较高效稳定。
如果仍然没法搞定,欢迎到 自学去论坛 提出你的疑问
成都网站建设公司地址:成都市青羊区太升南路288号锦天国际A座10层 建设咨询028-86922220
成都快上网科技有限公司-四川网站建设设计公司 | 蜀ICP备19037934号 Copyright 2020,ALL Rights Reserved cdkjz.cn | 成都网站建设 | © Copyright 2020版权所有.
专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网! | 成都网站建设哪家好? | 网站建设地图