之所以采集Xpareto是因为这个也页面的数据比较特别,不是简单的表格形式的数据,它是用DIV展示数据的。
同时,它的HTML代码布局比较复杂,找到xpath定位逻辑对我来说还是比较难的。所以研究了一下,把这个网站的数据当做自学的案例来采集。
//div[@class='col-xs-1 tborder'][position()=(position() mod 2 = 0) and position() < last()]| //div[@class='col-xs-1 tborder rbottomleft']/center
至于采集出来的数据,大家有兴趣可以下载看看,本站VIP免费。因为现在有很多工具能查看Shopify店铺榜单了,而且这个工具展示的店铺不全,只展示了TOP2万多的店铺,所以需要所有店铺数据的朋友可以下载这里的数据找找灵感 全球77万Shopify网站清单+网站联系人数据(包含Shopify Plus)
分析这些Shopify店铺数据的方法是采集网站的关键词,描述,网站标题,甚至BSR页面,做成数据库,供给自己使用。比如通过分析所有网站的关键词能找出目前Shopify店铺的主流产品类型。
P.S.:xpareto,这是远古级别的Shopify工具了,我了解到这个工具的时候,Shopify都没怎么火起来。
有些网友对火车头采集器有兴趣,或者正在学习这个软件,我就随带着把我的这个采集规则放上来给大家借鉴学习一下,大家按需购买。
原文链接:https://www.amazon888.com/2166.html,转载请注明出处和链接。
评论0