蓝天采集器是我见过的非常棒的采集器,但是很多人在采集缩图的时候却不知道如何处理。
相信网上和很多人的解决方法都是直接获取内容中的**张图片作为缩图的吧。
但是问题来了,内容中不一定有图片啊,而且内容中的图片尺寸大小不一,如果目标站的列表图片是规则的一个比例的图片,那岂不是得不尝失。
所以今天我们就来说一下如何采集列表中的缩略图入库。
方法也很简单的哟:
1:在获取列表的页面,也就是内容页网址中,原来我们一般是从选定域名中提取网址即可。

现在我们需要增加匹配内容页网址,然后我们就可以增加一个字段,一个是网址的内容XF1,一个是图片的内容XF2,这样就获取到了图片地址。
2:然后我们在获取内容中添加缩图字段,然后获取方式为内容标签,选择刚才的内容XF2即可。

这样就可以了哟。赶快试一下吧。
第一步:robots.txt 配置User-agent:GPTBotDisallow:/User-agent:ClaudeBotDisallow:/User-agent:anthropic...
起因是客户的网站在产品详情页有很多图片,比淘宝详情页还多。然后PC端和手机端又是独立分开的,单PC端或者...
给一个客户做的网站,详情页中七八十张图片。所以需要处理加载过慢的问题。现在使用懒加载的方式来处理。&l...
最近发现一些网站在复制别的文章的时候,远程本地化图片的时候不能本地化。下面来说一下如何处理这个问题:...