大数跨境
0
0
分享网址

谷歌SEO|如何批量检查网站页面收录情况

大数跨境的伙伴们
2023-07-05
14782
大数跨境 导读:网站页面要在SERP中获得排名,其中的流程非常复杂,但总归分为三个环节:抓取(爬行和抓取页面HTML代码存入数据库);收录(对页面数据进行文字提取等预处理,存入索引库);排名(最后等待用户搜索关键词,页面才在SERP中呈现排名)。

网站页面要在SERP中获得排名,其中的流程非常复杂,但总归分为三个环节:抓取(爬行和抓取页面HTML代码存入数据库);收录(对页面数据进行文字提取等预处理,存入索引库);排名(最后等待用户搜索关键词,页面才在SERP中呈现排名)。

网站收录对于网站能否获得排名至关重要,因此网站收录检查是所有网站运营人员日常工作的一部分。如何可以更加高效地进行检查工作,同时确保检查结果的正确性,本文分享了一些操作起来较为简单可行的办法。

方法要点:

1.  单个页面 直接用info命令/新版GSC查看是否被 谷歌收录

2.  超过1000个页面的网站整站收录检查/快速检查多个新上线页面收录情况:Screaming Frog爬取网页快照,确定页面快照是否存在,来反推页面是否已被收录

使用Excel的VLOOKUP函数,匹配GA近期访问和整站Sitemap文件,筛选掉部分已被收录页面,得到未确认是否收录页面,为下面步骤提高效率

使用Excel的CONCATENATE函数,匹配快照命令+页面链接,直接批量生成网页快照链接

Screaming Frog爬取确认网页快照,返回200码则已被收录,302码需要进一步检查(注意使用VPN,调整爬取速度,避免被谷歌block out)

对爬取结果返回302的页面进行检查

查看单个页面收录情况

如果单独查看某个页面是否被收录,可以用在谷歌搜索使用info命令,如info:www.crossborderdigital.cn/us-apparel-industry-overview/

也可以通过新版google search console 的URL Inspection功能查看

批量查看页面收录情况

如果要检查整站页面收录情况,可以使用新版GSC 的index report,可以导出网站页面收录情况报告,方便检查哪些页面不被收录,但是只能导出1000个页面。

查看网站页面(>1000)收录情况

除了用GSC批量查看网站页面收录情况,还有一个替代方案是通过用Screaming Frog查cached页面Http状态,由于网页快照(cached)是搜索引擎在收录网页时对网页进行的备份,因此可以利用爬虫爬取该页面的数据来确认网页是否在搜索引擎中存有网页快照,确定是否被搜索引擎索引。

页面数量在1000以上的站点,或是只希望检查新页面收录情况的用户,可以尝试使用这个方案。以下为大家展示如何使用Screaming Frog批量检查页面收录情况。

1. GA匹配sitemap筛选已被收录页面。

页面数量特别多的站点,可以先通过筛选掉部分已经确认被收录的页面,提高下面收录检查的效率。页面获得自然搜索流量,说明搜索引擎为用户展示了该页面。

导出GA数据后使用VLOOKUP函数与网站sitemap进行匹配,筛选出近一个月未获得搜索流量的页面进行进一步的收录查询 (不会用Vlookup函数的小伙伴,可以在文章底部加小编微信获取模板)。

2. 批量生成谷歌网页快照链接。

上一步获得的页面清单,接下来用Screaming Frog爬取谷歌页面缓存的方式,来确认页面是否已被收录。

我们可以通过excel函数,批量生成页面谷歌快照链接。

3. Screaming Frog批量抓取链接状态。

现在我们只需要通过Screaming Frog批量抓取这些链接状态,如果状态码返回200,则该页面成功被搜索引擎索引;如果是404,则说明未被索引。

打开Sreamingfrog, 点击Upload上传所有待检查链接,点击Start开始爬取页面信息:

注意:

由于我们现在是通过爬虫软件来抓取谷歌的搜索信息,IP地址极有可能被block out,因此在使用爬虫前,要注意使用VPN来操作,并且降低Screaming Frog爬取速度。

开启Screaming Frog上的代理:

Configuration>System>Proxy中点选“Use Proxy Server”

控制Screaming Frog的爬取速度:

4. 对爬取结果进行检查。

如果在爬取过程中都被返回302状态码,则很大可能被谷歌block out,需要调整爬行速度,更换VPN地区。如果仅有几个链接返回302状态码,则是谷歌需要对你进行人机识别,我们可以进行逐个查询。

关于网站页面收录的问题,大家如果有相关疑问,欢迎跟小编交流哦。
文章转载至公众号:cross border digital;大数跨境经授权转载
【版权声明】秉承互联网开放、包容的精神,大数跨境欢迎各方(自)媒体、机构转载、引用我们原创内容,但要严格注明来源大数跨境;同时,我们倡导尊重与保护知识产权,如发现本站文章存在版权问题,烦请将版权疑问、授权证明、版权证明、联系方式等,发邮件至 zoey@10100.com,我们将第一时间核实、处理。
谷歌SEO
0
0
大数跨境的伙伴们
大数跨境是跨境从业者专属的媒体平台,旨在输出高质量跨境内容、聚合出海全链条跨境资源、联通跨境网络,为跨境电商打造更加美好、便利的出海环境。
内容 5006
粉丝 15
关注
相关文章
外观专利侵权预警:调料挤压瓶(预警)
2024-05-27
外观专利侵权预警:调料挤压瓶(预警)
跨境电商园艺选品:小众产品月销超3千单!低成本+高利润
2024-05-27
跨境电商园艺选品:小众产品月销超3千单!低成本+高利润

PHP网站源码崇左百度竞价公司泰安关键词按天计费推荐开封百度爱采购价格滨州企业网站建设公司巢湖企业网站改版马鞍山seo哪家好台州至尊标王价格大同seo排名推荐那曲seo网站优化报价德州优秀网站设计多少钱衡水网站设计模板迁安关键词排名包年推广报价韶关网站设计价格柳州百搜标王报价崇左网站关键词优化哪家好抚州网站制作设计价格茂名阿里店铺运营哪家好霍邱seo网站优化公司德宏网络广告推广公司山南百度关键词包年推广公司临沧网站优化按天扣费报价忻州SEO按天计费价格烟台百度标王报价毕节seo优化推荐大浪网站搜索优化推荐温州外贸网站制作多少钱周口网站建设报价濮阳模板网站建设报价长治营销网站哈密阿里店铺运营报价歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化