记录
近期把域名备案后,这里也为了增加流量,这里也开始着手准备搞谷歌收录与百度收录,让自己的网站有更多的人访问,在没有收录时,你的网站在百度是无法搜索的(如下图),这里要自己布置收录,这里记录一下过程。
简介
经过查询,GitHub是禁止百度爬虫的,最常见的解决方法就是双线部署到 coding pages 和 GitHub pages,百度可以爬虫到 coding 上的内容,从而实现百度收录,由于coding被收购后,这里用的次数也变少了,这里就直接百度、谷歌收录,收录过程需要时间,大概需要半个月时间段才能看到效果。
百度收录
插件地址
GitHub:hexo-baidu-url-submit
百度资源平台添加网站
访问百度搜索资源平台官网,注册或者登陆百度账号,依次选择【用户中心】-【站点管理】,添加你的网站,在添加站点时会让你选择协议头(http 或者 https),如果选择 https,它会验证你的站点,大约能在一天之内完成。
之后会让你验证网站所有权,提供两种种验证方式:
- 文件验证:下载给定的文件,将其放到本地主题目录 source 文件夹,然后部署上去完成验证
- HTML 标签验证:一般是给一个 meta 标签,放到首页 与 标签之间即可完成验证
提交百度搜索
百度提供了自动提交和手动提交两种方式,其中自动提交又分为主动推送、自动推送和 sitemap 三种方式,以下是官方给出的解释:
- 主动推送:最为快速的提交方式,推荐您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录
- 自动推送:是轻量级链接提交组件,将自动推送的 JS 代码放置在站点每一个页面源代码中,当页面被访问时,页面链接会自动推送给百度,有利于新页面更快被百度发现
- sitemap:您可以定期将网站链接放到sitemap中,然后将sitemap提交给百度。百度会周期性的抓取检查您提交的sitemap,对其中的链接进行处理,但收录速度慢于主动推送
- 手动提交:如果您不想通过程序提交,那么可以采用此种方式,手动将链接提交给百度
四种提交方式对比:
方式 | 主动推送 | 自动推送 | Sitemap | 手动提交 |
---|---|---|---|---|
速度 | 最快 | —— | —— | —— |
开发成本 | 高 | 低 | 中 | 不需开发 |
可提交量 | 低 | 高 | 高 | 低 |
是否建议提交历史连接 | 否 | 是 | 是 | 是 |
和其他提交方法是否有冲突 | 无 | 无 | 无 | 无 |
推荐同时使用主动推送和 sitemap 方式,下面介绍这两种方法。
主动推送
在博客根目录安装插件 hexo-baidu-url-submit --save
,然后在根目录 _config.yml
文件里写入以下配置:
1 | baidu_url_submit: |
不是第一次部署的 token
可以在【链接提交】-【自动提交】-【主动推送】下面看到,接口调用地址最后面 token=xxxxx
即为你的 token
第一次部署的可以用文件进行验证,在文件中有你的token
。
最后,加入新的 deployer:
1 | # Deployment |
执行hexo g -d
部署一遍即可实现主动推送,推送成功如下:
1 | {"remain":4999953,"success":81} |
这里表示有 81 页面已经主动推送成功,remain 表示当天可用推送的 url 条数。
sitemap
首先我们要使用以下命令生成一个网站地图:
1 | npm install hexo-generator-sitemap --save |
同样是在根目录的 `_config.yml`` 文件,大约第 17 行处,url 要改为在百度站长平台添加的域名,也就是你网站的首页地址:
1 | # URL |
然后使用命令 hexo g -d
将网站部署上去,然后访问 你的首页/sitemap.xml
或者 你的首页/baidusitemap.xml
就可以看到网站地图了。
其中 sitemap.xml
文件是搜索引擎通用的 sitemap
文件,baidusitemap.xml
是百度专用的 sitemap
文件
然后来到百度站长平台的 sitemap
提交页面,将你的 sitemap
地址提交即可,如果成功的话状态会显示为正常,初次提交要等几分钟,sitemap.xml
相比 baidusitemap.xml
来说等待时间也会更长,如果以后你博客有新的文章或其他页面,可以点击手动更新文件,更新一下新的 sitemap
。
配置Google收录
首先要确保可以访问google,且拥有google账号。 进入 Google Search Console,点击立即使用进入Google Search Console控制台。
输入网址前缀进入下一步。
进行所有权的验证,这个验证有几个方式,HTML文件验证就是下载Google提供的文件放到hexo的
source目录
中,但在发布时因为hexo的关系,会导致内容发生变化,所以建议使用HTML标记
的验证方式,而且这个验证方式要长期保持。打开HTML标记的验证页面,将content内容复制出来,复制到
主题_config.yml
中的google_site_verification
属性中。但注意配置时一定注意冒号后有空格:google_site_verification: xxxxxxxxxxx-xxxxxxxx
。执行指令
hexo g -d
,之前点击google中的验证按钮,通过即可。