记录

近期把域名备案后,这里也为了增加流量,这里也开始着手准备搞谷歌收录与百度收录,让自己的网站有更多的人访问,在没有收录时,你的网站在百度是无法搜索的(如下图),这里要自己布置收录,这里记录一下过程。

简介

经过查询,GitHub是禁止百度爬虫的,最常见的解决方法就是双线部署到 coding pagesGitHub pages,百度可以爬虫到 coding 上的内容,从而实现百度收录,由于coding被收购后,这里用的次数也变少了,这里就直接百度、谷歌收录,收录过程需要时间,大概需要半个月时间段才能看到效果。

百度收录

插件地址

GitHub:hexo-baidu-url-submit

百度资源平台添加网站

访问百度搜索资源平台官网,注册或者登陆百度账号,依次选择【用户中心】-【站点管理】,添加你的网站,在添加站点时会让你选择协议头(http 或者 https),如果选择 https,它会验证你的站点,大约能在一天之内完成。

之后会让你验证网站所有权,提供两种种验证方式:

  • 文件验证:下载给定的文件,将其放到本地主题目录 source 文件夹,然后部署上去完成验证
  • HTML 标签验证:一般是给一个 meta 标签,放到首页 与 标签之间即可完成验证

提交百度搜索

百度提供了自动提交和手动提交两种方式,其中自动提交又分为主动推送、自动推送和 sitemap 三种方式,以下是官方给出的解释:

  • 主动推送:最为快速的提交方式,推荐您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录
  • 自动推送:是轻量级链接提交组件,将自动推送的 JS 代码放置在站点每一个页面源代码中,当页面被访问时,页面链接会自动推送给百度,有利于新页面更快被百度发现
  • sitemap:您可以定期将网站链接放到sitemap中,然后将sitemap提交给百度。百度会周期性的抓取检查您提交的sitemap,对其中的链接进行处理,但收录速度慢于主动推送
  • 手动提交:如果您不想通过程序提交,那么可以采用此种方式,手动将链接提交给百度

四种提交方式对比:

方式主动推送自动推送Sitemap手动提交
速度最快——————
开发成本不需开发
可提交量
是否建议提交历史连接
和其他提交方法是否有冲突

推荐同时使用主动推送和 sitemap 方式,下面介绍这两种方法。

主动推送

在博客根目录安装插件 hexo-baidu-url-submit --save,然后在根目录 _config.yml 文件里写入以下配置:

1
2
3
4
5
6
baidu_url_submit:
count: 1 # 提交最新的多少个链接
host: www.xxx.com # 在百度站长平台中添加的域名
token: your_token # 秘钥
path: baidu_urls.txt # 文本文档的地址, 新链接会保存在此文本文档里

不是第一次部署的 token 可以在【链接提交】-【自动提交】-【主动推送】下面看到,接口调用地址最后面 token=xxxxx 即为你的 token

第一次部署的可以用文件进行验证,在文件中有你的token

最后,加入新的 deployer:

1
2
3
4
5
6
7
8
9
# Deployment
## Docs: https://hexo.io/docs/deployment.html
deploy:
- type: git
repository:
github: git@github.com:xxx/xxx.github.io.git # github 配置
coding: git@git.dev.tencent.com:xxx/xxx.git # coding 配置
branch: master
- type: baidu_url_submitter # 主动推送

执行hexo g -d 部署一遍即可实现主动推送,推送成功如下:

1
2
{"remain":4999953,"success":81}
INFO Deploy done: baidu_url_submitter

这里表示有 81 页面已经主动推送成功,remain 表示当天可用推送的 url 条数。

sitemap

首先我们要使用以下命令生成一个网站地图:

1
2
npm install hexo-generator-sitemap --save
npm install hexo-generator-baidu-sitemap --save

同样是在根目录的 `_config.yml`` 文件,大约第 17 行处,url 要改为在百度站长平台添加的域名,也就是你网站的首页地址:

1
2
3
4
# URL
url: https://www.itrhx.com
root: /
permalink: :year/:month/:day/:title/

然后使用命令 hexo g -d 将网站部署上去,然后访问 你的首页/sitemap.xml 或者 你的首页/baidusitemap.xml 就可以看到网站地图了。

其中 sitemap.xml 文件是搜索引擎通用的 sitemap 文件,baidusitemap.xml 是百度专用的 sitemap 文件

然后来到百度站长平台的 sitemap 提交页面,将你的 sitemap 地址提交即可,如果成功的话状态会显示为正常,初次提交要等几分钟,sitemap.xml 相比 baidusitemap.xml 来说等待时间也会更长,如果以后你博客有新的文章或其他页面,可以点击手动更新文件,更新一下新的 sitemap

配置Google收录

  1. 首先要确保可以访问google,且拥有google账号。 进入 Google Search Console,点击立即使用进入Google Search Console控制台。

  2. 输入网址前缀进入下一步。

  3. 进行所有权的验证,这个验证有几个方式,HTML文件验证就是下载Google提供的文件放到hexo的source目录中,但在发布时因为hexo的关系,会导致内容发生变化,所以建议使用HTML标记的验证方式,而且这个验证方式要长期保持。

    HTML标记

  4. 打开HTML标记的验证页面,将content内容复制出来,复制到主题_config.yml中的google_site_verification属性中。但注意配置时一定注意冒号后有空格:google_site_verification: xxxxxxxxxxx-xxxxxxxx

  5. 执行指令hexo g -d,之前点击google中的验证按钮,通过即可。