什么是Google RankBrain?它是如何工作的?你能优化它吗?以下是您需要了解的有关Google RankBrain算法的所有信息。
可以毫不夸张地说,Google RankBrain是搜索结果确定方式的一场革命。
1996年,链接作为排名信号的想法彻底改变了搜索,后来成为Google PageRank。
这就是为什么过去十年的搜索市场份额是这样的:
从那以后发生了很多事情,并且引入了许多大规模的重组和算法,但可以说没有一个比RankBrain算法重要。
正如我们将在下面讨论的那样,这不仅仅是因为它对搜索结果的影响,而是因为它意味着什么——机器学习首次被引入到我们认知的搜索结果中。
在此之前,机器学习已经在谷歌新闻中使用过,但与我们在 RankBrain 中看到的完全不同。
所以,这很重要。这是革命性的。这是在搜索中引入机器学习。
但 …
什么是RankBrain?
RankBrain是一个系统,谷歌可以通过它更好地了解搜索查询的可能用户意图。它于2015年春季推出,但直到当年10月26日才公布。
一开始,RankBrain被应用于谷歌以前没有遇到过的查询,这些查询在当时占所有搜索的大约15%。它从那里扩展到影响所有搜索结果。
RankBrain的核心是一个基于蜂鸟算法的机器学习系统,它将谷歌从“字符串”环境带到“实体”环境。
也就是说,它是从“阅读”文字字符,而不是“看到”它们所代表的实体。
关于字符串上的实体和实体的简要说明
为了说明这一重要进步及其在RankBrain中的作用,我们只需考虑构成我的朋友名字的字符:
“jason barnard”
在Hummingbird之前,Google看到了这些字符以及2个单词和13个字符的集合,这些字符按此顺序排列并经常在页面上使用,将使其与搜索字符串“jason barnard”相关。
真的可以是任何一个Jason,那没关系。
他们依靠链接和其他一些信号,在不了解Jason是谁或什么的情况下,找到最“相关”的信号。
有了蜂鸟算法,我的朋友不再是简单的角色集合,而是成为了实体:
/g/11cm_q3wqr
这个人的机器ID是哪个:
在这种情况下,机器ID是Google分配给实体的字母数字序列。
我们无法在本文中详细介绍实体,但您可以在此处阅读有关它们的信息。
简而言之,Hummingbird 发生的事情是 RankBrain 运行所必需的,它是否让 Google 无法看到以下声明:
“Jason Barnard 是 Dave Davies 的朋友,他喜欢红色衬衫,并且是一名数字营销人员。”
并简单地将其解释为一系列要根据查询进行排列和权衡的字符。
虽然非常高级,但基本上无法回答以下问题:“jason barnard”在文本中以及在该文本的链接中出现了多少次?
假设查询再次是“jason barnard”,对于 Hummingbird,这句话在 Google 中看起来更像是:
每个核心实体都由一个机器 ID 表示。
这些 ID 对每一个都是唯一的——没有两个实体具有相同的 ID。
我故意把自己加到句子中来说明它并不总是完美的。
我的名字很常见,还有比我更出名的“dave davies”(我知道,我知道……难以置信)。
由于 Jason 的音乐背景,Google 可以在没有其他上下文的情况下轻松假设 Jason 的朋友 Dave Davies 是 The Kinks (/m/08w4pm) 的 Dave Davies (/m/01pwfk)。
谷歌将通过页面上的其他实体以及网络上的其他连接获得说明。但那是另一回事了,改天再说。
在RankBrain的背景下,重要的是要了解蜂鸟算法,谷歌 (/m/045c7b) 现在将世界理解为实体的集合,而不是字符串。
返回RankBrain
有了关于实体的知识,我们可以回到RankBrain。
RankBrain的核心可以看作是一个预筛选系统。
在Google中输入查询时,搜索算法会将查询与您的意图进行匹配,以努力以最佳格式呈现最佳内容。
但是,如果Google不知道您的意图怎么办?
为什么Google引入了RankBrain?
RankBrain最初是为了解决一个简单但大的问题而推出的。
谷歌没有看到 15% 的查询被使用,因此没有它们的上下文,也没有过去的分析来确定它们的结果是否满足用户的意图。
输入 RankBrain。
该系统将查看实体而不是字符串。
RankBrain 还会考虑环境背景(例如,搜索者所在位置)并推断已完成的位置的含义。
这可能是一个简单的理解词序可能是搜索过程的函数,而不是意图的过程。
我们当中谁没有通过简单地添加一两个词来完善查询。
在我进入它之前,谷歌肯定已经看到:
“pizza victoria BC”
但是当我没有找回我想要的内容时,我可能只是开始添加其他单词,导致查询更像是:
“pizza victoria bc thin crust veggie”
谷歌很有可能没有看到这个特定的查询,但因为他们谷歌正在查看的是实体而不是字符串,所以他们知道查询将是相似的,如果不相同的话,如下:
“thin crust vegetarian pizza victoria bc”
“thin crust veggie pizza near me”
或者用语音:
“OK Google,where can i get a thin crust vegetarian pizza?”
RankBrain 如何运作?
不出所料,谷歌从未概述过 RankBrain 的具体运作方式。
尽管如此,我们还是可以对幕后发生的事情做出一些有根据的猜测。
新的搜索功能
如上所述,我们需要停止用我们理解的方式思考,开始像机器一样思考。
我可能会看到的地方:
“pizza victoria bc”
谷歌看到:
/m/0663v /m/07ypt
这极大地改变了事情。“victoria bc”不是两件事,而是一件事。
比较其他位置时:
“pizza” “location”
他们可以推断:
/m/0663v /m/07ypt(pizza victoria bc)
可能与以下内容相同:
/m/07ypt /m/0663v(victoria bc pizza)
基本上,因为他们知道实体如何运作的本质,所以他们可以超越查询,深入了解意义。
普通实体
如上所述,他们将使用的核心机制之一是实体识别。
如果他们明白一个查询包含与他们以前见过的另一个相同的实体,而几乎没有限定词(例如在关于音乐会的查询中从“where”变为“when”),那么这将表明结果集可能相同、高度相似,或者至少来自相同的 URL 候选列表。
前10名
在他们2013年的专利“使用非结构化数据中的实体引用进行问答”中,谷歌描述了一种他们将:
将实体提交到它们自己的索引中。
查看自己的前10名中的实体。
从中推断出他们希望彼此相关的各种实体,以及对查询的最佳回答。
例如,如果Google看到Jason的ID和我的ID经常同时出现,他们就可以将两者联系起来。
如果是Jason和那个讨厌的Kink的家伙一直在为我的名字排名……那么他们会得出结论,那就是那个Dave Davies。
同样,如果他们看到为Jason的名字排名的页面也有一组共同的实体,他们可以假设Jason的完整数据包括该信息,并在该查询中忽略那些没有的。
监测
请记住,这是一个机器学习系统。
其中固有的是确定、测试、跟踪和调整的功能。
基本上,系统将在考虑成功指标的情况下查看查询。
然后它将调整它如何加权不同的信号以及它喜欢的信号,然后监测是否成功。
这不会在逐个查询的基础上完成。
记住,这个系统是为了解决谷歌以前从未遇到过的查询问题而推出的,经常会有自己无法监控的无词或低词。
相反,系统会寻找如下模式:
[食品] [位置] [限定词]
然后创建管理所有此类查询的规则集。
因此,如果它发现信号加权适用于以下查询:
pizza victoria bc vegetarian
它可以使用它来支持或增强它对查询的作用,例如:
tacos seattle wa chicken
此外,值得注意的是,系统不仅会考虑查询中的实体,还会考虑参与查询的实体。这包括你自己、你的位置、你的设备等。
这些都是RankBrain会考虑的所有变量,就像您可能会查看分析并将桌面与移动流量进行比较,或者查看一天中的时间或设备类型以了解不同用户如何以不同方式与您的业务交互一样场景。
可能还有十几件事……
谷歌的人很聪明。
毫无疑问,他们进入 RankBrain 的机制比我想象的要多,而且这些机器可能自己组成的更多。
我们要记住的是目的,我们讨论RankBrain是为什么?
目的是理解查询。
我们需要应对的变量是实体和信号以及机器如何处理它们。
在维多利亚推出RankBrain披萨面团
因此,RankBrain的开发是为了处理Google从未见过的查询。
但这种情况在 2015年春季和2016年春季之间发生了变化。
谷歌官方没有提醒我们,Rankbrain参与用户的每个查询,而不是仅仅处理Google从未见过的查询。
谷歌似乎又一次在没有告诉任何人的情况下推出了它。
在当时,一级现在可能更多的时候,RankBrain被认为是非常有效的,并被标记为第三重要的排名信号。
也许我们这样思考是错的。
相反,了解它的重要性,让我们专注于……
我们如何针对 RankBrain 进行优化?
从本质上讲,我们不会针对 RankBrain 进行优化。
虽然这个说法有点逃避的意思。
单身,还是让我们努力做得更好吧。
早在2016年,Google的Gary Illyes在SMX上就表示我们是无法针对它进行优化:
后来,基本上说它只是为用户优化:
但对我来说,这有点像谷歌式的声明。
我对那些想要优化RankBrain或更好的措辞、优化他们的网站并考虑 RankBrain 和类似系统的人的建议是什么?
不要寻找技巧。
寻找功能。
在此任务中使用的一个有趣的免费工具是 Google 自己的Natural Language API Demo。
假设我们想了解 Google 如何看待我上面链接到的关于实体的文章。
有什么比去源头更好的方法 – 谷歌。
我们可以复制文章的文本,将其粘贴到他们的 NLP 演示中。
我们得到了他们对哪些实体出现在页面上的分析以及情绪分析和语法。
你会注意到语法箭头既可以向前移动也可以向后移动。
你可以感谢BERT的相关性,而不是 RankBrain。
这是它的样子:
如果您在实体列表上向下滚动,Google 还会向您展示页面上实体类型的完整分类。
我需要注意的是,这些远非完美,并且旨在作为默认实体集进行训练——而不是谷歌如何看待世界的完整列表。
但它确实可以很好地直观地理解我们的内容。
使用这个工具,我们可以探索 Google 如何看待各种查询的排名靠前的网站、页面上有哪些实体、它们是人、地点还是实体等,并从蜂鸟算法的加赌真正了解谷歌是如何解释页面的。
从那里我们只需要他们考虑我们无法控制或看到的变量,例如可能的用户位置、设备等。
所以,我们要考虑的是用户,其实谷歌就在那里。
因此,要“针对RankBrain进行优化”:
1、使用NLP API查看实体。
2、深入了解实体知识图资源管理器。
3、把所有这些都放在你的上下文中(你有什么设备和位置)。
4、使用 Mobile Moxie 等工具从其他位置和设备运行一些测试,以比较结果并了解情况如何倾斜。
5、开始优化 RankBrain。
Google会告诉你,针对 RankBrain 进行优化就是针对用户进行优化。
很容易看出这是他们的建议,而且还不错。
但我们知道它是建立在实体之上的。
那么,为什么不将这些知识加到自己的工作中呢?
了解 Google 如何解释用户意图,您就会了解如何自己做。
为什么 RankBrain 很重要?
RankBrain的重要性不仅在于它是什么,还在于它意味着什么。
这是谷歌首次将机器学习应用于搜索结果。这不是最后一次。
事实上,早在2018年,John Mueller 就指出:
###########
RankBrain仍然是第三重要的信号吗?
我一直认为它更像是一个预调节器——一个不产生结果的系统,而是评估查询的类型和含义以及应用于该类型和含义的信号的权重。
基本上,更像是一个过滤器而不是一个信号。
但同样,这也是它的意义。
但一定要考虑一下。它可能已有5年历史,但其意义和影响却只增不减。
当然,在谷歌内部,他们会称呼它的元素和分支不同的东西,但 RankBrain 最初要做的事情和今天所做的事情对我们来说影响是巨大的。
=====这个时段的SEOer是“阅读者和分享者”,分享我的所知,收获我所不知====
如果你觉得此文章能够帮您解决问题,您可以点击下方百度分享,让您的更多好朋友能够学到更多有关SEO知识的技巧。
作者:SEOiit@seo顾问 上海seo顾问修订 2023-02-14
SEOiit(企业seo顾问),专门研究百度seo(搜索引擎优化)技术,让更多喜欢seo的朋友,能从中学习有关seo知识,理解搜索引擎优化真谛。
本文伊利诺SEO研究中心版权所有,未经批准转载必究。
共有 0 条评论