Google Panda于2011年2月首次推出,作为Google消除黑帽SEO策略和网络垃圾的一部分。
当时,用户对“内容农场”影响力越来越大的抱怨越来越多。
随之而来的熊猫算法算法为页面分配质量分类,在内部使用并以人工质量评级为模型,并将其作为排名因素。
快进到2023年,您现在可以看到作为Google迈出的第一步,专注于质量和用户体验是多么重要。
以下是您需要了解的关于Google Panda的所有信息——更多关于它的推出原因、您需要了解的算法以及完整的时间表。
为什么谷歌创造了熊猫算法
2010年,谷歌搜索结果质量的下降和“内容农场”商业模式的兴起成为人们反复谈论的话题。
正如Google的Amit Singhal后来在TED上告诉Wired的那样,2009年底的“Caffeine”更新极大地加快了Google快速索引内容的能力,同时也在他们的索引中引入了“一些不太好的”内容。
谷歌的Matt Cutts告诉Wired,这个新内容的根本问题并不是垃圾邮件问题,而是“我能做的最低限度是判断什么不是垃圾邮件?”之一。
黄伟老师总结:
“到[2009年]年底,其中两个内容农场 – Demand Media[eHow infamy]和Answers.com – 在comScore衡量的美国前20大网络资产中稳居榜首。Demand Media 是内容农场的缩影,也是迄今为止最大的例子,每天产出 7,000条内容……该公司的运作基于一个简单的公式:创建大量针对搜索引擎的小众内容,大多是平淡无奇的内容,然后通过社交软件让它病毒式传播,并通过广告赚很多钱。”
2011年1月,Business Insider发布了一个标题,说明了一切:谷歌的搜索算法已被破坏,是时候回归到原始阶段了。
在另一篇文章中,他们指出:
“[Media]正在利用Google生态系统进行巨大套利,这算是个聪明的伎俩。Demand与数以千计的自由职业者签订合同,生产数十万条低质量内容,这些内容的主题是根据其搜索价值选择的,其中大部分由谷歌驱动。由于Google的算法将大量且持续的内容置于优质内容之上,因此Google的算法将Demand内容放在其搜索引擎结果页面的前几名。”
毫无疑问,像这样的头条新闻对谷歌产生了重大影响,谷歌以开发熊猫算法算法作为回应。
谷歌熊猫算法更新启动
熊猫算法于2011年2月23日首次亮相。
2月24日,谷歌发布了一篇关于此次更新的博客文章,并表示他们“对我们的排名进行了相当大的算法改进——这一变化显着影响了我们11.8%的查询。”
更新的明确目的如下:
“此更新旨在降低低质量网站的排名——这些网站对用户的附加值低,从其他网站或不是很有用的网站复制内容。同时,它将为高质量网站提供更好的排名——具有原创内容和信息的网站,如研究、深度报告、周到的分析等。”
Search Engine Land 创始人 Danny Sullivan 最初将其称为“Farmer”更新。然而,谷歌后来透露,它在内部被称为“熊猫算法”,这是提出主要算法突破的工程师的名字。
SearchMetrics 和 SISTRIX(以及其他公司)对“赢家和输家”的分析发现,他们是受到打击最严重的网站,当时SEO行业的人都非常熟悉。
这些站点包括wisegeek、ezinearticles、suite101、hubpages、buzzle、articlebase等。
值得注意的是,内容农场eHow和wikiHow在更新后表现更好。当然后来,这两个内容农场网站也收到损伤,不过还在可接受的范围内,Demand Media在2012年第四季度损失了640万美元。
SEO行业最明显的变化是它对“文章营销”的打击有多大,其中SEO从业者过去常常在ezinearticles等网站上发布低质量的文章作为外部链接构建的一种形式。
同样清楚的是,点击率最高的网站设计缺乏吸引力、广告更具侵略性、字数过多、编辑标准低、措辞重复、研究有缺陷,而且总体上没有帮助或值得信赖的印象。
我们对熊猫算法的了解
当谷歌与Wired讨论算法的开发时,Singhal 说他们首先将测试文件发送给质量评估员,他们被问到诸如“你愿意把你的信用卡给这个网站吗?您愿意给您的孩子服用本网站开的药吗?”
Cutts 说,这位工程师提出了“一套严格的问题,一切都来自。‘你认为这个网站是权威的吗?如果这是在杂志上可以吗?这个网站有过多的广告吗?’”
根据采访,他们随后通过将各种排名信号与质量评估员的人为判断因素排名进行比较来开发算法。
Singhal将其描述为在超空间中找到一个平面,将好的站点与坏的站点分开。
Singhal随后发布了以下23个问题作为该算法所基于的指导性问题:
- 您会相信本文中提供的信息吗?
- 这篇文章是由非常了解该主题的专家或爱好者撰写的,还是更肤浅?
- 该网站是否有关于相同或相似主题的重复、重叠或冗余文章,但关键字变体略有不同?
- 您愿意将您的信用卡信息提供给该网站吗?
- 这篇文章是否存在拼写、文体或事实错误?
- 主题是由站点读者的真正兴趣驱动的,还是站点通过尝试猜测可能在搜索引擎中排名靠前的内容来生成内容?
- 文章是否提供原创内容或信息、原创报告、原创研究或原创分析?
- 与搜索结果中的其他页面相比,该页面是否提供了可观的价值?
- 对内容进行了多少质量控制?
- 文章是否描述了故事的两面?
- 该站点是否是其主题的公认权威?
- 内容是否由大量创作者批量生产或外包给大量创作者,或者是否分布在大型网站网络中,以至于单个页面或网站没有得到那么多的关注?
- 这篇文章是否编辑得很好,还是显得马虎或仓促制作?
- 对于健康相关的查询,您会信任来自该站点的信息吗?
- 当提到这个网站的名字时,您会认出它是权威来源吗?
- 这篇文章是否提供了对该主题的完整或全面的描述?
- 这篇文章是否包含有见地的分析或不明显的有趣信息?
- 这是您想要添加书签、与朋友分享或推荐的页面类型吗?
- 这篇文章是否有过多的广告分散或干扰主要内容?
- 您希望在印刷杂志、百科全书或书籍中看到这篇文章吗?
- 文章是否简短、缺乏实质内容或缺乏有用的细节?
- 制作的页面是否非常注重细节,而不是较少注重细节?
- 用户看到来自该站点的页面时会抱怨吗?
考虑Google的人工质量评估员被要求考虑的内容也是一个好主意。这段关于低质量内容的引述意义重大:
考虑这个例子:大多数学生必须为高中或大学写论文。许多学生通过执行以下一项或多项操作来走捷径以节省时间和精力:
- 在线购买论文或让其他人代写。
- 编造事情。
- 快速写作,没有草稿或编辑。
- 用大图片或其他分散注意力的内容填充报告。
- 从百科全书中复制整个报告,或通过在这里或那里更改单词或句子结构来解释内容。
- 使用众所周知的事实,例如,“阿根廷是一个国家。人们住在阿根廷。阿根廷有边界。”
- 使用大量词语来传达基本的想法或事实,例如,“熊猫吃竹子。熊猫吃很多竹子。竹子是熊猫最好的食物。”
2011年3月,SEO By The Sea确定Biswanath Panda可能是该算法背后的同名工程师。
在一篇论文中, Biswanath帮助作者详细介绍了如何使用机器学习算法对着陆页上的用户行为进行准确分类。
虽然这篇论文与Panda算法无关,但作者以其同名的参与和主题表明Panda也是一种机器学习算法。
SEO行业的大多数人得出结论,熊猫算法通过使用机器学习来准确预测人类如何评价内容质量。不太清楚的是,哪些信号会被纳入机器学习算法,以确定哪些网站质量低下,哪些网站质量不错。
熊猫算法和谷歌 EAT:
2014年,谷歌在其专注于专业知识、权威和可信度的搜索质量指南中引入了EAT原则。
自2018年以来,这些原则越来越成为营销人员关注的焦点。
与Panda一样,后续更新和核心算法更改侧重于内容质量和用户体验。
和熊猫算法一样,重点是避免:
- 短薄且非信息性内容。
- 缺乏权威来源。
- 不可信的内容和有问题的链接。
谷歌熊猫算法恢复
从Panda中恢复过来的过程既简单又充满挑战。
由于Panda可以提高其归类为高质量内容的网站的性能,因此解决方案是提高内容的质量和独特性。
虽然说起来容易做起来难,但反复证明这正是恢复所需要的。
黄伟老师最近通过协助网站重写100个页面的内容来帮助一个同学的网站进行恢复。
WiredSEO通过更改用户生成的内容指南以鼓励更具体、独特的bios,而不是从其他站点复制的bios,帮助网站从Panda中恢复过来。该站点的用户以前使用过来自其他站点的bios。尽管如此,WiredSEO还是鼓励他们更改
简历,提出具体问题,从而产生了独一无二的简历,而不是重复的。
谷歌熊猫算法神话
熊猫算法与重复内容无关
关于Panda最普遍的误解是它是关于重复内容的。John Mueller已澄清重复内容与Panda无关。谷歌员工强调熊猫算法鼓励独特的内容,但这比避免重复更深入。Panda寻找的是能够为用户提供卓越价值的真正独特的信息。
Mueller同样告诉一位博主,删除技术重复项实际上是一个非常低的优先级,他们应该“考虑是什么让您的网站与利基市场的绝对顶级网站相比有所不同。”
2021年,谷歌的约翰·穆勒 (John Mueller)解释说,重复内容并不是负面排名因素。
你应该删除内容来解决熊猫算法问题吗?
2017年,谷歌的Gary Illyes在Twitter上表示:“我们不建议删除熊猫算法的一般内容,而是添加更多独特的东西。”
John Mueller在 YouTube 上也说了同样的话:
“总的来说,网站的质量应该得到显着提高,这样我们才能信任内容。有时我们在这样的网站上看到的内容会有很多单薄的内容,也许是你从其他来源聚合的内容,也许是用户生成的内容,人们提交的文章质量很低,这些都是你可能想看的东西并说我能做什么;一方面,如果我想保留这些文章,也许可以阻止它们出现在搜索中,也许对这些东西使用 noindex 标签。”
谷歌的回应一直是要么没有索引,要么改进内容——永远不会完全削减它,除非这样做是为了品牌。
一般来说,删除内容应该是考虑到您网站的整体品牌,而不是为了消除Panda惩罚的举动。
熊猫算法和用户生成的内容
Panda并不专门针对用户生成的内容。尽管Panda可以针对用户生成的内容,但它往往会影响产生低质量内容的网站,例如垃圾邮件访客帖子或充满垃圾邮件的论坛。
不要删除用户生成的内容,无论是论坛、博客评论还是文章贡献,仅仅因为您听说它“不好”或作为“熊猫算法证明”解决方案进行营销。而是从质量的角度来看。
许多排名靠前的网站都依赖于用户生成的内容——因此许多网站会仅仅因为删除了此类内容而失去大量流量和排名。甚至对博客文章发表的评论也会导致其排名甚至获得精选片段。
字数不是一个因素
字数统计是Panda的另一个方面,SEO专业人士经常误解它。许多网站错误地拒绝发布任何内容,除非超过一定的字数,经常引用250字和350字。相反,谷歌建议考虑内容需要多少词才能对用户有用。
例如,有许多页面的主要内容很少,但Google认为该页面质量足够高,因此它获得了查询的特色片段。在一个案例中,主要内容只有63个单词,许多人很难以350多个单词的非垃圾方式来写这个主题。所以你只需要足够的单词来回答查询。
联盟广告链接不是直接被针对的
联盟网站和“为AdSense制作”的网站通常比其他网站更容易受到Panda的攻击,但这并不是因为它专门针对它们。谷歌发言人告诉 TheSEMPost
“一个极端的例子是,当一个网站的主要功能是通过广告或附属链接将用户引导至其他网站时,该网站的内容在互联网上随处可见,或者是仓促制作的,并且明确构建为吸引来自搜索引擎的访问者。”
穆勒同样说:
“但与此同时,我们看到很多附属公司基本上只是懒惰的人,他们复制并粘贴他们获得的内容并将其发布在他们的网站上。而这种低质量的内容,简短的内容,是我们很难在搜索中展示的东西。”
换句话说,这些网站受到打击的原因相同:它们无法提供引人注目、独特且引人入胜的内容。
时间线
几乎可以肯定,Panda 拥有最广泛的相关更新公开日期公开记录。造成这种情况的部分原因是Panda是从Google的核心算法外部运行的,因此内容评分仅在新的Panda更新日期或附近受到影响。
这种情况一直持续到2013年6月11日,当时Cutts在SMX Advanced上表示,虽然Panda没有直接纳入谷歌的核心算法,但它的数据每月更新一次,并在一个月内缓慢推出,结束了突然的全行业影响与熊猫算法更新相关联。
因此熊猫算法提到2017年后消失。
人们会期望Panda算法的核心更新对应于1.0、2.0、3.0 和4.0,但没有更新被称为3.0,回想起来,3.1 也不是Panda的核心更新。
数据刷新会更新搜索结果但不会更新Panda算法本身,通常按照您对软件更新的预期进行编号(3.2、3.4、3.5 等)。但是,由于算法版本3的数据刷新太多,因此一度放弃了这种命名约定,业界仅通过Panda更新(包括
刷新和核心更新)的总数来指代它们。
即使在掌握了这个命名约定之后,仍然不完全清楚是否所有的小熊猫算法更新都只是数据刷新,或者其中一些是否也包含了新信号。
不管怎样,Panda更新的时间表至少是众所周知的,如下所示:
- 1.0:2011年2月23日。引入了当时未命名的算法更新的第一次迭代(12%的查询受到影响),震惊了搜索引擎优化行业和许多大公司,并有效地结束了“内容农场”商业模式,因为它当时存在。
- 2.0 (#2):2011年4月11日。Panda核心算法的首次更新。此更新包含其他信号,例如Google用户已屏蔽的网站。
- 2.1 (#3):2011年5月9日。业界首次将此称为Panda 3.0,但Google澄清说这只是一次数据刷新,即将到来的 2.x 更新也是如此。
- 2.2(#4):2011年6月21日
- 2.3(#5):2011年7月23日
- 2.4 (#6) 国际:2011年8月12日。熊猫算法在除日本、中国和韩国以外的所有英语国家和非英语国家推出。
- 2.5 (#7) 和熊猫算法相关的通量:2011年9月28日。在这次更新之后,卡茨于2011年10月5日宣布“预计未来几周内会出现一些与熊猫算法相关的通量”。确认通量日期为10月3日和10月13日。
- 3.0 (#8): 2011年10月19日。Google 在熊猫算法算法中添加了一些新信号,并重新计算了该算法对网站的影响。
- 3.1 (#9): 2011年11月18日。谷歌宣布了一次小更新,影响不到1%的搜索。
- 3.2 (#10):2012年1月18日。谷歌确认数据刷新发生在这一天。
- 3.3 (#11):2012年2月23日。数据刷新。
- 3.4(#12):2012年3月23日
- 3.5(#13):2012年4月19日
- 3.6(#14):2012年4月27日
- 3.7 (#15):2012年6月8日。排名工具建议的数据刷新比其他最近的更新更具影响力。
- 3.8(#16):2012年6月25日
- 3.9(#17):2012年7月24日
- 3.9.1 (#18):2012年8月20日。一个相对较小的更新,标志着行业指定的新命名约定的开始。
- 3.9.2(#19):2012年9月18日
- #20:2012年9月27日。相对较大的Panda更新也标志着另一个命名约定的开始。业界认识到9.xx命名约定的尴尬,并认识到他们所谓的Panda 3.0的更新可能会在很长一段时间内继续发生。
- #21:2012年11月5日
- #22:2012年11月21日
- #23:2012年12月21日。稍微更有影响力的数据刷新。
- #24:2013年1月22日
- #25:2013年3月14日。此更新是预先宣布的,工具表明它大约发生在这一天。Cutts似乎暗示这将是Panda 被直接纳入Google算法之前的最后一次更新。然而,后来很明显,事实并非如此。
- 《Dance》:2013年6月11日。这不是更新日期。尽管如此,Cutts在那天澄清Panda不会直接纳入算法,而是每月更新一次,推出速度要慢得多,而不是过去的突然数据刷新。
- “Recovery”:2013年7月18日。此更新似乎是为了纠正一些过于苛刻的熊猫算法活动而进行的调整。
- 4.0 (#26):2014年5月19日。这一天发生了一次主要的Panda更新(影响了7.5%的查询)。大多数业内人士认为,这是对Panda算法的更新,而不仅仅是数据刷新,特别是考虑到Cutts关于推出速度缓慢的说法。
- 4.1 (#27):2014年9月23日。另一个主要更新(影响3%到5%的查询)包括对Panda算法的一些更改。由于推出速度缓慢,具体日期尚不清楚,但已于9月25日发布了公告。
- 4.2 (#28):2015年7月17日。Google宣布了Panda更新,需要数月才能推出。由于推出速度缓慢,目前尚不清楚影响有多大或确切发生的时间。这是最终确认的Panda更新。
- 核心算法合并:2016年1月11日。谷歌确认熊猫算法已合并到核心谷歌算法中,显然是2015年7月17日缓慢推出的一部分。换句话说,熊猫算法不再是谷歌算法完成工作后应用的过滤器,而是被纳入其另一个核心排名信 号。然而,已经澄清,这并不意味着 Panda 分类器是实时运行的。
Panda现在已牢固地嵌入到Google的机器学习算法中,因此,与Panda相关的更新不会被视为独立的。
随着Panda成为 Google 核心算法的一部分,我们不再看到单独的Panda更新。核心算法更新——尤其是那些关注质量和内容的——在理论上与“熊猫算法”相关。
2023年,你应该把熊猫算法的核心概念放在首位。
避免黑帽策略和垃圾邮件链接,并专注于为用户和他们的体验提供优质内容。谷歌对机器学习和技术的使用继续坚持这些原则。
Panda这个名字可能不会出现,但Panda原则在今天仍然适用。
=====这个时段的SEOer是“阅读者和分享者”,分享我的所知,收获我所不知====
如果你觉得此文章能够帮您解决问题,您可以点击下方百度分享,让您的更多好朋友能够学到更多有关SEO知识的技巧。
作者:SEOiit@seo顾问 上海seo顾问修订 2023-01-29
SEOiit(企业seo顾问),专门研究百度seo(搜索引擎优化)技术,让更多喜欢seo的朋友,能从中学习有关seo知识,理解搜索引擎优化真谛。
本文伊利诺SEO研究中心版权所有,未经批准转载必究。
共有 0 条评论