茂石虎博客 互联网思维 NLP是什么?如何通过自然语言处理获得更好的内容

NLP是什么?如何通过自然语言处理获得更好的内容

仅仅为搜索引擎优化内容的日子已经一去不复返了。对于现代SEO,你的内容需要同时取悦机器人和人类。但是你怎么知道…

NLP

仅仅为搜索引擎优化内容的日子已经一去不复返了。对于现代SEO,你的内容需要同时取悦机器人和人类。但是你怎么知道你写的东西可以同时满足人和机器呢?

在今天的白板上,Ruth Burr Reedy专注于她最近的MozCon 2019演讲的一部分,并告诉我们谷歌如何使用NLP(自然语言处理)来真正理解内容,以及如何利用这些知识来更好地优化您为人类和机器人编写的内容。

视频转录

莫兹迷,您好!我是Ruth Burr Reedy,我是UpBuild战略副总裁,UpBuild是一家专门从事SEO技术和高级Web分析的精品技术营销机构。最近,我在MozCon上谈到了SEO的基本框架,并探讨了我们行业的变革,该变革基于我们是人类向人类进行营销的观点来思考SEO,但我们应该使用机器作为中介。

但是今天我想谈一谈我发现非常有趣的一点,它改变了我创建内容的方式,那就是为机器人编写内容,对于Google来说更容易理解,实际上可以使您成为更好的作家,并帮助您为人类编写更好的内容。 这是双赢。

实体,单词之间的关系以及人们的搜索方式

搜索

为了了解当前如何解析内容并了解内容的含义,Google在神经匹配和自然语言处理等方面花费了大量的时间和精力,并花了很多钱,这些方法旨在基本了解人们在什么时候说话,他们在说什么?

随着搜索的发展,会话变得越来越多。但是很多时候有人在搜索,但是他们并不完全知道自己想要什么,而Google仍然希望他们得到他们想要的东西,因为那是Google赚钱的方式。他们花费大量时间试图理解实体之间以及单词之间的关系以及人们如何使用单词进行搜索。

我认为,丹尼·沙利文(Danny Sullivan)在网上提供了一个很好的示例,该示例是有人正在电视上观看肥皂剧的效果。如果您曾经看过一部肥皂剧,就会注意到它们看起来很奇怪。有人可能正在经历这种情况,并且不知道那叫什么,因为他们对此一无所知,因此无法获得Google肥皂剧的效果。

肥皂剧

他们可能会搜索类似的内容,“为什么我的电视看起来很有趣?” 神经匹配可以帮助Google理解有人搜索“为什么我的电视看起来很有趣?”的情况。一个可能的答案可能是肥皂剧效果。这样他们就能兑现这一结果,并且人们会感到高兴。

了解显著兴

自然语言处理

在我们思考自然语言处理时,自然语言处理的核心部分是理解显著兴。

显著兴,内容和实体

显著兴是一句话式的方法,可以概括该特定实体的内容在多大程度上?在这一点上,谷歌真的很擅长从内容中提取实体。实体基本上是名词,人,地方,事物,专有名词,常规名词。

实体是事物,人等,数字,诸如此类。Google真的很擅长将其删除,并说:“好吧,这是这些内容中包含的所有实体。” Salience试图了解它们之间的关系,因为Google真正在试图爬行页面时试图理解的是:该页面是关于什么的,这是关于该主题的页面的一个很好的例子吗?

显着型进入第二部分。内容的主题在多大程度上是给定实体?人们创造的一段内容实际上与任何东西无关的程度通常令人惊讶。我认为我们都经历过。

您正在搜索,然后进入页面,您会觉得:“这太含糊了。太宽泛了。这说的是一件事,但实际上是其他事情。我没有找到什么我需要的。这对我来说不是很好的信息。” 作为营销人员,我们经常处于另一端,试图让客户在其网站上说出他们的产品实际的作用,或者说:“我知道您认为您为假期创建了Instagram指南。但是您实际上写了一个关于假期的段落,然后写了关于您的新Instagram工具的七个段落。这实际上不是关于假期的Instagram的博客文章。这是关于您的工具的一部分内容。” 这些是我们作为营销人员所进行的战斗。

自然语言处理(NLP)API

自然语言处理(NLP)API

幸运的是,现在可以使用许多不同的API来理解自然语言处理:

  • IBM有一个:https :  //www.ibm.com/watson/services/natural-language-understanding/
  • Google实际上具有https://cloud.google.com/natural-language/上的自然语言处理API。

是否像他们在自己的东西上使用的一样复杂?可能不是。但是您可以测试一下。放入一条内容,然后查看(a)Google能够从中提取哪些实体,以及(b)Google对于这些内容整体而言对每个实体的感觉如何。再说一遍,关于这个东西的这些内容在什么程度上?

因此,您可以免费试用这种自然语言处理API,并且如果您要使用它构建工具,那么对于API来说实际上并不昂贵,它将为每个实体分配可以提取0到1之间的显着分数的实体, “好吧,我们如何确定这部分内容是关于这个东西而不是仅仅包含它?”

因此,您越高或越接近1,该工具就越有信心确定此内容与此相关。0.9真的非常好。0.01表示存在,但他们不确定其相关程度。

显着型和实体如何工作的一个好例子

我在这里有一个示例,它不是取材于真实的内容-这些数字是组合而成的,仅是一个示例-如果您有巧克力曲奇饼干食谱,则需要巧克力曲奇饼干或巧克力曲奇饼干食谱,巧克力曲奇,就像是第一大实体,最突出的实体,您希望它具有很高的显着分数。

您可能希望该工具充满信心,是的,这部分内容与此主题有关。但是您还可以看到它正在提取的其他实体以及它们在多大程度上也对该主题有意义。因此,您会看到类似巧克力曲奇饼干的配方,可能会看到诸如曲奇,黄油,糖,350(这是您加热烤箱的温度)之类的东西,所有这些东西共同构成了一个巧克力曲奇饼干食谱。

但是我认为对于SEO来说,了解显着型是相关关键字的未来对我们来说确实非常重要。我们不止需要优化巧克力曲奇饼干配方的时间,我们还将寻找诸如巧克力食谱,巧克力片,巧克力曲奇饼干配方之类的东西。词干,变体,TF-IDF,这些都是用于理解内容的较旧的方法。

取而代之的是,我们需要了解的是Google使用其丰富的知识,使用Freebase等工具,使用互联网的大部分内容的实体,Google 在哪里看到这些实体以他们认为合理的速率共现确信某个实体上的某项内容要与该实体显眼,会包括这些其他实体吗?

使用专家是创建与主题相关的内容的最佳方法

因此,巧克力曲奇配方,我们现在还要确保添加黄油,面粉,糖等。如果您确实有巧克力曲奇食谱可以摆放,那么实际上这确实很容易。这是我认为,作为SEO中的内容趋势,我们将开始看到的是,创建与主题相关的内容的最佳方法是让该主题的实际专家来创建该内容。

精通某个主题的人自然会包含共同出现的术语,因为他们知道如何创建与该主题有关的东西。坦率地说,我认为我们将开始看到人们将不得不开始为内容营销支付更多费用。不幸的是,许多公司似乎认为内容营销是而且应该便宜的。

作为内容营销人员,我对此感到满意。很烂,现在不再如此。我们需要开始对内容进行投资,并对专家进行投资以创建该内容,以便他们可以创建每个人真正需要的深层,丰富,突出的内容。

您如何使用此API来改善自己的SEO?

我喜欢使用这类信息来做的一件事情就是看待-这是我多年以来所做的事情,但并非在这种情况下-但总体上主要的优化目标是按主题排名的页面,但它们在第2页上排名。

这通常意味着Google理解该关键字是页面的主题,但不一定理解它是该主题的一个很好的内容,页面实际上仅是关于那个内容的,它是一个主题。好资源。换句话说,信号在那里,但是很微弱。

您可以做的是,获取经过排序但效果不佳的内容,通过此自然语言API或其他自然语言处理工具运行该内容,并查看实体的提取方式以及Google如何确定它们之间的相互关系。有时可能是您需要消除歧义。因此,在此示例中,您会注意到,虽然巧克力曲奇被称为艺术品,但我同意,这里的曲奇实际上被称为其他。

这是因为cookie意味着不止一件事。有饼干,烘烤过的食物,还有饼干,数据包。两者都是“ cookie”一词的合法使用。单词有多种含义。如果您注意到Google,那么这种自然语言处理API很难正确地对您的实体进行分类,那么现在是进行消歧的好时机。

确保围绕该术语的术语明确地说:“不,我的意思是烘烤好的商品,而不是软件数据。” 这确实是提高您的显着型的好方法。查看您的主要实体是否有很强的显着分数。您会惊讶于此工具可以插入多少内容,而最突出的最上层实体仍然仅是0.01、0.14。

很多时候,API就像“我认为这就是它的意思”,但不确定。这是进入和完善该内容,使其更加健壮并寻找使这些实体更易于提取和相互关联的好时机。这将我带到第二点,这是我在世界上最喜欢的东西。

为人类写作和为机器写作,您现在可以同时进行。您不再需要,而且很长一段时间都不必这样做,但是您可以为用户添加关键字或以其他方式为用户可能看不到或不在意的Google内容创建想法的方式,方式,方式过度。

现在,您可以为Google创建对用户也更好的内容,因为机器可读型和人类可读型的宗旨越来越紧密。

有关人和机器可读型的写作技巧:

机器可读

我在这里所做的是,我不是在自然语言处理方面而是在为提高人类可读兴而进行的写作方面进行了一些研究,即作者的建议,即来自写作专家的关于如何编写更好,更清晰,更易读,更易理解的内容的建议。然后,我提出了一些建议,这些建议也可以作为编写自然语言处理的建议。因此,自然语言处理再一次成为Google或实际上可能处理语言的任何事物试图了解实体在给定内容体内如何相互关联的过程。

简短的句子

简短的句子。简单地写。不要用很多花哨的语言。简短句子,并尽量使每个句子保持一个主题。

每句话一个意思

如果您继续使用,如果您有很多不同的从句,如果您使用了很多代词,并且使您所谈论的内容变得混乱,那么这对读者来说就不好了。这也使机器更难解析您的内容。

将问题与答案联系起来

然后将问题与答案紧密联系。因此,请不要说“烘烤饼干的最佳温度是多少?好吧,让我告诉您一个有关祖母和我童年的故事”,而500字以后就是答案。将问题与答案联系起来。

这三个可读型技巧的共同点是归结为缩小实体之间的语义距离。

如果您希望自然语言处理理解您内容中的两个实体紧密相关,请将它们在句子中移近。将单词靠近在一起。减少混乱,减少绒毛,减少机器人可能需要在一个实体和另一个实体之间理解语义关系的次数,现在您已经创建了更具可读型的内容,因为它更短,更容易浏览,而且还使机器人更容易解析和理解。

首先要具体,然后再解释细微差别

回到“烘烤巧克力饼干的最佳温度是多少?”的示例。现在,要烘烤巧克力饼干的最佳温度是多少,真正的答案取决于它。你好。嗨,我是SEO,我只是回答了一个问题。

的确如此,这是事实,但这不是一个好答案。这也不是机器人可以通过语音搜索或精选片段提取和复制的东西。如果有人说:“好吧,谷歌,在什么温度下可以烘烤饼干?” Google说“这取决于你”,即使这是真的,也无济于事。因此,为了兼具机器可读型和人类可读型,请先进行具体说明,然后再解释细微差别。

然后,您可以进入细节。因此,对“烘烤巧克力曲奇的温度是多少?”有一个更好而正确的答案。烘烤巧克力饼干的最佳温度通常在325至425度之间,具体取决于您的海拔高度以及您喜欢饼干的脆度。正如它所依赖的一样真实,实际上,它所依赖的含义是相同的,但是它要具体得多。

更精确了。它使用实数。它提供了一个真实的答案。我缩短了问题和答案之间的距离。我没有说这首先取决于你。我说这要看最后。您可以采取这种方式来提高人类和机器的可读型和理解度。

切入要点

讲到重点。不要埋头。你们中所有想成为内容营销人员的记者,然后内容营销中的每个人都说:“哦,您需要等到最后才明白自己的意思,否则他们不会阅读整本书。” “不要埋头,”是正确的。对于不熟悉新闻业的人来说,不掩盖领导本质上就意味着直截了当。

包括某人真正需要从该内容中获取的所有信息。如果他们什么都没读,他们就会读那一段,并且是精髓了。这样,想要深入的人就可以深入。这就是人们实际上喜欢消费内容的方式,而且令人惊讶的是,这并不意味着他们不会阅读内容。这只是意味着,如果他们没有时间,需要快速回答,则不必阅读。

对于机器也是如此。提前点。立即弄清楚内容的主要实体,主要主题和主要重点是什么,然后进入细节。您将获得结构更好的内容,更易于在所有方面进行解析。

避免行话和“营销语言”

避免行话。避免营销语言。这不仅可怕而且很难理解。您经常看到这一点。我再次回到让客户说出他们的产品用途的例子。您与许多B2B公司合作,您会经常遇到这种情况。是的,但是它有什么作用?它提供了简化工作流程的解决方案,等等。好吧,它有什么作用?对于公司来说,这种事情真的很难做到,但是对于用户和机器来说,这是如此重要。

避免行话。避免营销语言。不必太讲重述,但是一个单词越深奥,它的使用就越少。这实际上就是深奥的意思。这意味着使用的字词越少,Google理解其与其他实体的语义关系的可能型就越小。

把事情简单化。请明确点。说出你的意思。清除所有行话。通过消除行话和营销语言的种类以及内容中可能出现的模糊现象,您还将再次减少实体之间的语义距离,使它们更易于解析。

整理您的信息以适应用户旅程

对其进行组织并将其映射到用户体验中。考虑某人可能需要的信息以及他们所需的顺序。

用标题划分子主题

然后用小标题将其分开。这就像非常非常基本的写作建议,但是你们都没有这样做。因此,如果您不打算为您的用户使用它,那么请为计算机使用它。

用项目符号或数字格式化列表

您还可以通过使用项目符号或数字列出列表来真正影响用户的可略写型。

最好的是,用项目符号或数字分隔列表还可以使机器人更容易解析和提取信息。如果这些技巧中的许多似乎与获取特色摘要所用的技巧相同,则因为它们确实是一个很好的指示,表明您正在创建机器人可以找到,解析,理解的内容,然后解压缩,这就是您想要的。

因此,如果您以精选片段为目标,那么您可能已经做了很多事情,做得很好。

语法和拼写计数!

最后一件事,我不必说,但我要说的是,语法,拼写和标点以及类似的东西绝对重要。他们算是用户。它们并不会计入所有用户,但会计在用户中。他们也算是搜索引擎。

语法,拼写和标点之类的东西对于机器来说是非常非常容易找到和解析的信号。Google在诸如“ Quality Rater Guidelines”(质量评估者指南)之类的东西上具有特定型,即编写得当,结构合理,语法正确的文档,这些都是权威型的标志。我并不是说拥有一个拼写出色的文档将意味着您立即飞跃到结果的顶部。

我是说,如果您不在那方面,那可能会伤害您。因此,请花点时间确保一切都整洁。您可以使用白话英语。您不必一直都是完美的“ AP风格指南”。但是,请确保从语法角度和技术角度正确设置格式。我喜欢所有这些,这只是很好的写作。

这是很好的写作。很容易理解。很容易解析。离开行话世界,直截了当,停止写2,000个单词仍然很困难,尤其是在营销领域,因为我们认为需要2,000个单词,真正思考我们是否正在创建内容有关我们认为这是关键。

使用这些工具来了解您的内容的可读型,可解析型和可理解型

SEO

因此,我对SEO以及您的希望是,您可以使用这些工具,而不仅仅是考虑如何实现完美的关键字密度,或者在自然语言处理API的显着型方面获得几乎完美的评分。我希望您将使用这些工具来帮助自己了解内容的可读型,可解析型和可理解型,您对内容的理解以及把握程度,以便您可以为用户创建更好的东西。

它使互联网成为一个更好的地方,也可能会为您带来一些收入。这就是我的想法。如果您现在正在使用自然语言处理API,是否已使用该工具构建了内容,你对此有何看法,如何做,我希望在评论中看到。您使用它,情况如何。告诉我一切。

本文来自网络,不代表茂石虎博客立场,转载请注明出处:http://www.maoshihu.com/1662.html

作者: 茂石虎

茂石虎(www.maoshihu.com)互联网从业20年,行业领导者,擅长SEO、网络营销、视频营销、内容营销等。

发表评论

邮箱地址不会被公开。 必填项已用*标注

联系我们

联系我们

0898-88888888

在线咨询: QQ交谈

邮箱: redyelove@qq.com

工作时间:周一至周五,9:00-17:30,节假日休息

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部