哪些内容对法学硕士 (LLM) 有用?

Exchange insights, tools, and strategies for canada dataset.
Post Reply
mdarafat5724
Posts: 18
Joined: Tue Jan 07, 2025 4:50 am

哪些内容对法学硕士 (LLM) 有用?

Post by mdarafat5724 »

在过去的 12 个月里,我们填补了对 ChatGPT & Co 等 AI 聊天机器人理解方面的重大空白。

我们知道:

采用率正在迅速增长。
随着时间的推移,人工智能聊天机器人会向网站发送更多的推荐。
来自 AI 聊天机器人的引荐流量比来自 Google 的引荐流量质量更高。
您可以在AI 聊天机器人和 SEO的状态中阅读有关它的所有信息。

但是,关于推动人工智能聊天机器人引用和提及的内容的示例和成功因素的内容并不多。

为了得到答案,我在 2024 年 2 月借助Profound分析了 #AI 聊天机器人 (ChatGPT、Perplexity、AI Overviews) 中 1,600 个内容密集型网站 (想想:集成商) 的 URL 中的 7,000 多个引用。

我的目标是弄清楚:

为什么有些页面比其他页面被引用得更多,所以我们可以为 AI 聊天机器人优化内容。
经典的 SEO 因素是否对 AI 聊天机 阿富汗电话号码数据 器人的可见性重要,因此我们可以确定优先顺序。
要避免哪些陷阱,这样我们就不必多次学习相同的教训。
如果不同的因素影响提及和引用,那么我们可以更有针对性地开展工作。
以下是我的发现:

利用 Growth Memo 每周专家的见解提升您的技能。免费订阅!

人工智能聊天机器人品牌引证的关键:深度内容

图片来源:Kevin Indig
🔍 背景:我们知道,AI 聊天机器人使用检索增强生成 (RAG) 来衡量其答案与 Google 和 Bing 的结果。但是,这是否意味着经典的 SEO 排名因素也会转化为 AI 聊天机器人引用?不是的。


我的相关性分析表明, 经典的 SEO 指标与引用量没有很强的关系。LLM 的偏好较轻:困惑度和 AIO 更看重单词和句子数量。ChatGPT 更看重域名评级和 Flesch 分数。

💡Takeaway:经典的 SEO 指标对于 AI 聊天机器人提及和引用来说并不那么重要。内容优化的最佳方法是追求深度、全面性和可读性(文本的易读性)。

以下示例均证明了这些属性:


广泛的相关性并没有揭示足够多实质内容,并给我留下了太多悬而未决的问题。

因此,我研究了引用次数最多的内容与其他内容有何不同。这种方法显示出了更明显的模式。


图片来源:Kevin Indig
🔍背景:因为我没有从统计相关性中获得太多信息,所以我想看看被引用次数最多的前 10% 的内容与后 90% 的内容相比如何。

差异越大,该因素对前 10% 越重要。换句话说,乘数(图表上的 x 轴)表示 LLM 用引用奖励哪些因素。

结果:

最突出的两个因素是 句子数和字数,其次是弗莱什分数。与反向链接和流量相关的指标似乎有负面影响,这并不意味着人工智能聊天机器人对它们给予负面评价,而只是它们对提及或引用并不重要。
在所有三个 LLM 中,被引用次数最多的前 10% 页面的流量要少得多,排名靠前的关键词也更少,获得的反向链接总数也更少。这怎么解释呢?看起来,传统 SEO 指标的强势似乎不利于 AI 聊天机器人的可见性。
顺便说一句,Copilot(未包含在图表中)的不平等现象最为明显。排名前 10% 的引用量比排名后 90% 的引用量多 17.6 次。然而,排名前 10% 的关键词在自然搜索中的排名也高出 1.7 倍。因此,Copilot 似乎比其他 AI 聊天机器人有更强的偏好。
通过 AI 聊天机器人拆分数据,可以向你展示他们独特的偏好:


图片来源:Kevin Indig
💡要点: 内容深度(单词和句子数量)和可读性(Flesch 分数)对 AI 聊天机器人的引用影响最大。

理解这一点很重要:较长的内容并不是因为较长而更好,而是因为它更有可能回答 AI 聊天机器人中提示的特定问题。

例子:
只有 3 处引用,弗莱什分数也很低,只有 48 分,但“不足”,只有 3,900 个单词和 580 个句子。
人工智能聊天机器人中品牌提及的关键:受欢迎程度
🔍背景:我们还不知道人工智能聊天机器人提到的品牌的价值。

早期研究 表明这一比例很高,尤其是当提示表明购买意向时。

然而,我首先想更进一步地了解是什么导致人工智能聊天机器人提及品牌。

在将许多指标与 AI 聊天机器人可见性进行匹配后,我发现一个比其他任何因素都更突出的因素:品牌搜索量。

AI 聊天机器人提及次数与品牌搜索量的相关性为 0.334 – 在这个领域相当不错。换句话说,品牌的受欢迎程度大致决定了它在 AI 聊天机器人中的可见度。


图片来源:Kevin Indig
受欢迎程度是 ChatGPT 最重要的预测因素,它也是所有 AI 聊天机器人中流量最多、使用率最高的。

当通过 AI 聊天机器人进行细分时,我发现 ChatGPT 的相关性最高,为 .542(强),但 Perplexity(.196)和 Google AIO(.254)的相关性较低。

需要明确的是,在提示和类别层面上存在很多细微差别。但从广义上讲,品牌的知名度似乎受到其受欢迎程度的严重影响。


热门品牌及其在健康类别中的知名度示例(图片来源:Kevin Indig)
然而, 当 提到品牌时,所有 人工智能聊天机器人都会更喜欢受欢迎的品牌 ,并始终按照相同的顺序对它们进行排名。

用户问题类别(心理健康、皮肤护理、减肥、脱发、勃起功能障碍)与品牌之间存在明显的联系。
早期数据显示,最知名的品牌都是数字化优先的,并通过内容、搜索引擎优化、评论、社交媒体和数字广告投入大量资金来提升其在线形象。
订阅每日搜索洞察
精炼 AI、PPC 和数字营销新闻,助力成功。加入其他 75,000 名营销人员!


电子邮件*












💡要点:受欢迎程度是决定品牌是否在 AI 聊天机器人中被提及的最大标准。消费者将品牌与产品类别联系起来的方式也很重要。

将品牌搜索量和产品类别存在度与竞争对手进行比较,可以让您最好地了解您在 ChatGPT & Co. 上的竞争力。

示例:我分析的所有模型都最常引用 Healthline。没有一个其他域名进入所有四个模型的前 10 个引用,这表明它们有截然不同的品味,并且跟踪许多模型(而不是仅跟踪 ChatGPT)是多么重要——如果这些模型也为您带来流量的话。


图片来源:Kevin Indig
大多数模型中引用量较高的其他领域:


图片来源:Kevin Indig
背景:并非所有 AI 聊天机器人都以相同的频率 在过去的 12 个月里,我们填补了对 ChatGPT & Co 等 AI 聊天机器人理解方面的重大空白。

我们知道:

采用率正在迅速增长。
随着时间的推移,人工智能聊天机器人会向网站发送更多的推荐。
来自 AI 聊天机器人的引荐流量比来自 Google 的引荐流量质量更高。
您可以在AI 聊天机器人和 SEO的状态中阅读有关它的所有信息。

但是,关于推动人工智能聊天机器人引用和提及的内容的示例和成功因素的内容并不多。

为了得到答案,我在 2024 年 2 月借助Profound分析了 #AI 聊天机器人 (ChatGPT、Perplexity、AI Overviews) 中 1,600 个内容密集型网站 (想想:集成商) 的 URL 中的 7,000 多个引用。

我的目标是弄清楚:

为什么有些页面比其他页面被引用得更多,所以我们可以为 AI 聊天机器人优化内容。
经典的 SEO 因素是否对 AI 聊天机 阿富汗电话号码数据 器人的可见性重要,因此我们可以确定优先顺序。
要避免哪些陷阱,这样我们就不必多次学习相同的教训。
如果不同的因素影响提及和引用,那么我们可以更有针对性地开展工作。
以下是我的发现:

利用 Growth Memo 每周专家的见解提升您的技能。免费订阅!

人工智能聊天机器人品牌引证的关键:深度内容

图片来源:Kevin Indig
🔍 背景:我们知道,AI 聊天机器人使用检索增强生成 (RAG) 来衡量其答案与 Google 和 Bing 的结果。但是,这是否意味着经典的 SEO 排名因素也会转化为 AI 聊天机器人引用?不是的。


我的相关性分析表明, 经典的 SEO 指标与引用量没有很强的关系。LLM 的偏好较轻:困惑度和 AIO 更看重单词和句子数量。ChatGPT 更看重域名评级和 Flesch 分数。

💡Takeaway:经典的 SEO 指标对于 AI 聊天机器人提及和引用来说并不那么重要。内容优化的最佳方法是追求深度、全面性和可读性(文本的易读性)。

以下示例均证明了这些属性:


广泛的相关性并没有揭示足够多实质内容,并给我留下了太多悬而未决的问题。

因此,我研究了引用次数最多的内容与其他内容有何不同。这种方法显示出了更明显的模式。


图片来源:Kevin Indig
🔍背景:因为我没有从统计相关性中获得太多信息,所以我想看看被引用次数最多的前 10% 的内容与后 90% 的内容相比如何。

差异越大,该因素对前 10% 越重要。换句话说,乘数(图表上的 x 轴)表示 LLM 用引用奖励哪些因素。

结果:

最突出的两个因素是 句子数和字数,其次是弗莱什分数。与反向链接和流量相关的指标似乎有负面影响,这并不意味着人工智能聊天机器人对它们给予负面评价,而只是它们对提及或引用并不重要。
在所有三个 LLM 中,被引用次数最多的前 10% 页面的流量要少得多,排名靠前的关键词也更少,获得的反向链接总数也更少。这怎么解释呢?看起来,传统 SEO 指标的强势似乎不利于 AI 聊天机器人的可见性。
顺便说一句,Copilot(未包含在图表中)的不平等现象最为明显。排名前 10% 的引用量比排名后 90% 的引用量多 17.6 次。然而,排名前 10% 的关键词在自然搜索中的排名也高出 1.7 倍。因此,Copilot 似乎比其他 AI 聊天机器人有更强的偏好。
通过 AI 聊天机器人拆分数据,可以向你展示他们独特的偏好:


图片来源:Kevin Indig
💡要点: 内容深度(单词和句子数量)和可读性(Flesch 分数)对 AI 聊天机器人的引用影响最大。

理解这一点很重要:较长的内容并不是因为较长而更好,而是因为它更有可能回答 AI 聊天机器人中提示的特定问题。

例子:

只有 3 处引用,弗莱什分数也很低,只有 48 分,但“不足”,只有 3,900 个单词和 580 个句子。
人工智能聊天机器人中品牌提及的关键:受欢迎程度
🔍背景:我们还不知道人工智能聊天机器人提到的品牌的价值。

早期研究 表明这一比例很高,尤其是当提示表明购买意向时。

然而,我首先想更进一步地了解是什么导致人工智能聊天机器人提及品牌。

在将许多指标与 AI 聊天机器人可见性进行匹配后,我发现一个比其他任何因素都更突出的因素:品牌搜索量。

AI 聊天机器人提及次数与品牌搜索量的相关性为 0.334 – 在这个领域相当不错。换句话说,品牌的受欢迎程度大致决定了它在 AI 聊天机器人中的可见度。


图片来源:Kevin Indig
受欢迎程度是 ChatGPT 最重要的预测因素,它也是所有 AI 聊天机器人中流量最多、使用率最高的。

当通过 AI 聊天机器人进行细分时,我发现 ChatGPT 的相关性最高,为 .542(强),但 Perplexity(.196)和 Google AIO(.254)的相关性较低。

需要明确的是,在提示和类别层面上存在很多细微差别。但从广义上讲,品牌的知名度似乎受到其受欢迎程度的严重影响。


热门品牌及其在健康类别中的知名度示例(图片来源:Kevin Indig)
然而, 当 提到品牌时,所有 人工智能聊天机器人都会更喜欢受欢迎的品牌 ,并始终按照相同的顺序对它们进行排名。

用户问题类别(心理健康、皮肤护理、减肥、脱发、勃起功能障碍)与品牌之间存在明显的联系。
早期数据显示,最知名的品牌都是数字化优先的,并通过内容、搜索引擎优化、评论、社交媒体和数字广告投入大量资金来提升其在线形象。
订阅每日搜索洞察
精炼 AI、PPC 和数字营销新闻,助力成功。加入其他 75,000 名营销人员!


电子邮件*






💡要点:受欢迎程度是决定品牌是否在 AI 聊天机器人中被提及的最大标准。消费者将品牌与产品类别联系起来的方式也很重要。

将品牌搜索量和产品类别存在度与竞争对手进行比较,可以让您最好地了解您在 ChatGPT & Co. 上的竞争力。

示例:我分析的所有模型都最常引用 Healthline。没有一个其他域名进入所有四个模型的前 10 个引用,这表明它们有截然不同的品味,并且跟踪许多模型(而不是仅跟踪 ChatGPT)是多么重要——如果这些模型也为您带来流量的话。


图片来源:Kevin Indig
大多数模型中引用量较高的其他领域:



图片来源:Kevin Indig
背景:并非所有 AI 聊天机器人都以相同的频率提及品牌。尽管 ChatGPT 的采用率最高,并且向来源发送的推荐流量最多,但 Perplexity 在答案中平均提及的品牌最多。

提示结构对于品牌知名度很重要:

在 69.71% 的提示中,“最佳”一词是品牌提及的强烈触发因素。
“值得信赖”(5.77%)、“来源”(2.88%)、“推荐”(0.96%)和“可靠”(0.96%)等词语也与品牌提及可能性的增加有关。
包括“推荐”在内的提示经常会提到 FDA 这样的公共组织,尤其是当提示包含“值得信赖”或“领先”这样的词语时。
Google AIO 表现出最高的品牌多样性,其次是 Perplexity,然后是 ChatGPT。
💡要点:提示结构对答案中出现的品牌有着重大影响。

然而,我们目前还无法真正了解用户使用了哪些提示。这一点很重要:我们查看和跟踪的所有提示都只是用户可能正在做的事情的代理。

技术陷阱可能严重破坏人工智能的可见性

图片来源:Kevin Indig
🔍背景:在我的调查中,我发现了几种品牌无意中破坏其 AI 聊天机器人可见性的方式。

我在这里展示它们是因为在 LLM 中可见的先决条件当然是它们抓取您的网站的能力,无论是直接抓取还是通过训练数据抓取。

例如,Copilot 没有引用 onlinedoctor.com,因为该网站未在 Bing 中编入索引。我找不到任何迹象表明这是故意为之,因此我推测这是一个意外,可以快速修复并奖励引荐流量。

另一方面,ChatGPT 4o 没有引用 cnet.com,Perplexity 没有引用 everydayhealth.com,因为这两个网站都故意在其 robots.txt 中阻止相应的 LLM。

但也存在人工智能聊天机器人引用网站的情况,尽管从技术上来说它们不应该这么做。

在我的数据集中,Perplexity 中引用次数最多的域名是blocked.goodrx.com。GoodRX 屏蔽了美国以外国家的用户,似乎它有意或无意地屏蔽了 Perplexity。 提及品牌。尽管 ChatGPT 的采用率最高,并且向来源发送的推荐流量最多,但 Perplexity 在答案中平均提及的品牌最多。

提示结构对于品牌知名度很重要:

在 69.71% 的提示中,“最佳”一词是品牌提及的强烈触发因素。
“值得信赖”(5.77%)、“来源”(2.88%)、“推荐”(0.96%)和“可靠”(0.96%)等词语也与品牌提及可能性的增加有关。
包括“推荐”在内的提示经常会提到 FDA 这样的公共组织,尤其是当提示包含“值得信赖”或“领先”这样的词语时。
Google AIO 表现出最高的品牌多样性,其次是 Perplexity,然后是 ChatGPT。
💡要点:提示结构对答案中出现的品牌有着重大影响。

然而,我们目前还无法真正了解用户使用了哪些提示。这一点很重要:我们查看和跟踪的所有提示都只是用户可能正在做的事情的代理。

技术陷阱可能严重破坏人工智能的可见性

图片来源:Kevin Indig
🔍背景:在我的调查中,我发现了几种品牌无意中破坏其 AI 聊天机器人可见性的方式。

我在这里展示它们是因为在 LLM 中可见的先决条件当然是它们抓取您的网站的能力,无论是直接抓取还是通过训练数据抓取。

例如,Copilot 没有引用 onlinedoctor.com,因为该网站未在 Bing 中编入索引。我找不到任何迹象表明这是故意为之,因此我推测这是一个意外,可以快速修复并奖励引荐流量。

另一方面,ChatGPT 4o 没有引用 cnet.com,Perplexity 没有引用 everydayhealth.com,因为这两个网站都故意在其 robots.txt 中阻止相应的 LLM。

但也存在人工智能聊天机器人引用网站的情况,尽管从技术上来说它们不应该这么做。

在我的数据集中,Perplexity 中引用次数最多的域名是blocked.goodrx.com。GoodRX 屏蔽了美国以外国家的用户,似乎它有意或无意地屏蔽了 Perplexity。
Post Reply