什么是 AB 测试?全面的初学者指南

目录

什么是 A/B 测试?

A/B 测试是一种用于营销、Web 开发和用户体验 (UX) 的研究方法。它会比较某个元素(例如网页或广告)的两个版本,以确定哪个版本效果更好。A/B 测试的另一个名称是拆分测试。

在 A/B 测试中,研究人员选择两个或多个变量并将它们标记为“A”、“B”、“C”等。然后,该网站在相似的受众群体中同时测试这些变量,以衡量其有效性以及对用户行为的影响。

A/B 测试使营销人员、设计师和开发人员能够做出有数据支持的决策,从而提高认知度、点击量和转化率。

您可以对整个网页或单个元素(例如图像选择和布局)运行 A/B 测试。

其他常见应用包括:

  • 电子邮件营销主题行
  • 内容格式
  • 号召性用语 (CTA) 按钮
  • 广告投放

A/B 测试示例

想象一下:您开展了一次电子邮件营销活动,以激发人们对一系列新产品的兴趣。

您为开场白创建了两个清晰的主题行:版本 A 和版本 B。

从包含 3,000 人的电子邮件列表中,您制作了 300 人的样本部分。

您将主题行版本 A 的消息发送给 150 人。然后你将版本 B 发送给其他 150 个人。

测试完成后,数据显示有 50 人打开了版本 B 的电子邮件,但只有 28 人打开了版本 A。

您得出结论,版本 B 更有可能吸引您的受众并选择将其用于更广泛的活动。 

您已成功运行第一个 A/B 测试。 

A/B 测试与多变量和多页测试

多变量多页 测试是用于更复杂分析的两种附加 A/B 测试技术。

多变量测试使用多个修改变量来测试假设(您正在研究的命题或想法)。目标?确定许多可能的排列中哪一种对共同目标表现最好。

想象一下,您想要衡量网页首屏元素对转化的影响。您可以同时测试两个着陆页标题和两个标题图像。总共,您将创建四个测试页面,每个测试页面都有独特的元素组合。 

鉴于其复杂性,多变量测试最适合高级营销人员、设计师和开发人员。好消息:如果做得正确,您将通过跳过冗长的连续测试来节省时间。

另一方面,多页测试涉及跨多个页面测试对特定元素的更改。它对于测试您想要在更大范围内进行的小调整非常有用。

例如,您可以尝试客户评价,看看它们是否会影响转化。 

您无需将评论添加到单个测试页面,而是将它们添加到所有产品页面的测试版本中。一些访问者会看到这些带有推荐的测试迭代,而其他访问者会看到未经编辑的版本。 

这种方法的结果是什么?来自更大样本的更准确的性能数据和一致的客户体验。即使在测试期间,网站访问者在查看多个产品页面时也会看到相同的格式。

为什么要运行 A/B 测试?

A/B 测试消除了营销活动、网站改进和转化率优化 (CRO)中的猜测。

用它来:

  • 最大化现有流量的价值。 没有转化的流量对大多数企业来说意义不大。创建网站的最佳版本可以让访问者更有可能购买、订阅或保持联系。
  • 降低跳出率。吸引新访问者,让他们在您的网站上花费更多时间。他们停留的时间越长,他们就越有可能了解您的品牌并开始将您视为解决他们问题的方法。
  • 增加销量。完善营销活动以吸引企业的理想客户(即最有可能购买并成为忠诚客户的客户)并实现更高的转化率。
  • 了解您的受众。使用测试结果来了解什么对目标受众有效,什么无效。将您学到的知识融入到未来的网站设计和营销工作中。

但这些好处仅适用于有效的A/B 测试。如果弄错了,您可能会浪费时间并错过销售机会。 

更多 A/B 测试示例:您可以测试哪些元素?

您可以使用 A/B 测试来优化一切,从网站设计的特定元素到电子邮件主题行中的挂钩。 

以下是一些最有影响力的测试。

头条新闻

标题是访问者在您的网页上看到的第一件事。这就是吸引或不吸引他们注意力的东西。仅此一点就使其成为一个值得进行 A/B 测试的主题。

要遵循最佳实践,目标是成为头条新闻:

  • 短的。理想情况下,六到八个字之间。你不会每次都达到这个目标。但这个过程迫使你思考每个词的价值和影响。
  • 说到点子上了。你的标题是你的第一印象。确保它能快速吸引注意力。
  • 朗朗上口。令人难忘的标题使内容更容易分享。可共享的内容可以提高品牌知名度。
  • 反映您的内容。误导你的读者可能会导致他们反弹,再也不会回来。例如,Semrush 的以下标题引用了读者可能感兴趣的免费模板。内容兑现了标题的承诺。

尝试使用不同的样式(字体、大小和颜色)、词语选择和消息传递来对几个版本的标题进行 A/B 测试。

如果您正在试验网站内容,则可以使用以下指标来衡量更改的效果:

  • 页面浏览量。您网站上的特定页面被访问的总次数。更强有力的标题应该会吸引更多的观点。
  • 平均页面停留时间。访问者在页面上花费的平均时间长度。如果您的标题具有误导性,那么这个数字可能会很低。
  • 跳出率。登陆页面并在未执行特定操作的情况下离开的用户所占的百分比。高跳出率可能表明您的标题可靠,但内容不匹配。
  • 停留时间。用户在返回搜索引擎结果页面 (SERP) 之前在搜索结果页面上花费的时间。如果停留时间很短,您的标题(和元数据)可以发挥作用,但您的内容可能会不够。

Google Analytics(分析)是查找所有这些内容营销指标等的最佳场所。

号召性用语 (CTA)

一个出色的号召性用语可能会决定某人的转化(例如,购买您的产品或订阅您的电子邮件通讯)和转向您的竞争对手之一。

A/B 测试允许您试验 CTA 的各种元素,包括:

  • 复制。您的内容已经成功。现在,简洁的结束语应该会激发参观者采取行动。
  • 放置。你的号召性用语应该是显而易见的,但又不会过早地转移读者的注意力(即在他们消化你的主要信息之前)。
  • 尺寸。您的号召性用语应该足够大,以吸引点击(或致电)而不分散读者的注意力。
  • 设计。您的 CTA 是突出按钮的一部分还是只是文本中的链接?两者都可以工作——A/B 测试过程可以显示哪一个最适合您的受众。
  • 字体。截然不同的字体可能会令人不舒服,尤其是当您的 CTA 构成内容正文的一部分时。但如果您使用按钮,请考虑测试一些设计。 

CTA 的目标始终是激发行动——通常是转化。使用以下方法衡量您所做的任何更改的影响:

  • 点击率(CTR)。CTA 的点击次数与人们接触它的次数的比率。例如,如果 100 人访问登陆页面,其中 5 人点击 CTA 按钮,则点击率为5%。
  • 兑换率。完成所需操作的访问者的百分比。该操作可能是请求报价、加入您的邮件列表或购买产品。

您经常会在产品页面和其他登陆页面的底部看到并使用 CTA。您还可以对搜索引擎广告、社交媒体广告和营销电子邮件进行 A/B 测试 CTA 。

主题行

主题行是您电子邮件的标题。这决定了人们是否打开您的消息。

即使是细微的调整也会影响电子邮件营销活动的打开率。避免停留在你想到的第一行。相反,写下 10 个或更多的想法。然后将领先者派往小样本组,对领先者进行 A/B 测试。

扎实的主题行可以吸引电子邮件用户并引起他们的兴趣。但它必须脱颖而出,不能误导读者。因此,请关注电子邮件的主要好处,并用他们能够理解的语言和语气与受众交谈。

以下是一些电子邮件主题行最佳实践:

  • 包括数字(如果相关)。在许多情况下,它们可以提高打开率。
  • 问问题。这可以激起电子邮件用户的好奇心,吸引他们打开。
  • 避免陈词滥调。像“打开惊喜”、“里面有很多东西”和“免费试用我们的产品”这样的台词被过度使用。 

在下面的电子邮件中,Pitch 的活泼问题(“准备好开始了吗?”)鼓励好奇的收件人继续阅读。

为什么这很重要?几乎在所有情况下,您的主题行的唯一目的就是获得打开。因此,在 A/B 测试中比较主题行的两个或多个版本时,您只需选择打开率最高的版本即可。

布局和导航

为用户平滑转化路径的最佳方式是什么?将最有吸引力和最有帮助的内容放在他们面前。

两个页面可以包含完全相同的内容。但如果一个看起来很混乱或强调最不有价值的信息,那么它吸引的访客就会减少。

例如,Chilly 的 主页以一个简短、活泼的视频片段打开,以引起兴趣。

该产品视频吸引点击页面中间的“探索瓶子”按钮。反过来,单击该按钮会将用户带到精简且易于导航的产品页面。 

此页面上简单的标题(“所有瓶子”)是读者的线索,表明他们正在查看整个瓶子产品线。

从那里,读者可以使用过滤选项来个性化结果,然后再进一步探索。 

如果 Chilly’s 将其主页剪辑放得更靠下或不使用它,访问者可能会在看到链接之前就离开或最终到达网站的其他位置。

混乱且无用的页面布局往往会导致:

  • 高跳出率
  • 平均页面停留时间低
  • 转化率低
  • 停留时间短

如果您手头有一个,设计师就会知道布局视觉资产的一般最佳实践。 

否则,请考虑用户最看重的是什么,以便您知道要优先考虑什么。然后将最有吸引力和最有帮助的内容放在触手可及的地方,以便访问者始终可以找到他们需要的内容。

社会证明

营销中的社会证明是来自第三方的支持产品或品牌价值的任何东西。 

社会证明的例子包括:

  • 感言
  • 评论
  • 代言
  • 认证证书
  • 奖项

强调这些的目的是为了客观地安抚买家。它之所以有效,是因为人们往往更信任他人而不是品牌。

Matter 调查发现,更多的消费者信任朋友、家人和影响者的推荐 (61%),而不是信任品牌社交内容 (38%)。

在 BrightLocal 的另一项调查中,近一半 (46%) 的消费者表示,他们对评论的信任程度与对个人推荐的信任程度相同。

以下是英国蜡烛制造商Solent Wick实施的社会证明示例:

各种名称格式、语气和写作风格表明这些都是真实的评论。每个人都向参观者重申购买是一个明智的决定。

目前,Solent Wick 的客户评论位于其主页底部附近。如果他们想测试页面的优化,公司的营销或设计团队可以 A/B 测试在更高的位置(即首屏)或单个产品页面上发布推荐。 

然后,他们可以通过比较转化率或页面停留时间来衡量成功。 

抓住一切机会收集社会证据。您可以使用具有不同内容的不同类型。例如,推荐在产品页面上效果很好,而奖项和认证可以让主页访问者放心,他们来对地方了。

如何通过 7 个步骤运行基本 A/B 测试

A/B 测试有多种不同的形式。每一个都遵循一个独特的过程。 

我们并没有尝试一次性涵盖所有内容,而是创建了一份分步指南来帮助您对两部分内容运行标准 A/B 测试。

注意:如果您渴望更深入地了解 SEO A/B 测试,请查看我们的SEOsplit 测试指南。并查看SplitSignal的无代码 SEO 对比测试功能。

1.寻找改进机会

使用以下工具中的数据构建网站当前性能的概况:

  • 塞姆拉什
  • 谷歌分析
  • 谷歌搜索控制台

例如,您可以使用 Semrush 的ImpactHero工具突出显示表现不佳和表现出色的内容。

ImpactHero 工具可以帮助您确定哪些内容需要改进(即使用 A/B 测试方法来试验哪些内容)以及哪些改进可能有助于帮助您实现内容目标。

2. 识别变量

当您探索 ImpactHero 和其他工具中的数据时,您会发现有许多变量需要测试。我们的建议:一次专注于一项。这样可以更轻松地确定性能变化的原因。

例如:假设您所有表现最好的博客的标题都包含九个或更少的单词。您可能决定通过缩短标题并跟踪页面浏览量来衡量影响,对一组旧的、性能较低的作品运行 A/B 测试。

在这里,您的变量是标题长度

或者,为了提高社交媒体广告的点击率,您可以尝试使用不同的图像,看看什么最能吸引注意力。这里,图像是变量。

3. 确定测试假设

根据您的研究,准确确定您想要发现的内容。

请记住:A/B 测试旨在证明和反驳利用数据提高性能的想法。

在我们运行的示例中,假设可以很简单,比如“较短的标题比较长的标题更有吸引力”。

考虑证明或反驳该假设将如何使您的业务受益。这样您就可以知道您将要进行的测试是否值得。

例如:“通过证明较短的标题更有效地吸引我们的受众,我们可以完善我们的编辑指南,以提高我们的内容营销投资回报率。”

4.设定您的目标和测试周期(或样本量)

您将在测试期间测量多个指标。但一两个可能比其他更重要。

在开始之前选择一个主要指标。这将帮助您准确地了解如何衡量成功。您可以查看我们的测试元素列表,了解每个元素要使用哪些指标。

如果您要同时测试两项新功能,请牢记一个指标,并在测试期结束时对每个受众群体进行测量。这样,您就可以直接比较性能。

同时测试时,请选择适合您目标的测试周期。 

较长的测试通常会生成更准确的数据。但越早获得结果,就能越早采取行动,因此平衡很重要。 

一个月通常是一个合理的起点。

如果您正在测试对现有内容的更改,则需要对现有性能(没有任何更改的情况下的表现)进行基准测试,以获得衡量新版本的基准。

对于某些测试元素,您将根据时间来衡量性能。

例如,您可以在调整之前检查博客文章过去 30 天内的页面浏览量。并在30天后再次检查。 

对于其他人来说,根据样本大小跟踪性能更容易。

例如,如果您正在测试电子邮件主题行,您可以将前 1,000 封电子邮件的打开率(您的主要指标)与接下来 1,000 封电子邮件的打开率进行比较。这样,您的更改的影响应该清晰且准确。

5. 根据你的假设创建变体

设置您的“控制”和“挑战”版本。

无论您测试什么,未更改的版本都是控制版本

这可能是:

  • 现有的内容,例如一年前的主页
  • 依赖于现有流程的新事物,例如遵循您通常公式的着陆页 CTA。

挑战者是修改后的版本,将与您的控制竞争你需要创建这个。如果您测试次要变量(例如标题长度),请复制现有内容并根据需要调整详细信息。

例如,如果您想知道向产品页面添加联系信息是否有助于您产生更多潜在客户,请设置(或查找)没有联系详细信息的页面。然后创建一个包含联系方式新版本以进行比较。

6. 运行测试

要了解 A/B 测试如何影响搜索,请设置302 重定向到您的挑战者页面。

对于搜索,直接针对旧页面测试新页面不会给出准确的结果。搜索引擎有时需要时间来索引页面,并且它们可能需要更长的时间才能进入 SERP。这就是为什么临时重定向到挑战者页面是这里的重要一步。

在测试期结束时(例如一个月),或者当您有足够的数据时,将挑战者页面的结果与控制版本的结果进行比较,看看哪一个表现更好。

7. 分析结果并规划后续步骤

你的数据告诉你什么? 

如果您的变体优于原始内容,那么接下来的步骤就很简单。 

将您所学到的知识应用到网站上的其他页面,随时监控性能(更重要的是,性能的变化)。

如果你的实验反驳了你的假设,那也没关系。毕竟,如果数据支持你所做的每一个假设,你可能不会学到任何东西。 

每个零假设都是一个学习和构思更多测试机会的机会。

解析 A/B 测试结果的 3 个主要挑战

发现自己怀疑自己的测试结果?考虑一下这些常见陷阱之一是否可能会扭曲您的数据。 

样本量不足

想象一下您在 Facebook 广告中调整 CTA。第一周,所有点击的 10 个人都继续进行转化。 

是时候庆幸了吗?不完全的。这种误报并不意味着您已经掌握了社交媒体广告的文案写作。更有可能的是您的样本量太小,并且您需要运行更长时间的测试。 

继续前进。随着时间的推移,数据应该会趋于平衡,以便您更准确地了解性能。

新奇效应

某些网络用户可能比其他用户更频繁地访问您的网站。可能是关注您博客文章的人、老客户或竞争对手。

如果其中一位访客突然看到一些不同的东西,很可能会引起他们的注意。即使它像新按钮颜色一样小。

假设您正在主页上测试新图像。它可能会导致普通访问者在页面上停留更长时间,但不一定是因为它更具吸引力或影响力 – 只是因为它不同。

尽可能将测试重点放在首次访问者身上,以克服新奇效应。为什么?这些访问者正在以新的眼光看待您的内容。因此,它们的行为可能会更自然,为您生成更准确的数据。 

外在因素

您无法控制的因素可能会影响您的 A/B 测试结果。 

有些,比如假期,你可以解决。

例如,如果您经营一家电子商务商店并想要测试电子邮件主题行,请避免将 12 月和 1 月的效果数据进行比较。 

在重大节日来临之际,消费者可能会在网上花费更多。因此,营销参与度可能会更高。

但其他因素,例如平台中断,是无法预测的。

如果您在平台上测试广告文案时 Instagram 出现故障,那么参与度将不可避免地下降。您在中断期间收集的任何数据都不准确,不应有助于您得出结论。

一种可能的解决方案是运行更长时间的测试以收集更准确的数据。这应该可以帮助您生成更平衡、更真实的图片。

仔细选择 A/B 测试对象

您无法对营销策略或网站的每个方面进行 A/B 测试,也不应该尝试。

相反,尝试最有可能提升您最关心的指标的元素。 

新 A/B 测试人员可靠且简单的起点包括 CTA、标题和电子邮件主题行。

SplitSignal可以帮助您解决所有这些问题。您可以设置简单的 A/B 测试,无需复杂的代码或开发人员。而且,在对网站进行任何永久性更改之前,您可以测试想要进行的任何更改,以确保它们不会损害您现有的流量。

一旦您完成了几次基本步骤并从过程中学习,您就可以开始探索更复杂的方法以获得更大的结果,例如SEO 对比测试和多变量测试。

获取SEO所需的一切