有些人认为可用性是非常昂贵和复杂的,用户测试应该保留给稀有的web设计项目,有巨大的预算和大量的时间安排。不正确的。精心设计的可用性测试是对资源的浪费。最好的结果来自于测试不超过5个用户和运行尽可能多的小测试。

在早期的研究中,Tom Landauer和我表明,在可用性测试中发现的可用性问题数量n用户是:

N(1 - (1 -l)n)

在哪里N是设计中的可用性问题总数l是测试单个用户时发现的可用性问题的比例。典型的价值l是31%,我们研究过的很多项目的平均值。绘制曲线l= 31%给出以下结果:

通过测试用户数量发现的可用性问题的比例增加

曲线最引人注目的真相是零用户提供零见解

当你从单独的测试用户,你的见解拍摄,你已经学到了几乎三分之一的信息,了解了设计的可用性。零和甚至一点点数据之间的差异是惊人的。

当你测试时第二个用户,你会发现这个人与第一个用户做了一些相同的东西,所以你的学到了一些重叠。人们肯定是不同的,所以还有一些新的用户,第二个用户确实没有观察到第一个用户。因此,第二个用户增加了一些新的洞察力,但几乎与第一个用户一样多。

第三个用户会做很多你已经在第一个用户或第二个用户上观察到的事情,甚至一些你已经见过两次的事情。另外,当然,第三个用户将生成少量的新数据,即使没有第一个和第二个用户生成的那么多。

当你添加越来越多的用户,您将学到较少,更少因为你会一次又一次地看到同样的事情。没有必要反复观察相同的东西,你会非常有动力回到绘图板上重新设计站点,以消除可用性问题。

在第五个用户之后,您正在通过重复观察同样的发现,但没有学习很多新的用户。

迭代设计

曲线清楚地表明你需要用至少15名用户测试来发现所有可用性问题在设计中。那么为什么我建议使用更少数量的用户测试?

主要原因是最好分配您的预算通过许多小测试进行用户测试而不是把一切都浪费在一项复杂的研究上。假设你有资金招募15个有代表性的客户,让他们测试你的设计。太好了。将此预算花在3项研究中,每个用户都有5个用户!

您希望运行多个测试,因为可用性工程的实际目标是提高设计,而不仅仅是记录其缺点。在第一次与五个参与者的研究中发现了85%的可用性问题后,您将希望在重新设计中修复这些问题。

创建新设计后,您需要再次测试。尽管我说重新设计应该“修复”在第一次研究中发现的问题,但事实是你认为新设计克服了这些问题。但由于没有人能设计出完美的用户界面,也不能保证新设计确实解决了问题。第二次测试将发现修复是否有效。此外,在引入新的设计时,总是存在引入新的可用性问题的风险,即使旧的问题得到了解决。

另外,在第二次调查中,5个用户将发现在第一轮测试中没有发现的剩余15%的可用性问题。(仍然会有2%的原来的问题留下-他们将不得不等到第三次研究来确定。)

最后,第二项研究将能够深入探究基本结构的可用性该网站,评估信息架构,任务流程等问题,以及与用户需求相匹配。这些重要问题通常在初步研究中掩盖了用户陷入愚蠢的表面级可用性问题,以防止它们真正挖掘到网站。

因此,第二项研究既是第一项研究结果的质量保证,也有助于提供深刻的见解。第二项研究将始终导致新的(但较小)的可用性问题列表来修复重新设计。同样的介绍适用于此重新设计:并非所有修复都将起作用;清理界面后,将发现一些更深层次的问题。因此,也需要第三项研究。

最终的用户体验比使用15个用户的单个怪物学习,从5个用户提供更多的用户体验。

为什么不使用单个用户进行测试?

您可能认为使用单个用户的15项研究甚至比3个用户的研究更好。曲线确实表明我们从第一个用户比从任何后续的用户那里学到更多,所以为什么要继续?两个原因:

  • 总是有被一个人的虚假行为所误导的风险,这个人可能出于意外或以一种不具代表性的方式进行某些行为。即使是3个用户也足以让你了解用户行为的多样性,并深入了解什么是独特的,什么是可以概括的。
  • 用户测试的成本效益分析根据测试风格提供3或5个用户左右的最佳比率。与规划和运行一项研究总是有固定的初始成本:最好贬值来自多个用户的调查结果的启动成本。

何时测试更多用户

网站时需要测试其他用户几个截然不同的用户群体。该公式仅适用于将以相似的方式使用该网站的可比用户。

例如,如果您有一个将由子女和父母使用的网站,那么两组用户将具有足够不同的行为,即有必要与两组人员一起测试。对于旨在将采购代理商与销售人员连接的系统来说,这也是如此。

即使用户组是截然不同的,两组的观察结果仍然存在很大的相似之处。所有用户都是人类的。此外,许多可用性问题与人们与Web交互的基本途径以及来自其他网站对用户行为的影响。

在测试多个不同用户的多组中,您不需要在单个用户的单一测试中包含每个组的成员。观察之间的重叠将确保在每个组中测试较少数量的人的更好的结果。我建议:

  • 如果测试两组用户,则每个类别中有3-4个用户
  • 每类别中的3个用户,如果测试三组或多组用户(您总是希望至少有3个用户以确保您在组中涵盖了该组内的行为的多样性)

参考

Nielsen, Jakob和Landauer, Thomas K:“发现可用性问题的数学模型,”ACM Interchi'93会议的会议记录(阿姆斯特丹,荷兰,1993年4月24日至29日),第206-213页。

后续文章狗万注册页