Statistics 你如何衡量一个界面的改变是改善了还是降低了可用性?

Statistics 你如何衡量一个界面的改变是改善了还是降低了可用性?,statistics,e-commerce,usability,testing-strategies,Statistics,E Commerce,Usability,Testing Strategies,对于一个电子商务网站,你如何衡量网站的改变是否真的提高了可用性?您应该收集什么样的度量,以及如何建立一个框架,使测试成为开发的一部分?而报告是实际度量这类事情的好方法 它允许您测试哪些页面元素组合具有最大的转换率,从而持续改进您的网站设计和可用性 支持这一点。类似于您用来识别可用性问题的方法——可用性测试。通常,您确定您的用例,然后进行实验室研究,评估用户如何实现特定目标。8-10人的实验室测试通常很好 我们为了解用户而采用的更多信息方法是进行匿名数据收集(您可能需要用户许可,明确隐私政策等)。

对于一个电子商务网站,你如何衡量网站的改变是否真的提高了可用性?您应该收集什么样的度量,以及如何建立一个框架,使测试成为开发的一部分?

而报告是实际度量这类事情的好方法

它允许您测试哪些页面元素组合具有最大的转换率,从而持续改进您的网站设计和可用性


支持这一点。

类似于您用来识别可用性问题的方法——可用性测试。通常,您确定您的用例,然后进行实验室研究,评估用户如何实现特定目标。8-10人的实验室测试通常很好


我们为了解用户而采用的更多信息方法是进行匿名数据收集(您可能需要用户许可,明确隐私政策等)。这只是评估用户单击的按钮/导航菜单,以及用户删除内容的方式(即,更改数量-是否有更多用户输入0并更新数量或点击X)?设置起来有点复杂;您必须开发一个基础结构来保存此数据(实际上只是计数器,即“点击次数X:1388383,输入次数0:390393”)并允许根据需要创建数据点以插入设计。

第一种方法可以是完全主观的或部分量化的:用户投诉和积极反馈。问题是,在过滤这些反馈时,你可能会有一些强烈的偏见,所以你最好尽可能地量化g系统将来自用户的每个报告归档,并收集关于每个界面版本的统计信息可能很有用

第二种方法是测量最终用户对界面的问卷调查中的差异。每个问题的答案应该是一组离散值,然后您可以再次收集每个版本界面的统计数据


后一种方法可能更难设置(设计一份调查问卷,可能为其设计受控环境,以及解释结果的指南本身就是一种工艺)但是前者让你很难把测量结果弄糟。例如,你必须考虑到每个版本的门票数量取决于使用的时间,并且所有的时间范围都不相等。(例如,在使用的第三周或第四周之前,可能永远不会发现整个类别的关键问题,或者用户可能倾向于在使用的第一天不提交票据,即使他们发现了问题,等等)。

将用户界面更改改进的度量从最终用户推到上游(数据收集可能需要一段时间)为了设计或实施,可以使用一些简单的启发式方法:

  • 执行场景所需的操作数量是否减少?(如果是,则说明它有所改进)。度量:减少/增加步骤数

  • 这种改变是否减少了要使用的输入设备的种类(即使步骤是相同的)?我的意思是,如果你把同时依赖鼠标和键盘的东西改成只依赖鼠标或键盘,那么你就提高了可用性。测量:所用设备的变化

  • 更改是否使网站的不同部分保持一致?例如,如果电子商务网站的一部分在您未登录时丢失了所做的更改,而另一部分未登录,则这是不一致的。更改该部分以使它们具有相同的行为可提高可用性(最好是更容错!).测量:绘制一个图表(真正的流程图)来映射一个特定动作可以完成的方式。改进是减少图表上的边

  • 等等……找到一些通用的UI提示,找出一些类似于上述的指标,然后您就可以大致了解可用性改进


一旦您获得了这些用户改进的设计近似值,然后收集了长期数据,您就可以看到设计级可用性改进对最终用户反应的预测能力(比如:在过去的10个项目中,我们已经看到平均每删除一个动作,场景速度会加快1%,范围为0.25%,标准开发速度为0.32%)。

Torial窃取了我的答案。尽管有一个衡量完成某项任务所需时间的指标。如果时间缩短,任务仍然完成,那么这是一件好事


此外,如果有一种方法可以记录取消的次数,那么这也会起作用。

当您已经进行了测量时,您将使用多元测试对接口进行分类。这就留下了测量本身的问题……出于某种原因,我有一个概念,即Web Optimizer仅适用于使用Googl进行广告的人e、 很高兴你链接到它,这样我就可以纠正我的错误假设了!很抱歉偷了。我会给你一个投票来弥补:-)问卷调查不会违反可用性准则吗?