Statistics 你如何衡量一个界面的改变是改善了还是降低了可用性？_Statistics_E Commerce_Usability_Testing Strategies

Statistics 你如何衡量一个界面的改变是改善了还是降低了可用性？

statistics e-commerce

Statistics 你如何衡量一个界面的改变是改善了还是降低了可用性？,statistics,e-commerce,usability,testing-strategies,Statistics,E Commerce,Usability,Testing Strategies,对于一个电子商务网站，你如何衡量网站的改变是否真的提高了可用性？您应该收集什么样的度量，以及如何建立一个框架，使测试成为开发的一部分？而报告是实际度量这类事情的好方法它允许您测试哪些页面元素组合具有最大的转换率，从而持续改进您的网站设计和可用性支持这一点。类似于您用来识别可用性问题的方法——可用性测试。通常，您确定您的用例，然后进行实验室研究，评估用户如何实现特定目标。8-10人的实验室测试通常很好我们为了解用户而采用的更多信息方法是进行匿名数据收集（您可能需要用户许可，明确隐私政策等）。

对于一个电子商务网站，你如何衡量网站的改变是否真的提高了可用性？您应该收集什么样的度量，以及如何建立一个框架，使测试成为开发的一部分？

而报告是实际度量这类事情的好方法

它允许您测试哪些页面元素组合具有最大的转换率，从而持续改进您的网站设计和可用性

支持这一点。

类似于您用来识别可用性问题的方法——可用性测试。通常，您确定您的用例，然后进行实验室研究，评估用户如何实现特定目标。8-10人的实验室测试通常很好

我们为了解用户而采用的更多信息方法是进行匿名数据收集（您可能需要用户许可，明确隐私政策等）。这只是评估用户单击的按钮/导航菜单，以及用户删除内容的方式（即，更改数量-是否有更多用户输入0并更新数量或点击X）？设置起来有点复杂；您必须开发一个基础结构来保存此数据（实际上只是计数器，即“点击次数X:1388383，输入次数0:390393”）并允许根据需要创建数据点以插入设计。

第一种方法可以是完全主观的或部分量化的：用户投诉和积极反馈。问题是，在过滤这些反馈时，你可能会有一些强烈的偏见，所以你最好尽可能地量化g系统将来自用户的每个报告归档，并收集关于每个界面版本的统计信息可能很有用

第二种方法是测量最终用户对界面的问卷调查中的差异。每个问题的答案应该是一组离散值，然后您可以再次收集每个版本界面的统计数据

后一种方法可能更难设置（设计一份调查问卷，可能为其设计受控环境，以及解释结果的指南本身就是一种工艺）但是前者让你很难把测量结果弄糟。例如，你必须考虑到每个版本的门票数量取决于使用的时间，并且所有的时间范围都不相等。（例如，在使用的第三周或第四周之前，可能永远不会发现整个类别的关键问题，或者用户可能倾向于在使用的第一天不提交票据，即使他们发现了问题，等等）。

将用户界面更改改进的度量从最终用户推到上游（数据收集可能需要一段时间）为了设计或实施，可以使用一些简单的启发式方法：

执行场景所需的操作数量是否减少？（如果是，则说明它有所改进）。度量：减少/增加步骤数
这种改变是否减少了要使用的输入设备的种类（即使步骤是相同的）？我的意思是，如果你把同时依赖鼠标和键盘的东西改成只依赖鼠标或键盘，那么你就提高了可用性。测量：所用设备的变化
更改是否使网站的不同部分保持一致？例如，如果电子商务网站的一部分在您未登录时丢失了所做的更改，而另一部分未登录，则这是不一致的。更改该部分以使它们具有相同的行为可提高可用性（最好是更容错！）.测量：绘制一个图表（真正的流程图）来映射一个特定动作可以完成的方式。改进是减少图表上的边
等等……找到一些通用的UI提示，找出一些类似于上述的指标，然后您就可以大致了解可用性改进

一旦您获得了这些用户改进的设计近似值，然后收集了长期数据，您就可以看到设计级可用性改进对最终用户反应的预测能力（比如：在过去的10个项目中，我们已经看到平均每删除一个动作，场景速度会加快1%，范围为0.25%，标准开发速度为0.32%）。

Torial窃取了我的答案。尽管有一个衡量完成某项任务所需时间的指标。如果时间缩短，任务仍然完成，那么这是一件好事

此外，如果有一种方法可以记录取消的次数，那么这也会起作用。

当您已经进行了测量时，您将使用多元测试对接口进行分类。这就留下了测量本身的问题……出于某种原因，我有一个概念，即Web Optimizer仅适用于使用Googl进行广告的人e、很高兴你链接到它，这样我就可以纠正我的错误假设了！很抱歉偷了。我会给你一个投票来弥补：-）问卷调查不会违反可用性准则吗？