Transactions 来自交易级别数据的帐户级别视图

Transactions 来自交易级别数据的帐户级别视图,transactions,sas,large-data,Transactions,Sas,Large Data,因此,我的问题是关于我目前工作中必须从事的一个领域的一个特殊问题 域名是信用卡交易。因此,它在事务级别上是唯一的。但是一个人可以执行多个事务。现在很明显,每笔交易都不完全相同 所以我有这个基本的特征数据集,我可以很容易地管理。从这个数据集中,我想评估客户级别的性能,跨段,这应该很容易访问,而不必为不同的变量组合运行我的代码。基本上,我的目标是达到客户级别的视图,这不会导致任何帐户信息的丢失,而且我仍然可以在客户级别跨部门查看性能 你们有人做过类似的分析吗?或者你对我该怎么做有什么好主意?我不知道

因此,我的问题是关于我目前工作中必须从事的一个领域的一个特殊问题

域名是信用卡交易。因此,它在事务级别上是唯一的。但是一个人可以执行多个事务。现在很明显,每笔交易都不完全相同

所以我有这个基本的特征数据集,我可以很容易地管理。从这个数据集中,我想评估客户级别的性能,跨段,这应该很容易访问,而不必为不同的变量组合运行我的代码。基本上,我的目标是达到客户级别的视图,这不会导致任何帐户信息的丢失,而且我仍然可以在客户级别跨部门查看性能


你们有人做过类似的分析吗?或者你对我该怎么做有什么好主意?我不知道这个解释有多清楚,但如果你需要进一步解释,请告诉我。谢谢你的帮助

假设您有来自10个客户的30个交易的数据,每个客户有三个交易。在关系数据库中,通常在SAS中也是一个好主意,您通常会有一个包含列transactionID、customerID、transactionDate、TransactionMount的事务表和一个包含列customerID、customerName、customerSegment等的客户表。这是数据库规范化的一部分。将事务级数据与客户级数据分开

如果您是procsql的粉丝,那么该设置将在SAS中非常适合您。如果要分析某个customerSegment的事务,只需连接表或子查询或其他内容

SAS中的另一个选项是按customerID合并两个表,创建一个数据集,该数据集具有每个事务的一条记录,并且具有一些作为事务属性的变量和其他作为客户属性的变量。所以可能看起来像:

custID  transID  transDate  transAmount  customerSegment  customerDOB
1       1        1/1/2015   100          A                1/1/1990
1       2        1/2/2015   50           A                1/1/1990
1       3        1/3/2015   75           A                1/1/1990
2       4        1/1/2015   10           B                12/12/1950
2       5        1/2/2015   5            B                12/12/1950
2       6        1/3/2015   75           B                12/12/1950
这是较低的存储效率和标准化程度,因为来自同一客户的每个事务都会重复客户属性的值。但是,当您希望按客户属性分析交易数据时,它可以使您的工作更轻松


有关这方面的更多信息,请访问google数据库规范化。托比·邓恩(Toby Dunn)有一些关于SAS标准化的好文章,例如:

你需要更具体一些。你有什么,你想要什么,你试过什么……好的,我有交易ID。这些都是独一无二的。每个交易ID对应的账户ID将重复。每个事务将由一组类别变量定义。假设每个事务都有变量A,B,C,D。我必须对这些变量的每个组合进行性能分析。帐户ID在每个组合中都是唯一的。说问题是我必须总结我在A、B级的表现;A、B和C级。我想在单个csv中查看这两个视图。目前我想到的只是一个proc摘要和切换类型变量。如果你需要帮助,人们可以很容易地帮助你。用你所拥有的东西发布一个你的数据库的小样本,然后试着发布一个你想要的小模型,也许这会有帮助?好吧,那更好,但是你展示的东西似乎没有意义。a只有e和f,b只有g。另外,b有多个记录,因此总额远大于300美元。或者更详细地解释您试图做什么,或者发布一个一致性数据集的示例