R 按市值匹配两个大数据帧_R_Matlab_Match

R 按市值匹配两个大数据帧

r matlab

R 按市值匹配两个大数据帧,r,matlab,match,R,Matlab,Match,我在管理我论文的数据集时遇到了一个棘手的问题（关于REITs期权的隐含波动率表面）。我应该找到那些公司的名字（上面有期权），这些公司不是房地产投资信托基金，它们的市值与我已经拥有的房地产投资信托基金的市值相似。我有一个非常大的数据集，包括71个REIT市值的每日obs（从2005年到2014年），以及美国上市的所有非REIT名称的相同数据集（已经清理了市值极值）。有人告诉我，我应该每年进行一次多对多匹配，获得市值差异（REIT-非REIT），并消除+/-10%公差范围之外的所有内容。我在R和Ma

我在管理我论文的数据集时遇到了一个棘手的问题（关于REITs期权的隐含波动率表面）。我应该找到那些公司的名字（上面有期权），这些公司不是房地产投资信托基金，它们的市值与我已经拥有的房地产投资信托基金的市值相似。我有一个非常大的数据集，包括71个REIT市值的每日obs（从2005年到2014年），以及美国上市的所有非REIT名称的相同数据集（已经清理了市值极值）。有人告诉我，我应该每年进行一次多对多匹配，获得市值差异（REIT-非REIT），并消除+/-10%公差范围之外的所有内容。我在R和Matlab方面都是初学者，我不知道该如何进行这场比赛。有人知道吗？谢谢（在matlab中）您需要在Treit和Tnonreit（两个表）之间进行交叉连接。matlab中的交叉连接是这样完成的：

然后比较mcap_left和mcap right并放弃给定的阈值，这将为您留下具有类似mcap的成对数据

您能否提供一个，例如，您的数据子集或伪数据？您需要在Treit和Tnonreit（两个表）之间进行交叉连接。matlab中的交叉连接是这样完成的：“data.frame”：1400506OBS。共有18个变量：$X:int 1 2 3 4 5 6 7 8 9 10…$secid:int 51395139513951395139513951395139513951395139美元日期：日期，格式：“2010-05-19”“2010-06-10”市值：2370217231121822126962962410 2772855。。。这是两个数据集之一的结构。另一个类似，但名称不同（还有更多变量）