R 按市值匹配两个大数据帧

R 按市值匹配两个大数据帧,r,matlab,match,R,Matlab,Match,我在管理我论文的数据集时遇到了一个棘手的问题(关于REITs期权的隐含波动率表面)。我应该找到那些公司的名字(上面有期权),这些公司不是房地产投资信托基金,它们的市值与我已经拥有的房地产投资信托基金的市值相似。我有一个非常大的数据集,包括71个REIT市值的每日obs(从2005年到2014年),以及美国上市的所有非REIT名称的相同数据集(已经清理了市值极值)。有人告诉我,我应该每年进行一次多对多匹配,获得市值差异(REIT-非REIT),并消除+/-10%公差范围之外的所有内容。我在R和Ma

我在管理我论文的数据集时遇到了一个棘手的问题(关于REITs期权的隐含波动率表面)。我应该找到那些公司的名字(上面有期权),这些公司不是房地产投资信托基金,它们的市值与我已经拥有的房地产投资信托基金的市值相似。我有一个非常大的数据集,包括71个REIT市值的每日obs(从2005年到2014年),以及美国上市的所有非REIT名称的相同数据集(已经清理了市值极值)。有人告诉我,我应该每年进行一次多对多匹配,获得市值差异(REIT-非REIT),并消除+/-10%公差范围之外的所有内容。我在R和Matlab方面都是初学者,我不知道该如何进行这场比赛。有人知道吗? 谢谢(在matlab中)您需要在Treit和Tnonreit(两个表)之间进行交叉连接。matlab中的交叉连接是这样完成的:
然后比较mcap_left和mcap right并放弃给定的阈值,这将为您留下具有类似mcap的成对数据

您能否提供一个,例如,您的数据子集或伪数据?您需要在Treit和Tnonreit(两个表)之间进行交叉连接。matlab中的交叉连接是这样完成的:“data.frame”:1400506OBS。共有18个变量:$X:int 1 2 3 4 5 6 7 8 9 10…$secid:int 51395139513951395139513951395139513951395139美元日期:日期,格式:“2010-05-19”“2010-06-10”市值:2370217231121822126962962410 2772855。。。这是两个数据集之一的结构。另一个类似,但名称不同(还有更多变量)