Stata 统计和删除面板数据集中一个变量的观察值
我有一个20年的面板数据集,其中几个公司有不同的财务产出(例如销售、成本)。我有超过100000次观察 现在,我想剔除在数据集中只有2个或更少观察值的公司(例如,公司A只有2000年的产出,但没有其他年份) 我用过:Stata 统计和删除面板数据集中一个变量的观察值,stata,Stata,我有一个20年的面板数据集,其中几个公司有不同的财务产出(例如销售、成本)。我有超过100000次观察 现在,我想剔除在数据集中只有2个或更少观察值的公司(例如,公司A只有2000年的产出,但没有其他年份) 我用过: by fyear: tabulate companyid 我可以看到少于3个观察值的公司,但如何能够自动删除所有少于3个观察值的公司 by companyid (fyear), sort: drop if _N<3 sort fyear companyid
by fyear: tabulate companyid
我可以看到少于3个观察值的公司,但如何能够自动删除所有少于3个观察值的公司
by companyid (fyear), sort: drop if _N<3
sort fyear companyid