R 结构怪异的数据回归

R 结构怪异的数据回归,r,R,我有一个包含500个不同用户推文的数据框。每个用户有1-200条推文。对于每一条推文,我都记录了用户的关注者数量,以及推文的参与度(转发+收藏夹)。我现在正试图运行一个lm回归,以DV的参与和IV的追随者 问题是IV(追随者)是有点明确和连续的。对于在数据集中有200条tweet的用户,将有200条tweet具有相同数量的关注者。基本上,IV是分类的,在8000到190万的范围内有500个不同的类别。其结果是,我的绘图中的数据点彼此“堆叠”在一起,regline受到影响。是否有一种方法可以重组/

我有一个包含500个不同用户推文的数据框。每个用户有1-200条推文。对于每一条推文,我都记录了用户的关注者数量,以及推文的参与度(转发+收藏夹)。我现在正试图运行一个lm回归,以DV的参与和IV的追随者

问题是IV(追随者)是有点明确和连续的。对于在数据集中有200条tweet的用户,将有200条tweet具有相同数量的关注者。基本上,IV是分类的,在8000到190万的范围内有500个不同的类别。其结果是,我的绘图中的数据点彼此“堆叠”在一起,regline受到影响。是否有一种方法可以重组/转换数据,以便在视觉上更好地表现线性?(线性关系本身通过运行lm摘要来确认)


希望有人能理解这个相当奇怪的问题,能帮我一把

听起来您需要汇总参与度度量。用户参与度的平均值或中位数?那么每个用户参与度的平均值,然后对500个平均值与500个不同的关注者进行回归?我想是的。这样,你就可以与追随者建立1:1的互动关系。当你思考你想在模型中表达什么时,这也很有意义:假设(大概)是更多的追随者=平均更多的参与度。听起来你需要聚合参与度度量。用户参与度的平均值或中位数?那么每个用户参与度的平均值,然后对500个平均值与500个不同的关注者进行回归?我想是的。这样,你就可以与追随者建立1:1的互动关系。当你思考你想在模型中表达什么时,这也是有意义的:假设(大概)是追随者越多=平均参与度越高。