R 结构怪异的数据回归_R - Fatal编程技术网

R 结构怪异的数据回归

R 结构怪异的数据回归,r,R,我有一个包含500个不同用户推文的数据框。每个用户有1-200条推文。对于每一条推文，我都记录了用户的关注者数量，以及推文的参与度（转发+收藏夹）。我现在正试图运行一个lm回归，以DV的参与和IV的追随者问题是IV（追随者）是有点明确和连续的。对于在数据集中有200条tweet的用户，将有200条tweet具有相同数量的关注者。基本上，IV是分类的，在8000到190万的范围内有500个不同的类别。其结果是，我的绘图中的数据点彼此“堆叠”在一起，regline受到影响。是否有一种方法可以重组/

我有一个包含500个不同用户推文的数据框。每个用户有1-200条推文。对于每一条推文，我都记录了用户的关注者数量，以及推文的参与度（转发+收藏夹）。我现在正试图运行一个lm回归，以DV的参与和IV的追随者

问题是IV（追随者）是有点明确和连续的。对于在数据集中有200条tweet的用户，将有200条tweet具有相同数量的关注者。基本上，IV是分类的，在8000到190万的范围内有500个不同的类别。其结果是，我的绘图中的数据点彼此“堆叠”在一起，regline受到影响。是否有一种方法可以重组/转换数据，以便在视觉上更好地表现线性？（线性关系本身通过运行lm摘要来确认）

希望有人能理解这个相当奇怪的问题，能帮我一把

听起来您需要汇总参与度度量。用户参与度的平均值或中位数？那么每个用户参与度的平均值，然后对500个平均值与500个不同的关注者进行回归？我想是的。这样，你就可以与追随者建立1:1的互动关系。当你思考你想在模型中表达什么时，这也很有意义：假设（大概）是更多的追随者=平均更多的参与度。听起来你需要聚合参与度度量。用户参与度的平均值或中位数？那么每个用户参与度的平均值，然后对500个平均值与500个不同的关注者进行回归？我想是的。这样，你就可以与追随者建立1:1的互动关系。当你思考你想在模型中表达什么时，这也是有意义的：假设（大概）是追随者越多=平均参与度越高。