如何改进在R中绘制大型数据集的散点图?
我试图使用两个变量(如何改进在R中绘制大型数据集的散点图?,r,database,plot,bigdata,scatter-plot,R,Database,Plot,Bigdata,Scatter Plot,我试图使用两个变量(DATE和INT\u RATE)创建一个绘图,并使用第三个变量GRADE的内容作为过滤器 在下一节中,有一个我正在处理的非常大的数据集样本以及我得到的结果 STARTING DATA | DATE | INT_RATE | GRADE | –––––––––––––––––––––––––––––– | 1-jan | 5% | A | <-- A | 5-feb | 3% | B | | 9-feb |
DATE
和INT\u RATE
)创建一个绘图,并使用第三个变量GRADE
的内容作为过滤器
在下一节中,有一个我正在处理的非常大的数据集样本以及我得到的结果
STARTING DATA
| DATE | INT_RATE | GRADE |
––––––––––––––––––––––––––––––
| 1-jan | 5% | A | <-- A
| 5-feb | 3% | B |
| 9-feb | 2% | D |
| 1-apr | 3% | A | <-- A
| 5-jun | 5% | A | <-- A
| 1-aug | 3% | G |
| 1-sep | 2% | E |
| 3-nov | 1% | C |
| 8-dec | 8% | A | <-- A
| . | . | . |
| . | . | . |
| . | . | . |
这是我的R脚本的相关部分,我用来构建下图所示的图表(使用filter
函数过滤数据):
这是我得到的“断裂”图:
现在是问题
如何改进此图表?因为以这种方式阅读是不可能的,也许我应该选择一种完全不同的图形,但哪一种呢?在绘制数据之前,我确实需要过滤数据。刚才你问了一个@JilberUrbina问题,现在问题完全不同了,我问了一个新问题,正如“apax”和“CPak”所建议的那样
WANTED RESULT:
GRADE "A"
INT_RATE
|
|
8%-| •
| ̷
| ̷
| ̷
5%-| • •
| \ /
| \ /
| \ /
| \ /
3%-| •
|
|
|
|
––––––––––––––––––––––––––––––––––-–––>
| ˆ ˆ ˆ ˆ DATE
|1-jan 1-apr 5-jun 8-dec
plot(x = df$issue_d, y = df$int_rate, data=filter(df, df$grade == "A"))