Apache spark df.cache()存储在哪里?该存储在驱动程序内存还是执行器内存中

Apache spark df.cache()存储在哪里?该存储在驱动程序内存还是执行器内存中,apache-spark,caching,pyspark,Apache Spark,Caching,Pyspark,大宗报价 如果它存储执行器级别,则在数据帧大小大于执行器内存的情况下,它应通过内存不足错误将其存储在执行器上。如果选择存储级别为StorageLevel.MEMORY\u和\u DISK或StorageLevel.MEMORY\u和\u DISK\SER,则当内存不足时,它会将数据存储在磁盘中 所以,如果用户选择MEMORY_ONLY,那么在执行器内存开销的情况下,它会通过一个错误,对吗?不,它会缓存可以缓存的数据,其余的不会缓存,所以在这一点上没有缓存的用途。我认为MEMORY_只会在无法将所

大宗报价


如果它存储执行器级别,则在数据帧大小大于执行器内存的情况下,它应通过内存不足错误将其存储在执行器上。如果选择存储级别为StorageLevel.MEMORY\u和\u DISK或StorageLevel.MEMORY\u和\u DISK\SER,则当内存不足时,它会将数据存储在磁盘中

所以,如果用户选择MEMORY_ONLY,那么在执行器内存开销的情况下,它会通过一个错误,对吗?不,它会缓存可以缓存的数据,其余的不会缓存,所以在这一点上没有缓存的用途。我认为MEMORY_只会在无法将所有数据存储在内存中时崩溃,它将在运行时计算rest数据,没有任何崩溃