如何使用Excel 2010上的Power Query和Power Pivot组合处理不适合RAM的巨大csv文件

如何使用Excel 2010上的Power Query和Power Pivot组合处理不适合RAM的巨大csv文件,excel,powerpivot,powerquery,Excel,Powerpivot,Powerquery,我想知道是否有人能帮我解决以下问题。首先是我的设置(我无法更改,因为这是一个公司环境) 操作系统:Windows7专业版。服务包1。32位 硬件:8.00 GB RAM(2.73 GB可用) 我正在寻找一个解决方案切片和切割真正的大文件(约5Gb)与Excel。因此,这相当于能够使用数据透视表和数据透视图 我刚在笔记本电脑上安装了Power Query和Power Pivot(记得我运行的是Excel 2010-32位),并将巨大的.csv文件保存为与Power Query的连接。然而,我不

我想知道是否有人能帮我解决以下问题。首先是我的设置(我无法更改,因为这是一个公司环境)

  • 操作系统:Windows7专业版。服务包1。32位
  • 硬件:8.00 GB RAM(2.73 GB可用)
我正在寻找一个解决方案切片和切割真正的大文件(约5Gb)与Excel。因此,这相当于能够使用数据透视表和数据透视图

我刚在笔记本电脑上安装了Power Query和Power Pivot(记得我运行的是Excel 2010-32位),并将巨大的.csv文件保存为与Power Query的连接。然而,我不能将它添加到我的数据模型中,并从PowerPivot使用它(显然,这在Excel2010中是一个问题)。我试图通过点击Power Pivot->existing connections四处走动。但当它试图导入所有内容时,我的内存耗尽或达到了Excel的极限

对我来说,这个想法应该是永远不会加载数据,而是将其作为连接保存(在这里只存储查询),并且数据是“惰性”加载的,并且只在设置Power Pivot报告后加载您需要的内容(否则我不知道Power query和Power Pivot如何帮助处理Excel中不适合的大文件)

我可以做些什么来将这个巨大文件的连接添加到数据模型中,以便我可以继续工作,直到我可以设置一个报告(使用Power Pivot)并查看结果

如果我缺少一个软件包(如Power BI),这将帮助我解决问题,请让我知道。如果它是免费的(比如Power Query和Power Pivot),我可以安装它


非常感谢您,并向

致意,因为这听起来像是由于导入了所有内容而导致将CSV直接加载到power pivot失败。一种选择是在清理数据以提高内存使用率的同时,将CSV加载到access文件(或SQL server Express)等中间数据库中

注意:power pivot在更新模型时使用更多内存

其中有一些关于如何设计power pivot模型以提高内存效率的提示


还要注意,数据的唯一性会极大地影响内存中可以容纳多少数据。具有较少不同值的列消耗的内存更少,而事实表上的行ID等唯一的东西将消耗大量内存。

您尝试过Power BI吗?我没有。即使是对公司也是免费的吗?如果这能解决问题,我不介意在公司环境中安装另一个软件包的痛苦。只要你不想在网上与他人共享,它是免费的。作为一个桌面工具,它绝对是免费的。不过,您的32位操作系统可能存在问题。它更多的是可视化,而不是表格和网格。这是免费下载,你应该能够安装没有管理员访问。从微软应用商店下载,很高兴知道它对公司也是免费的。不过,我不知道这是否能解决我的问题。我在家里用过它,它对仪表板很好,但我想解决的问题与尺寸有关。我想要一个工具,这样我可以设置报告(与数字和绘图)与巨大的数据源和工具应该足够聪明,永远不会加载内存或Excel文件中的所有数据。它应该只在需要的时候加载到内存中(我认为Power Pivot和Power Query是实现这一点的正确工具,也许我错了),您可以随时尝试SQL Express(免费)或在Azure上尝试分析(免费帐户可用),非常感谢。我会安装Access并按照你说的去做,尽管我看不出有什么理由让它变得更好。经过Power Query的转换步骤后,我的数据已经非常干净了。如果Power Pivot为数据模型加载内存中的所有内容,无论数据来自Access还是csv文件,都不会有什么区别。。。我总是会耗尽内存,不是吗?这主要取决于您处理的数据行数以及重复性。例如,我已将1600万行零售商POS数据加载到Power Pivot中,但这将是一个相当重复的数据示例,我已将其构造为尽可能节省内存,