基于clojure的大规模数据挖掘

基于clojure的大规模数据挖掘,clojure,data-mining,Clojure,Data Mining,我在找一份关于你的好推荐信 基于Clojure的大规模数据挖掘 我知道很多好的clojure编程书籍(编程clojure,clojure的乐趣,…),还有很多好的数据挖掘教科书(挖掘海量数据集,管理千兆字节,…)。然而,我不知道有任何参考文献专门针对 基于Clojure的大规模数据挖掘 “with clojure”部分对我来说相当重要,原因如下: * most theoretical analysis uses big-Oh running time, which ignores constan

我在找一份关于你的好推荐信

基于Clojure的大规模数据挖掘

我知道很多好的clojure编程书籍(编程clojure,clojure的乐趣,…),还有很多好的数据挖掘教科书(挖掘海量数据集,管理千兆字节,…)。然而,我不知道有任何参考文献专门针对

基于Clojure的大规模数据挖掘

“with clojure”部分对我来说相当重要,原因如下:

* most theoretical analysis uses big-Oh running time, which ignores constants
* constants matter, if it ends up being a matter of 1 second vs 1 hour (for things that need to be real time)
* or 1 hour vs 1 week (for batch jobs)
特别是,我认为JVM和Clojure数据结构之间有很多相互作用,无论数据是存储在内存中还是从磁盘惰性地读取,都可能有“相同”的算法,通过“稍微”不同的实现,运行时间会有很大的差异

因此,我的问题是(以上所有问题都是为了避免被“检查谷歌”关闭):

使用Clojure进行海量数据挖掘的好资源是什么


谢谢

我认为还没有人写过好的综合参考书。但在这个领域肯定有很多工作要做(包括我自己的公司!)

以下是一些有趣的后续链接:

  • -使用Clojure的分布式实时计算。可用于大规模数据挖掘
  • -关于Clojure性能和机器学习应用程序优化的有趣视频
  • -可能是领先的Clojure统计和数据可视化库
  • -非常全面的Java数据挖掘/机器学习库(因此非常容易直接从Clojure使用)

    • 2013年5月将出版一本精彩的书:《Clojure数据分析食谱》。我可能会买它

      详细地

      数据无处不在,获取数据变得越来越重要 我们可以采取行动的见解。使用Clojure进行数据分析和 收藏,这本书将告诉你如何获得新的见解和经验 从您的数据中透视,并收集必要的实用数据, 结构化食谱

      《Clojure数据分析食谱》介绍了每个阶段的食谱 数据分析过程的一部分。无论是从网页上抓取数据, 执行数据挖掘或为web创建图表,这本书 为手头的任务准备的东西

      您将学习如何获取数据、清理数据并将其转换为 然后可以分析并发布到 互联网覆盖范围包括处理数据等高级主题 同时,应用强大的统计技术,如贝叶斯 建模,甚至数据挖掘算法,如K-均值聚类, 神经网络和关联规则

      接近

      《Clojure数据分析食谱》中有很多实用技巧,会有所帮助 您可以通过一系列循序渐进的实际操作来充分利用您的数据 世界配方涵盖数据分析的各个方面

      这本书是给谁的

      有Clojure和数据分析技术及应用经验 工作流将是有益的,但不是必需的


      实际上,很多这样的固定成本来自虚拟机。特别是,数据挖掘中包装的基本对象的成本非常高,这就是为什么Java在这方面总是相当慢的原因。我怀疑Clojure在这方面会有多大帮助。事实上,Clojure引以为豪的很多事情听起来都和这个问题一模一样。例如不变性。在挖掘大型数据时,您希望避免拷贝,而不变性和良好的接口通常需要拷贝!我想让Vala试试。数据结构的克隆是不可变的,但不需要复制现有数据。查看“Clojure持久数据结构”。你的公司是什么?您的个人资料似乎链接到带有在线游戏的网站。。更多信息请访问。