基于clojure的大规模数据挖掘
我在找一份关于你的好推荐信 基于Clojure的大规模数据挖掘 我知道很多好的clojure编程书籍(编程clojure,clojure的乐趣,…),还有很多好的数据挖掘教科书(挖掘海量数据集,管理千兆字节,…)。然而,我不知道有任何参考文献专门针对 基于Clojure的大规模数据挖掘 “with clojure”部分对我来说相当重要,原因如下:基于clojure的大规模数据挖掘,clojure,data-mining,Clojure,Data Mining,我在找一份关于你的好推荐信 基于Clojure的大规模数据挖掘 我知道很多好的clojure编程书籍(编程clojure,clojure的乐趣,…),还有很多好的数据挖掘教科书(挖掘海量数据集,管理千兆字节,…)。然而,我不知道有任何参考文献专门针对 基于Clojure的大规模数据挖掘 “with clojure”部分对我来说相当重要,原因如下: * most theoretical analysis uses big-Oh running time, which ignores constan
* most theoretical analysis uses big-Oh running time, which ignores constants
* constants matter, if it ends up being a matter of 1 second vs 1 hour (for things that need to be real time)
* or 1 hour vs 1 week (for batch jobs)
特别是,我认为JVM和Clojure数据结构之间有很多相互作用,无论数据是存储在内存中还是从磁盘惰性地读取,都可能有“相同”的算法,通过“稍微”不同的实现,运行时间会有很大的差异
因此,我的问题是(以上所有问题都是为了避免被“检查谷歌”关闭):
使用Clojure进行海量数据挖掘的好资源是什么
谢谢 我认为还没有人写过好的综合参考书。但在这个领域肯定有很多工作要做(包括我自己的公司!) 以下是一些有趣的后续链接:
- -使用Clojure的分布式实时计算。可用于大规模数据挖掘
- -关于Clojure性能和机器学习应用程序优化的有趣视频
- -可能是领先的Clojure统计和数据可视化库
- -非常全面的Java数据挖掘/机器学习库(因此非常容易直接从Clojure使用)
- 2013年5月将出版一本精彩的书:《Clojure数据分析食谱》。我可能会买它
详细地
数据无处不在,获取数据变得越来越重要
我们可以采取行动的见解。使用Clojure进行数据分析和
收藏,这本书将告诉你如何获得新的见解和经验
从您的数据中透视,并收集必要的实用数据,
结构化食谱
《Clojure数据分析食谱》介绍了每个阶段的食谱
数据分析过程的一部分。无论是从网页上抓取数据,
执行数据挖掘或为web创建图表,这本书
为手头的任务准备的东西
您将学习如何获取数据、清理数据并将其转换为
然后可以分析并发布到
互联网覆盖范围包括处理数据等高级主题
同时,应用强大的统计技术,如贝叶斯
建模,甚至数据挖掘算法,如K-均值聚类,
神经网络和关联规则
接近
《Clojure数据分析食谱》中有很多实用技巧,会有所帮助
您可以通过一系列循序渐进的实际操作来充分利用您的数据
世界配方涵盖数据分析的各个方面
这本书是给谁的
有Clojure和数据分析技术及应用经验
工作流将是有益的,但不是必需的
实际上,很多这样的固定成本来自虚拟机。特别是,数据挖掘中包装的基本对象的成本非常高,这就是为什么Java在这方面总是相当慢的原因。我怀疑Clojure在这方面会有多大帮助。事实上,Clojure引以为豪的很多事情听起来都和这个问题一模一样。例如不变性。在挖掘大型数据时,您希望避免拷贝,而不变性和良好的接口通常需要拷贝!我想让Vala试试。数据结构的克隆是不可变的,但不需要复制现有数据。查看“Clojure持久数据结构”。你的公司是什么?您的个人资料似乎链接到带有在线游戏的网站。。更多信息请访问。