Hadoop离线计算的意义

Hadoop离线计算的意义,hadoop,Hadoop,我一直在阅读Hadoop,有一件事我读了好几遍,那就是Hadoop对离线计算很有好处。“离线计算”是什么意思?AFAIK,“离线计算”正是它所说的。它是一个与网络断开连接的系统(通常是出于安全原因)。但它也与可以访问本地数据库的专用服务器相关,因此它们实际上不需要连接到web,也不想浪费任何资源 因此,我认为您阅读的文档意味着Hadoop对于需要处理长时间运行的专用计算的专用服务器非常有用,而CPU是必须的。在这种情况下,“脱机”通常与性能有关,而不是与安全性有关。术语“联机”和“脱机”有时分别

我一直在阅读Hadoop,有一件事我读了好几遍,那就是Hadoop对离线计算很有好处。“离线计算”是什么意思?

AFAIK,“离线计算”正是它所说的。它是一个与网络断开连接的系统(通常是出于安全原因)。但它也与可以访问本地数据库的专用服务器相关,因此它们实际上不需要连接到web,也不想浪费任何资源

因此,我认为您阅读的文档意味着Hadoop对于需要处理长时间运行的专用计算的专用服务器非常有用,而CPU是必须的。在这种情况下,“脱机”通常与性能有关,而不是与安全性有关。

术语“联机”和“脱机”有时分别与术语“实时”和“批处理”同义。例如,指随着新的培训数据可用而不断发生的学习。相比之下,是指从一批训练数据中学习


Hadoop擅长批量处理大量数据(通常在相对不频繁的基础上执行,例如每小时),而不是在数据可用时实时处理数据。

在线计算中,
用户将等待对其查询的响应,并期望在
实时
近实时
中得到响应

离线计算中
,用户将在特定时间触发/调度操作,而不期望实时响应。一旦手术完成,他会在一段时间后检查结果


离线计算
将在大量数据集上完成,这可能需要数小时才能完成,因此用户对实时响应不感兴趣。他会开枪&忘记计算操作。他将在自己的时间检查结果

出于安全原因,数据库与Internet断开连接是一项硬性规定?我不认为这与定义有关?事实上,我认为曼苏尔的解释更清楚。:-)但是术语“脱机系统”通常与由于某种原因与web断开连接的系统相关。我更喜欢使用术语“批处理”