Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Search HBase、MapReduce和HDFS可以在安装并运行Hadoop的单机上工作吗?_Search_Cloud_Search Engine_Mapreduce_Hbase - Fatal编程技术网

Search HBase、MapReduce和HDFS可以在安装并运行Hadoop的单机上工作吗?

Search HBase、MapReduce和HDFS可以在安装并运行Hadoop的单机上工作吗?,search,cloud,search-engine,mapreduce,hbase,Search,Cloud,Search Engine,Mapreduce,Hbase,我正在设计一个搜索引擎,它将在云上运行。 我们刚刚开始,对Hdoop没有太多的了解。 有人能告诉我HBase、MapReduce和HDFS是否可以在一台安装了Hdoop并在其上运行的机器上工作吗?是的。在我的开发环境中,我运行 名称节点(HDFS) SecondaryNameNode(HDFS) 数据节点(HDFS) 作业跟踪器(MapReduce) TaskTracker(MapReduce) 硕士(HBase) 区域服务器(HBase) QuorumPeer(动物园管理员-HBase所需)

我正在设计一个搜索引擎,它将在云上运行。 我们刚刚开始,对Hdoop没有太多的了解。
有人能告诉我HBase、MapReduce和HDFS是否可以在一台安装了Hdoop并在其上运行的机器上工作吗?

是的。在我的开发环境中,我运行

  • 名称节点(HDFS)
  • SecondaryNameNode(HDFS)
  • 数据节点(HDFS)
  • 作业跟踪器(MapReduce)
  • TaskTracker(MapReduce)
  • 硕士(HBase)
  • 区域服务器(HBase)
  • QuorumPeer(动物园管理员-HBase所需)
此外,我运行我的应用程序,并映射和减少任务跟踪器启动的任务。
在同一台机器上运行如此多的进程会导致CPU核心、内存和磁盘I/O的大量争用,因此这对高性能肯定不是什么好事,但除了可用的资源量之外,没有其他限制。

是的。在我的开发环境中,我运行

  • 名称节点(HDFS)
  • SecondaryNameNode(HDFS)
  • 数据节点(HDFS)
  • 作业跟踪器(MapReduce)
  • TaskTracker(MapReduce)
  • 硕士(HBase)
  • 区域服务器(HBase)
  • QuorumPeer(动物园管理员-HBase所需)
此外,我运行我的应用程序,并映射和减少任务跟踪器启动的任务。
在同一台机器上运行如此多的进程会导致CPU核心、内存和磁盘I/O的大量争用,因此这对高性能来说肯定不是什么好事,但除了可用的资源量之外,没有其他限制。

是的,您可以。您甚至可以创建一个虚拟机,并在一台“计算机”上运行它(这就是我所拥有的:)

关键是简单地在“”中安装Hadoop,这甚至在中有描述

如果您使用Cloudera发行版,他们甚至在RPM中创建了所需的配置


是的,你可以。您甚至可以创建一个虚拟机,并在一台“计算机”上运行它(这就是我所拥有的:)

关键是简单地在“”中安装Hadoop,这甚至在中有描述

如果您使用Cloudera发行版,他们甚至在RPM中创建了所需的配置


HTH

同样,我在一台计算机上运行hadoop/hbase/hive。 如果你真的想在一台计算机上看到分布式计算,那么抓取大量的RAM和一些硬盘空间,然后像这样做-

  • 创建一个或两个虚拟机(使用虚拟盒)
  • 在它们中的每一个上安装hadoop,使您的真实安装(不是任何虚拟安装)成为主设备,rest是从设备
  • 为真正的分布式环境配置hadoop
  • 现在,当hadoop启动时,实际上应该有一个由多台计算机组成的集群(一台真实的、rest虚拟的)
  • 这可能只是一个实验,因为除非您有一个像样的多cpu或多核系统,否则这样的配置实际上会消耗更多的维护费用,而不是提供任何性能

    祝你好运


    --l4l

    同样,我在一台计算机上运行hadoop/hbase/hive。 如果你真的想在一台计算机上看到分布式计算,那么抓取大量的RAM和一些硬盘空间,然后像这样做-

  • 创建一个或两个虚拟机(使用虚拟盒)
  • 在它们中的每一个上安装hadoop,使您的真实安装(不是任何虚拟安装)成为主设备,rest是从设备
  • 为真正的分布式环境配置hadoop
  • 现在,当hadoop启动时,实际上应该有一个由多台计算机组成的集群(一台真实的、rest虚拟的)
  • 这可能只是一个实验,因为除非您有一个像样的多cpu或多核系统,否则这样的配置实际上会消耗更多的维护费用,而不是提供任何性能

    祝你好运

    --l4l