从mysql到Hbase的连续数据迁移
我安装了hadoop和hbase用于实时分析。我面临的问题是在线将数据从mysql迁移到Hbase sqoop工具对于批量数据迁移非常有用,有没有任何方法可以将mysql中的数据在线传输到HBase(然后在插入/更新/删除时)。这样就可以实现实时分析。不是近实时的从mysql到Hbase的连续数据迁移,mysql,hadoop,hbase,data-migration,Mysql,Hadoop,Hbase,Data Migration,我安装了hadoop和hbase用于实时分析。我面临的问题是在线将数据从mysql迁移到Hbase sqoop工具对于批量数据迁移非常有用,有没有任何方法可以将mysql中的数据在线传输到HBase(然后在插入/更新/删除时)。这样就可以实现实时分析。不是近实时的 请在这方面帮助我 我认为您面临着在不同DBMS之间设置复制的任务。在这种情况下,本机复制机制没有用处。 最简单的解决方案是在要复制的表上创建一组触发器,并将要复制的数据写入其他表中。然后,您可以设置监视此表并将更改应用于HBase 更
请在这方面帮助我 我认为您面临着在不同DBMS之间设置复制的任务。在这种情况下,本机复制机制没有用处。 最简单的解决方案是在要复制的表上创建一组触发器,并将要复制的数据写入其他表中。然后,您可以设置监视此表并将更改应用于HBase
更健壮但更复杂的解决方案是分析用于本机复制机制的MySQL日志,并将更改应用于HBase
同时,我也不清楚hoe HBase是否能为您提供实时分析。我在这里写了一篇关于这个问题的文章:
要添加有关在项目中的何处使用Hive的更多信息,可以通过多种设置将Hive和HBase集成在一起工作。例如,如果您使用AWS,您可以在同一hadoop集群上安装HBase/Hive,以便在Hive表和HBase表上同时运行联接查询。或者,您可以将HBase和配置单元分为两个不同的集群,并从配置单元查询中引用HBase数据。如果您使用Cloudera发行版,您也可以做同样的事情 参考: