Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/apache-kafka/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache kafka ApacheKafka将数据存储在代理节点的哪个目录中_Apache Kafka - Fatal编程技术网

Apache kafka ApacheKafka将数据存储在代理节点的哪个目录中

Apache kafka ApacheKafka将数据存储在代理节点的哪个目录中,apache-kafka,Apache Kafka,我可以在config/server.properties中看到一个名为log.dir的属性?这是否意味着kafka使用相同的目录来存储日志和数据?kafka主题是“分布式和分区仅附加日志”。参数log.dir定义主题(即数据)的存储位置 它与应用程序/代理日志记录无关 默认的log.dir是/tmp/kafka logs,如果您的操作系统有/tmp目录清理器,您可能需要对其进行更改。config/server.properties中的log.dir或log.dirs指定保存日志数据的目录。 默认

我可以在
config/server.properties
中看到一个名为
log.dir
的属性?这是否意味着kafka使用相同的目录来存储日志和数据?

kafka主题是“分布式和分区仅附加日志”。参数
log.dir
定义主题(即数据)的存储位置

它与应用程序/代理日志记录无关


默认的
log.dir
/tmp/kafka logs
,如果您的操作系统有/tmp目录清理器,您可能需要对其进行更改。

config/server.properties中的log.dir或log.dirs指定保存日志数据的目录。
默认情况下,服务器日志目录为kafka_base_dir/logs。您可以通过在log4j.properties中为“kafka.logs.dir”指定另一个目录来修改它。

server.properties中的
log.dir
是kafka代理存储包含您的数据的提交日志的位置。通常,这将为任务关键型用例提供高速装载磁盘

对于应用程序/代理日志记录,您可以使用general
log4j
logging在自定义位置获取事件日志记录。下面是执行此操作的变量

-Dlog4j.configuration=file:<configuration file with log rolling, logging level etc.>  & -Dkafka.logs.dir=<path to logs>
-Dlog4j.configuration=文件:&-Dkafka.logs.dir=

Mathias完美地描述了日志和数据的目录位置。然而,数据是为卡夫卡引擎的内部处理而设计的,您可以使用卡夫卡连接来存储和操作数据。Kafka Connect是一种用于在Apache Kafka和其他系统之间提供可伸缩性和可靠性数据的工具。看下面的图片:


它将使定义连接器变得简单,这些连接器将大量数据移入和移出卡夫卡内部数据系统。Kafka Connect可以接收整个数据库,使数据可用于流处理,或将单个主题(或多个主题)的特定数据接收到另一个系统或数据库以进行进一步分析。

如果未定义log.dir,则将日志存储在/tmp/Kafka logs/-,至少在我的CentOS 6机器上。我的理解是卡夫卡数据存储在*.log文件中,位置存储在log.dir属性中。在这里使用日志是非常令人困惑的,当然它应该被更改吗?我理解它可能会令人困惑。请随时在邮件列表中提出。任何人都可以提出修改建议(Apache开源项目的美妙之处)。使用.log背后的原因是它的附加功能。许多实时流应用程序使用日志不断追加大量数据。值得注意的是,配置文件是config/server.properties,其中包含log.dirs property。正如我们在
apache kafka
v0.10.1.1
中看到的那样。对于这样重要的操作,通常避免使用
/tmp
。使用
/tmp
有什么理由吗?或者我们也可以将其存储在
/var/logs
之类的地方。我正在
AWS ec2
上使用
RHEL LVM
。也张贴了@。如果您能抽出几分钟的时间,我将不胜感激。。