kafka是否可以使用文件源作为输入，使用jdbc接收器作为输出？_Jdbc_Apache Kafka_Apache Kafka Connect_Confluent Platform

kafka是否可以使用文件源作为输入，使用jdbc接收器作为输出？

jdbc apache-kafka

kafka是否可以使用文件源作为输入，使用jdbc接收器作为输出？,jdbc,apache-kafka,apache-kafka-connect,confluent-platform,Jdbc,Apache Kafka,Apache Kafka Connect,Confluent Platform,我目前正在从事一个卡夫卡项目，我的问题是我能够使用文件源连接器读取文件，并将数据存储到主题中我的配置： connector.class=FileStreamSource tasks.max=1 file=/vagrant/fake_sensor.dat topic=sensor connector.class=io.confluent.connect.jdbc.JdbcSinkConnector tasks.max=1 topics=sensor connection.url=jdbc:po

我目前正在从事一个卡夫卡项目，我的问题是我能够使用文件源连接器读取文件，并将数据存储到主题中

我的配置：

connector.class=FileStreamSource
tasks.max=1
file=/vagrant/fake_sensor.dat
topic=sensor

connector.class=io.confluent.connect.jdbc.JdbcSinkConnector
tasks.max=1
topics=sensor
connection.url=jdbc:postgresql://localhost:5432/pg_data_eng
connection.user=vagrant
connection.password=vagrant
auto.create=true
key.converter=org.apache.kafka.connect.json.JsonConverter
schemas.enable=false

然后，我努力用Jdbc接收器连接器将数据发送到我的Postgres数据库中

我的配置：

connector.class=FileStreamSource
tasks.max=1
file=/vagrant/fake_sensor.dat
topic=sensor

connector.class=io.confluent.connect.jdbc.JdbcSinkConnector
tasks.max=1
topics=sensor
connection.url=jdbc:postgresql://localhost:5432/pg_data_eng
connection.user=vagrant
connection.password=vagrant
auto.create=true
key.converter=org.apache.kafka.connect.json.JsonConverter
schemas.enable=false

请注意，我尝试了一系列不同的配置，但没有任何效果。我可以使用REST API查看我的错误：

http://localhost:18083/connectors/jdbc-sink/tasks/0/status

我明白了：

{"id":0,"state":"FAILED","worker_id":"127.0.1.1:8083","trace":"org.apache.kafka.connect.errors.ConnectException: Exiting WorkerSinkTask due to unrecoverable exception.
at org.apache.kafka.connect.runtime.WorkerSinkTask.deliverMessages(WorkerSinkTask.java:587)
at org.apache.kafka.connect.runtime.WorkerSinkTask.poll(WorkerSinkTask.java:323)\
at org.apache.kafka.connect.runtime.WorkerSinkTask.iteration(WorkerSinkTask.java:226)
at org.apache.kafka.connect.runtime.WorkerSinkTask.execute(WorkerSinkTask.java:194)
at org.apache.kafka.connect.runtime.WorkerTask.doRun(WorkerTask.java:175)
at org.apache.kafka.connect.runtime.WorkerTask.run(WorkerTask.java:219)
at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
at java.util.concurrent.FutureTask.run(FutureTask.java:266)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
at java.lang.Thread.run(Thread.java:748)\nCaused by: org.apache.kafka.connect.errors.ConnectException: Value schema must be of type Struct
at io.confluent.connect.jdbc.sink.metadata.FieldsMetadata.extract(FieldsMetadata.java:82)
at io.confluent.connect.jdbc.sink.metadata.FieldsMetadata.extract(FieldsMetadata.java:63)
at io.confluent.connect.jdbc.sink.BufferedRecords.add(BufferedRecords.java:78)
at io.confluent.connect.jdbc.sink.JdbcDbWriter.write(JdbcDbWriter.java:66)
at io.confluent.connect.jdbc.sink.JdbcSinkTask.put(JdbcSinkTask.java:74)
at org.apache.kafka.connect.runtime.WorkerSinkTask.deliverMessages(WorkerSinkTask.java:565)
... 10 more\n"}

我可以看出，

值模式必须是Struct类型

是主要问题，可能与模式注册表有关

我还尝试添加

value.converter.schema.registry.url=http://localhost:8081

但仍然不起作用

我确实在互联网上研究了一些教程，但没有一个是关于文件源和jdbc接收器的，所以我的问题是：甚至可以这样做吗？

问题是

FileSourceConnect

返回字符串模式连接记录，而不是结构（这是jdbc接收器和其他连接通常期望的）.

您必须使用转换将值包装到结构中

connector.class=FileStreamSource
tasks.max=1
file=/vagrant/fake_sensor.dat
topic=sensor

# Add this
transforms=HoistField
transforms.HoistField.type=org.apache.kafka.connect.transforms.HoistField$Value
transforms.HoistField.field=line

然后使用

Foo 
Bar

转换后，消息将变为此（请手动使用主题以确认）

因此，您的数据库需要一个

行文本列
我还通过添加value.converter.schema.registry.url=尝试了这一点，但仍然不起作用
您需要使用Avro，而不是JSONConverter