Name	Name	Last commit message	Last commit date
Latest commit History 14 Commits
auto	auto
config	config
connectors	connectors
gradle/wrapper	gradle/wrapper
scripts	scripts
src/main	src/main
.gitignore	.gitignore
README.md	README.md
build.gradle	build.gradle
docker-compose.yml	docker-compose.yml
gradlew	gradlew
gradlew.bat	gradlew.bat
settings.gradle	settings.gradle

Quick Start (Update on 2024年11月14日)

Start with docker

auto/dev

Create topics download https://www.apache.org/dyn/closer.cgi?path=/kafka/3.7.0/kafka_2.13-3.7.0.tgz

tar -xzf kafka_2.13-3.7.0.tgz

Update your kafka unzipped jar path in the script scripts/create-topic.sh and run it to create topics.

Create connectors after the step 1 finished

run the script scripts/create-connectors.sh to create connectors. run the script scripts/check-connector-status.sh to check the status of connectors. More scripts can be found in the scripts folder.

Run the producer to send messages to the topic
- /src/main/java/OrderProducer.java
- /src/main/java/StudentProducer.java
Update the connector's config Currently we cannot see new data was saved in DB when the producer sends messages to the topic because the SMT filter some messages. You can update the SMT in the connector's config to see the new data saved in DB.
- /config/connect-jdbc-sink.json
- /config/connect-aws-lambda-sink.json

{
 "transforms": "purchaseFilter",
 "transforms.purchaseFilter.type": "com.github.jcustenborder.kafka.connect.transform.common.PatternFilter$Value",
 "transforms.purchaseFilter.pattern": "^filter$",
 "transforms.purchaseFilter.fields": "name"
}

It means only the message with the field name not equals to filter will be saved in DB.

Add new connector jars Unzip jars to connectors folder or

RUN confluent-hub install --no-prompt --component-dir /usr/share/java/kafka jcustenborder/kafka-connect-transform-common:0.1.0.58

Reference

Kafka Connect Concept

https://docs.confluent.io/platform/current/connect/index.html https://docs.confluent.io/platform/current/connect/userguide.html#connect-userguide

Kafka Connect JDBC Connector

https://www.confluent.io/hub/confluentinc/kafka-connect-jdbc?session_ref=direct

Other open source connectors

https://www.confluent.io/product/connectors/?_ga=2.68501202.25982689.1717039609-1247891401.1693981423&_gl=1*1kp58w3*_ga*MTI0Nzg5MTQwMS4xNjkzOTgxNDIz*_ga_D2D3EGKSGD*MTcxNzEyNDQzMC41Mi4xLjE3MTcxMjU0NDkuNjAuMC4w

Kafka quick start

download https://www.apache.org/dyn/closer.cgi?path=/kafka/3.7.0/kafka_2.13-3.7.0.tgz

tar -xzf kafka_2.13-3.7.0.tgz
cd kafka_2.13-3.7.0

start brokers

bin/zookeeper-server-start.sh config/zookeeper.properties

bin/kafka-server-start.sh config/server.properties

cd /Users/zeyan.du/WorkSpace/libs/package/kafka_2.13-3.7.0

create topic

bin/kafka-topics.sh --create --topic students --bootstrap-server localhost:29092

list topic

bin/kafka-topics.sh --list --bootstrap-server localhost:9092

produce

bin/kafka-console-producer.sh --topic quickstart-events --bootstrap-server localhost:9092

consume

bin/kafka-console-consumer.sh --topic quickstart-events --from-beginning --bootstrap-server localhost:9092

JDBC sink config

https://docs.confluent.io/kafka-connectors/jdbc/current/sink-connector/sink_config_options.html

table.name.format A format string for the destination table name, which may contain ${topic} as a placeholder for the originating topic name.

For example, kafka_${topic} for the topic orders will map to the table name kafka_orders.

Type: string Default: ${topic} Importance: medium

Required Kafka Connect configurations

https://docs.confluent.io/platform/current/installation/docker/config-reference.html

Install the JDBC sink connector

https://docs.confluent.io/kafka-connectors/jdbc/current/sink-connector/overview.html#install-the-jdbc-sink-connector

AWS Lambda sink connector

https://docs.confluent.io/kafka-connectors/aws-lambda/current/overview.html https://www.confluent.io/hub/confluentinc/kafka-connect-aws-lambda?_ga=2.26271741.1937555616.1722783142-1247891401.1693981423&_gl=1*c92a0m*_gcl_au*OTc2MTEyNzMuMTcyMjQwNzAyNw..*_ga*MTI0Nzg5MTQwMS4xNjkzOTgxNDIz*_ga_D2D3EGKSGD*MTcyMjc4MzE0MS43Ni4xLjE3MjI3ODMyODcuMzguMC4w

manually install https://docs.confluent.io/platform/current/connect/userguide.html#connect-installing-plugins

curl -X POST -H "Accept:application/json" -H "Content-Type: application/json" \
--data @/etc/kafka/connect-jdbc-sink.json http://localhost:8083/connectors

或

curl -X POST -H "Accept:application/json" -H "Content-Type: application/json" \
--data @./config/connect-jdbc-sink.json http://localhost:8083/connectors

replica partition 分区数要靠下游的节点数来决定

pk.mode 是 Confluent JDBC Sink Connector 的一个配置选项, 用于指定如何处理 Kafka 记录的键(key)以及如何将其映射到数据库表的主键。如果你希望 Kafka topic 中的数据被自动创建表并写入数据库,你需要指定 pk.mode。
"pk.mode": "record_key",key将被用作数据库表的主键。如果key是一个结构体(Struct),那么它的所有字段都将被用作复合主键

如果你希望生成的表有主键,但 Kafka 记录的键不适合作为主键, 你可以使用 pk.fields 选项来指定一个或多个字段作为主键

Assignment received from leader connect-1-7e2db73f-e396-4b15-8b7e-7267ad091d7a for group my-connect-group for generation

The group has 1 members, 0 of which are static. (kafka.coordinator.group.GroupCoordinator)

curl -X GET http://localhost:8083/connectors 
curl http://localhost:8083/connectors/JdbcSinkConnector/status
curl -X DELETE http://localhost:8083/connectors/JdbcSinkConnector

"topics.regex": ".*"或 "topics": "students"必填一个

delete.enabled=false:这个配置项表示是否允许删除操作。当设置为false时,Sink Connector不会处理Kafka中的删除操作(即,Kafka中的null值记录)。这意味着,如果Kafka中的某个记录的值为null,那么这个记录不会被Sink Connector处理。

"delete.enabled": "true"配置项允许connector处理Kafka中的删除记录(也就是说,当Kafka中的一条记录的值部分为null时,connector会删除数据库中对应的记录)

由于你的配置设置了delete.enabled=false和pk.mode=record_key,所以你需要确保Kafka中的每个记录都有一个非空的结构体(Struct)值和非空的结构体(Struct)模式。换句话说,你不能发送值为null或者没有结构体模式的记录到Kafka中,否则Sink Connector将无法处理这些记录。

自动创建表的功能依赖于Kafka记录的schema。如果Kafka记录没有schema(例如,你正在使用schemaless的数据格式,如JSON),那么Connector可能无法正确地创建表。

converter

https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained/

Common converters include:

Avro io.confluent.connect.avro.AvroConverter

Protobuf io.confluent.connect.protobuf.ProtobufConverter

String org.apache.kafka.connect.storage.StringConverter

JSON org.apache.kafka.connect.json.JsonConverter

JSON Schema io.confluent.connect.json.JsonSchemaConverter

ByteArray org.apache.kafka.connect.converters.ByteArrayConverter

json-schema-serializer-and-deserializer https://docs.confluent.io/platform/current/schema-registry/fundamentals/serdes-develop/serdes-json.html#json-schema-serializer-and-deserializer-for-sr-on-product

mvn 地址 https://mvnrepository.com/artifact/io.confluent/kafka-connect-json-schema-converter

converter https://docs.confluent.io/platform/current/schema-registry/connect.html#json-schema

注册schema

curl -X GET http://localhost:8081/schemas/ids/1 [2024年06月05日 13:49:24,419] INFO 192.168.160.1 - - [05/Jun/2024:13:49:24 +0000] "GET /schemas/ids/1 HTTP/1.1" 404 51 "-" " curl/8.6.0" 25 (io.confluent.rest-utils.requests) [2024年06月05日 13:50:59,557] INFO Registering new schema: subject customized_students-value, version null, id null, type JSON, schema size 288 (io.confluent.kafka.schemaregistry.rest.resources.SubjectVersionsResource)

connect dlq

https://docs.confluent.io/platform/current/connect/index.html#dead-letter-queues "errors.tolerance": "all", "errors.deadletterqueue.topic.name": "dlq-gcs-sink-01", "errors.deadletterqueue.context.headers.enable": true

SMT

Initially, we used an SMT from confluentinc which is not a free plugin so instead, we found a new free SMT that can work

Reference link:

You can download the latest Apache kafka connect transforms jar from the below link: https://mvnrepository.com/artifact/org.apache.kafka/connect-transforms/3.9.0

old SMT: https://www.confluent.io/hub/confluentinc/connect-transforms

configuration of old SMT: https://docs.confluent.io/platform/current/connect/transforms/filter-confluent.html

new SMT(free): https://www.confluent.io/hub/jcustenborder/kafka-connect-transform-common

configuration of new SMT: https://jcustenborder.github.io/kafka-connect-documentation/projects/kafka-connect-transform-common/transformations/PatternFilter.html

Git of new free SMT https://github.com/jcustenborder/kafka-connect-transform-common/blob/master/src/te[...]tenborder/kafka/connect/transform/common/PatternFilterTest.java

config for free SMT

 "transforms": "purchaseFilter",
 "transforms.purchaseFilter.type": "com.github.jcustenborder.kafka.connect.transform.common.PatternFilter$Value",
 "transforms.purchaseFilter.pattern": "^filter$",
 "transforms.purchaseFilter.fields": "name"

config for 2 SMTs

 "transforms": "purchaseFilter,purchaseFilter2",
 "transforms.purchaseFilter.type": "io.confluent.connect.transforms.Filter$Value",
 "transforms.purchaseFilter.filter.condition": "$[?(@.name == 'purchase')]",
 "transforms.purchaseFilter.filter.type": "include",
 "transforms.purchaseFilter.missing.or.null.behavior": "exclude",
 "transforms.purchaseFilter2.type": "io.confluent.connect.transforms.Filter$Value",
 "transforms.purchaseFilter2.filter.condition": "$[?(@.studentId == '1')]",
 "transforms.purchaseFilter2.filter.type": "include",
 "transforms.purchaseFilter2.missing.or.null.behavior": "exclude"

多个SMT会按顺序执行:purchaseFilter,purchaseFilter2

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

gonBorn/kafka-java

Folders and files

Latest commit

History

Repository files navigation

Quick Start (Update on 2024年11月14日)

Reference

Kafka Connect Concept

Kafka Connect JDBC Connector

Other open source connectors

Kafka quick start

JDBC sink config

Required Kafka Connect configurations

Install the JDBC sink connector

AWS Lambda sink connector

converter

注册schema

connect dlq

SMT

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages

Languages

gonBorn/kafka-java

Folders and files

Latest commit

History

Repository files navigation

Quick Start (Update on 2024年11月14日)

Reference

Kafka Connect Concept

Kafka Connect JDBC Connector

Other open source connectors

Kafka quick start

JDBC sink config

Required Kafka Connect configurations

Install the JDBC sink connector

AWS Lambda sink connector

converter

注册schema

connect dlq

SMT

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages