Xử lý dữ liệu trong thời gian thực (Speed Layer)

Tại Speed Layer, chúng ta sẽ sử dụng Spark Structured Streaming để đọc và xử lý dữ liệu từ topic “TwitterStreaming” của Kafka trong thời gian thực. Công việc này được thực hiện qua ba bước sau: – Kết nối

Kết nối Spark với Cassandra

Trong bài tutorial này, chúng ta sẽ thực hành viết chương trình sử dụng Spark Cassandra Connector để kết nối Spark với Cassandra. Trước hết các bạn thêm dependencies sau vào file pom.xml:

Spark Cassandra Connector cho phép người