Trong loạt tutorials này, chúng ta sẽ cùng tìm hiểu cách viết các chương trình sử dụng Spark để phân tích và xử lý dữ liệu lớn. Spark hỗ trợ nhiều ngôn ngữ lập trình khác nhau như  Scala, Java, Python, R nhưng Spark được phát triển chính thức bằng ngôn ngữ Scala. Vì vậy chúng ta sẽ sử dụng Scala là ngôn ngữ lập trình chính để viết các chương trình Spark.

Về cơ bản thì Scala được phát triển dựa trên Java nên nếu các bạn đã lập trình Java thì sẽ tương đối dễ dàng để tiếp cận Scala. Các bạn có thể tham khảo thêm các bài tutorials về Scala tại trang tutorialspoint.com. Ở đây, chúng ta sẽ chủ yếu tập trung vào việc sử dụng Scala để viết các ứng dụng mà không đi sâu vào giải thích chi tiết về ngôn ngữ Scala. Ngoài ra, chúng ta cũng sẽ sử dụng IDE (Integrated Development Environment: Môi trường phát triển tích hợp) chính là IntelliJ IDEA.

Bên cạnh việc theo sát các bài tutorials, các bạn có thể thao khảo code của các bài tutorials này trên trang Github chính thức của ITechSeeker tại đây)

Tháng Mười Một 8, 2018
ITechSeeker