Huấn luyện Seq2seq sử dụng Data Pipeline

Trong bài tutorial Tóm tắt văn bản sử dụng mô hình Seq2seq, chúng ta đã áp dụng mô hình Seq2seq vào bài toán thực tế là Tóm tắt và tạo tiêu đề cho bài viết. Trong bài tutorial này, chúng

Sử dụng Datasets thay thế cho feed_dict

Trong bài tutorial trước (Xây dựng mô hình Deep learning với Mid-level APIs), chúng ta đã làm quen với việc sử dụng feed_dict nhằm truy xuất dữ liệu để huấn luyện mô hình. Tuy nhiên, nhược điểm lớn nhất của

Chương trình WordCount

Trong bài này chúng ta sẽ viết một chương trình WordCount để đếm số lần xuất hiện của từng từ trong một đoạn dữ liệu được chuyển về từ Data server. Chúng ta sẽ sử dụng Netcat để mô phỏng

Spark SQL, Dataset và DataFrames

Trong loạt tutorials này, chúng ta sẽ làm quen với việc sử dụng Spark SQL, Dataset và DataFrames. SparkSQL chính là một trong năm thành phần chính của Spark được phát triển cho việc sử lý dữ liệu có cấu