WebScraping sử dụng RSS

Trong các bài tutorial trước, chúng ta đã viết chương trình sử dụng Jsoup, Boilerpipe, Selenium và Apache Tika để tìm kiếm và trích xuất các thông tin cần thiết. Trong bài tutorial này, chúng ta sẽ viết chương trình

Tìm kiếm trên Google với Jsoup

Trong bài tutorial Viết chương trình sử dụng Jsoup, chúng ta đã làm quen với các hàm chức năng của Jsoup và viết một chương trình để truy xuất dữ liệu, tổng hợp các đường link và các file ảnh

Viết chương trình sử dụng Jsoup

Bên cạnh Selenium thì Jsoup cũng là một thư viện tương đối phổ biến được sử dụng trong Web Scraping. Ưu điểm lớn nhất của việc sử dụng Jsoup so với Selenium là Jsoup có tốc độ nhanh hơn (do