Xử lý ngôn ngữ tự nhiên (Natural Language Processing -NLP) là một trong những kỹ thuật quan trọng trong thời kỳ kỹ thuật số ngày nay. Nó là một nhánh của Trí tuệ nhân tạo (AI) với sự giao thoa của Khoa học máy tính (Computer Science), Khoa học thống kê (Statistic) và Ngôn ngữ học tính toán (Computational Linguistic). NLP được sử dụng để phát triển các hệ thống có thể hiểu, phân tích và xử lý thông tin tồn tại dưới dạng ngôn ngữ tự nhiên (văn bản, hội thoại, audio,…).

Trong loạt bài này chúng ta sẽ cùng tìm hiểu các kiến thức lý thuyết cơ bản về Xử lý ngôn ngữ tự nhiên cũng như cách viết các chương trình và ứng dụng sử dụng các thư viện có sẵn. Phần thực hành chúng ta sẽ tập chung chủ yếu vào thư viện CoreNLP được phát triển bởi trường Đại học Standford và sử dụng ngôn ngữ lập trình chính là Java.

Tháng Mười 18, 2018
ITechSeeker