Hiện giờ đa số phân tích tiếng Việt nên số lượng bài báo và luận văn nghiên về Knowledge nhiều hơn: ghép trợ từ, tìm từ ghép, từ điển ngữ nghĩa,… Vì vậy nếu xây dựng các ứng dụng rút trích thông tin, hệ thống tư vấn,… hay nếu làm với thầy cô chuyên về NLP sẽ làm bên Knowledge.
Về hướng hiện đại, thì có thầy cô trẻ hay nghiên cứu sinh làm, gần như xây lại từ đầu.
Về giải thuật, mình thấy đa số chỉ dùng đến classification hay SVM là đủ chính xác. Chưa cần thiết phải làm tới RNN. Dự án không nhất thiết phải hiểu toàn bộ văn bản, như làm về phân tích cảm xúc, thì chỉ cần mô hình Ngram, Markov là đủ.