Grabber 1 mục từ 1 trang web

Chào anh chị, Em định làm 1 ứng dụng xem video. Em đang mắc ở module phía server. Bây giờ em muốn lấy các video của 1 trang web khác add vào csdl trên server của em 1 cách tự động ( không phải copy từng đường link paste vào) ? Em có tìm hiểu 1 thì có 1 thuật ngữ là Grabber . Nhưng em k tìm được tài liệu cũng như cách sử dụng của nó! Mong nhận được sự giúp đỡ của mọi người.
Em xin chân thành cảm ơn!

có nhiều cách để bóc tách dữ liệu , đơn giản là bạn dùng regex

1 Like

bạn google từ khóa web crawler xem thử
Link tham khảo tài liệu tài về máy tìm kiếm

Chắc bạn build một trang giống trang này
http://www.how.vn/

2 Likes

đúng rồi. em định làm 1 app quản lý video nhiều nguồn như thế. như chỉ cần csdl thôi. k cần giao diện web vì chỉ để kết nối từ android lên!

1 Like

anh có project example k ạ?

cái này phải build một web crawler để nó tự động thêm vào csdl

Project được viết bằng Java, dùng thư viện Lucence để lập chỉ mục

Link tham khảo khóa học search engine từ trang www.udacity.com
https://www.udacity.com/course/viewer#!/c-cs101/l-48299949/m-48698544

Link từ quora.com
https://www.quora.com/How-can-I-build-a-web-crawler-from-scratch

1 Like
83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?