Chia sẻ tài liệu “Crawl Data with Scrapy”
Chào các bạn,
Chúng tôi gồm các thành viên đến từ nhóm EGG Club và một số bạn đang làm việc ở công ty Onfta. Chúng tôi đã cùng làm việc và tổng hợp tài liệu chia sẻ kinh nghiệm “Crawl dữ liệu với Scrapy”.
Tài liệu gồm các phần chính sau:
- Kiến trúc Scrapy.
- Tutorial, tạo crawler đơn giản với Scrapy.
- Các vấn đề cần giải quyết khi crawler.
- Cách giải quyết các vấn đề.
- Chia sẻ các use case thực tế và cách giải quyết
Có nhiều đoạn viết dạng cookbook: Problem + Solution.
Đây là tài liệu tổng hợp, chúng tôi sử dụng cả tiếng Anh và tiếng Việt. Tài liệu đang là dạng nháp (draft), rất cần những đóng góp (contribute) của các bạn để tài liệu hoàn thiện hơn.
Tài liệu được phát hành dưới giấy phép “Creative Commons Share-alike 4.0”. Các thành viên contribute sẽ được ghi tên vào mục Contributors.
Chúng tôi hi vọng tài liệu này có ích cho các bạn và mong muốn các bạn contribute để tài liệu ngày càng hoàn thiện hơn.
Cảm ơn.
Tài liệu: http://bit.ly/egg-crawl-data-with-scrapy
Contributors:
Cuong Tran, Nguyễn Quang Dương, Khai Nguyen Dinh, Nguyễn Bá Cường, Huan Phan
EGG Club - CLB Sáng tạo Công nghệ
Nơi ươm mầm các tài năng lập trình
Website: http://eggclub.org/
Fanpage: http://facebook.com/eggclub.org/