Crawl dữ liệu từ web

mottramdong · May 12, 2019, 11:54am

Chào các bạn!
Mình có làm một vài tool về crawl dữ liệu từ một số trang web và thường phải đối mặt với vấn đề bị block ip khi thực hiện request liên tục và nhiều. Cho mình hỏi có mẹo hay tip nào có thể giảm thiểu tối đa khả năng bị rơi vào vấn đề trên không các bạn nhỉ?

noz1995 · May 12, 2019, 1:23pm

1 phút cào 1 lần chứ cào nhiều chi mà để block

hainguyen31794 · May 12, 2019, 1:47pm

Dùng proxy. download tha hồ