Xin giúp đỡ về việc crawl Amazon bằng Scrapy

Tình hình là mình đang dùng scrapy để crawl sản phẩm áo thun trên Amazon.
Nhưng mỗi khi gửi request đến url này https://www.amazon.com/s/ref=s9_acss_bw_cts_novclo_T1_w?rh=i%3Afashion-novelty%2Cn%3A7141123011%2Cn%3A7147445011%2Cn%3A12035955011%2Cn%3A9103696011%2Cn%3A9056985011%2Cp_6%3AATVPDKIKX0DER&bbn=9103696011&sort=date-desc-rank&ie=UTF8&pf_rd_m=ATVPDKIKX0DER&pf_rd_s=merchandised-search-3&pf_rd_r=NXSN2BTBF7AB7YB7M0S6&pf_rd_t=101&pf_rd_p=e788f135-61de-45f6-84ce-c4c77ded408a&pf_rd_i=7147445011 (dài kinh :sweat_smile:)
thì toàn bị redirect sang url này https://www.amazon.com/Men-Amazon-com-Novelty/s?ie=UTF8&page=1&rh=n%3A9056985011%2Cp_6%3AATVPDKIKX0DER

Mong mọi người giúp mình, xin cảm ơn nhiều!

Khả năng là do user agent, bạn add cái user agent của chrome hay firefox vào thử xem :smile:

Mình đã đổi user agent về của Firefox (vì mình có dùng selenium cùng geckodriver) và đã thành công :blush:. Cảm ơn bạn!

1 Like
83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?