Mình chưa crawl từ Shopee bao giờ (với cũng chưa có thời gian coi kỹ cái hình của bạn), nhưng mình có 1 số kinh nghiệm thế này:
#1. Nếu bạn đang học, thì tìm những trang “thường” thôi, cho dễ crawl. Những site lớn họ thường có thủ thuật này nọ để chống crawl (mình không biết shopee có làm vụ này không). Tất nhiên là vẫn crawl được, nhưng không phù hợp cho việc học.
#2. Mới học thì Beautiful Soup chắc sẽ dễ hơn (tại mình xài thấy dễ)
#3. Luyện cái xpath cho thiệt nhiều. Lúc mình mới tìm hiểu, đa phần không crawl được là do ngu cái xpath này
#4. Hoc thêm Regex sẽ giúp cuộc sống khi hoc crawl của bạn dễ dàng hơn.
#5. Đọc hiểu cách hàm find/search/match, coi nó dùng khi nào, return ra cái gì
#6. Có chút kiến thức về HTML/CSS sẽ rất có ích.
#7. Nên bắt đầu với việc đơn giản là gửi request lên để lấy content HTML về và xử lý trước. Rồi từ từ hãy lên selenium, headless browser…