Đầu tiên nếu bạn muốn tìm một groups để học hỏi thì có thể tham gia Discord của DNH: https://discordapp.com/invite/jHwsRAN
Quay lại vấn đề của bạn.
À note trước là bạn không phải dân lập trình nhưng muốn làm được như vậy bạn phải biết lập trình nhé
- lấy thông tin, dữ liệu website !!!
Ngôn ngữ nào cũng được bạn, nhưng muốn dễ và nhanh thì đối với mình có 3 sựa lựa chọn.
-
PHP
: Đây là ngôn ngữ chính mình hay dùng. Cấu trúc lỏng lẻo, dễ dùng, dễ hiểu, dễ áp dụng.
-
NodeJS
: Dùng Javascript, khá hay, mình không biết nhiều nhưng cũng có vài demo nhỏ với nó.
-
Python
: Mình chưa tiếp cận nhưng theo nhiều người nói no dễ hiểu, cú pháp rõ ràng và mạnh mẽ.
Học về các cú pháp, cấu trúc, cách dùng của ngôn ngữ đó. Cách gửi HTTP request. Làm việc với file.
Thuật ngữ hay dùng trong trường hợp này của bạn là: crawl data
. Với từng ngôn ngữ bạn có thể tìm với từ khóa kiểu như: crawl data python
, crawl data php
, crawl data nodejs
Mình xin trích một kết quả mình google được với từ khóa crawl data python
https://medium.com/python-pandemonium/develop-your-first-web-crawler-in-python-scrapy-6b2ee4baf954
Tuy nhiên dữ liệu website show ra cho client là HTML vậy nên bạn cần biết về kiến thức HTML. Mình nghĩ tài kiệu không đâu tốt hơn https://www.w3schools.com/html/default.asp
Sau quá trình chuẩn bị kiến thức bạn cần nắm thêm cách crawl
nữa là được. Đối với mình nó đơn giản là như thế này:
- Load HTML: Đây là việc bạn tải nội dung trang bạn cần lấy dữ liệu về dứu dạng text (nội dùng HTML)
- Chọn một bộ thư viện để đọc HTML: từ khóa
php read html dom
, python read html dom
. Với Nodejs thì dễ hơn thì nó dùng Javscript rồi
- Tìm nội dung bạn muốn lấy: Lúc này bạn cần có thêm kiến thức về HTML để hiểu được
tab
class
, id
là gì để rồi select đúng data mình cần.
- Sau khi có data đó rồi thì bạn cứ lưu nó vào 1 file nào đó thôi.
Có thể cách bước trên bạn chưa hoàn toàn hiểu, tuy nhiên sau khi có đủ lượng kiến thức về 1 ngôn ngữ nào đó và HTML thì bạn có thể bắt tay vào làm mà không cần xem 4 bước trên của mình
2 . tool gửi dữ liệu lên web site !!!
Mình chưa rõ câu này nên chưa trả lời được.
Cuối cùng nếu bạn vẫn không muốn lập trình thì bạn có thể tìm kiếm: website crawler tool
nhưng hầu hết là không free.
Chúc bạn thành công