Muốn tạo tool lấy dữ liệu của website nên học ngôn ngữ nào?

Em muốn tạo một cái tool, soft, dạng như tương tác với website:

  1. lấy thông tin, dữ liệu website !!!
  2. tool gửi dữ liệu lên web site !!!
    Nhưng Em Không Phải Dân Lập Trình Nên Chỉ Muốn Học Cái Đơn Giản Nhất Có Thể Thực Hiện Những Công Việc Trên Thôi Ạ !!!

Em nên bắt đầu từ đâu ạ, nên chọn 1 ngôn ngữ học hay là khóa học lập trình tool máy tính nào anh em chỉ với ạ !!!


Nếu học ngôn ngữ lập trình thì nên học ngôn ngữ nào cho phù hợp ạ !!!
Anh em có group nào dành cho newbie cho em tham gia với


Thanks

1 Like

Đầu tiên nếu bạn muốn tìm một groups để học hỏi thì có thể tham gia Discord của DNH: https://discordapp.com/invite/jHwsRAN

Quay lại vấn đề của bạn.
À note trước là bạn không phải dân lập trình nhưng muốn làm được như vậy bạn phải biết lập trình nhé :blush:

  1. lấy thông tin, dữ liệu website !!!

Ngôn ngữ nào cũng được bạn, nhưng muốn dễ và nhanh thì đối với mình có 3 sựa lựa chọn.

  • PHP: Đây là ngôn ngữ chính mình hay dùng. Cấu trúc lỏng lẻo, dễ dùng, dễ hiểu, dễ áp dụng.
  • NodeJS: Dùng Javascript, khá hay, mình không biết nhiều nhưng cũng có vài demo nhỏ với nó.
  • Python: Mình chưa tiếp cận nhưng theo nhiều người nói no dễ hiểu, cú pháp rõ ràng và mạnh mẽ.

Học về các cú pháp, cấu trúc, cách dùng của ngôn ngữ đó. Cách gửi HTTP request. Làm việc với file.

Thuật ngữ hay dùng trong trường hợp này của bạn là: crawl data. Với từng ngôn ngữ bạn có thể tìm với từ khóa kiểu như: crawl data python , crawl data php, crawl data nodejs

Mình xin trích một kết quả mình google được với từ khóa crawl data python

https://medium.com/python-pandemonium/develop-your-first-web-crawler-in-python-scrapy-6b2ee4baf954

Tuy nhiên dữ liệu website show ra cho client là HTML vậy nên bạn cần biết về kiến thức HTML. Mình nghĩ tài kiệu không đâu tốt hơn https://www.w3schools.com/html/default.asp

Sau quá trình chuẩn bị kiến thức bạn cần nắm thêm cách crawl nữa là được. Đối với mình nó đơn giản là như thế này:

  1. Load HTML: Đây là việc bạn tải nội dung trang bạn cần lấy dữ liệu về dứu dạng text (nội dùng HTML)
  1. Chọn một bộ thư viện để đọc HTML: từ khóa php read html dom, python read html dom. Với Nodejs thì dễ hơn thì nó dùng Javscript rồi :smiley:
  2. Tìm nội dung bạn muốn lấy: Lúc này bạn cần có thêm kiến thức về HTML để hiểu được tab class, id là gì để rồi select đúng data mình cần.
  3. Sau khi có data đó rồi thì bạn cứ lưu nó vào 1 file nào đó thôi.

Có thể cách bước trên bạn chưa hoàn toàn hiểu, tuy nhiên sau khi có đủ lượng kiến thức về 1 ngôn ngữ nào đó và HTML thì bạn có thể bắt tay vào làm mà không cần xem 4 bước trên của mình :thumbsup:

2 . tool gửi dữ liệu lên web site !!!

Mình chưa rõ câu này nên chưa trả lời được.

Cuối cùng nếu bạn vẫn không muốn lập trình thì bạn có thể tìm kiếm: website crawler tool nhưng hầu hết là không free.
Chúc bạn thành công :sunny:

2 Likes

Nếu không phải dân lập trình mà cũng không muốn theo ngành lập trình thì nên thuê người ta code luôn cho nhanh, không mất thời gian với công sức của bạn.


Với không nên để tên kiểu “daynhauhoc.com”, dễ gây hiểu lầm cho các Member khác.Nên đổi tên nhé !
Cách đổi tên tài khoản

2 Likes
83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?