Chào anh chị và các bạn,
Hiện tại mình có một đề bài như thế này, vì mình chưa tìm hiểu kĩ về mạng, nên mình muốn hỏi ý kiến mọi người xem bài này cần những kiến thức gì? ( về mạng server, sử dụng CSDL nào phù hợp (SQL, NoSQl, …), C#, oop, …) và mọi người có thể trả lời các câu hỏi cuối bài được không ạ?
Cách của mình hiện tại là viết một hệ thống bằng C# or C++ sau đó mình sẽ lưu nhưng trữ dữ liệu về về database rồi mới dùng chương trình để xử lí.
Thanks
Bài :
Thiết kế một hệ thống để thu thập dữ liệu và sao chép tất cả Wikipedia bằng một mạng máy phân tán.
Cụ thể hơn, giả sử máy chủ của bạn có quyền truy cập vào một bộ máy khách. Máy khách của bạn có thể thực thi mã bạn đã viết để truy cập các trang Wikipedia, tải xuống và phân tích dữ liệu của họ và ghi kết quả vào cơ sở dữ liệu.
Một số câu hỏi bạn có thể muốn xem xét như một phần của giải pháp của mình là:
Làm thế nào bạn sẽ đạt được càng nhiều trang càng tốt?
Làm thế nào bạn có thể theo dõi các trang đã được truy cập?
Làm thế nào bạn sẽ đối phó với các máy khách của bạn bị đưa vào danh sách đen?
Làm thế nào bạn có thể cập nhật cơ sở dữ liệu của mình khi các trang Wikipedia được thêm hoặc cập nhật?
83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?