Chào các cậu. Mình mới học lập trình và đi làm được khoảng vài tháng.
Mình có đi phỏng vấn và họ có gửi một câu để kiểm tra tư duy như sau:
ABC là công ty sale B2B. Bên bộ phận sale của cty ABC đang có sẵn database 1.000.000 bản ghi, mỗi bản ghi gồm có tên cty và domain của công ty đó (.com và .vn).
Công ty ABC thuê một bên khác thu nhập dữ liệu và họ cung cấp cho ABC tầm 5.000.000 bản ghi được lưu trong 20 file cỡ ~ 450MB (Đúng theo chuẩn format trong database hiện có của ABC).
Bài toán đặt ra cho ABC là làm sao để có thể duyệt 20 files kia để so sánh với các dữ liệu hiện có của mình trong database với thời gian nhanh nhất có thể.
Kết quả cuối cùng là lọc ra được những cty nào mới, cty nào đã có. Những cái mới thì sẽ insert vào một bảng khác.
Hiện tại thì mình đang hơi bí hướng giải quyết cho bài toán này. Xin được mọi người chỉ giáo.