Chào mọi người, em có một bài toán thế này, giả sử có một cơ sở dữ liệu mới và một cơ sở dữ liệu cũ, cơ sở dữ liệu cũ bao gồm tất cả dữ liệu từ trước tới nay, ví dụ từ 2015-2020; và cơ sở dữ liệu mới chỉ có dữ liệu từ 2018-2020, bài toán đặt ra là làm thế nào để import từ CSDL cũ vào CSDL mới này một cách nhanh nhất.
Em làm thế này:
INSERT INTO TAB_INIT (
SELECT * FROM TAB_FINAL
WHERE COL_1 NOT IN (SELECT COL_1 FROM TAB_INIT))
Em có trình bày cách này với anh leader, anh ấy chỉ bảo là về suy nghĩ thêm.
Em có tạo thử 2 tab trên db2 trên cloud và test thử tốc độ thế nào, tab_1 gồm 1 triệu rows và 23 col, tab_2 gồm 1 tr 50k row và 23 col. Kết quả là nó chạy mất 10 giây
Em không biết thực tế người ta làm thế nào, muốn tham khảo ý kiến của các anh, em xin cảm ơn ạ.