Em chào các anh chị.
Hiện tại em đang làm trong một dự án và gặp vấn về với việc xóa dữ liệu cũ.
Em đang có 1 collection trong mongodb có các trường chính sau:
id, a, b ,c ,d , bet_date ( các trường a, b, c, d có kiểu dữ liệu là số thực, id có kiểu dữ liệu số nguyên, bet_date có kiểu dữ liệu date time )
Collections này đã được đánh index theo id và bet_date.
id là id của user, có tầm 30.000 id trong collection này ( Tức trung bình mỗi id có tầm 37000 bản ghi )
Hiện tại collection này đang có số bản ghi rất rất lớn: tầm 1.100.000.000 ( Hơn 1 tỉ bản ghi )
Em đang muốn xóa những dữ liệu lâu hơn 30 ngày ( do đó em cần xóa tầm 700 triệu bản ghi )
Em đã thử cách sau:
Em tìm theo từng id, sau đó xóa những bản ghi dưới 30 của id đó. Nhưng em đã thử chạy xóa cho 1 id thì nó mất tận từ 2-4 phút 1 lần xóa cho 1 con. Như vậy tốc độ xóa như thể không thể kịp thời với tốc độ ghi thêm vào dữ liệu.
Có anh chị nào có kinh nghiệm trong việc xóa một lượng dữ liệu lớn thế này không ạ ?
Em cảm ơn.