Làm thế nào để máy tính người dùng request một trang web thì proxy đọc trước trang web đó quét xem có chứa từ khóa bị cấm không nếu không có thì trả kết quả về cho người dùng. Em cảm ơn!
Ý tưởng của em là proxy sẽ download trang HTML đó về (giống như control S trên browser) sau đó dùng regex để kiểm tra các file HTML. Rồi dùng chính bản sao này làm cache luôn. Nhưng vấn đề là không biết được web thật đã cập nhật hay chưa để xóa cache. Nó chỉ có tác dụng với những trang public mà có thể crawl được. Còn những page phía sau form login (facebook) thì không check được hoặc trang public mà frontend theo kiểu SSR (reactjs)
_________ _______ ________
| | | | | |
| Your PC | ----- | Proxy | ----- | Server |
|_________| |_______| |________|