Phát hiện iframe trên webpage có là quảng cáo hay không?

Chào anh chị,
Em đang tìm hiều cách phát hiện quảng cáo dựa vào bộ lọc của adblockplus
hiện tại em đã kéo được tất cả các iframe trên webpage dựa vào “phantomjs” về được rùi, việc bây giờ là dựa vào adblockplus filter để đưa ra được iframe là quảng cáo.
Hiện tại em đang mắc chỗ này, chưa biết dùng api của adblock filter hoặc có cách nào hay hơn để chỉ ra iframe là quảng cáo hay không ?
Mong ac và các bạn đã từng làm với phantomjs hoặc thao tác với api của adblockplus gợi ý giúp em, em cám ơn nhiều ạ?

Adblock có cho xem mã nguồn tại http://code.getadblock.com/ với giấy phép GPLv3.

2 Likes

Minh cung dang tim hieu ve quang cao doc hai, ban co the cho minh xin code de keo cac iframe ve khong?

Cam on nhieu!

https://gist.github.com/antivanov/3848638 link này mình search được trên mạng bạn nhé, còn code mình chưa thể gửi bạn được, vì rất nhiều lỗi…mình sẽ gửi bạn sau nhé.

Cảm ơn bạn nhé! Nhưng mình thấy code này chỉ kéo các URL chứ chưa kéo đuợc các links quảng cáo như các thẻ , ,

Bạn cho mình hỏi là: với mỗi thẻ như a, iframe, img,… có các thuộc tính tương ứng như href, src, src. Nếu mình muốn lấy thông tin về URL của từng thằng này rồi in ra màn hình theo thứ tự tương ứng thì viết code như thế nào nhỉ?

Dùng javascript
var muctieu=document.getElementsByTagName("a");
console.log(muctieu.length);
for(var i=0;i<muctieu.length;i++){
	console.log(muctieu[i].href);
}

Cảm ơn bạn nhé! Bạn cho mình hỏi thêm, làm cách nào để phân biệt iframe/URL links nào là quảng cáo, iframe không là quảng cáo? có thể cho mình xin code minh họa không?\

Cảm ơn bạn nhé! Bạn cho mình hỏi thêm, làm cách nào để phân biệt iframe/URL links nào là quảng cáo, iframe không là quảng cáo? có thể cho mình xin code minh họa không?

Link quảng cáo thì nó cũng là link, khó mà phân biệt được. Nhà quảng cáo mà tốt tính thì các parameter sẽ có thêm ad_ đằng trước, còn lại chỉ có thể dựa trên các bộ lọc thôi, ví dụ EasyList.

Mình muốn lưu các URL sau khi lọc được vào một file định dạng .xml (sau này để phân tích) chứ không phải xuất ra màn hình thì làm thế nào nhỉ?

Cách tạo 1 file XML thì có thể dùng javascript để tạo.
Bạn xem link
http://www.w3schools.com/xml/dom_nodes_create.asp

Chào bạn, bạn đã có code sử dụng adblockplus filter để lấy ra được iframe là quảng cáo chưa? cho mình xin để nghiên cứu với.

Bạn nào có code javascript (phantomJS) kiểm tra nội dung lấy về từ trang web xem có khớp với nội dung ở trong một file (dạng .txt) không? thì cho mình xin với.
Cảm ơn nhiều!

83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?