Lấy Title và Body của một trang báo trong android

Hi mọi người,
Hiện tại em đang làm một project cần lấy title và body của một trang báo về xử lý.
Em đã tìm hiểu và thử một số solution :

  • Custom WebViewClient
  • HttpClient
  • URLConnection
    Nhưng vẫn chưa lọc được Title và body của một trang báo về sử lý.
    Mong mọi người góp ý cho em xem có solution nào để xử lý việc này không ah?
    Em cảm ơn!

Bạn tìm hiểu về jsoup xen sao :smiley:

1 Like

nếu bạn đã tìm hiểu + URLConnection thì tìm hiểu thêm Regex !

1 Like

Tất cả bạn cần là JSoup…

1 Like

Cám ơn mọi người, em đã load được body và title của trang web về máy:
Em sử dụng jsoup theo base code:

import java.io.IOException;
import java.util.logging.*;
import org.jsoup.*;
import org.jsoup.nodes.*;
import org.jsoup.select.*;

public class JavaApplication14 {

  public static void main(String[] args)  {
    try {
      String url = "https://tanmoy_mahathir.makes.org/thimble/146";
      Document doc = Jsoup.connect(url).get();
      Elements paragraphs = doc.select("p");
      for(Element p : paragraphs)
        System.out.println(p.text());
    } 
    catch (IOException ex) {
      Logger.getLogger(JavaApplication14.class.getName())
            .log(Level.SEVERE, null, ex);
    }
  }
}
1 Like

Mình hỏi chút. Nếu trang báo đó sau khi đã load page xong mới dùng javascript để render dữ liệu thì có vẻ dùng jsoup trong trường hợp này vẫn không hiệu quả. Hoặc không lấy được content mình cần.

83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?