Cần giúp đỡ regular expression python

Em đang bắt đầu làm quen với python được 1 tháng, và thấy thú vị về lĩnh vực scraping web, muốn xây dựng 1 doạn code để lấy thông tin từ trang cá nhân của một mạng xã hội.
muốn get cái ngày sinh mà mãi k find được:

regex  = '''<dl class="pinfo_row _pinfo"><dt>День рождения:</dt><dd><a href="/search?c[section]=people&c[bday]=8&c[bmonth]=5">8 мая</a> <a href="/search?c[section]=people&c[byear]=1996">1996 г.</a></dd></dl>'''

reg2 = '''<dl class="pinfo_row _pinfo"><dt>День рождения:<\/dt><dd><a href="\/search\?c\\[section\\]=people\&c\\[bday\\]=\d\&c\\[bmont\\]=\d">[^.]*<\/a> <a href="\/search\?c\\[section\\]=people\&c\\[byear\\]=\d{1,}">(/+?) г\.<\/a><\/dd><\/dl>'''indent preformatted text by 4 spaces

bạn lấy thông tin từ web nào vậy?

Mình không rành về cái này lắm. Nhưng có cái web này rất hay, có thể test trực tiếp reg của bạn. Bạn thử xem có giúp gì được không.
https://regex101.com/

là bạn muốn lấy số “8” trong “[bday]=8” à?

Không bạn ạ, cái [bday]=8 trong href là để nó search những người sinh ngày 8 tháng năm, hoặc, năm 1996
mình muốn lấy cái 8 Мая và 1996.

Trang vk.com bạn ạ

"\/search.*">(.*?)<\/a>.* <a href="\/search.*">(\d*).*<

1 Like

Sao bạn không dùng html parser :sweat_smile: vừa dễ viêt vừa dễ đọc :smile:

import requests
from bs4 import BeautifulSoup

r = requests.get('http://vk.com/id364557226')

soup = BeautifulSoup(r.text, 'html.parser')
for i in soup.select_one('.profile_info').children:
    if 'Birthday:' in i.text:
        print i.select_one('dd').text
4 Likes
83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?