Em đã đọc vài tài liệu nói về cái này nhưng em không hiểu cho lắm nên em nhờ mọi người giải thích giúp em ý nghĩa của \b và \B trong regular Expression, mọi người có thể cho em vài ví dụ minh họa.
Ý nghĩa của \b và \B trong regular Expression trong C# là gì
\b \B là tìm ký tư liền nhau trong chữ (word), \b \B đứng ở đâu thì xem đó là giới hạn tìm kiếm trong chữ
Cho danh sách các từ, cụm từ:
incat
cat25
cat
tomcat
catfish
xcatx
a black cat
Ví dụ \b :
\bcat matched
cat25
cat
catfish
a black cat
cat\b matched
in cat
cat
tom cat
a black cat
\bcat\b matched
cat
a black cat
Ngược lại với \b là \B, nó sẽ tìm ở vị trí ngược lại với vị trí đặt giới hạn
\Bcat matched (đặt đầu nhưng tìm từ cuối lên)
in cat
tom cat
x cat x
a black cat
\Bcat\B matched (tìm trong lòng của chữ)
x cat x
p/s : vào http://regexr.com/ để test cho tiện.
Chuỗi: AHHA HAHAHAAA HAH
#A\b
=> AHHA
HAHAHAAA
HAH
#A\B
=> A
HHA HA
HA
HAA
A HA
H
Cứ một chuỗi các ký tự liền nhau nôm na gọi là một cụm (cách nhau bởi khoảng trắng…etc). => chuỗi trên có 3 cụm.
A\b: lấy trên boundary => những ký tự A nằm cuối mỗi cụm.
A\B: lấy trong cụm, trừ boundary => lấy những ký tự A từ đầu cho đến áp chót của mỗi cụm.
Cảm ơn mọi người rất nhiều em đã hiểu