Tách file txt cho trước thành các file riêng rẽ

Gỉa sử có 1 file txt dạng song ngữ Trung Việt, gồm các đoạn văn song ngữ (đã dịch của nhau). Cứ mỗi đoạn tiếng Trung bên trên là 1 đoạn tiếng Việt bên dưới (đã được dịch) liên tiếp nhau như vậy.

Ở dưới là 1 file giả sử có 2 đoạn (mỗi đoạn có thể có nhiều hơn 1 câu) như mô tả ở trên, như sau:

中国农历的五月五日是一个重要的节日,叫做端午节。它是一个古老的传统节日,有两千多年的历史。
Mùng năm tháng năm âm lịch là lễ hội quan trọng của Trung Quốc, gọi là tết Đoan Ngọ. Đây là một
lễ hội truyền thống cổ xưa, có hơn hai ngàn năm lịch sử.
关于端午节的起源有很多说法,其中,最有影响力的一种说法是:
Có rất nhiều cách lý giải liên quan đến nguồn gốc của tết Đoan Ngọ, trong đó, cách lý
giải có ảnh hưởng nhất là:

Yêu cầu đặt ra là: Tách file trên thành 2 file, 1 file (gọi là file 1) chỉ chứa nội dung là tiếng Trung, File 2 chỉ chứa nội dung là tiếng Việt. Đương nhiên là thứ tự các đoạn trên 2 file thành phần phải giống như thứ tự xuất hiện của nó trong file ban đầu.
Cụ thể, 2 file thành phần như sau:

File 1:
中国农历的五月五日是一个重要的节日,叫做端午节。它是一个古老的传统节日,有两千多年的历史。
关于端午节的起源有很多说法,其中,最有影响力的一种说法是:
File 2:
Mùng năm tháng năm âm lịch là lễ hội quan trọng của Trung Quốc, gọi là tết Đoan Ngọ. Đây là một
lễ hội truyền thống cổ xưa, có hơn hai ngàn năm lịch sử.
Có rất nhiều cách lý giải liên quan đến nguồn gốc của tết Đoan Ngọ, trong đó, cách lý
giải có ảnh hưởng nhất là:

Mình up lên để CẢ NHÀ CÙNG THẢO LUẬN CÁCH LÀM NHÉ. Thanks các bạn ^^!!!

trước hết phải biết bảng mã chữa tiếng trung và tiếng việt.
Dựa vào bảng mã đó để so sánh, tách 2 làm 2 file txt.

1 Like

Việc này cần dùng thủ thuật thôi… Đây mình dùng vừa Notepad++ vừa Excel.
1/ Trước tiên mình copy đoạn text muốn chuyển vào Excel Cột 2. Nó sẽ có các dòng giống nhau.
花開的時候最珍貴花落了就枯萎
huā kāi de shí hou zuì zhēn guì huā luò le jiù kū wěi
Hoa nở chờ đến đêm lại tàn héo rụng rơi xuống
錯過了花期花怪誰花需要人安慰
cuò guò le huā qī huā guài shuí huā xū yào rén ān wèi
Đã quá kỳ hoa nở có thể trách ai hoa cần người an ủi
一 生 要 哭 多 少 回 才 能 不 流 淚
yì shēng yào kū duō shǎo huí cái néng bù liú lèi
Một đời phải khóc bao nhiêu khi quay về mới không lưu lại nước mắt

2/ Sau đó Cột 1 mình gõ ô A1=1, A2=2, A3=3. Rồi chọn cả 3 Ô, click giữ dấu + ở góc phải bên dưới rồi kéo xuống bằng với số dòng của đoạn text copy lúc nãy. - Chú ý ko đổi giá trị khi trượt nhé, vẫn 1 2 3.
3/ Copy tất cả vào Notepad++, Thay thế với Option Search Mode là “Extended”. Từ cần thay là:
2-> \t2
3-> \t\t3

4/ Copy Tất cả vào Excel lại. Ta đã được 3 cột với 3 kiểu ngôn ngữ khác nhau.

CHÚC BẠN THÀNH CÔNG!!!

83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?