Làm thế nào để transcript lấy từ Google Dịch được định dạng lại?

Mình có câu hỏi thế này nhưng không biết xếp nó vào mục nào: Vì trình đọc hiểu tiếng anh của mình hạn chế nên thông thường lấy transcript sau đó dùng google dịch coi như để tham khảo về mặt ngữ nghĩa, nhưng thực thế đôi khi, file transcpit nó được định dạng không chuẩn, kiểu như là một câu nhưng nó tách ra nhiều dòng, như vậy dịch sẽ không còn chuẩn nữa, mình thường phải làm bằng tay việc cho các từ gần nhau và xuống dòng một cách tự nhiên.

Vậy cho hỏi, không biết mọi người có cách nào khắc phục điều đó không.

Đây là một ví dụ:

Cám ơn mọi người.

Join tất cả lại rồi sài sentence boundary detection thôi

4 Likes

mình chưa hiểu câu trả lời, bạn có thể giải thích thêm cho mình được không :slight_smile:

Join tất cả sub thành 1 đoạn văn rồi tách từng câu ra rồi cho vào google mà dịch
key: sentence boundary detection
p/s: à mà bạn tập đọc tiếng anh cho quen đi chứ cứ google dịch quen thói là sau này khó nâng cao trình độ lắm.

6 Likes

Tiếng Anh của mình cũng khá là tệ, nhưng khi đọc tài liệu mình cũng sẽ không sử dụng Google dịch mà vẫn cứ đọc thôi, từ nào không biết thì tra từ điển, chứ gg dịch thì nó không đủ nghĩa. :slight_smile:

4 Likes

Cám ơn bạn. Mình đang thử. Trong có vẽ khá nhiều bước, vì đây chỉ là giải pháp tình thế nên mình mong muốn càng đơn giản càng tốt.

Mình đang thử theo cái này: https://github.com/fnl/syntok

Mình đã từng thử cách đó, nhưng để hiểu được cả câu, thì việc tra từ điển như vậy mất thời gian đôi khi lại không hiệu quả. Vì một từng đừng một mình nó cũng thường khác khi nó đi kèm với từ khác, đại loại vậy. :slight_smile:

Mới đầu chắc chắn là sẽ lâu hơn khi bạn sử dụng cách này.

Nhưng về sau, quen dần, ví dụ bạn gặp phải một từ có nhiều nghĩa, bạn vẫn có thể biết được ngay nên chọn nghĩa nào là hợp lý.

Mà dịch được hết từ rồi vẫn chưa hiểu được nghĩa cả câu thì có khi bạn phải xem lại Tiếng Anh của mình. (Trừ một vài câu kiểu như thành ngữ. :slight_smile:)

4 Likes

Thế chắc do bạn ko biết code rồi, chứ thư viện có sẵn rồi, code cộng trừ chuỗi tí la ra thôi mà @@

5 Likes

Ok cám ơn bạn, chỉ là việc mình thấy nó không hiệu quả và phù hợp với mình thôi. Mình dùng cách của mình thấy vẫn ổn.

1 Like

mình không biết thật mà.

Vậy đơn giản nhất là xóa hết ký tự '\n' trong chuỗi là ok. :slight_smile:

4 Likes

Ok ban đầu thì mình nghĩ là có phim tắt gì đấy, nên mong muốn tìm ra nó. Nhưng cuối cùng thì lại phải dùng đến code, thật sự mình không muốn dùng code ấy mà.

Muốn đơn giản nhất thì tập dịch cho quen đi thôi :slight_smile:, dịch thời gian đầu nó phải tra nhiều chứ về sau tích đủ từ vựng rồi thì sẽ nhàn ngay ấy mà.

7 Likes

Cám ơn 2 bạn rất nhiều :). Mình hiểu rồi.

1 Like
83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?