Google sử dụng các mạng Nơ-ron (neural networks) để dịch mà không cần phiên âm

Máy dịch (machine translation) của Google có thể giúp mọi người giao tiếp với các ngôn ngữ khác dễ dàng hơn, bằng cách phiên ân trực tiếp sang dạng văn bản của ngôn ngữ mà họ có thể hiểu được.

(Nguồn: Floresco Images/Getty)

Máy dịch thực hiện bằng cách chuyển giọng nói sang dạng văn bản, sau đó dịch văn bản này sang ngôn ngữ khác. Nhưng bất cứ lỗi nào trong phần nhận dạng giọng nói sẽ đưa đến lỗi phiên âm và sẽ dẫn đến dịch sai.

Các nhà nghiên cứu tại Google Brain đã sử dụng mạng nơ-ron để bỏ qua bước trung gian này. Vì bỏ qua phần phiên âm nên cho phép việc dịch chính xác và nhanh hơn.

Nhóm nghiên cứu đã huấn luyện hệ thống hàng ngàn giờ tiếng Tây Ban Nha tương ứng với văn bản tiếng Anh. Trong mỗi trường hợp, hệ thống sử dụng nhiều lớp của mạng nơ-ron – hệ thống máy tính mô phỏng bộ não người – để đối chiếu các phần tiếng Tây Ban Nha với ngôn ngữ viết. Để làm được việc này, hệ thống phân tích sóng âm của tiếng Tây Ban Nha để học, từng phần tương ứng với chữ viết tiếng Anh. Khi hệ thống được yêu cầu dịch, mỗi lớp nơ-ron sử dụng kiến thức đã học được để mô phòng lại sóng âm cho đến khi chuyển thành chữ viết tiếng Anh tương ứng.

Các ngôn ngữ hiếm

Hệ thống cũng có thể sử dụng để dịch các ngôn ngữ viết hiếm, vì hệ thống không yêu cầu bản viết của ngôn ngữ gốc để dịch.

Cho đến được thử nghiệm trên dữ liệu lớn xong, thật khó có thể nói trước cách sử dụng mạng nơ-ron có thể so sánh với các hệ thống dịch thông thường, theo Sharon Goldwater (Đại học Edinburgh, Vương quốc Anh). Nhưng theo bà nghĩ, nó có thể là tiêu chuẩn mới cho máy dịch trong tương lai.

Nhiều dịch vụ hiện tại sử dụng máy dịch để giúp mọi người nói chuyện với nhau trong thời gian thực. Skype đã giới thiệu hệ thống dịch trực tiếp speech-to-text năm 2014 và hiện tại đã hỗ trợ 9 ngôn ngữ, bao gồm cả tiếng Quan thoại và tiếng Ả Rập cũng như các ngôn ngữ Châu Âu phổ biến khác. Nhưng cũng như những cách dịch khác, Skype phiên âm giọng nói thành văn bản trước khi dịch thành những ngôn ngữ khác.

Dịch vụ dịch của Google Translate đã sử dụng mạng nơ-ron trong hầu hết các ngôn ngữ phổ biến, nó phân tích toàn bộ câu nói một lần để tìm ra kết quả dịch tốt nhất. Hệ thống này sử dụng một “interlingua” (một cách diễn tả chung của câu, có cùng ý nghĩa trong các ngôn ngữ khác nhau) để dịch từ ngôn ngữ này qua ngôn ngữ khác, có nghĩa rằng hệ thống có thể dịch giữa 1 cặp ngôn ngữ mà nó không cần phải học trước. Các nhà nghiên cứu tại Google Brain gợi ý một cách tiếp cận speech-to-text mới có khă năng xây dựng một hệ thống để dịch đa ngôn ngữ.

Trần Ngân (dịch từ NewScientist)

Có thể bạn quan tâm
Để lại một trả lời

Địa chỉ email của bạn sẽ không được công bố.

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More