/Cỏn con một sợi lông mày. Mà đem cột trái đất này vào anh/ Thơ Trần Mạnh Hảo

VIDEO

HỖ TRỢ

QUẢNG CÁO

LỊCH

LIÊN KẾT

THƠ VĂN BẠN BÈ

MÁY DỊCH THƠ: THỰC TIỄN VÀ HẠN CHẾ

Nó có thể tạo ra một “bài thơ giả” của bản gốc: một bài thơ giả không có bất kì một tội lỗi nào, miễn là nó gần với bài thơ gốc nhất nếu có thể và có tác động tình cảm tương tự đối với người đọc.

MÁY DỊCH THƠ: THỰC TIỄN VÀ HẠN CHẾ

.
       Bài viết của dịch giả người Mĩ - Vasylbabiy, chuyên chuyển ngữ tác phẩm văn học từ tiếng Anh sang tiếng Nga. “Bài thơ là một chiếc máy nhỏ (hoặc lớn) được tạo bởi các từ ngữ.”─ William Carlos Williams. Đối với người dịch thì dịch thơ quả là một công việc khó khăn. Vì người dịch đã gặp khó khăn thì máy móc càng không có khả năng làm việc đó.

       Máy dịch thơ làm công việc được coi là khó khăn nhất không chỉ trong ngôn ngữ máy tính mà còn trong lĩnh vực trí tuệ nhân tạo nói chung. Người ta thường tin rằng, máy tính mà dịch thơ là một cách làm thơ rất tồi tệ. Nhưng điều gì sẽ xảy ra nếu bạn sáng tác một bài thơ với một máy tính như là một người cộng tác? Sự cộng tác như vậy là một chủ đề trong cuốn sách Virtual Muse của Charles Hartman. Tác giả cho rằng, trí thông minh nhân tạo cuối cùng sẽ ngang hàng với não người trong việc sáng tác và dịch thơ (Hartman, 1996). Với hiện trạng của máy dịch, người sử dụng thường phải chọn giữa giữ đúng hình thức hoặc đúng nội dung. Tuy nhiên, việc đạt được cả hai là rất mâu thuẫn và hạn chế.

       Vladimir Nabokov trong bản dịch Eugene Onegin (A. Pushkin) của ông đã phê phán các dịch giả đang cố gắng để giữ đúng hình thức. Ông lập luận rằng, nên hi sinh hình thức vì lợi ích của đúng nội dung. Những người khác cho rằng, nên giữ đúng hình thức để duy trì âm điệu và nội dung của một bài thơ. Máy tính dường như rất phù hợp với những công việc như vậy, bởi vì trong thơ không theo tiêu chuẩn. Do đó, không phải sợ rằng một câu thơ được sáng tác bằng máy sẽ không đáp ứng giáo lí và những chuẩn mực thi vị nào đó. Ngoài ra, khi dịch một bài thơ theo cách thủ công, bạn phải chỉnh sửa nó nhiều lần. Tuy nhiên, không có sự khác biệt về nguyên tắc giữa việc chỉnh sửa “câu thơ” của chính bạn và “câu thơ” mà máy tạo ra cho bạn.

       Bài viết này đưa ra giả thuyết về những rào cản đối với bản dịch thơ bằng máy có nhiều khả năng được khắc phục bằng các tiến bộ thuật toán cũng như cách đánh giá thơ sáng tác bằng máy tính dựa trên loại thuật toán dịch và các quá trình nhận thức trong tâm trí của người dịch. Bài viết cũng bình luận về những gì bị mất trong việc dùng máy dịch thơ, máy tính nào phá hỏng thơ và cách hiểu, trực giác, tham khảo văn hóa, nhạy cảm và các ràng buộc khác của con người có thể ảnh hưởng đến những bài thơ do máy tính tạo ra.

       Thơ thường được coi là biểu hiện cao nhất của ngôn ngữ và đặt ra nhiều thách thức cho người dịch. Như ai đó đã nói, “chất thơ” là những gì bị mất trong bản dịch, nhưng điều quan trọng là cho phép câu thơ được dịch là một bài thơ theo đúng nghĩa của nó. Ngay cả trong dịch thơ thủ công cũng hiếm khi giữ được vần và nhịp, người ta nên cho phép sự tự do nào đó đối với các câu thơ trong bản dịch thơ bằng máy, vì lợi ích của bài thơ được dịch, ví dụ như dịch sang tiếng Anh. Miễn là bài thơ có thể tồn tại độc lập, các quyền tự do có thể được đưa vào ở các cấp độ từ ngữ, ngữ pháp và nhịp điệu. Việc nắm bắt nhịp điệu của bài thơ rất có ý nghĩa, đặc biệt là khi nó có một cái gì đó nhấn mạnh, tức là, có sự nhấn mạnh trên các từ khóa. Theo như bản dịch bằng máy, việc xây dựng cách nói đúng ngữ pháp và có cảm xúc không phải lúc nào cũng làm được, và do đó, các quyền tự do nói trên có thể được chấp nhận.

       Phần mềm dịch thuật của Google, tạo ra các văn bản bằng cách tìm kiếm thông qua một cơ sở dữ liệu khổng lồ của các bản dịch có thể, được định hướng bởi một mô hình chính xác. Nói chung, thường phải hi sinh độ chính xác nội dung của bản dịch vì lợi ích của hình thức thơ. Dmitriy Genzel, một nhà nghiên cứu của Google, cho rằng: “Máy có thể dịch thơ hay mà không phải quá sức như mọi người thường nghĩ.” (Genzel, 2010).

       Google hiện đang thiết kế phần mềm có khả năng dịch một bài thơ và giữ đúng vần và nhịp, hoặc chuyển bài thơ từ thể loại này sang thể loại khác, ví dụ như từ thơ 5 chữ thành thơ haiku chẳng hạn. Để làm được điều này, Google đang thay đổi các thuật toán (thủ tục tìm kiếm) để hi sinh chút ít việc giữ chính xác nội dung mà không ảnh hưởng đến hình thức. Từ lâu máy tính có thể phân tích các kho văn bản rất lớn các tác phẩm của con người và lưu giữ chúng trong bộ nhớ. Vần điệu là phần khó nhất, có thể bảo đảm được. Máy sẽ lướt qua một kho dữ liệu đồ sộ và tìm ra phương án tốt nhất. Nói cách khác, máy có thể “đào xới” các vần điệu phù hợp từ kho dữ liệu thơ trực tuyến hiện tại.

       Như đã được đề cập ở trên, hạn chế của phương pháp mới này là tính chính xác về nội dung thường bị mất mát chút ít trong bản dịch. Mặc dù máy chọn các vần điệu xác suất có thể xảy ra nhất, chúng thường không chính xác, và các từ có vần điệu trong bài thơ được dịch hiếm khi tương đương trực tiếp với các từ trong văn bản gốc. Hơn nữa, các từ trong một ngôn ngữ không nhất thiết phải vần với các từ trong ngôn ngữ khác. Điều gì là cần phải hiểu được trong việc giữ đúng một trong hai tiêu chí: hình thức hoặc nội dung, trong bài thơ được dịch bằng máy? Đó là cách tiếp cận thực dụng: nếu chúng ta không thể đưa ra thông điệp của bài thơ theo nguyên gốc (của tác giả) yêu cầu, thì chúng ta áp dụng cách tiếp cận thực dụng, tức là tập trung vào nhận thức của người đọc, và nếu cần thiết, chỉ giữ vần điệu và nhịp điệu, cho phép từ vựng không chính xác như cần thiết. Bất kì sự thiếu chính xác nào, có thể tránh được hoàn toàn hoặc một phần, miễn là người dịch chỉnh sửa bản nháp của một bài thơ được dịch bằng máy và “tỉa tót” nó một cách hợp lệ. Các ưu điểm khác về máy dịch thơ được tiếp tục đưa ra giả thuyết trong phần dưới đây:

       Có thể bài thơ dịch bằng máy được cho là những bài thơ chất lượng tốt? Nhiều chương trình dịch thuật thuộc loại khá phổ biến, chúng là các bộ lọc: bạn lấy một số bài thơ đã có từ trước và bạn truyền nó qua chương trình biến đổi nó theo một cách nào đó và tạo ra một bài thơ dịch mà bạn có thể thấy thú vị hoặc vô vị. Các từ vựng và cú pháp của một bài thơ như vậy thường là chính đáng, chính xác nhưng ngẫu nhiên.

       Ý tưởng về sự ngẫu nhiên là rất quan trọng ở đây. Nó có thể có ích cho một nhà thơ hay dịch giả để có một loại đầu vào ngôn ngữ nào đó đáng ngạc nhiên, bất ngờ, điều mà bạn không thể dự đoán được. Đó là một phần rất hấp dẫn của quá trình này, bởi vì máy tính thực sự cung cấp cho bạn một bài thơ dịch và sau đó bạn gọt giũa nó thông qua chỉnh sửa và hiệu đính. Đó là tính năng quan trọng của mối quan hệ này, thử nghiệm cộng tác này. Mặc dù nó có vẻ nghe như là một cách kì lạ để viết những bài thơ, nó không gây ra bất kì tác hại để thử, chủ yếu là bởi vì nó không cảm thấy rằng nhiều khác nhau từ các bản nháp thơ sáng tác thủ công. Thường hay xảy ra, khi bạn ngồi xuống để dịch một bài thơ, bạn không biết bạn đang đi đâu, và tự nhiên, rất nhiều thứ bạn làm là ngớ ngẩn, vô dụng và không hiệu quả. Theo đó, sau khi bạn đã tạo ra một vài bản dịch, bạn phải ngồi xuống và trở thành một biên tập viên. Bạn trở thành một biên tập viên của câu thơ dịch của chính bạn, thì không khác gì việc trở thành một biên tập viên của câu thơ mà máy tính dịch ra cho bạn. Các nhà thơ thường thử nghiệm với vốn từ vựng của họ, vậy tại sao máy tính không thể làm như thế? Tuy nhiên, những gì mà máy tính làm hỏng trầm trọng là đọc mà không viết, nghĩa là máy không thể chỉnh sửa. Nó chỉ có thể đưa và tạo ra (dịch) những sự việc.

       Máy tính chưa biết cách nhìn vào những gì nó đã đưa ra và quyết định rằng như thế có hợp lý hay không, quyết định xem như thế có thú vị hay không, quyết định xem việc tạo ra như vậy có ý nghĩa mà mọi người đọc đều cảm nhận được, có bõ công hay không?

       Mặt khác, “câu thơ” do máy tính tạo ra không có ý nghĩa bởi vì bài thơ được cho là xuất phát từ bộ não con người. Có một nền tảng cơ học cho những gì bộ não làm, và sự khác biệt cơ bản nhất giữa máy tính và bộ não con người, nói một cách tương đối là, cho đến nay thì máy không thông minh và bộ não con người mới thực sự thông minh. Mặt khác, người ta có thể thực hiện một thử nghiệm và thấy có sự khác biệt: lấy một trang được dịch bởi một chương trình máy tính và đưa nó cho một nhóm sinh viên mà không nói với họ rằng tài liệu đã được dịch bằng máy. Ví dụ, Hartman đề nghị lấy một trích đoạn từ tập thơ “Bộ râu cảnh sát là xây dựng một nửa”.

Bài thơ được tạo ra bởi một chương trình tên là Racter vào năm 1984:

Bill hát cho Sarah. Sarah hát cho Bill.

Có lẽ họ sẽ làm những trò nguy hiểm với nhau.

Họ có thể ăn thịt cừu hoặc cùng nhau đánh lộn

Họ có thể hát về những khó khăn và hạnh phúc.

Họ có tình yêu nhưng họ cũng có máy chữ.

Điều đó thật thú vị.

Các câu trên nghe có vẻ khá kích thích tư duy và vui nhộn vô cùng. Các sinh viên sẽ phải làm những gì mà mọi độc giả làm, đó là tìm ý nghĩa. Nếu họ giỏi về nó, họ có thể tạo ra rất nhiều ý nghĩa ngoài đoạn thơ, thật ra là không có tác giả. Sau đó, nếu bạn nói với họ rằng đoạn thơ này được làm bởi một máy tính, phản ứng của họ có thể khá ngạc nhiên, từ sự phấn khích đến thậm chí điên rồ; do đó, máy tính có thể được xem không chỉ như một công cụ mà còn là một trí tuệ nhân tạo. Nếu trí tuệ nhân tạo trở nên ngang hàng với bộ não con người trong khi dịch thơ, thì chúng ta có thể không thấy bất kì khác biệt nào, với chúng ta nó sẽ giống như nói chuyện với một người khác. Một lập trình viên máy tính người Nga là Sergey Teterin đã đưa ra một dự án thú vị Cyber-Pushkin 1.0 beta vào năm 2003, một nguyên mẫu được gọi là trí thông minh nhân tạo. Ông đã thiết kế phần mềm hoạt động trong MS DOS và tạo ra những bài thơ bằng cách sử dụng bộ nhớ được sưu tập từ hàng ngàn bài thơ Nga. đầy những tác phẩm hay nhất của Sergey Esenin và Aleksandr Pushkin, Cyber-Pushkin làm ra những bài thơ rất dễ thương, ở đó được giữ đúng vần điệu. Chúng có vẻ vô vị, tuy nhiên sau khi chỉnh sửa, những bài thơ như vậy có thể được coi là có cảm xúc.

       Thật không may, các thí nghiệm của Google dường như gây kinh ngạc cho nhiều nhà thơ chuyên nghiệp và dịch giả văn học. Nhiều người trong số họ giữ quan niệm rằng, những bài thơ không phải là vấn đề thống kê để được giải quyết bằng máy móc. Các nhà phê bình cho rằng, để tạo ra những bản thơ dịch chất lượng cao, máy móc phải có những phẩm chất của một người dịch. Rõ ràng, vốn tiếng Anh của máy phải uyển chuyển để tạo sản phẩm đầu ra rõ ràng. Đây có nhiều ý nghĩa, vì từ lâu nay, ngôn ngữ nên được xem như một hình thức tham gia tích cực với thế giới. Mỗi từ đều có tiếng vang: chọn một từ điển đồng nghĩa và bạn có thể đánh giá cao sự phong phú phân nhóm quanh mỗi từ hoặc sắp xếp thứ tự. Do đó, máy không chỉ có quyền truy cập vào từ điển, mà còn có khả năng hiểu được sự tương đương, đây là điều quan trọng cho việc dịch thơ một cách chính xác. Máy cũng phải có khả năng kiểm tra liên tục và cập nhật các từ, hình thành các khuôn mẫu lời nói, chữ viết và giọng nói. Ngoài ra, máy phải hiểu không chỉ ý nghĩa mà cả mục đích, tức là điều gì làm nền tảng cho mỗi bài thơ, ý tưởng có ý thức của tác giả. Với điều kiện là máy học các kĩ năng trên, người ta có thể nói nó có ý thức và sẵn sàng để xử trí thơ. Nếu nó trở nên ngang hàng với người dịch, thì việc đánh giá sản phẩm đầu ra của máy sẽ giống nhau. Đánh giá hiệu suất của máy, người ta nên xem xét những điều sau đây: bài thơ sống và có tính toàn vẹn, liệu nó có bổ sung vào kiến thức về bản gốc, và liệu nó có biến đổi bản gốc đó không? Nếu nó không sử dụng tài liệu tham khảo văn hóa, thiếu độ nhạy cảm, hoặc không có tác động về cảm xúc thì bản dịch sẽ không thành công. Rob Hardy lập luận rằng “một bài thơ ngụ ý một cuộc gặp gỡ mật thiết với một nền văn hóa khác, một cuộc trò chuyện, một bản dịch không chỉ là của từ ngữ, mà là của thế giới “(Hardy, 2012).

       Hầu hết các bản dịch là những sáng tạo lâu bền và phản ánh ngôn ngữ của một địa điểm và thời gian cụ thể. Đó là những gì mà máy làm sai. Ngoài ra, ngôn ngữ thơ thường chứa đầy những trò chơi chữ, mà máy thì chỉ có thể xử lí và dịch theo nghĩa chữ, bởi vì trước đây nó chưa từng gặp sự kết hợp từ ngữ như vậy. Ở đây, từ mới là một nỗi đau, vì chúng không thể dịch được và phải được xử lí thủ công.

       Sự chính xác của bài thơ dịch liên quan đến bối cảnh nhiều hơn bao giờ hết, có thể đạt được bởi một chiếc máy. Vấn đề nan giải ở đây là mục tiêu dịch thuật, diễn giải đầy đủ nội dung của một bài thơ bằng ngôn ngữ khác, đó là điều không thể đạt được. Mọi bản dịch thơ đều phải gánh chịu sự biến đổi của các hiệu quả ngôn ngữ, và mọi ngôn ngữ đích đều khác nhau về lời lẽ làm thơ. Thật không may, nguyên tắc hoạt động của các chương trình dịch máy là chúng chỉ sử dụng các phương pháp dựa trên thành ngữ. Nếu câu thơ dài, chương trình có thể không nhận ra đó là một câu, do đó, máy dịch thành từng đoạn và liên kết các đoạn trở nên có vấn đề.

       Như đã được đề cập ở trên, đánh giá trong dịch thơ là rất quan trọng. Để đánh giá thơ do máy tính tạo ra, người dịch phải hiểu rằng, thơ đề cập đến ngôn ngữ trên tất cả các cấp độ của nó, bao gồm ngữ nghĩa, nhịp điệu, ngữ âm và cú pháp. Sáng tác và dịch các bài thơ, máy tính dựa vào các thuật toán ban đầu được nhúng vào chương trình dịch. Nói cách khác, các thuật toán ở đây bao hàm ý các thủ tục tìm kiếm, theo đó tìm thấy các kết quả chính xác hoặc gần chính xác. Google phân biệt giữa hai loại thuật toán: chữ và tự nhiên hoặc lai ghép. Dựa trên loại thuật toán theo nghĩa chữ, từ vựng của bài thơ sẽ được hoàn lại từng chữ một (kết hợp một từ trong một ngôn ngữ với cùng một từ trong một ngôn ngữ khác). Tuy nhiên, để làm cho bài thơ trôi chảy tự nhiên hơn, chương trình có thể tổ hợp lại các từ (loại thuật toán tự nhiên/ lai ghép). Loại thuật toán lai ghép là thiết lập khó nhất, bởi vì nó sẽ cho phép máy “hiểu” tác động kích thích tư duy của một bài thơ tới người đọc. Ngoài ra, nguyên tắc của Google về việc sử dụng các thuật toán theo nghĩa chữ hoặc lai ghép tuân theo khái niệm tương đương chính thức và năng động của Eugine Nida. Gần đây đã cung cấp một dạng thành ngữ tự nhiên và dễ dàng để tạo ra một đáp ứng tương tự cho người đọc (Nida, 1964). Bởi vậy, bất kì đánh giá nào về bài thơ do máy tính tạo nên chủ yếu dựa vào loại thuật toán và khái niệm về cách tiếp cận tương đương được thực hiện. Tuy nhiên, quá trình đánh giá bài thơ do máy dịch sẽ không có thành phần “chất lượng”, vì thành phần này là chủ quan và máy tính chỉ được xem là nâng cao công cụ dịch thuật.

       Ngoài ra, tâm lí của một người dịch là rất quan trọng trong việc đánh giá thơ máy tính làm ra. Tuy nhiên, không thể giải thích các quy trình nhận thức trong tâm trí của người dịch mà không kết hợp chúng với hoàn cảnh làm việc, sự hiểu biết thế giới, kinh nghiệm, kĩ năng và các di vật văn hóa khác nhau của người dịch. Vì các di vật văn hóa làm cho con người thông minh hơn, trong máy dịch thơ phần lớn phụ thuộc vào bộ nhớ dịch thuật (TM) và tập sao lục thơ trực tuyến (OPC). Cả TM và OPC, là một phần của quá trình nhận thức, can thiệp và kiểm soát các qúa trình trí tuệ của người dịch trong việc chọn các từ tương đương và các từ có vần điệu. Một vấn đề nhận thức khác là nhận thức về bài thơ của người mới làm thơ và người làm đã lâu năm. Nhìn vào một máy dịch thơ, một người mới dịch chủ yếu tập trung vào các từ và chỉnh sửa câu thơ ở cấp độ từ ngữ. Tuy nhiên, một người dịch lâu năm xem xét cùng một kết quả vô vị ngẫu nhiên giống như một văn bản. Theo phân loại bài thơ của Katharina Reiss, những bài thơ được coi là bài thơ có tác dụng bởi vì chúng tạo ra phản ứng hành vi và thu hút hoặc thuyết phục người đọc (Reiss, 1976: 15). Vì máy tính chỉ được xem là nâng cao công cụ dịch thơ, và người dịch là người ra quyết định cuối cùng, điều quan trọng là phải biết quy trình nhận thức nào làm cho các quyết định tối thượng của người dịch ra bài thơ và bài thơ. Nhìn chung, máy dịch thơ dường như hiện nay rất có thể làm được và nó là một lựa chọn thực sự cho các ngôn ngữ thiểu số. Richard Richens chỉ ra rằng “nếu một người nói tiếng Gruzia muốn đánh giá cao hình ảnh của thơ xứ Wales, máy dịch có thể được chứng minh là phương pháp lí tưởng” (Madsen, 2009). Đúng là sản phẩm đầu ra của máy dịch thường có vẻ vô vị và không mạch lạc nhưng điều này không gây cản trở hoặc làm ngừng nghiên cứu trên lĩnh vực dịch thơ. Những nỗ lực sáng tác và dịch các bài thơ của Google có thể được tặng thưởng trong vòng năm hoặc mười năm tới, giống như những nỗ lực của những lập trình viên máy tính đã thiết kế các chương trình cờ vua đầu tiên đã chiến thắng một người chơi vào năm 1950. Tuy nhiên, điều cần lưu ý là bản dịch thơ là một nghệ thuật sáng tạo đòi hỏi từ một dịch giả tuân theo các quy tắc nhất định cũng như chịu hệ lụy chủ quan khi so sánh bản dịch với bản gốc. Mặc dù nhiều chương trình máy tính hiện nay rất phù hợp cho việc dịch các dòng thơ trào phúng cổ Hy-lạp đơn giản với một hoặc hai âm tiết. Máy dịch vẫn còn một chặng đường dài để mô phỏng sự hiểu biết và trực giác của con người. Ví dụ, dịch thơ Nga, vần và nhịp là các yếu tố chi phối, chương trình máy tính luôn kéo theo hình thức và nội dung, và kết quả là thường phải thỏa hiệp độ chính xác ngữ nghĩa, chọn từ và thứ tự, mức từ vựng,… Tất nhiên, chỉ có người dịch mới có thể là một người kết nối thực sự giữa tác giả và người đọc trong việc thể hiện cảm xúc của những bài thơ. Tuy nhiên, máy dịch không nhất thiết phải tạo ra bản sao chính xác của bài thơ gốc. Nó có thể tạo ra một “bài thơ giả” của bản gốc: một bài thơ giả không có bất kì một tội lỗi nào, miễn là nó gần với bài thơ gốc nhất nếu có thể và có tác động tình cảm tương tự đối với người đọc.

Tài liệu tham khảo:

  • Genzel, Dmitriy, “ Thơ ca thống kê dịch máy:... Vần và nhịp”. Hội thảo về phương pháp thực nghiệm trong xử lí ngôn ngữ tự nhiên. Massachusetts năm 2010. Trang 158-166.
  • Hardy, Rob. Lời nói trong ngày. 12-7-2012. 08-1-2013...
  • Hartman, Charles. Thi hứng thực tế. Thử nghiệm thơ máy tính. Wesleyan, 1996.
  • Madsen, Mathias Winter Những giới hạn chế của máy dịch. Luận văn. Copenhagen: Cơ quan nghiên cứu Scandinavian và Ngôn ngữ học, 2009. 8-1-2013.
  • Nida, Eugene A. Lí thuyết và thực hành dịch thuật. Nhà xuất bản Viện Hàn lâm Brill, 2003.
  • Reiss, Katherina. Thể loại văn bản, kiểu dịch và đánh giá dịch thuật. A. Chesterman dịch, (1989), trang 105-15. 1977-1989.
  • Teterin, Sergei. Cyber-Pushkin. 2006. 19-1- 2013

PHẠM THANH CẢI dịch từ nguyên bản tiếng Anh