سالها پیش در پروازی از آمستردام به بوستون، دو راهبۀ آمریکایی سمت راست من نشسته بودند و به حرفهای مرد جوانِ خوشصحبتی از اهالی هلند گوش میدادند. مرد جوان قصد داشت ایالات متحده را ازنو کشف کند.
سالها پیش در پروازی از آمستردام
به بوستون، دو راهبۀ آمریکایی سمت راست من نشسته بودند و به حرفهای مرد
جوانِ خوشصحبتی از اهالی هلند گوش میدادند. مرد جوان قصد داشت ایالات
متحده را ازنو کشف کند. او از راهبهها پرسید اهل کجا هستند؟ افسوس که شهر
فرامینگهام در ماساچوست جزوِ برنامۀ سفرش نبود؛ اما اعلام کرد که «یه
خروار۱ وقت داره و قراره از یه خروار جای مختلف دیدن کنه».
جوان
سرخوشِ هلندی بهوضوح این را دریافته بود که «خروار» مترادف جذابی برای
«زیادِ» بیرنگوبوست. او علم نحو انگلیسی را بهخوبی فرا گرفته بود و
دایرۀ لغات نسبتاً گستردهای هم داشت؛ اما فاقد تجربۀ تناسب کلمات با
بافتهای اجتماعی بود.
خبر اخیر، که موتور ترجمۀ گوگل قرار است از
سیستم عبارتمحور به شبکۀ عصبی۲ تغییر کند، این خاطره را به ذهنم آورد.
تفاوتهای فنیِ این دو در این لینک تشریح شده است. هر دو روش متکی به آموزش
ماشین با یک «پیکرۀ متنی» شامل جملههای جفتیاند: جملۀ اصلی و ترجمۀ آن.
سپس کامپیوتر، براساس توالی کلمات در متن اصلی، قواعدی برای استنباط
محتملترین توالی کلمات در زبان مقصد استخراج میکند.
این روالْ
عملی در تطابقِ الگوهاست. زمانی که خطاب به گوشی هوشمندتان میگویید «مرا
به بروکلین هدایت کن»، برای تفسیر هجاهای گفتهشده، یا، هنگامی که یک
برنامۀ عکس چهرۀ دوستتان را شناسایی میکند و به آن برچسب میزند، از
الگوریتمهای تطابقِ الگوی مشابهی استفاده میشود. ماشینْ چهرهها یا
مقصدها را «نمیفهمد»؛ آنها را به بُردارهایی از اعداد تقلیل داده و
پردازش میکند.
من مترجمی حرفهای هستم و تاکنون حدود ۱۲۵ کتاب از
زبان فرانسه ترجمه کردهام. بنابراین ممکن است از من انتظار برود که در
برابر ادعای گوگل از کوره در بروم که موتور ترجمۀ جدیدش تقریباً بهخوبی
مترجمی انسانی است، زیرا از صفر تا شش، نمرۀ پنج را کسب میکند، درحالیکه
میانگین انسانها 5.1 بوده است. اما علاوهبرآن دکترای ریاضی هم دارم و
نرمافزاری ساختهام که روزنامههای اروپایی را به چهار زبان مختلف
«میخواند» و نتایج را براساس موضوع دستهبندی میکند. پس بهجای اینکه در
برابر احتمال جایگزینشدن بامترجم ماشینی موضع دفاعی بگیرم، از قابلیتهای
چشمگیر ماشینها آگاه و نسبتبه پیچیدگی و مهارت تکنیکیِ کار گوگل سراپا
ستایشم.
اما این ستایش چشمهایم را بر نواقص ترجمۀ ماشینی نمیبندد.
مسافر هلندی را به یاد بیاورید که «یه خروار» انگلیسی میدانست. فصاحت مرد
جوان نشان میداد که «خیسافزار»۳ یا بهعبارتی شبکۀ عصبی زندۀ او بهخوبی
برای درک شهودیِ قواعد ظریف (و استثناها)، که زبان را طبیعی میکنند،
آموزش دیده بود. در مقابل، زبانهای کامپیوتری دستورزبانی بدون بافت دارند.
اما هلندیِ جوانْ فاقد تجربۀ اجتماعی از زبان انگلیسی بود تا قواعدِ
ظریفتری را درک کند که به انتخاب واژه، لحن و ساختارِ زبانیِ یک بومی شکل
میدهند. گویندهای بومی نیز ممکن است، برای دستیافتن به نتیجهای خاص،
شکستن این قواعد را انتخاب کند. اگر من به دو نفر راهبه بهجای «جاهای
زیادی» میگفتم «یه خروار جا»، حتماً از آن منظوری میداشتم؛ اما مرد هلندی
به ورطۀ طنزِ ناخواسته افتاد.
موتور ترجمۀ گوگل با استفاده از
پیکرههای متنیِ متفاوت، از منابع خبری گرفته تا ویکیپدیا، «آموزشدیده»
است. یگانه سرنخی که موجب پی بردن به بافت یک پیکره میشود، توصیف سادۀ آن
پیکره است. استنباطِ تناسب یا عدمتناسبِ واژهای مثل «خروار» از چنین
اطلاعاتِ اندکیْ سخت خواهد بود. اگر بنا به ترجمۀ این واژه به فرانسه باشد،
ماشین میتواند معادلی مناسب را برای آن در beaucoup یا ۴plusieurs حدس
بزند. این معادلها ممکن است معنای گفته را ارائه کنند، اما طنز آن را نه.
زیرا این طنز وابسته به واژۀ «خروار» است که از لحاظ اجتماعی نشانهدار
است، درحالیکه plusieurs خنثی است. هرچقدر هم که الگوریتم پیچیده باشد،
باید به اطلاعات فراهمشده تکیه کند و سرنخها دربارۀ بافت، بهخصوص بافت
اجتماعی، برای انتقال از طریق کُد بسیار مشکلاند.
petite phrase در
زبان فرانسه را مثال بگیریم. phrase بهانگلیسی میتواند «جمله» یا
«عبارت» معنا دهد. وقتی مارسل پروست در رمان در جستوجوی زمان ازدسترفته
(۱۹۱۳)، در پارۀ «la petite phrase de Vinteuil’»، از آن در بافتی موسیقایی
استفاده میکند، باید «عبارت» ترجمه شود، زیرا «جمله» بیمعناست. ترجمۀ
گوگل در برگردانِ آن بسیار خوب عمل میکند (منظور نسخۀ قدیمی عبارتمحور آن
است؛ نسخۀ جدید شبکۀ عصبی تا الان تنها برای چینی ماندارین قابلاستفاده
است). اگر فقط petite phrase را وارد کنید، به شما «جملۀ کوتاه» را تحویل
میدهد. اگر la petite phrase de Vinteuil را وارد کنید (وانتوی نام شخصیتی
است که ازقضا آهنگساز است)، به شما «عبارت کوتاه وانتوی» را تحویل میدهد
که پژواکی از ترجمههای منتشرشده از اثر پروست است. کمیابی نام «وانتوی»
بافت لازم را فراهم میآورد و الگوریتم آماری از آن بهره میگیرد. اما اگر
le petite phrase de Sarkozy را وارد کنید، بهجای «متلک سارکوزی» که صحیح
است، «عبارت کوتاه سارکوزی» را میپراند، زیرا در بافت سیاسیای که نام
رئیسجمهور سابق آن را مینمایاند une petite phrase گفتۀ تندوتیزی است که
بهسوی رقیبی سیاسی نشانه رفته است: یک متلک، نه عبارتی موسیقایی. اما نام
سارکوزی در چنان تنوعی از جملات پدیدار میشود که موتور آماری از ثبت درست
آن در میماند و آنگاه این خطا۵ را با یک اشتباه اصطلاحی تأسفآور همنشین
میکند.
درست همانند تلاشهای پیشین برای خلق هوش مصنوعی که سابقۀ
آن به روزهای دانشجوییِ من در ام.آی.تی برمیگردد، مسئله این است که هوش
بهنحوی باورنکردنی پیچیده است. هوشمندبودن صرفاً توانایی استنباط منطقی از
قواعد، یا استنباط آماری از قاعدهمندیها نیست. پیشازآن، شخص باید بداند
که کدام قواعد کاربردیاند، هنری که نیازمند آگاهیداشتن از حساسیت به
موقعیت است. برنامهنویسها بسیار باهوشاند، اما هنوز آنقدر باهوش نیستند
که تنوع گستردۀ بافتهایِ حاملِ معنا را پیشبینی کنند. درنتیجه حتی
بهترین الگوریتمها نیز نکاتی را از دست میدهند و، همانطور که هنری جیمز
گفته، مترجم ایدئال کسی است که «هیچ نکتهای از دستش در نرود».
نمیگویم
که ترجمۀ مکانیکی سودمند نیست. مقدار زیادی از کارِ ترجمهْ تکراری است.
گاهی اوقات ماشینها از عهدۀ انجامِ کاری بسنده برمیآیند. اما نباید
انتظار معجزه، ترجمههای ادبی شایسته یا ارائۀ مناسبِ متلکهای سیاسی را
داشت. پژوهشهای مرتبط با هوش مصنوعی، از همان روزهای آغازین، زیر سایۀ
ادعاهای مغرورانه بودهاند. این را از ترس شغلم نمیگویم: از ترجمه
بازنشسته شدهام و این روزها بخشی از وقتم را صرف کدنویسی میکنم.
پینوشتها:
*
این مطلب در تاریخ ۲۱ نوامبر ۲۰۱۶ با عنوان Shitloads and zingers: on the
perils of machine translation در وبسایت ایان منتشر شده است
* آرتور
گُلدهمر نویسنده، مترجم، پژوهشگر و نیز نویسندۀ وبلاگی دربارۀ سیاست فرانسه
است. وی بیش از ۱۲۰ کتاب را از فرانسه ترجمه کرده که از میان آنها
میتوان به دموکراسی در آمریکا نوشتۀ توکویل و سرمایه در قرن بیستویکم
توماس پیکتی اشاره کرد. گلدهمر یکی از اعضای مرکز مطالعاتِ اروپایی هاروارد
است و یادداشتهای او در نشریاتی چون دِ امریکن پراسپکت و دِ نیشن منتشر
میشوند.
[۱] Shitload
این کلمه کاربرد عامیانه و بار معنایی توهین آمیز دارد و به خاطر همین استفاده اش توسط آن هلندی در آنجا مناسب نبوده
Neural network [۲] سیستمی کامپیوتری که براساس مغز انسان و دستگاه عصبی پایهریزی شده است.
Wetware [۳]
[۴] هر دوی اینها در زبان فرانسه بهمعنای بسیار هستند.
Error
[۵] در زبانشناسی کاربردی، خطا انحرافی از قواعد پذیرفتهشدۀ یک زبان است
که کسانی که در حال یادگیری آن بهعنوان زبان دوم هستند مرتکب میشوند.