الترجمة الآلية بين الحقيقة والخيال*
25-05-2009, 04:48 PM


الترجمة الآلية بين الحقيقة والخيال*
صادفت الدعاية للترجمة الآلية بعض المبالغة ، مما أعطى الانطباع بأن الآلات سوف تقوم قريبا بجميع أنواع الترجمة ، ليس بسرعة أكبر فحسب ، ولكن بصورة أفضل مما يستطيع البشر. ومن سبل المبالغات في دور الترجمة الآلية أن الخيال يُقدم أحيانا كما لو كان حقيقة ، أو أن التصميمات النظرية للآلات تُقدم بحسبانها قد أصبحت آلات تعمل بالفعل.

وحقيقة الأمر أن التطبيقات الفعلية للترجمة الآلية قد انحصرت حتى عهد قريب في إطار مقاطع قصيرة للغاية ، تتراوح بين جمل قليلة ومقالة قصيرة ، مع قَصْر المادة العلمية عادة على مجال واحد من مجالات المعرفة ، مثل الطبيعة النووية أو العمليات الرياضية أو الكيميائية. وبالإضافة إلى ذلك ، فقد كان من الضروري إجراء الكثير من التحرير أو التعديلات، بهدف جعل النص المترجم آليا مفهوما لقارئ غير ملم بلغة الأصل. وكثيرا ما تستغرق هذه التعديلات وقتا مساويا للوقت اللازم لمترجم كفء يتولى ترجمة النص بالطريقة التقليدية.

مجال الترجمة الآلية وحدودها :
وبالرغم مما قد يسببه القول السابق من خيبة أمل ، فإن التقييم الواقعي للترجمة الآلية يكشف عن ثلاث حقائق برزت نتيجة للبحث في هذا المجال. وهذه الحقائق هي : (1) أن الترجمة الآلية ممكنة في حالة النصوص التي تتناول مادة علمية محددة تناولا بسيطا نسبيا ؛ (2) في ظل التطورات التقنية الحالية في مجال الحاسبات الإلكترونية المتاحة حاليا أو التي ستكون متاحة في القريب العاجل ، فإن الترجمة الإلكترونية للنصوص المحدودة من ناحيتي الدلالة والأسلوب أمر ممكن بتكلفة اقتصادية معقولة؛ (3) أن الاعتبارات النظرية المهمة في مجال الترجمة الآلية تُلقي الكثير من الضوء على مشاكل الترجمة التقليدية، وتحفز إلى تطوير النظرية اللغوية.

وبالرغم من أن الترجمة الآلية يمكن أن تكون ذات فائدة في ترجمة أنماط معينة من النصوص ، فإن هناك أوجه قصور نظرية تجعل استخدامها في الترجمة الأدبية أمرا مستحيلا. إذ إنه ليس من السهل أو الممكن أن نُدخل إلى الآلة معلومات كافية بحيث تسمح للآلة أن تحل المشاكل الشكلية والدلالية العديدة التي تعتمد في مواقف معينة على معرفة بالكون تكاد تكون لا نهائية.

البحوث في مجال الترجمة الآلية :
مع أن هناك علماء في كثير من أنحاء العالم يهتمون بالنواحي العملية والنظرية للترجمة الآلية ، فإنه قد تم إحراز تقدم ملموس في ثلاث دول بصفة أساسية ، وهي : الاتحاد السوفييتي السابق ، وبريطانيا ، والولايات المتحدة الأمريكية.

ففي الاتحاد السوفييتي السابق كان هناك عدد كبير من العلماء يقومون بأبحاث في مجال الترجمة الآلية ، ربما فاق عددهم عدد العلماء المهتمين بهذا المجال في جميع الدول الأخرى مجتمعة ، ويبدو أن كثيرا من البحوث مازالت تجري على أساس تجريبي محض ، بمعنى أن القواعد توضع بحيث تناسب النصوص موضع البحث ، ويتم التوسع فيها كلما ظهرت استثناءات أو مشكلات إضافية ، أي بأسلوب "التجربة والخطأ" . ومن أهم مراكز البحوث الخاصة بالترجمة الآلية في الاتحاد السوفيتي السابق أكاديمية العلوم ومقرها موسكو.

أما في بريطانيا ، فقد تم أُجرى عدد من البحوث المهمة في مجال المفردات ، مع التركيز على التحليل الدلالي ، الذي يتضمن الاهتمام بتعدد المعاني للكلمة الواحدة ، ووسائل تحديد أوجه التوافق بين اللغات. ومن أهم مراكز البحث هناك كلية بيركبيك التابعة لجامعة لندن.

أما في الولايات المتحدة الأمريكية فإن الأبحاث في مجال الترجمة الآلية تجري في عدد من الجامعات ومراكز البحوث مثل جامعة هارفارد ، ومعهد ماساشوستس للتكنولوجيا، وجامعة جورجتاون، ومعامل رامو ، و ولدردج ، ومركز بحوث شركة آي . بي . إم في مدينتي تاريتاون ، ويروكتاون بولاية نيويورك ، وجامعة كاليفورنيا في بركلي ، ومؤسسة راند ، وجامعة وين. ومما يميز أبحاث الترجمة الآلية في الولايات المتحدة تعدد مداخلها ، وما يترتب على ذلك من تعدد الأفكار المبدعة في هذا المجال المهم.

ومما يجدر ذكره أنه حتى في حالة استخدام أكثر الآلات كفاءة ، فإن 90% على الأقل من الجهد المبذول للتوصل إلى برنامج كلي للترجمة ، يُنْفَق في التحليل اللغوي ، بينما يُنْفَق 10% فقط في برمجة نتائج التحليل لكي يمكن للآلة استخدامها. وبمعنى آخر فإنه حتى في حالة استخدام الآلات الأكبر والأفضل فإنها لا تستطيع القيام بالتحليل اللغوي الأساسي الذي لابد من أن يستند إليه أي برنامج للترجمة الآلية.

المكونات الأساسية للحاسب الإلكتروني :
يضم الحاسب الإلكتروني عددا من المكونات جميعها وثيقة الصلة ببعضها. وهناك ثلاثة أجزاء رئيسية في الحاسب ، وهي : (1) المُدْخَل. (2) المخزن الرئيسي والمعالِج (3) المُخْرَج. ويستقبل المدخل البيانات كما تتم تغذيته بها ، من بطاقات مثقبة أو شريط إلكتروني مثلا. ولقد كانت عملية تغذية الحاسب الإلكتروني بالمادة المصاغة شفريا بهذه الصورة الخاصة تشكل في الماضي إحدى المشكلات الرئيسية في طريق ترجمة عملية تتميز بالكفاءة ، إذ كـان لابد من تحويل النص المراد ترجمته إلى بطاقات مثقبة أو تحويله من حروف إلى أرقام ثنائية الشفرة قبل أن يُغَذَّى الحاسب به. وكان الوقت والتكلفة اللازمان لهذه العملية مساويين تقريبا لوقت الترجمة التقليدية وتكلفتها. ولكن في الوقت الحالي هناك أجهزة قراءة أوتوماتيكية يمكنها التعامل مع ألف حرف في الثانية الواحدة ، مع احتمال زيادة سرعة هذه الأجهزة في المستقبل. وفي هذه العملية تقوم عين إلكترونية بالمرور على الحروف ، وتحديد ملامحها المميزة ، ثم تترجم هذه المعلومات إلى وحدات ثنائية الشفرة.

ويستخدم الحاسب الإلكتروني نوعين من المعلومات : (1) معلومات الخلفية المخزنة في الآلة ، سواء أكانت في الذاكرة الرئيسية أم في مخزن إضافي. (2) التعليمات الخاصة بما ينبغي على الحاسب أن يفعله بالمعلومات الواردة إليه عن طريق المدخل. وتقوم الترجمة الآلية أساسا على عمليتين رئيسيتين وهما استقبال المعلومات ، والبحث في المعلومات المخزنة المناسبة ،وإجراء بعض الحسابات والتعديلات التي تستلزمها مجموعتا المعلومات ، ثم تغذية مخرج الحاسب بالنتائج.

ومن هذا يتضح لنا أن الحاسب الإلكتروني "لا يفكر" ، إذ أنه "ليس له مخ" ، إلا أنه ربما جاز لنا أن نقول إنه "يقوم بعمل ذهني" ، ولكن ينبغي أن نفهم هذه العبارة في إطار أن العمل العقلي الإبداعي إنما يقوم به عالم اللغة والمبرمِج ، إذا شئنا أن تكون نتائج الترجمة الآلية ، حتى في أبسط صورها ، مفهومة لنا.

المراحل الأساسية في عملية الترجمة الآلية :
هناك ناحيتان مختلفتان أساسا في الترجمة الآلية ، وهما : (1) البيانات المخزنة ، والتي تضم ، على سبيل المثال ، معجمي لغتي المصدر والتلقي (أي المنقول منها والمنقول إليها) (2) معالجة النص ، وتشتمل على إجراءات مثل التعرف على الكلمات ، ومجموعات الكلمات ذات المغزى ، وتوليد رسالة مماثلة بلغة التلقي.

ويتضح مما سبق أن هناك في الواقع ثلاث مراحل أساسية وهي : (أ) التحليل (ب) المقارنة (ج) التركيب ، وفي كل من هذه المراحل يكون التخزين والتشغيل أمرين مهمين. وعدما تتم تغذية الحاسب الإلكتروني بالنص في لغة المصدر ، فإن عملية التحليل لابد من أن تقوم بتحديد الوحدات الدلالية وتحليل الأنماط البنيوية. وبطبيعة الحال فإنه يمكن أن يتم هذا فقط عن طريق مقارنة النص المُدخل بالمعلومات التي سبق تخزينها بالفعل في الحاسب. وأثناء تحليل البيانات من الناحية الدلالية والتركيبية ، فإنه يمكن تحديد العناصر المعنية بإطلاق تسميات معينة عليها.

وفي مرحلة المقارنة ، تتم المزاوجة بين المسميات في النص بلغة المصدر ، والمسميات في لغة التلقي ، مما يترتب عليه تحديد العناصر الدلالية والتركيبية بالصورة المناسبة. ومثل هذه المقارنة تضم بطبيعة الحال الناحيتين الرئيسيتين وهما : (1) المعلومات المخزنة. (2) النظام المعقد الخاص بتعليمات المزاوجة بين المسميات.

أما في مرحلة التركيب ، فإن الحاسب لابد من أن يأخذ المسميات الدلالية والتركيبية في لغة التلقي ، ثم "يولِّد" الجملة المناسبة التي هي أقصى ما يستطيعه الحاسب من اقتراب من الجملة في لغة الأصل. وهناك جانبان في عملية توليد الجمل هذه وهما : (1) المعلومات المخزنة ، والتي تضم الوحدات الدلالية ، والكلمات ، والعبارات الاصطلاحية ، والقواعد النحوية التي تحكم استخدامها. (2) الإجراءات ذات الترتيب المعين التي يمكن عن طريقها تجميع مثل هذه البيانات على شكل مقولات ذات معنى.

دور الحاسب في التحليل :
بالرغم من أنه بإمكان الحاسب أن يقوم فقط بما يطلب منه بدقة ، فإنه لابد من أن يكون قادرا أيضا على تحليل مجموعات الكلمات التي لم يصادفها من قبل ؛ وإلا فإنه يكون عديم الجدوى تماما بحسبانه مترجما. وبالرغم من أن عالِم اللغة نفسه هو الذي يقوم بالفعل بالتحليل الأساسي للغتي المصدر والتلقي ، فإنه لابد للحاسب من أن يكون قادرا على أن يتخذ قرارات فيما يتعلق ببنية اللغة ، لأنه لابد من أن يترجم تركيبات ، وليس سلسلة من الكلمات ، ولكي يتمكن من ذلك فإنه لابد من أن يكون قادرا على معرفة حدود التركيبات والكلمات الرئيسية التي تتركز حولها أجزاء الجملة.

إعداد المعجم الثنائي اللغة :
من ألزم المتطلبات بالنسبة للحاسب الذي يقوم بالترجمة من لغة إلى أخرى هو المعجم الثنائي اللغة الذي يقدم وسيلة يمكن عن طريقها تحويل الكلمات المدخلة بإحدى اللغتين إلى كلمات مخرجة باللغة الأخرى. وفي بداية الأمر فإن هذا المطلب الضروري لم يشكل مشكلة كبرى ، إذ أن إحصاء للكلمات قامت به معامل شركة بل الأمريكية قد كشف عن أن خمسمائة كلمة فقط في اللغة الإنجليزية تشكل 77% من الكلمات المستخدمة في الكتابة ، و 93% من الكلمات المستخدمة في الحديث. وإذا افترضنا أن جميع هذه الكلمات يمكن إيجاد مقابل لها على أساس كلمة في لغة المصدر في مقابل كلمة في لغة التلقي ، فإن إعداد قائمة تحويلات لفظية يعد أمراً سهلاً نسبياً. ولكن حقيقة الأمر أن هذه الكلمات التي تتمتع بقدر كبير من الشيوع هي نفسها الكلمات التي لكل منها معان متعددة ، ومن ثم يترتب عليها أكبر عدد من الكلمات المناظرة في اللغات الأخرى، وهو الأمر الذي يشكل جوهر الصعوبة في عملية الترجمة. ومن هذا يتضح لنا أن إعداد معجم يفي بالغرض في الترجمة الآلية ليس أمراً هيناً ، إذ إن المعاني المختلفة للكلمة الواحدة لابد من أن يتم تُصَنَّف بعناية، كما أن الأنماط المتعددة للكلمات التي تعطي إشارة حول السياق لابد من أن تُعَدَّ قائمة بها مع كل كلمة ، حتى يتسنى اختيار المناظِر المناسب.

ولكن هناك بعض العزاء فيما يتعلق بالمعاجم المستخدمة في الترجمة الآلية ، وهو السرعة المذهلة التي يستطيع بها الحاسب "الكشف عن" معاني الكلمات. إذ يستطيع الحاسب أن يكشف عن كلمة في معجم يضم خمسمائة ألف كلمة في زمن يقدر بثمانية على الألف من الثانية ، بمعنى أنه يمكن الكشف عن 125 كلمة في الثانية الواحدة !

مشكلة العبارات التي تحتمل معنيين :
إلى جانب مشكلة تعدد معاني الكلمة الواحدة التي سبق الإشارة إليها ، هناك أيضا مشكلة وجود بعض تتابعات من الكلمات التي يمكن أن تنتمي إلى أكثر من تركيب ، فمثلا عبارة “a son of Pharaoh's daughter” في اللغة الإنجليزية ، يمكن أن تشير إلى ابن لبنت فرعون أو ابنة لابن فرعون ، بمعنى أنه يمكن أن يعني حفيد أو حفيدة فرعون*. إن برمجة الحاسب بحيث يقوم بتحليل بنية النص في لغة الأصل، ثم تحويل هذا إلى أنماط مماثلة في لغة التلقي، ثم توليد الشكل المناسب أسلوبيا في لغة التلقي ، لهو أمر خارج نطاق إمكانية الحاسب ، باستثناء بعض النصوص المتناهية في بساطتها ومباشرتها.

نواحي القصور الأساسية في الترجمة الآلية :
بالرغم من سعة التخزين الهائلة التي تتمتع بها الحاسبات الحديثة ، فإنها أقل تعقيدا – بصورة لا تصدق – من المخ البشري الذي يضم عددا من الخلايا مقداره 10 14 (أي الرقم عشرة مضروبا في نفسه أربع عشرة مرة). ولكي نقترب من فهم ما يعنيه هذا الرقم، لنتخيل أن طفلا ولد منذ نحو ألفين من السنين ولكنه مازال يعيش حتى الآن ! وأنه كان يُمنح جنيها كل دقيقة من عمره ، فإن كل ما يكون بحوزته الآن هو بليون (ألف مليون جنيه) . فإذا ضربنا هذا الرقم في مائة ألف ، يمكننا حينئذ فقط أن نقترب من عدد الخلايا في مخ الإنسان. وحتى وقت قريب وربما حتى يومنا هذا يتحدث المهندسون عن حاسبات ذات سعة تبلغ10 7 خلية ، وهو رقم يقصر كثيرا عن عدد خلايا مخ الإنسان ، إذ إنه يبلغ واحدا على عشرة ملايين من عدد الخلايا التي تكوِّن المخ! ولا يملك الإنسان إزاء هذه الأرقام إلا أن يهتف من أعماق قلبه وعقله معا قائلا : سبحان الله.

غير أن الحجم أو السعة ليست هي ناحية القصور الوحيدة في الحاسبات الإلكترونية، ولكنها آلات يمكن أن نقول عنها إنها يعوزها الذكاء ، على أحسن الفروض. ولا نعني بهذا أنها لا يمكنها أن تقوم بحسابات معينة بسرعة تفوق كثيرا سرعة الإنسان ، بل تستطيع فقط أن تفعل ما يًطلب منها فعله. ولكي يصبح الحاسب مترجما جيدا أو ذكيا فإنه يتعين عليه أن يكون قادرا على أن يقول : "لا أعرف" أو "لست أبالي" ، إذ إن هذا ليس ذا صلة بالموضوع" ، وهي أشياء لم يقل بها حاسب آلي بعد.

وبالإضافة إلى مشكلتي السعة والتعقيد ، هناك أيضا صعوبة إيجاد لغة مناسبة يتم بها "التحدث مع" الحاسب ، إذ إن الحاسب قد تم صُمِّم أساسا بغرض حفظ الملفات ، والترتيب ، وإجراء العمليات الحسابية. ولكن لكي "نترجم" تركيبات اللغة إلى شكل يمكن للحاسب أن يتعامل معه ، فإن هناك حاجة إلى لغة تقنية وسيطة يمكن تحويرها بصورة تلقائية لتناسب نواحي القصور الخاصة في الحاسب. وبمعنى آخر ، فإنه من المريح أن نستخدم نوعا من اللغة الخاصة المبنية في داخل الحاسب. وعلى سبيل المثال ، فإن أمرا لغويا بسيطا مثل : "حدد الاسم في السياق التالي" أو مثل "اذهب إلى نهاية الجملة" ، قد يتطلب عشرة أو أكثر من الأوامر المفصلة.* ولقد تم تطوير عدة لغات خاصة للحاسب الإلكترونية ، مثل كوميت ، وفورتران، وميميك ، ولكل منها نظامها الخاص بالتقابل بين العمليات اللغوية والعمليات التي تقوم بها الآلة.

هل ينتهي عصر المترجم الإنسان ؟
يرى اللغوي والمترجم الأمريكي يوجين نايدا أنه ليس ثمة شك في أن الحاسبات في نهايـة المطاف سوف تقوم بالمهمات الرتيبة المتعلقة بترجمة من مرتبة دنيا لبعض أنواع النصوص مثل ترجمة النصوص التقنية ذات الطبيعة المتخصصة ، حيث تكون مشكلة تعدد معاني الكلمة الواحدة في أدنى حد لها ، وحيث لا تكون الصياغة الأدبية مطلوبة. وحتى في هذه الحالة فإنه يلزم قدر كبير من التحرير أو المراجعة يقوم به إنسان ، على الأقل في حالات المواد المعقدة.

ولكن في الوقت الحالي ، فإننا نستطيع أن نؤكد أنه ليس هناك خطر على أي مترجم كفء من أن يجد نفسه بلا عمل نتيجة لهذا النوع من استخدام الحاسبات في الترجمة. وحتى عندما يحل ذلك اليوم الذي يستطيع فيه المهندسون بناء حاسبات يمكنها منافسة السعة التخزينية للمخ البشري ، فإن هذه " الآلات المعدنية" لن تشكل أي تهديد حقيقي للمترجم الذي يتمتع بقدر من الإحساس المرهف ؛ فالذاكرة ليست معادلا للفهم ، كما أن السرعة ليست بدلا عن الإحساس الجمالي.

ونختتم هذا المقال بما يقرره الباحثون فيكتوريا فرومكين ، و روبرت رودمان ، وناينا هيامس في كتاب لهم صدرت طبعته السابعة عام 2003بعنوان مقدمة في اللغة والذي يذكرون فيه أن فكرة الترجمة الآلية كانت في الأصل مبنية على أساس أنه يمكن استخدام الحاسبات الإلكترونية بدلا من البشر كمترجمين ، ولكن مشكلات معينة برزت نتيجة لأن الحاسبات الإلكترونية ليست بشرية !


مراجع المقال
Delavenay, E. An Introduction to Machine Translation. New York: Frederick A. Praeger, 1960.

Eastman, Carol E. Linguistic Theory and Language Description. Philadelphia: J. B. Lippincott Company, 1978.

Fromkin, Victoria, Robert Rodman, and Nina Hyams. An Introduction to Language. New York: Holt, Rinehart and Winston, Seventh Edition, 2003.

Nida, Eugene. Toward a Science of Translating. Leiden: E. J. Brill, 1964.------------

* جريدة الرياض ، الخميس 24 ربيع الآخر 1415 هـ - 29 سبتمبر 1994 م – العدد 9593 السنة الحادية والثلاثون ، ص 24.

* هذه العبارة ، عند ترجمتها إلى العربية ، لا يلتبس معناها. ولكن يمكننا ضرب مثل بعبارة عربية مثل "مساعدة الأصدقاء" التي قد تعني مساعدة مقدمة لهم ، أو مساعدة مقدمة منهم.

* يذكر ديلافني في كتابه مقدمة في الترجمة الآلية (ص116) أن "… ترجمة جملة من عشرين كلمة قد تستلزم عددا من العمليات يصل إلى 000ر10 عملية آلية منطقية."

منقول