Arabic Translators International _ الجمعية الدولية لمترجمي العربية

 


العودة   Arabic Translators International _ الجمعية الدولية لمترجمي العربية > الترجمة والحاسوب Translation & the Computer > الترجمة الآلية Machine Translation

الترجمة الآلية Machine Translation الترجمة الآلية

« آخـــر الـــمـــشـــاركــــات »
         :: Cfp_فعاليات الترجمة (آخر رد :ahmed_allaithy)       :: ماذا يعني ان تكون الأكادية أقدم تدوينا من العربية؟ (آخر رد :محمد آل الأشرف)       :: La Découverte d’un petit pays qui s’appelle Užupis (آخر رد :RamiIbrahim)       :: يصير رواء (آخر رد :عبدالحليم الطيطي)       :: خرجوا (آخر رد :عبدالحليم الطيطي)       :: ترجمة قانونية (آخر رد :Rok Malla)       :: أخبار من جرمرسهايم (آخر رد :Rok Malla)       :: وفاة الدكتور محمد عناني (آخر رد :ahmed_allaithy)       :: الذاكرة (آخر رد :RamiIbrahim)       :: Un appel à reconstruire la prononciation de l'hébreu biblique (آخر رد :RamiIbrahim)      

رد
 
أدوات الموضوع طرق مشاهدة الموضوع
  #1  
قديم 06-04-2006, 02:33 PM
الصورة الرمزية RaedHabash
RaedHabash RaedHabash غير متواجد حالياً
عضو رسمي
 
تاريخ التسجيل: May 2006
المشاركات: 279
افتراضي حول المعالجة الآلية للغات

amattouch



شاركت: 15 فبراير 2006
نشرات: 285

ارسل: الاحد فبراير 26, 2006 10:22 am موضوع الرسالة: حول المعالجة الآلية للغات

--------------------------------------------------------------------------------

تعريفات1


توم TAUM
هو اسم مختزل للترجمة الآلية لجامعة مونريال . وكانت الحكومة الكندية في 1965 وراء المشروع . وكان المشروع في بدياته عاما للترجمة ولكن بعد سنوات العمل والبحث تخصص المشروع في متابعة أحوال الطقس كتطبيق أساسي ميداني للبرنامج. ولذلك أصبح اليوم معروفا باسم توم ــ طقس..
هذا البرنامج يترجم المعلومات الطقسية للحكومة الكندية منذ عام 1977 من الإنجليزية إلى الفرنسية ومنذ عام 1989 من الفرنسية إلى الإنجليزية. فالترجمات من الإنجليزية إلى الفرنسية فهي توجه لمناطق فانكوفر وإدمونتن وكالجري ورجينا وتورونتو وهاليفاكس أما الترجمة من الفرنسية إلى الإنجليزية فتهم منطقة مونريال. واليوم فإن كل التوقعات الطقسية الكندية أصبحت مترجمة.
البرنامج يعتمد على 2000 كلمة وتعبرة. ويترجم ساعة بعد ساعة كل التوقعات بمعدل 30000 ألف كلمة في اليوم.
وواقعيا توم ـ طقس هو نظام مستعمل منذ زمن وقد حاز على استحسان الجميع. وللتدقيق يجب التفريق بين استعمال عادي وشامل واستعمال الزبائن من حيث التخصص والتواتر.
ولأن البرنامج شديد التخصص والتميز فهو يحوي مصطلحات محصورة أي ذي معجم محدد وشامل للكلمات المراد ترجمتها وتركيبا جامدا يدور حول عدد قليل من التركيبات الجملية وهو ما يمنح تطابقا كاملا لكل تركيب وهيكلة تعبيرية متكررة, لدرجة أن المترجم الإنساني لن يصبر أمام ملل التكرار أكثر من أشهر. وقد خلت مصلحة الطقس الكندية مشكلتين : الملل البشري ومشكلة لغوية باختيارها وتطويرها لنظام توم ـ طقس.

تعريفات 2

Titus تيتوس

طور برنامج تيتوس في ظروف خاصة ولأهداف محددة.
وكان وراء ظهوره ذلك معهد النسيج الفرنسي. فقد تصور المعهد برنامج تيتوس لترجمة ملخصات المقالات التي تخص النسيج للمهندسين المتخصصين المحتاجين للمعلومات العلمية الجديدة.
يتعامل برنامج تيتوس مع أربع لغات عمل : الفرنسية والإنجليزية والألمانية والإسبانية وكل الأزواج اللغوية فعالة.
وكان من المفروض أن يكون المعجم الأساس صغيرا ولو أنه من غير سابق الحصر. والتركيب محصورا نسبيا والمقالات تساير في عمومها ضرورة الوضوح والبساطة والقصر. وبرمج تيتوس للعمل في إطار تركيب مراقب, وقد شهد عدة تغيرات وخاصة تنوع الجمل المقبولة. وعندما جرب العهد الفرنسي للأبحاث العلمية برنامج تيتوس لترجمة ملخصات المقالات العملية المنشورة ظهر أن محرري الملخصات لا يحترمون شروط الكتابة المرخصة في المعالجة الآلية. وطرح إشكال بشري هل يمكن فرض تركيب مراقب ملزم على المحرر؟ فضرورات المعالجة الآلية لم تغير من عادات التحرير. ويمكن استعمال البرنامج بموازاة بيانات سابقة الإعداد, وهذا يقلص إنتاجيته, فقد أعد تيتوس كبرنامج كامل الآلية. ويمكن استعماله كما هو إذا احترمت بعض الشروط : ترتيب العناصر في الجملة وزمن الأفعال المقبول والملحقات الممكنة. و شيئا فشيئا تحول إلى نظام تفاعلي مع إمكانية إصلاح على الشاشة للمشتركات اللفظية والكتابية.

تعريف 3
Spanam /Engspan
برنامج يترجم من اللغة الإنجليزية إلى اللغة الإسبانية والعكس. وقد أعد خصيصا لمنظمة الصحة لعموم أمريكة في واشنطن التي تنشر وتصدر العديد من الوثائق الطبية الموجهة لأمريكا اللاتينية. وفي البداية أعد البرنامج الموجه نحو اللغة الإسبانية لخدمة مصالح الصحة في القرى النائية ولمقاربة أكبر عدد من الساكنة. وحاليا يستعمل زوجي اللغة بنجاح في مجالات الصحة والتغذية والفلاحة.
وإذا كانت بداية البحث حول البرنامج قد بدأت في جامعة جوج تاون فإنها طورت في منظمة الصحة لعموم أمريكة. وحيث أن المجال محصور ونوعية النصوص محددة فقد سار العمل بوتيرة سريعة. وأول الإصدارت نحو الإسبانية ظهرت في 1976 ودخلت مجال العمل في 1979 وجددت في 1988.... أما النسخة نحو الإنجليزية فهي قريبة العهد ودخلت مجال التطبيق في 1984. والبرنامج من شاكلة برامج سيستران : الترجمة الخامة تتطلب تصحيحا لتغدو النصوص مقبولة. وفي دراسة للانعكاسات ظهر أن المستعملين يحبذون الترجمة المصححة الآلية على الترجمة البشرية اليدوية.
وإنتاجية البرنامج تقارب 6500 كلمة/يوم للمترجم المصحح وهناك محاولات لإصدار يتعامل مع أزواج لغات أخرى.

تعريفات 4
Weidner
كان لجامعة بريغام دور مهم في تطوير العديد من برامج الترجمة الآلية وكان الهدف الأول منذ 1970 ترجمة النصوص المقدسة الخاصة بجماعة المرمون. وتابعت العمل شركة ويدنر منذ تأسيسها في 1977 بمشاركة كوادر الجامعة وحرج أول برنامج من الإنجليزية إلى الفرنسية في 1980. وتبع ذلك أزواج لغات أخرى من الإنجليزية إلى الإسبانية والألمانية والبرتغالية والإيطالية والعربية... ومن الفرنسية إلى الإنجليزية والإسبانية والألمانية إلى الإنجليزية و. ويمكن تشغيل هذه البرامج على حواسيب شخصية إلا البرامج الخاصة بالإنجليزية/العربية والألمانية/الإنجليزية.
وأكبر عائق لهذه البرامج هو صغر المعجم الذي يلائم دائما نوع النص المراد ترجمته وعلى المشغل إعداد معجم وهذا مكلف وضد إنتاجية البرنامج.
وإنتاجية البرنامج العملية : 4000-8000 كلمة/ساعة.
ويستعمل للترجمة في شركات دولية ومنها ماترا موتورولا طومسون بول أيروسباس بيركينس إنجين رانكس كسيروكس ...
واليوم تتوجه المجموعة المنتجة لتطوير برامج موجهة للسوق اليايانية.

تعريفات 5
Alps
بدايات ألبس كانت في جامعة برغام وقد تأسست الشركة في 1980.
ويمتاز برنامج ألبس بمستوياته الثلاثة لترجمة الألفاظ : الاختيار والذاتية والتفاعلية. وتحوي المستويات العليا المستويات الدنيا. والمستوي الأعلى تفاعلي أي أنه يقدم ترجمات جملة لجملة ويطرح أسئلة لمحو الغموض. وعموما يعد المستوى الثاني ـ الذاتية أكثر نفعا غير أن حلف الأطلسي و إحصائيات كندا تستعملان المستوى الثالث مستوى التفاعلية.
ومن اللغات العاملة في البرنامج : من الإنجليزية إلى الفرنسية والألمانية والإسبانية والإيطالية.
من الفرنسية إلى الإنجليزية.
من الألمانية إلى الإنجليزية.
ومن الشركات الكبرى التي تستعمل البرنامج: تكساس أنسترمنت , ونرس داتا, واتحاد المصارف السويسرية, ورانك كسيروكس, وهناك شركات ترجمة تستعمل هذا البرنامج ك أنترلونجوا وملتيسكربت...
ومن عيوب البرنامج المعجم الصغير ويجب أن تكون النصوص المعروضة للترجمة تقنية مكررة مكتوبة بلغة سهلة وبسيطة. ويتعامل البرنامج مع نصوص من 30000كلمة وأكثر من ذلك تتقلص الإنتاجية.
وللبرنامج إصدارات للتشغيل على الحواسيب الشخصية.
تعريفات 6
Logos
تعد برامج لوجوس منافسة لبرامج سيستران من حث جودة الترجمة رغم أن الأخير له معجم واسع ويتعامل بلغات عدة.
ولوجوس شركة أمريكية تطورت في الستينات. وخرجت أول برنامج الترجمة في 1971 خاص بالترجمة من الإنجليزية إلى اللغة الفتينامية متخصص بترجمة وثائق تتعلق بالتجهيزات العسكرية. وطورت لوجوس في الثمانينات برنامجا للترجمة الألمانية/الإنجليزية. وظهرت إصدارت لاحقا خاصة باللغات الفرنسية والإسبانية والإيطالية ولغات أخرى. وطورت شركة لوكوس برامج ترجمة ملحقة لنشر متعدد اللغات.
يمكن تشغيل بعض برامج لوكوس على حواسيب شخصية باستعمال واجهة يونكس.
ويستعمل في عدة شركات عالمية.
تعريفات 7
Smart/ Seppli
تستعمل وزارة الهجرة والعمل الكندية برامج سمارت لترجمة طلبات التشغيل ما بين الفرنسية والإنجليزية, وتنشر النتائج مباشرة على شاشات 4000 حاسوب موزع على مجموع التراب الكندي ويمكن للموظف تدقيقها آنيا وأغلب التدقيقات مع قلتها تمس التركيب ولا يتطلب البرنامج مراقبة التركيب المسبقة وذلك راج لقصر النصوص مما يجعل تراكيبها بسيطة وإن تنوع التحرير, ويستفيد البرنامج من تعدد المعطيات ويدمجها.
وتمكن برامج سمارت ترانسليتر من ترجمة خامة بسرعة 200000ك/س مع حواسيب مركزية.

وطورت جامعة جنيف نظام سيبلي وهو قريب من السابق للتعامل مع الألمانية/الفرنسية والألمانية/الإيطالية لنشر عروض العمل الصادرة في عاصمة الفيدرالية بيرن باللغات الفرنسية والألمانية والإيطالية والتي كانت ترجمتها بشرية. وزيادة على الجانب الاقتصادي في القضية فإن البرنامج يهدف إلى تشجيع الطلاب على التعامل مع المعالجة الآلية للغات الطبيعية.
تعريف 8

Socatra
وسوكترا اختزال لأسم : الشركة الترجمة الكندية. ونظامها المطروح يتعامل ما بين الفرنسية والإنجليزية. ولا يوجد في السوق وتتم الترجمة الخامة أو المحققة داخل مكاتب الشركة
وتقول الشركة أن الطاقة الإنتاجية لنظامها تصل إلى 200000ك/س على الأقل ومولد مسردي ب 500000ك/س وهي أرقام ضخمة.

Metal
ميتال هي اختزال لعبارة : الترجمة وتحليل اللغات, وكانت بدايات المشروع في جامعة تكساس في 1961 للترجمة من الألمانية إلى الإنجليزية. وتخلت الجامعة عن المشروع لصالح شركة سيمنس الألمانية التي عرضت في الثمانينات أوائل منتوجها للترجمة في ما بين العديد من اللغات –الفرنسية الهولندية الألمانية الإسبانيةـ وهي برامج ناجحة في مجال الاتصالات.
وميزة النظام أنه مركب من وحدات قابلة للتغيير مع مجموعة من القواعد النحوية المحددة يمكن الرجوع إليها كلما دعت الضرورة وقت التحليل وهكذا نحصل على عدة تمثيليات مقبولة للجملة وترفض أقل التمثيليات قبولا. ورغم أن نظام الوحدات المستقلة يسمح بالتطوير الدائم والتحسين إلا الزيادة المعجمية والبرمجية تؤدي إلى نتائج سلبية.

PC-translator
الحاسوب المترجم قد تجدونه في الأسواق على شكل حواسيب جيبية : وهو نظام يختلف عن باقي الأنظمة الأخرى. فشركة المنتوجات اللغوية تعرض بثمن بخس برامج ثنائية اللغة ـ من وإلى الإنجليزية : الفرنسية/ الدنماركية/السويدية/النرويجية/الإسبانية/الهولندية/الألمانية/الإيطالية....
والبرنامج ليس مؤللا بالمعنى الدقيق فهو يكتفي ببعض المواصفات اللسانية وبعض الوحدات اللغوية وقلة من القواعد التركيبية فهو أقرب إلى برنامج مساعد منه لبرنامج آلي أو مؤلل.

Gigatext
مثل مدرسي لما يجب الابتعاد عنه : خسارة ملايين الدولارات الكندية في برنامج يترجم النصوص القانونية ما بين الفرنسية والإنجليزية ولكن النتيجة صفر.

Winger
نحت شركة وينجر للنسيج منحى الترجمة الآلية من الإنجليزية إلى الدنماركية مستغلة قاعدة معلوماتها الضخمة. والبرنامج يعوض نقص الجانب التركيبي بالتفاعلية إذ أنه يمنح المستعمل عدة حلول يختار منها أحسنها. وهو أقرب إلى برنامج ألي مساعد للترجمة. وتعرض الشركة حاليا عدة برامج للترجمة بين اللغات الإنجليزية والإسبانية والروسية.

PaTrans


نظام للترجمة بين اللغتين الإنجليزية والدنماركية متخصص.


Tovna
برنامج إسرائيلي لم يخرج للسوق إلا في 1985 للغتين الفرنسية والإنجليزية والروسية. وميزته التقنية أنه يستفيد من تدقيقات الترجمات الخامة ويستغلها في ترجمات لاحقة.

Lexi-Tech
برنامج كندي موجه لخدمات عسكرية محددة وبداية بهدف ترجمة 100000 صفحة ذات علاقة مع الترسانة البحرية. ويحوي معجمها 75000 عبارة ولفظة مع برامج توسط بني خاصة بالشركة.

البرامج اليابانية
ولنا معها عودة خاصة
متابعة للسوق التجاري الدولي وللتطور العلمي والتقاني فقد واجهت الشركات اليابانية مشكلة الترجمة بين اليابانية والإنجليزية. ولذلك أصبحت الترجمة الآلية مع الجيل الخامس من الحواسيب من المهمات الأولية منذ 1980 وقامت الحكومة اليابانية بمجهود ضخم وشجعت الأبحاث في المجال وكان للأستاذ ماكوتو نجاو ـ مشروع حكومي ـ تأثير في توجيه الأبحاث نحو تحليل تركيبي شجري.
وهناك توجه كبير لتوسيع البرامج إلى لغات أسيوية أخرى كالصينية والكورية وغيرها من اللغات العالمية.
ومن الشركات اليابانية ذات الباع العالي في المجال
توشيبا, و فيجيتسو, و ميتشوبيشي وهيتاتشي....
وكل مشاريعها واعدة على مستويات الترجمة ومعالجة الصوت {ترجمة المكالمات الهاتفية آليا}.
ورغم أن إنتاجية الكثير من برامج الترجمة المعروضة وتتطلب تدقيقا مكلفا إلا أن اليابان يعد من أكثر البلدان توسعا في التجهيز والاستعمال ويعتبر أن المستقبل هو للترجمة الآلية فلا خيار لها نظرا لانعزال اللغة اليابانية وقلة العارفين بها عالميا والمترجمين منها وإليها.
مراكز علمية
الصين حاولت الصين الشعبية تطوير برنامج jet لترجمة إلى الصينية من اللغات الإنجليزية والفرنسية والألمانية والروسية. ولكن المشروع لم يعطي لحد الساعة نتائج
مجموعة الدول المستقلة
PARS
هو نظام للترجمة بين الروسية والإنجليزية يخص النصوص العلمية والاقتصادية. وهو يعتمد على نتائج جامعة جورج تاون للترجمة لغة إلى لغة.
SPRINT
خاص بمجالات الحاسوبيات والاقتصاد وهو إنجليزي روسي اللغة وعرضته مجموعة الترجمة لعموم روسيا.
ASPERA
هو من نوعية الأنظمة المعجمية روسي إنجليزي اللغة.
ETAP
نظام إنجليزي روسي اللغة خاص للنصوص الحاسوبية و للعلوم المعلوماتية.
ولبقية المراكز سنعود إليها في موضع آخر.

GETA
Ariane & Callipe

جامعة جرونبل الفرنسية ومركزها للدراسات والترجمة المؤللة الذي أداره بجدارة الأستاذ فوكوا لسنوات وقد اهتم مركزه بأوجه متعددة للمعالجة الآلية للغات. وكانت الترجمة من الروسية أحد مرتكزات العمل في المعهد.

Susy
بدأ مشروع سيزي في 1972 في جامعة شروبروك الألمانية للترجمة من الألمانية إلى الروسية. وتوجه الاهتمام نحو إضافة لغات أخرى الفرنسية والإنجليزية والدنماركية والهولندية وأولى المركز أهمية للغة الإسبرنتو. واستعمل البرنامج للفهرست الوثائقية وتحليل النصوص وإدماج المصطلحات الخارجية..
DLT
برنامج هولندي. تفاعلي متعدد اللغات يمن من توليد نصوص في إطار شبكة حواسيب. مع بنك معلومات معرفية بين اللغات . وتتم الترجمة عبر لغة توسطية هي لغة الإسبرنتو التي تستعمل للتواصل بين الحواسيب النهائية. فهو إذن موجه للتواصل أكثر من توجهه للترجمة رغم ما يزعم واضعوه.
Rosetta
أول برنامج من القطاع الخاص في أروبا. من شركة فيليبس. وقد نتجت عنه تجارب بين الإنجليزية والأسبانية والهولندية.
LMT
هو برنامج لشركة إبم المعروفة وهو برنامج ذي هدف متواضع ويتعامل مع اللغات : الفرنسية والإنجليزية والألمانية والدنماركية وغيرها. والمعجم والمسارد معروضة على الشاشة وعلى المستعمل التعرف على الترجمات المعروضة.
Pangloss
من عمل جامعتي المكسيك وكاليفورنيا الجنوبية وهو موجه لمنصة عمل المترجم.
ArchTran
من نتائج تايوان.
Systran

سيستران هي اختزال للعبارة الإنجليزية الترجمة الآلية, نظام أمريكي من تصور بيتر توما, اعتمدته وطورته لجنة المجموعة الأوروبية في أواخر السبعينات لمصالحها الترجمية وصدرته للأسواق. ورغم ما يعاب عليه من حيث المستوى الجمالي واللساني هو أكثر البرامج في الوقت الراهن عمليا وظيفية التي تساير متطلبات الترجمة الآلية ويمكن ترجمة صالحة مباشرة دون تدقيق وإن كانت النصوص الخارجة غير صحيحة مائة في المائة على المستوى التركيبي والنحوي.
وقد خضع تطويره لعدة مراحل ولم يتم تصوره مباشرة كتطبيق لنظرية محددة وإنما تميز بتكون متنام مجزئ المراحل وهو ما يعيبه عن البرنامج أصحاب الموقف النظري .
ويتعامل سيستران في المجموعة الأوروبية مع أزيد من 14 زوج ـ لغة. بتفاوت في الإنتاجية بين الأزواج فأقدمها تعطي نتائج متميزة عن الأخرى.
وطورت الشركة صاحبة المشروع, كاشو, نظام مصلحة ترجمة مباشرة على الخط لعدة لغات.
وبلغت إنتاجية البرنامج لبعض الأزواج : 500000 ك/س أي 1000 ص/د وهو ما يقارب عشرين صفحة في الساعة.
وحاولت شركة كاشو في مراحل تطوير نظام عربي سنتطرق له في جانب البرامج الخاصة بالعربية. ولأن هذا برامج سيستران هي المعتمدة في المجموعة الأوروبية فسنعود إليها تفصيلا لاحقا.





Eurotra

اختزال لعبارة الترجمة وأوروبا. منتوج أوروبي خالص, بدأ التفكير فيه عام 1977 على المستوى الأكاديمي بعرض تشجيع البرامج الأوروبية, ودعمته المجموعة الأوروبية. وكان الهدف محاولة إيجاد مترجم آلي يتعامل مع كل اللغات الرسمية في المجموعة الأوروبية وهي كانت تقارب الثمانين زوجا آنئذ واليوم تفوق 300. وميزة البرنامج أنه بني انطلاقا من نظرية متميزة تعتمد على [تمثيل] تصوير وسطي ودلالي مجرد بين اللغة الأصل ولغة الهدف ونمط التحويل. عكس البرامج المطورة حول محور والتي تتطلب لغة ثالثة شديدة الهيكلة.
وفي برنامج أوروترا يتشكل التصوير من تراكيب اللغة الأصل مع معلومات معجمية عن الألفاظ و بنية النص مرفوقة أحيانا بتصوير لمعلومات دلالية. وتصوير اللغة الهدف هو منسوخ عن تصور لغة الأصل. ويتدخل التجريد في تصوير المرحلة الوسطية. ورغم أن نمط المحور هو أكثر اقتصادية إلا أن الاختيار وقع في هذا البرنامج على نمط التحويل وهو يتطلب لكل لغة ـ هدف كتابة ثلاث وحدات أنماط : نمط التحليل ونمط التحويل ونمط التوليد ـ عكس نمط , بل أنماط المحور التي تتطلب فقط كتابتين : التحليل والتوليد غير أنها عمليات صعبة تتطلب تعمقا كبيرا في النص الأصلي. وتوليدية معقدة وعلى العكس ففي نمط التحويل يكفي تطبيق قواعد التركيب النحوية.
وهناك أسباب أخرى تفسر هذا الاختيار راجعة لطبيعة اللغات المراد التعامل معها.
فأمام اللغات المتقاربة صنفا وتركيبيا كاللغات الأوروبية يستحسن استعمال نمط التحويل لتشابه المعجم وتقارب التركيب, أما إذا تعلق الأمر بمزج بين لغات متباينة الصنف كالإسبانية والصينية مثلا فيفضل نمط المحور لما يتطلب ذلك من تصور شديد التجرد مشترك بين اللغتين وكما قلنا فهذا البرنامج موجه أساسا لخدمة اللغات الأوروبية المتقاربة.



إحالة : الزوج اللغوي
للدقة يجب التمييز حين الحديث عن الأزواج اللغوية زوج ـ لغة يعني من لغة س إلى ص أما من ض إلى س فذلك زوج آخر والمابين لغتين تعني إذا زوجين.
وحين تسمع ببرنامج يتعامل : من س إلى ص
ومن س إلى ن
لا يعني أنه يتعامل من ص إلى ن
لأن هندسة اللغويات الحاسوبية تأخذ بعين الاعتبار تأثير النقل والانتقال للغوي فالقواعد المتحكمة في الانتقال من لغة إلى أخرى تخلف عن قواعد النقل المعاكس. ولذلك قد تجد برنامجا ذي إنتاجية عالية في الترجمة من لغة إلى أخرى وضعيف الانتاجية حين يتعلق الأمر بالترجمة المعاكسة لنفس اللغتين وقد تنعدم هذه الأخيرة في بعض البرامج أي تنجد مترجما آليا من لغة س إلى لغة ص حصرا وليس العكس.

إحالة : في الحدود بين الآلي والمساعد الآلي
أن هدف الترجمة الآلية هو الاغتناء عن العنصر البشري وبقدر ما قل تدخل هذا الأخير يعد البرنامج آليا وحين يتطلب تدخلا كبيرا يعد البرنامج مساعدا. وتتحدد الفروق أيضا إذا اعتبرنا نوعية وسعة المعجم وطريقة هندسة البرنامج ذاته. فإذا كان البرنامج يكتفي بترجمة كلمة إزاء كلمة فهو مساعد لا أكثر لأنه يفتقد آليات العمل المؤلل.


إحالة : المحورية أو التحويل

إن نمط المحور يتشكل من وحدتين نمطيتين : التحليل الذي ينتج عنة تصوير/ تمثيل للنص الأصلي في لغة جديدة مستقلة ونمط توليد يترجم هذه اللغة الجديدة إلى لغة الهدف, والعملية الوسطية تهتم بالمفاهيم المجردة والعلاقات بينها وليس بالتركيب الجملي وقد تحمل معلومات خالسانية. ففي نمط المحور يتجاوز التصوير حدود الجملة إلى النص حاملا معه معطيات خطابية وذلك يستحيل قي نمط التحويل الذي يتعامل مع كل جملة على حدا
ومنه يمكن أن نتخيل أن النمط المحوري أقرب إلى معنى النص وإن ابتعد عن هيكلة النص الأصلي. ومع يضل نمط التحويل أسهل لأنه في آخر المطاف يكتفي بالجانب اللساني من عملية الترجمة.

أن كل برامج الترجمة المؤللة تهدف في ما تهدف إلى مساعدة المترجم في :
الترجمة في للشركات الكبرى تتبعا لسوقها العابر للحدود من أجل محو هذه الحدود.
خدمة للتجسس الصناعي والتتبع التقاني, لتتبع واستباق ما قد يبدعه الخصم من جديد في حرب تنافسية.
من أسلحة الحرب باردة أو حامية.
هذه أبرز المشجعات على تطوير برامج الترجمة المؤللة وإن تم إدخال نتائج التطوير في مجالات أهلية وإلى استعمالات شخصية أو سلمية.
والملاحظ هو أن البلدان ذات التعدد اللغوي المؤسس هي التي تبنت وأنتجت أحسن البرامج.

سيستران حفريات تاريخية.
SYSTRAN

حفريات تاريخية
في الخمسينات وفي جو الحرب الباردة بدأت الولايات المتحدة تتخوف من التطور التقاني السوفياتي. وتخيل الأمريكان أنه لو تمت ترجمت خيرة الوثائق العلمية الروسية لتمكن خبراء الغرب من استباق تقدم الروس وتحديد قدراتهم.
وكان مصب همهم هو كل ما تعلق واقترب من القدرات والتقنيات العسكرية من وثائق بما فيها البحوث الروسية النووية والفضائية.
ولأن ترجمة بشرية لكم هائل من الوثائق و بالسرعة المطلوبة لم يكن ممكنا فقد انصب التفكير على آلية وآلة مترجمة.
وفي خضم الصراع على السبق الفضائي لم تعد ترجمة الوثائق الروسية قضية علمية فحسب بل مسألة مصير وبالتالي سياسية. ذلك أن الروس أطلقوا في الرابع من تشرين 1957 صاروخ سبوتنيك نحو الفضاء, ودار الملاح الروسي يوري جاجرين حول الكرة الأرضية في الثاني عشر من نيسان 1961. وبمجرد وصول الرئيس الأمريكي كيندي إلى البيت الأبيض طالب ببدل الجهد لمحو العار الذي لحق بالولايات المتحدة.
وتزامن ذلك مع تطور الحاسبات الآلية وتطور الإليكترونيات ودخولها ميدان الحسابات العلمية المتخصصة. و بدأ البعض يفكر في ربط معالجة اللغويات مع التحليل بالمقدرات الإليكترونية.
وفي 30حزيران1966 نزلت مركبة أمريكية على القمر و تم إطلاق أول قمر صناعي, أبولو 8 , أمريكي آهل حول القمر في 1968 , ووطأت قدم أمريكية سطح القمر في الواحد والعشرين من حزيران 1969.
وإن لم يكن لتأليل اللغويات والترجمة دور في ذلك فإن المرحلة صبغت بطابعها الدراسات في الميدان ومنحت للبحوث في الترجمة الآلية نفسا قويا. وخصصت الحكومة والشركات الكبرى مبالغ ضخمة للتجارب في الترجمة الآلية.
وكانت جامعة جورج تاون بواشنطن أولى الجامعات التي دخلت الميدان حيث بدأ طاقمها في اللسانيات قبل المهندسين بترميز المعارف اللسانية.
وأعطت تلك المجهودات : منظومات ترجمة روسية/إنجليزية مثل مارك1 ومارك 2 لـ إ.ب. م. التي وجهت للاستعمال في سلاح الجو الأمريكي وكذلك نظام جورج تاون الذي دخل الخدمة بمركز لجنة الطاقة الذرية ومركز الأبحاث الذري.
وكان للمهندس من أصل بلغاري بيتر توما دورا متميزا في مجال معالجة اللغة آليا, حيث اقتنع بضرورة التواصل من وإلى الروسية بحكم عمله كضابط اتصال خلال الحرب.
وبدأ بيتر توما في 1956 بتطوير فكرته وتطبيق معارفه عن اللغات في هندسة تقانة الحواسيب. هادفا ابتكار برنامج عملي للترجمة الآلية. عارضا عن اللسانيين فهو لم يتخيلهم أبدا بقادرين على حل المعضلة وحسب رأيه ـ وهي مدرسة في معالجة اللغات آليا ـ فإن على معالجة اللغات أن تنقاد للحاسوب وليس العكس.
وابتكر توما في معهد كاليفورنيا للتقنيات, في الستينات نظام أوتوتران autotran وبعدها تكنوتران technotran وأخيرا سيستران العامل على إ.ب.م. 360 في سنوات64- 1963 .
ولما ظهر أن البحوث في مجال تأليل اللغات لا يعطي النتائج المرتقبة أصدرت لجنة مراقبة تأليل اللغات في 1967 تقريرا منتقدا مطالبا بتقليص الاعتمادات المالية في الميدان ورغم أن التقرير لم يطالب بإلغائها فقد أثر التقليص على الكثير من برامج البحث.
إلا أن توما وكعادته فسر خلفيات التقرير بأنها راجعة لتقوقع أصحاب نظريات غير عملية وتطبيقية.
ونجح في نقل مشاريعه إلى شركة ألمانية والتي أخرجت في 1968 برنامجا عاملا على إ.ب.م. 3460-50.
بعدها مباشرة اعترفت مديرية التقانات الأجنبية في سلاح الجو الأمريكي بتميز منظومة سيستران على باقي الأنظمة واشترت أول نظام ترجمي منه في 1969 , . ومنذ ذلك الوقت ونظام سيستران يتطور بنجاح وفي 1973 دخل الخدمة في وكالة الفضاء الأمريكية في مشروع اتصالات سيوز-أبولو ومولت الوكالة برنامج ترجمة روسية إنجليزية. [ عد لما قلناه بخصوص الأزواج اللغوية].
وتوجه البحث في اتجاه الإنجليزية الفرنسية عام 1974 بتشجيع من مكتب الترجمات الرسمية بكندا وشركات فورد وجينرال موتورز.
و الجدير بالذكر أن البرامج الأولى المقتناة كانت بهدف التجسس العسكري.

حفريات منهجية

وصولا لهذه الفترة من تاريخ الترجمة الآلية نلاحظ:
أن كل البرامج كانت ثنائية اللغة ولم تظهر فكرة لغة محورية تدور حولها عدة لغات إلا لاحقا.
البرامج المعروضة هي برامج عملية وليست ذات تعمق نظري لساني موجهة لأهداف محصورة ومحددة فاعلة مما يغضب أصحاب التنظير الذين لا يرون في برامج سيستران إلا كشكولا ومن هذه الناحية يمكن اعتبار سيستران نقيضا على صعيد منهج العمل لأرورترا, مثلا , وغيره من البرامج التي تأخذ بعين الاعتبار مسألة تحديد مسبق لمواصفات اللغات بهدف الوصول لتحديد لغة محورية تكون قاعدة للترجمة. ومع هذه الانتقادات تبقى منظومة سيستران أكثر البرامج فعالية وإنتاجية في ميدان الترجمة الآلية.


حفريات
لم يكل بيتر توما من العمل وفتح الأسواق الجديدة, إذ أنه توجه للمنظومة الأوروبية عارضا عليها برامجه ومنهجيته. وتزامن ذلك مع دخول برنامج أورونيت euronet ميدان الخدمة في المديرية الثالثة عشرة في المنظومة الأوروبية ...... وهو برنامج يهدف إلى توحيد وسيلة استجواب قواعد المعلومات الوثائقية في عموم أوروبا ولذلك طورت المخازن متعددة اللغات. ولرفع المردودية فقد توجه التفكير إلى الترجمة الآلية.
واعتمدت المديرية برنامجي سيستران وتيتوس في 1976.
فالأول هو البرنامج الوحيد الذي يتعامل مع النصوص كاملة للترجمة من الإنجليزية إلى الفرنسية ويتوافق مع تجهيزات المديرية الحاسوبية. وقد يمكن من ترجمة كاملة لقاعدة معلومات وثائقية تهم المنظومة عامة, من الإنجليزية إلى الفرنسية وربما من الفرنسية إلى الإنجليزية لاحقا.
وتيتوس برنامج ذي تراكيب مختزلة عامل بين الإنجليزية والفرنسية والألمانية والإسبانية [عد للتعريفات] وخممت المديرية في توسيع تركيبه ولأسباب زمنية تخلت عن هذا البرنامج ليبقي سيستران البرنامج الوحيد المطلوب تطويره . وهكذا انطلقت مرحلة إعداد معاجم لترجمة ملخصات قاعدة علم التغذية والتقانة وهي قاعدة مرتبطة بأورونيت, و حقق البرنامج تطورا في ترجمة زوج اللغة إنجليزية/ فرنسية وبدأ تطوير أزواج أخرى.
ومع ذلك فلم يصبح برنامج سيستران عام التوظيف في المجموعة الأوروبية إلا في بداية الثمانينات.

يستعمل حاليا نظام سيستران في لجنة المجموعة الأوروبية وسلاح الجو الأمريكي وكبريات الشركات الدولية وغيرها من المواقع.
وحيث أن كل مجال وكل موقع له حاجته المختصة من المعجم فذلك يعني أن معاجم المنظومة الترجمية في تطور لأن كل مجال يتطلب تطوير معجم خاص, وأن آليات الوصول إليها يجب أن تتحسن لتدخل برامج المنظومة حيز الحواسيب الشخصية ومنصات العمل الترجمي الشخصية مع ما يعني ذلك من سعة الانتشار والاستعمال.
أما في ما يتعلق بالمنصات الكبرى ذات المراكز الحاسوبية الضخمة, فلا منافس لسيستران إطلاقا من حيث : سهولة الوصول إلى الهدف و إمكانية التجديد والتحيين والشمولية وهي ميزات مهمة لكل برنامج حاسوبي ويعزى هذا السبق لأقدمية تجربة المنظومة
المنهجية
أولى القائمون على مشروع سيستران منذ البداية أهمية لتعدد استعمالات المنظومة وتوافقها مع مختلف الحالات ولم يحصروا اهتمامهم في مجال عملي ضيق. وكان الهدف منذ البداية حسب بيتر توما اختزال عملية التأليل الترجمي إلى ما يمكنه منطق الرياضيات والمعلوميات من سبل.
ولم يضيق القائمون على المشروع على أنفسهم بقواعد نحوية محددة قاهرة. وحسب البعض من معارضي المشروع فإنه يستحيل الحصول على نتائج صحيحة في برنامج يعدم مثل تلك القواعد النحوية.
ثم أن توسيع المجال يمكن من الاستعمال في كل الحالات لنفس البرنامج الترجمي : محاضر اجتماعات ووثائق تقنية والبيانات التقنية... وطبعا ذلك يعني وقتا زائدا لاختيار الترجمة الموافقة لكل حالة على حدا من بين العديد من الترجمات المطروحة.
وبتلخيص شديد فإن منهجية المنظومة جمعت بين السطحية والعملية والفعالية. أليست العبرة بالنتيجة لا في ما يسبقها من كلام وتنظير؟.
والفرق بين المنهجيتين, ولنا عودة بتوسيع أكثر لهذه النقطة, يتلخص في موقف ينطلق من العملي وشروط ومتطلبات التقانة والمنطق الرياضي و منطلق يولي أسبقية لتصور نظري لساني شامل قبل الجانب التقاني وهذا لا يعني انعدام أرضية منطقية في هذا التصور كما سنرى فيما بعد.
والقضية, بتعبير أوضح مع شيء من الغلو, هي من يقهر أو ينصهر للآخر الإلكترونيات أم اللغويات؟


مكونات النظام
النظام الأساسي يتحكم ويدعم المكونات الأخرى. وكتب بلغات المجمع 360 و لغة س. تفوق قواعده المائة ألف غامضة. ويحوي بعض البرامج موحدة لكل الأزواج تجمع في:
برامج توسيط وتناول للنصوص
برامج تسيير وتحيين المعاجم
برامج خلق وصول إلى معاجم الترجمة
برامج مراقبة الترجمة والتأكد من المعجم
مكونات مختلفة
برامج الاستعمال الروتينية.
ووحدات الوصول إلى المعجم هي مكونات أساسية للبرنامج ولا تحتاج لنظام قاعدة معلومات مستقلة تستند إليها.
وهذا يعني أن المنظومة يمكن تثبيتها مباشرة على الحاسوب وخاصة إذا توافق مع منظمة ما بعد إ.ب.م. 360 وما بعدها, بدون حاجة إلى برامج توسيطية أخرى. ويصعب نقله إلى منصة عمل عاملة تحت مستغل يونكس أو دوس.
وأظهر النظام الأساسي صلابة ومسايرة ولم يحتاج طوال فترة استغلاله إلى تحسينات مهمة مسجلا قلة العطب مما يسند منهجه و مقولة حاجة الترجمة الآلية إلى الرضوح لمتطلبات المعلوميات الضيقة .

البرامج اللسانية,
ورغم أن البرامج اللسانية, أي جانب تحليل اللغة, في المنظومة كتبت بنفس اللغات البرمجية كبقية النظام, إلا أنها أكثر سهولة وتلائما من السابقة, وحيث أنها في أغلبها كتبت خصيصا لسيستران فإن لها ميزات تفوق بها لغات البرمجة العامة بتضمنها لأوامر برمجية موجهة خصيصا للترجمة مثل :
Cw= كلمة مستعملة , SKCAT = لصنف الدلالات وغيرها مما يجعل النظام في متناول المستعملين غير البرمجيين ويتطلب تشغيله دراية دنيا بأدغال البرمجيات.
ويتم الرجوع إلى البرامج اللسانية تراتبيا وتحلل لغة المنبع باستقلالية عن لغة الهدف بخطوات منها :
حل مشكل المتشابه النحوي, تحليل حدود الملفوظ, أعداد مختلف مستويات الترابط التركيبي.
واختزل برنامج التحويل إلى المعجمية الروتينية وتحل في هذا المستوى إشكاليات ثنائية اللغة والتراكيب والبنيات المعقدة. وعلى مستوى لغة الهدف تحل مسائل الصرف والتركيب وترتيب الكلمات.
وعكس ما قد نتخيل فإن هذه المسيرة معقدة.
المعاجم
سنعود لمسألة المعاجم في توسع خاص بالمعجمية الحاسوبية. ونحتفظ هنا بتقدم بعض خاصيات معاجم منظومة سيستران تقريبا للمعنى.

ميزة معاجم سيستران
السعة أي كير المعجم,
الوظيفية والعملية فلا يكفي أن يكون العجم واسعا كبيرا لكي يكون صالحا وسهلا ومفيدا في الاستعمال.
الشمولية ويقصد بها شمولية المجال المراد .
ومعاجم سيستران ذات مداخل إما على شكل كلمة وحيدة أو كلمات متعدد حين تتعدد الدلالات أو تتنوع السياقات .
وتحوي معاجم لغة المنبع معلومات صرفية ونحوية وتركيبية ودلالية وقسم الكلمة إذا كانت مشكلة.
والمداخل المتعددة تشمل تعابير لمختلف الأصناف وتقعيدا للسياق تتعلق بالترابط وخصائص كلمة أو كل كلمات العبارة.
وفي لغة الهدف فالمعنى المعطى لكل حالة يبدأ من المقابل العام لكلمة إلى الترجمات الخاصة الإلزامية لعبارة في سياق سابق التحديد أخذا بعين الاعتبار الملفوظ والظرف والمجال. وبتحديد المجال والسياق يمكن أن نمنح إلزاما, كصنف خاص, للتعبرة والكلمة مقابلا محددا يعوض المعنى العام والمقابل العام في كل المعجم إذا حددنا المجال في أوامر و طلبات الترجمة.

إحالة
قد يتساءل البعض عن جدوى النعوت التي تتابع في كتابتي حول المنظومة.
تلك الكلمات وما يتبعها من نعوت هي من صلب المصطلح وضرورة للدقة.
وفي حديثي عن الترجمة المؤللة تعترضني دائما مشكلة المقابل العربي. وقد اخترت كعادتي وكموقف شمولية التعريب فاستعملت ما هو معروف ومشهور, طبعا نعدم معجما موحدا, وابتكرت في الكثير من الحالات بما يساير المضمون والمجال.
وعلى سبيل التنكيت حضرت عرضا في اللسانيات قدمه أستاذ كبير من القاهرة فإذا هو يسمعنا كلمات البراجمتيك, والسيمانتك, والهيد ينطقها بفخامة وفي اللقاء الجانبي اكتشفت أن صاحبنا لم يؤتى من العلم شيئا في المجال وأن علمه بالــ hpsg و tag لا يزيد عن نطقه بها أعجمية ثقيلة. فكان بحق نعم الأستاذ الدكتور المفرخ.
ولمن يجد صعوبة في التتبع لا يزعج طرحه سؤالا, وقد يجد الجواب طي التعريفات العديدة التي أقدمها.
إحالة
كلمة الغموض بل مصطلح الغموض وقد وردت هنا كثيرا.
من هو المترجم الذي لم يتصارع مع الغموض في ترجماته.
وأصعب ما تتعرض له الترجمة الآلية والمؤللة قضية الغموض. وهو أنواع عديدة.
فهناك غموض المشترك اللفظي والأضداد كما يقول النحاة العرب وهي مسألة تحل بالمعاجم وبالمكانز السياقية.
وهناك غموض كتابي, أو المشترك الكتابي في اللغات الغربية.
والغموض الشكلي في الكتابة العربية الخالية من الحركات. فحين نكتب مثلا دخل الدولة السنة الماضية لا نعرف إلا بالسياق ما المقصود هل فعل الدخول أم المصدر.
وقد نعطي مثلا آخر: ضرب مصطفى موسى ولو لم تكن هناك قاعدة أسبقية الفاعل على المفعول في هذا النوع من الجمل لتعذر علينا معرفة من الضارب والمضروب. وطبعا فالترتيب يحل الكثير من الغموض والترتيب غير عام في اللغة العربية كما نعرف وحتى في اللغات الهندية الأوروبية ذات الترتيب المحدد تجد مع ذلك جملا غامضة.
وحيث أن نحاة العرب تكثر من فعل الضرب في أمثلتها لو كتبت سيرا على خطاهم: ضرب النساء واجب أو مذلة, لفهم أغلب قراء الجملة أنني أقصد ما ورد في القرآن الكريم في شأن بعض الزيجات. ولو قلت لهم أن فاعل الضرب هو النسوة لوجدتَ القراء بعد تردد قد ولجت باب الحديث عن طغيان النسوة في هذا الزمن الرديء. هذا الصنف من الجمل يعد غامضا. ولا يفهم إلا بالسياق أو بالذاكرة الثقافية والاجتماعية للفرد. وهي ذاكرة غربالة ومتغيرة وآنية مضطربة يتحكم فيها الظرف والمحيط.
وتختلف عن ذلك ذاكرة الحاسوب فهي مرتبة ممنهجة خارج المجتمع تتعامل بسيل من الأوامر المحددة وليست قط قضية بلادة الآلة أو تفوق البشر.
المسألة بطريقة أخرى كيف نكتب ونصيغ أوامر برمجية منطقية حاسوبية تحت محدد الرياضيات الحازم ليفهم الحاسوب المقصود. وهذا هو صلب مجال التأليل.
ويفسر ذلك في كثير من الحالات كيف تجيب برامج الترجمة المؤللة بطريقة غريبة على مسائل نعتبرها كبشر سهلة يسيرة.


قال الجاحظ : البياض كتابة

فتحت الحوسبة اللغوية أبوابا في النحو لم تكن معروفة.
وكان لمنطق الحوسبة الصارم دورا في إبراز ظواهر لغوية على الأقل في اللغات الغربية لم تكن في حساب النحو التقليدي. وظهر أن جداول وتصنيفات النحاة لا تشمل كل جوانب اللغة والكلام.
النحو التقليدي وصفي في هدفه يصف الكلمة ودورها ومكانتها في الجمل ويمنحها سمات العدد والجنس ومحلها من الأعراب والزمن وترتيب الفعل والفاعل والمفعول. هذا إذا كانت الكلمة واضحة لا تطرح مشكلة غموض وضبابية. وقد يزيد النحاة تفصيلأ وتحديدا لوصف اللغة, فنحن نقول مثلا في العربية [مع مصدر الأكل] أكل الخبز بجر ونصب الخبز معا ونقول مرة أنه مفعول وقام المصدر مقام الفعل ومرة مضافا على اعتبار أن المصدر فقد فعليته وأصبح اسما [وهي ظاهرة واسعة الانتشار في اللغات الأوروبية وتفرد لها أبواب في نحوها], ولك في كتب النحاة العرب من هذه الأعاجيب والحالات ما يخفف عنك وقع الشمس في الظهيرة يكفيك أن تفتح باب المنادى لتسافر عبر حالات واستثناءات طويلة ساعات وأيام طوال.
وهذا الجانب الوصفي لا يكفي في حوسبة اللغة.
تعد ما نسميه بمسألة التنازع النحوي والمشترك من أعقد القضايا في معالجة اللغات آليا.
وتعتبر اللغة الإنجليزية من أكثر اللغات إشكالا من هذه الناحية عكس ما قد نتخيل سلفا وأظهرت بعض المعطيات أن ما يقارب الخمسين بالمائة من كلمات جملها النمطية مشكلة متنازعة.
وتحل المعضلة بالرجوع إلى السياق وتحديد السياق ليس من السهولة كما قد نتخيل ويتطلب ذلك برمجة ضخمة وثقيلة. وهناك طريقتان لحل ولتحديد السياق : إما خطية أي أننا نقلص غموض الكلمة بمعلومات مستمدة من سابقها في الجملة ونستعمل الحاصل لمحو غموض ما يتبعها وهكذا دواليك إلى نهاية الجملة والطريقة الثانية انتقائية : نهتم بالسهل أولا ثم نرجع لما هو أعقد. وكل ذلك يتم بتطبيق نظرية تقاطع المجموعات أو نظرية المحتمل المشروط.
ولتقريب المعنى نورد بعض الأمثلة والقضية تحتاج إلى أكثر من أسطر.
نقول : جاء المطر وحين يقرأ برنامجي هذه السلسلة يبدأ بالكلمة الأولى وانطلاقا من معجمه يحدد أنها فعل غير متعد لا تنازع فيه ومن حلوله الممكنة أنه قد يعتبرها جملة قائمة من فعل وفاعل محذوف وينتظر أن يكون تابعها إما جملة جديدة أو حشوا أو فاعلا أو صفة , علما أن معجمه يأخذ بعين الاعتبار كون المطر اسما لأنه معرف. وقد تعرف البرنامج على الفعل بسهولة لأن الفعل هنا ينتمي إلى مجموعة محددة العناصر لا تسمح بالتنازع فيها. كما لا يتنازع اثنان في تحديد تالي حرف جر أ اسم أم فعل هو.

وقد يجد البرنامج عقدة في تحديد : أكل الرجل الأسد, فسلسلة أكل قد تكون فعلا معلوما أو مجهولا أ أو مصدرا أو اسما والأسد فاعل أو مفعول أو بدل.... ومكره أخوك لا بطل وجائني أسدا ودخل القاضي امرأة وغيرها من عجائب الدنيا السبع في لغتنا الجملية مما يسعد أخانا الكريم الأستاذ الليثي في منتداه سهرا ومتعة ويسهر من جراها أهل البرجمة في شركة سيستران ليالي غم و سهاد.

وما يلي نوع آخر من معضلات الترجمة الآلية:

خذ : في نص ما السلسلة 2.5 هل هي عدد كسري أم رقم ترتيبي أم شيء آخر؟ المشكلة في النقطة.
وفي بعض النصوص نكتب بدل الأرقام الهندية أو المغربية حروفا وهكذا نجد: اب و دن وغيرها من عجائب الكائنات وطبعا حاسوبي البليد لا يميز بين دن الخمر وقرابة الأبوة و بين الرقم المكتوب بحروف أبجدية.
ولنعقد المسألة بعض الشيء فنحن نكتب : واحد من عشرين وواحد في المائة وخمسة على عشرة وصفر على الهامش أو اليدين.... ولا نلاحظ أنها جمل تتطلب توقفا. فما أتعس هذه الآلة التي لا تفقه ما يفقه صغار التلاميذ !!! من يقول هذا لم يرى أن هذه المتواليات الرمزية غامضة وتحاج لتوضيح وبرنامج روتيني ليفهم حاسوبي المترجم متى يتعلق الأمر بنقطة الفصل والنهاية ورقم كسري وترتيب فصول ومتى يكون دني رقما أو وعاءا و... متى يكون الواحد صفة للخالق الجبار أو رقما ... وهذه محددات لا تجدها في النحو الوصفي التقليدي.

وبدأت كلامي بذكر الجاحظ وبياضه
النص وأي نص هو توال سلاسل رمزية من بداية المقال مثلا إلى آخره. ولكن النص يحوي سلاسل خاصة كالعنوان وعناوين الفقرات ونصوص مدخلية وهو إخراج منسق ومشكل ومزع ومهيكل فيه فراغات ورجوع إلى السطر.... كل هذه المشكلات يجب أن تكون مضبوطة قابلة للبرمجة.

التنقيط :
دخلت علامات التنقيط إلى بلاد العرب في ما دخل من المورد ولازال هناك من يعتبرها بدعة حرام. ومن شاء أن يسهر ليال في إعداد أطروحة للدكتورة أوجهه لدراسة استعمالات علامات التنقيط في اللغة العربية الحالية وأظنه أنه سينتحر قبل انتهاء بحثه. ولنفتح أي منشور عربي سنجد أن الفواصل والنقط ونقط الفاصلة تسير بما سارت به ركبان الإبل العمياء. وليسوا الوحيدين وأنا أسأل ــ دفاعا عن عروبتنا ــ العارفين باللغات الغربية ما هي القواعد المحددة المضبوطة في استعمال علامات التنقيط؟ طبعا ليس المطلوب جواب مستمد من كتب المبتدئين !!!
يقال أن الجملة تنتهي بنقطة ولكننا نقول أيضا على ذمة نحاتنا الكبار أنها تنتهي بتمام معناها ومتى ينتهي المعنى يا سادة النحو ؟ بنهاية النص, طبعا, هذا إذا كان للنص معنى.
والحلول البرمجية التي قدمت لهذه المسألة في سيستران حلول استمدت من التجارب العملية ومن سياقات النصوص ونوعيتها.
وللحديث بقية في انتظار ذلك هل فكرتم لماذا نكتب في العربية : وجاء ثم جاء مرة بإلحاق حرف العطف ومرة بفصله وأنا متأكد أن صاحبنا, وأنتم تعرفون من أقصد ابن مدينة الضباب, سيثقلني بإحالات من كتب النحو والإملاء لتعليل ذلك ولن يفهم حاسوبي الساذج شيئا من ذلك لأنني سبقت ودربته على معرفة الفراغ فإذا الفراغ هنا يتحول شيئا آخر, فكيف تريدونه أن يتصاحب معه, أقول ذلك وأنا أعلم بوسائلي الخاصة أنه لا يفارق حاسوبه ليل نهار وقد هددته زوجته بالخلع على ذلك. معذرة ودمتم بخير.

إحالة
المصطلح والاصطلاح دائما
يستعمل في الكثير من النشريات العربية مصطلح البرنامج الداعم للعربية في الحديث عن برامج الترجمة المؤللة. وللتذكير فقد بدأنا في استعمال هذه التعبرة وقت الحديث عن البرامج الحاسوبية التي تمكن من الكتابة بالحرف العربي. وهي ترجمة حرفية للتعبرة اللاتينية. فيقال مثلا برنامج ويندوز داعم للعربية. وهذا ليس بمزعج . ويختلف الوضع حين الحديث عن الترجمة.
مفهوميا ماذا يعني الدعم في حالة الترجمة؟ وقد نفترض أن الأمر يتعلق ببرامج تساعد في الترجمة إلى العربية. ومن خلال تقص بسيط نفهم أن المقصود بالدعم هو المساعدة والترجمة الآلية في نفس الوقت. ولا أفهم لماذا لا نتحدث عن برنامج مساعد وبرنامج مترجم. زد لذلك أن أغلب البرامج المقصودة أبعد ما تكون عن برامج مساعدة هي أقرب ما تكون برامج شبه مساعدة !!!
فلا يكفي أن يكون البرنامج متضمنا لمعجم بسيط وبعض القواعد ليفي بالغرض. وأعلب تلك البرامج المعروضة بخصوص العربية لا تملك من الزاد ما يكفي للحديث عن برنامج آلي للترجمة فهي لا تتضمن في غالبها قواعد قياس ومعاجمها ليست بقواعد معطيات علاقية مثلا.
إحالة
قضية المعجم
ولنا عودة إليها بشكل مطول لا حقا.
المعجم الحاسوبي المؤلل معجم من نوع خاص, جمعت مواده بطريقة أنظمة قواعد المعطيات العلاقية وهي تختلف عن أبناك المعلومات في نسقها وهندستها. وتحوي الكثير من المعلومات التي لا توجد في معجم ورقي عادي. وإن معجما شاملا وناجعا كفيل برفع نتائج برنامج ترجمة. وللأسف فأغلب ما يستعمل في المجال العربي لا يف بأقل شروط هذه المعاجم.
قد أسجل لسان العرب بكامله في البرنامج دون أن أحصل على برنامج معجمي عملي. والدراسات العربية في المجال قليلة أو عديمة الجدية.

أزواج اللغة
كيف اختيرت أزواج اللغة في منظومة سيستران؟ وما هي الصعوبات التي تعرضت كل تأليف وزوج؟ وما هي التعقيدات التي قد تتعرض سيستران عند زيادة زوج جديد؟
قلنا بداية أن سيستران تعامل مع الروسية إلى الإنجليزية وبدخوله الخدمة داخل المنظومة الأوروبية توجب توسيع أزواج اللغات العاملة. ومن البداية ظهر أن أزواج الإنجليزية ــ الفرنسية أزواج أساسية. فأول برنامج قدمته سيستران للجنة الأوروبية, للإنجليزية/ الفرنسية, كان برنامجا لم يتم فحسب تجريبه بل وسع للعديد من المجالات والنصوص. وزوج اللغة الفرنسية الإنجليزية تحول بسرعة إلى برنامج عملي تام بعد أن كان قد برمج أولا للبرهنة على فعالية منهجية سيستران.
انطلاقا من قواعد وثائقية متواجدة مختلفة في سياقاتها ومعطياتها عن ما هو متداول في اللجنة تم تكوين معاجم.
وتم إدخال الزوج إنجليزية/ إيطالية للبرهنة على إمكانية دمج لغة هدف جديدة أخرى في نظام سيستران ونظرا لعدد الناطقين بالإيطالية في المجموعة الأوروبية, وحيث أن اللغة الإيطالية شبيه باللغة الفرنسية كلغات لاتينية فقد تمت عملية الدمج بيسر مع الاحتفاظ بمعجم لغة المنبع للاثنين. ولم يتم اختيار الألمانية حينذاك لأن اللجنة تخليت أن برامج أوروترا سوف تحل هذه المسألة ولما ظهر أن برامج أوروترا لن تكون عملية في القريب, طلب من شركة سيستران تطوير برنامجها الإنجليزي الفرنسي وطلب من شركة توما تطوير برنامج فرنسي ألماني.
طرحت اللغة الألمانية الكثير من المعضلات نظرا لاختلافها من حيث ترتيب الكلمات في الجمل ونحوها وقواعد تركيبها, ولم تكن النتائج في مستوى الأزواج السابقة حتى بعد سنوات من العمل والتطوير.
وطلبت اللجنة الأوروبية تطوير الأزواج : الفرنسية الهولندية والإنجليزية الهولندية. علما أن سيستران لم تكن سبق لها وأن تعاملت بأي شكل مع هذه اللغة.. وقد أعطت العملية نتائج أحسن من نتائج جانب الألمانية.
كل هذا التوسع جرى وسط تجاهل شبه مطلق من المترجين داخل اللجنة لقضية الترجمة الآلية ــ ويلاحظ قلة المترجمين الذين شاركوا في عملية التطوير ــ وهو موقف لازال قائما لحد الساعة بين المترجمين الذين لا يرون في المترجم الآلي إلا مضيعة وقت أو منافسا خطيرا على لقمة عيشهم وربما فسر التجاهل وعدم التحمس لما هو آلي بكون الكثير في عالم الترجمة هم ممن يتخيلون الترجمة فنا ووحيا لا مجال فيه للبرمجة الآلية وقد برهنت السنوات التالية على جهلهم و غلطهم كما سنرى فيما بعد.
بتوسع حدود السوق الأوروبية إلى دول أخرى فقد تم دمج أزواج إنجليزية/أسبانية وإنجليزية /برتغالية لاستعمالات محصورة. ومن ترجمة بعض المتعاملين مع برامج سيستران داخل اللجنة الأوروبية وسعادتهم بنتائج الترجمة بين لغات مختلفة فقد شجعوا العمل على دمج أزواج لغات متقاربة كالفرنسية والإيطالية. وبالفعل فلم يتطلب هذا البرنامج وقتا طويلا ليصبح فعالا وتجاوز في نتائجه باقي أزواج اللغات وأعطى البرنامج في مجالات ولبعض النصوص نتائج تقارب نتائج الترجمة البشرية.
وتم دمج زوج إنجليزية / يونانية لا حقا.
ومن جانب اللغة الأسبانية فقد تم الاستفادة من برنامج الإسبانية/ الإنجليزية, ــ الذي كان قيد التجريب في سلاح الجو الأمريكي كما قلت عاليه ــ, وتوجه التفكير نحو تطوير أزواج الفرنسية/ الإسبانية مع الاستفادة من تجربة الإيطالية.
وبهذا نكون قد وصلنا في متابعتنا لاستعمال برنامج سيستران في اللجنة الأوروبية تاريخيا إلى 1990. وبذلك تنتهي الحفريات وندخل مرحلة مختلفة من تاريخ سيستران نفصل لها حيزا خاصا.
وأول ما يمكن أن نقول عن هذه الفترة السابقة أنها قصيرة 20 سنة !!! وما أشبه الليلة بالبارحة. أقول ذلك ثلاثا لأن الكثيرين من التراجمة أو أنصافهم يتجاهلون هذه الحقيقة البسيطة, وأن عجلة التاريخ تسير, كره من كره. وان ما حققه التأليل في هذه الفترة الزمنية القصيرة خيالي. زد لذلك أن عدد المبرمجين والعاملين في كل زوج لغة قليل وتحسب الفترات الزمنية ب سنة/شخص العمل على أصابع اليد الواحدة.
وأتذكر في بداية دراستي كيف كنا نتمنى وجود برنامج داعم للكتابة العربية, وكانت أول البرامج المعروضة علينا تعد ثورة وكانت لا تمكن إلا من القليل وأتذكر كيف كان يجيبني أحد الأساتذة كلما رأى ما أنقره : ’’لا تضيع وقتك في اللعب على ذلك التلفاز !!‘‘
أستاذي الكبير كان يعتبر كل ما خرج عن التقليد بدعة وأن ’’التلفاز‘‘ ما وجد إلا لفرجة الأشرار وأخال أنه لازال حاله.

أخي الفاضل العبيدي, جارنا سكنا ومجاورنا هما,
أشكرك على مداخلتك الوجيهة, ويتجلى من خلالها أنك ملم بخفايا المسألة. وكما تعلم فمن الناحية المنهجية فكل قضية وكل مسألة عندما تطرح بجلاء وتحدد في مراميها وتحصر أسسها تعتبر شبه محلولة أي أنه من الممكن وجود جواب لها. وبالعكس فإذا خلطنا المنطلقات والمنهجيات كما يفعل بعض أصحابنا جهلا وتطاولا على ميدان معطاء آنذاك لن تحصل على حريرة ولا هريسة بل خليطا غريبا.
وعاليه طرحت قضية البرنامج الداعم للعربية في الترجمة !!! وكما لا يخفى عليك فشعر رأسي ينتصب غضبا وغيرة حين أسمع كلاما عير مضبوط وتغذوا المسألة ليس وجود برنامج داعم للعربية بل شخص داعم للعربية.
ومرحبا بك على حريرة حقيقية ولحم بهريسة.
ودمت عزا


أخي الفاضل العبيدي, جارنا سكنا ومجاورنا هما,
أشكرك على مداخلتك الوجيهة, ويتجلى من خلالها أنك ملم بخفايا المسألة. وكما تعلم فمن الناحية المنهجية فكل قضية وكل مسألة عندما تطرح بجلاء وتحدد في مراميها وتحصر أسسها تعتبر شبه محلولة أي أنه من الممكن وجود جواب لها. وبالعكس فإذا خلطنا المنطلقات والمنهجيات كما يفعل بعض أصحابنا جهلا وتطاولا على ميدان معطاء آنذاك لن تحصل على حريرة ولا هريسة بل خليطا غريبا.
وعاليه طرحت قضية البرنامج الداعم للعربية في الترجمة !!! وكما لا يخفى عليك فشعر رأسي ينتصب غضبا وغيرة حين أسمع كلاما عير مضبوط وتغذوا المسألة ليس وجود برنامج داعم للعربية بل شخص داعم للعربية.
ومرحبا بك على حريرة حقيقية ولحم بهريسة.
ودمت عزا

حصيلة النتائج
إن كل برنامج لا يمكنه أن يتجاوز نقاط ضعفه إذا لم يقيم ويقوم.
فتقييم النجاحات إذا كان موضوعيا يقدم حلولا توجيهية وسوقية. ونظام سيستران لم يخرج عن القاعدة واستفاد من انتقادات ورد فعل المترجمين في تحسيناته وإصداراته التالية. وقد انصب التقييم في البداية على دراسة عدد الأخطاء وصنفها وفعالية الإخراج ووضوح النص الحاصل قراءة ومعنى.
ومن خلال هذا التقييم يتم وضع خطط سوقية إما لتحسين البرنامج داخليا [فترة ما بين 75-] و إما لتوسيع استعمالاته إلى مجالات أخرى . ونظرا لانتقادات بعض المترجمين لجدية التقييم من حيث شروطها ولتمكين غير المختصين في البرمجة من متابعة التقويم فقد طور برنامج خاص أقليديس يمكن من ترجمة لغة البرمجة الخاصة بسيستران إلى اللغة الطبيعية ليتمكن المنتقدون من غير المختصين بفهم هيكلة أوامر النظام مما خفف من حدة النقد وبرهن على تعقيد أوامر البرنامج .
و نتائج المتابعة الإحصائية في كارلسلو لــوضوح الفهم و أخطاء النقر وأخطاء الكلمات والمصطلحات والأخطاء النحوية و التركيب .... أوضحت أن نسبة الغلط في الترجمة الخامة انحصرت من ثلاثمائة إلى40 غلطا تقريبا بينما ارتفعت نسبة وضوح الفهم لتقارب نتائج الانتخابات العربية مما أدى في بعض المواقع إلى اعتماد الترجمة الخامة دون التدقيق النهائي.
موقف المترجمين من النظام
رغم أن لجنة الترجمة في المنظومة الأوروبية طلبت من مترجمين مهنيين تقييم البرنامج وتحديد مجالات استعمالاته الفعالة ورغم أن النتائج كانت مقبولة في الكثير من المجالات إلا أن غالبية المترجمين بقيت على هواها ونتيجة هذا التقييم قرر استعمال سيستران لترجمة دقائق اجتماعات رؤساء المديريات..
وقد طالب تقرير في 1990 بضرورة صياغة سيستران بلغة برمجة متطورة واستعمال قاعدة معلومات علاقية لتسيير المعجم وتقريبه من المستعمل.

أفتح قوسا جديدا إجابة على تدخل فخر الخضراء أعلاه,
مرة أخرى أؤكد على انعدام برنامج مترجم كامل الفعالية وناجح لعدة أسباب. وأننا حين نتحدث عن الترجمة الآلية يجب أن نضيف الحيز والمجال والنوعية فبدون هذا التحديد فإننا سنخبط خبط عشواء. الترجمة الآلية تضاهي الترجمة البشرية بل تتجاوزها حينما يتعلق الأمر بترجمة تقنية محددة المجال محصورة معجما وتركيبا. ويختلف الأمر حين يتعلق بنصوص حرة أو شبه حرة.
أقول ذلك لأن الكثيرين من المترجمين لهم مشكلة ليس فحسب مع الحاسوب والترجمة الآلية بل مع اللغويات بحد ذاتها. وأنا أطرح عليك أخي عبيدي سؤالا استفزازيا إذا سمحت وأنا متأكد أن ذلك لن يزعجك بل على العكس :
كم عدد المترجمين الذين تعرفهم, يقرؤون النص وأي نص بنظرة علمية لسانية؟
وأتحدى أي واحد ممن يكتبون حول لغة الصحافة أن يقدم لي هيكلة متكاملة لهذه اللغة؟ لا أريد أن يكرر لي ما يقرأه التلاميذ في المدارس الابتدائية بهذا الخصوص.
حين نقرأ جريدة عربية وأي جريدة فإننا نواجه عدة مستويات لغوية, وطبعا القارئ المتوسط أو العالي قد يمر من نص جاهلي إلى خبر رياضي دون أن يفطن أنه يتعامل مع تراكيب متنوعة وقد يقول البعض بلغات متنوعة.
المترجم البشري نفسه قد يجد صعوبة في ترجمة نصوص لم يتعود عليها فكيف نطلب من آلة قريبة الحدث أن تترجم ما لا تفهمه ويعجز الإنسان ذاته عن فهمه. ولكي تفهم الآلة يجب أن نقدم لها أوامر صريحة وواضحة ومضبوطة. وإلا فإننا نكرر قصة البدوي الذي لم يفهم كيف أن مذياعه خبره بأخبار بعيدة ولم يخبره بموت بقرته في جواره.
أتوقف هنا لكي لا أرجم.
__________________
مهندس/ رائد حبش
mobile: 0021374323046 Algeria
رد مع اقتباس
  #2  
قديم 06-04-2006, 02:38 PM
الصورة الرمزية RaedHabash
RaedHabash RaedHabash غير متواجد حالياً
عضو رسمي
 
تاريخ التسجيل: May 2006
المشاركات: 279
افتراضي حول المعالجة الآلية للغات

amattouch



شاركت: 15 فبراير 2006
نشرات: 285

ارسل: الاحد فبراير 26, 2006 10:30 am موضوع الرسالة:

--------------------------------------------------------------------------------

مع المعالجة الآلية للغات الطبيعية
نبدأ هذه الجولة بعرض مبسط لبعض البرامج الحاسوبية الموجهة للتعامل مع اللغات الطبيعية. محيلين من شاء التوسع إلى ما كتبناه في مواضع أخرى بخصوص الموضوع.
برنامج توم TAUM
هو اسم مختزل للترجمة الآلية لجامعة مونريال . وكانت الحكومة الكندية في 1965 وراء المشروع . وكان المشروع في بدياته عاما للترجمة ولكن بعد سنوات العمل والبحث تخصص المشروع في متابعة أحوال الطقس كتطبيق أساسي ميداني للبرنامج. ولذلك أصبح اليوم معروفا باسم توم ــ طقس..
هذا البرنامج يترجم المعلومات الطقسية للحكومة الكندية منذ عام 1977 من الإنجليزية إلى الفرنسية ومنذ عام 1989 من الفرنسية إلى الإنجليزية. فالترجمات من الإنجليزية إلى الفرنسية فهي توجه لمناطق فانكوفر وإدمونتن وكالجري ورجينا وتورونتو وهاليفاكس أما الترجمة من الفرنسية إلى الإنجليزية فتهم منطقة مونريال. واليوم فإن كل التوقعات الطقسية الكندية أصبحت مترجمة.
البرنامج يعتمد على 2000 كلمة وتعبرة. ويترجم ساعة بعد ساعة كل التوقعات بمعدل 30000 ألف كلمة في اليوم.
وواقعيا توم ـ طقس هو نظام مستعمل منذ زمن وقد حاز على استحسان الجميع. وللتدقيق يجب التفريق بين استعمال عادي وشامل واستعمال الزبائن من حيث التخصص والتواتر.
ولأن البرنامج شديد التخصص والتميز فهو يحوي مصطلحات محصورة أي ذي معجم محدد وشامل للكلمات المراد ترجمتها وتركيبا جامدا يدور حول عدد قليل من التركيبات الجملية وهو ما يمنح تطابقا كاملا لكل تركيب وهيكلة تعبيرية متكررة, لدرجة أن المترجم الإنساني لن يصبر أمام ملل التكرار أكثر من أشهر. وقد خلت مصلحة الطقس الكندية مشكلتين : الملل البشري ومشكلة لغوية باختيارها وتطويرها لنظام توم ـ طقس.

Titusتيتوس

طور برنامج تيتوس في ظروف خاصة ولأهداف محددة.
وكان وراء ظهوره ذلك معهد النسيج الفرنسي. فقد تصور المعهد برنامج تيتوس لترجمة ملخصات المقالات التي تخص النسيج للمهندسين المتخصصين المحتاجين للمعلومات العلمية الجديدة.
يتعامل برنامج تيتوس مع أربع لغات عمل : الفرنسية والإنجليزية والألمانية والإسبانية وكل الأزواج اللغوية فعالة.
وكان من المفروض أن يكون المعجم الأساس صغيرا ولو أنه من غير سابق الحصر. والتركيب محصورا نسبيا والمقالات تساير في عمومها ضرورة الوضوح والبساطة والقصر. وبرمج تيتوس للعمل في إطار تركيب مراقب, وقد شهد عدة تغيرات وخاصة تنوع الجمل المقبولة. وعندما جرب العهد الفرنسي للأبحاث العلمية برنامج تيتوس لترجمة ملخصات المقالات العملية المنشورة ظهر أن محرري الملخصات لا يحترمون شروط الكتابة المرخصة في المعالجة الآلية. وطرح إشكال بشري هل يمكن فرض تركيب مراقب ملزم على المحرر؟ فضرورات المعالجة الآلية لم تغير من عادات التحرير. ويمكن استعمال البرنامج بموازاة بيانات سابقة الإعداد, وهذا يقلص إنتاجيته, فقد أعد تيتوس كبرنامج كامل الآلية. ويمكن استعماله كما هو إذا احترمت بعض الشروط : ترتيب العناصر في الجملة وزمن الأفعال المقبول والملحقات الممكنة. و شيئا فشيئا تحول إلى نظام تفاعلي مع إمكانية إصلاح على الشاشة للمشتركات اللفظية والكتابية.


Spanam /Engspan
برنامج يترجم من اللغة الإنجليزية إلى اللغة الإسبانية والعكس. وقد أعد خصيصا لمنظمة الصحة لعموم أمريكة في واشنطن التي تنشر وتصدر العديد من الوثائق الطبية الموجهة لأمريكا اللاتينية. وفي البداية أعد البرنامج الموجه نحو اللغة الإسبانية لخدمة مصالح الصحة في القرى النائية ولمقاربة أكبر عدد من الساكنة. وحاليا يستعمل زوجي اللغة بنجاح في مجالات الصحة والتغذية والفلاحة.
وإذا كانت بداية البحث حول البرنامج قد بدأت في جامعة جوج تاون فإنها طورت في منظمة الصحة لعموم أمريكة. وحيث أن المجال محصور ونوعية النصوص محددة فقد سار العمل بوتيرة سريعة. وأول الإصدارت نحو الإسبانية ظهرت في 1976 ودخلت مجال العمل في 1979 وجددت في 1988.... أما النسخة نحو الإنجليزية فهي قريبة العهد ودخلت مجال التطبيق في 1984. والبرنامج من شاكلة برامج سيستران : الترجمة الخامة تتطلب تصحيحا لتغدو النصوص مقبولة. وفي دراسة للانعكاسات ظهر أن المستعملين يحبذون الترجمة المصححة الآلية على الترجمة البشرية اليدوية.
وإنتاجية البرنامج تقارب 6500 كلمة/يوم للمترجم المصحح وهناك محاولات لإصدار يتعامل مع أزواج لغات أخرى.


Weidner
كان لجامعة بريغام دور مهم في تطوير العديد من برامج الترجمة الآلية وكان الهدف الأول منذ 1970 ترجمة النصوص المقدسة الخاصة بجماعة المرمون. وتابعت العمل شركة ويدنر منذ تأسيسها في 1977 بمشاركة كوادر الجامعة وحرج أول برنامج من الإنجليزية إلى الفرنسية في 1980. وتبع ذلك أزواج لغات أخرى من الإنجليزية إلى الإسبانية والألمانية والبرتغالية والإيطالية والعربية... ومن الفرنسية إلى الإنجليزية والإسبانية والألمانية إلى الإنجليزية و. ويمكن تشغيل هذه البرامج على حواسيب شخصية إلا البرامج الخاصة بالإنجليزية/العربية والألمانية/الإنجليزية.
وأكبر عائق لهذه البرامج هو صغر المعجم الذي يلائم دائما نوع النص المراد ترجمته وعلى المشغل إعداد معجم وهذا مكلف وضد إنتاجية البرنامج.
وإنتاجية البرنامج العملية : 4000-8000 كلمة/ساعة.
ويستعمل للترجمة في شركات دولية ومنها ماترا موتورولا طومسون بول أيروسباس بيركينس إنجين رانكس كسيروكس ...
واليوم تتوجه المجموعة المنتجة لتطوير برامج موجهة للسوق اليايانية.


Alps
بدايات ألبس كانت في جامعة برغام وقد تأسست الشركة في 1980.
ويمتاز برنامج ألبس بمستوياته الثلاثة لترجمة الألفاظ : الاختيار والذاتية والتفاعلية. وتحوي المستويات العليا المستويات الدنيا. والمستوي الأعلى تفاعلي أي أنه يقدم ترجمات جملة لجملة ويطرح أسئلة لمحو الغموض. وعموما يعد المستوى الثاني ـ الذاتية أكثر نفعا غير أن حلف الأطلسي و إحصائيات كندا تستعملان المستوى الثالث مستوى التفاعلية.
ومن اللغات العاملة في البرنامج : من الإنجليزية إلى الفرنسية والألمانية والإسبانية والإيطالية.
من الفرنسية إلى الإنجليزية.
من الألمانية إلى الإنجليزية.
ومن الشركات الكبرى التي تستعمل البرنامج: تكساس أنسترمنت , ونرس داتا, واتحاد المصارف السويسرية, ورانك كسيروكس, وهناك شركات ترجمة تستعمل هذا البرنامج ك أنترلونجوا وملتيسكربت...
ومن عيوب البرنامج المعجم الصغير ويجب أن تكون النصوص المعروضة للترجمة تقنية مكررة مكتوبة بلغة سهلة وبسيطة. ويتعامل البرنامج مع نصوص من 30000كلمة وأكثر من ذلك تتقلص الإنتاجية.
وللبرنامج إصدارات للتشغيل على الحواسيب الشخصية.

Logos
تعد برامج لوجوس منافسة لبرامج سيستران من حث جودة الترجمة رغم أن الأخير له معجم واسع ويتعامل بلغات عدة.
ولوجوس شركة أمريكية تطورت في الستينات. وخرجت أول برنامج الترجمة في 1971 خاص بالترجمة من الإنجليزية إلى اللغة الفتينامية متخصص بترجمة وثائق تتعلق بالتجهيزات العسكرية. وطورت لوجوس في الثمانينات برنامجا للترجمة الألمانية/الإنجليزية. وظهرت إصدارت لاحقا خاصة باللغات الفرنسية والإسبانية والإيطالية ولغات أخرى. وطورت شركة لوكوس برامج ترجمة ملحقة لنشر متعدد اللغات.
يمكن تشغيل بعض برامج لوكوس على حواسيب شخصية باستعمال واجهة يونكس.
ويستعمل في عدة شركات عالمية.

Smart/ Seppli
تستعمل وزارة الهجرة والعمل الكندية برامج سمارت لترجمة طلبات التشغيل ما بين الفرنسية والإنجليزية, وتنشر النتائج مباشرة على شاشات 4000 حاسوب موزع على مجموع التراب الكندي ويمكن للموظف تدقيقها آنيا وأغلب التدقيقات مع قلتها تمس التركيب ولا يتطلب البرنامج مراقبة التركيب المسبقة وذلك راج لقصر النصوص مما يجعل تراكيبها بسيطة وإن تنوع التحرير, ويستفيد البرنامج من تعدد المعطيات ويدمجها.
وتمكن برامج سمارت ترانسليتر من ترجمة خامة بسرعة 200000ك/س مع حواسيب مركزية.

وطورت جامعة جنيف نظام سيبلي وهو قريب من السابق للتعامل مع الألمانية/الفرنسية والألمانية/الإيطالية لنشر عروض العمل الصادرة في عاصمة الفيدرالية بيرن باللغات الفرنسية والألمانية والإيطالية والتي كانت ترجمتها بشرية. وزيادة على الجانب الاقتصادي في القضية فإن البرنامج يهدف إلى تشجيع الطلاب على التعامل مع المعالجة الآلية للغات الطبيعية.
تعريف 8

Socatra
وسوكترا اختزال لأسم : الشركة الترجمة الكندية. ونظامها المطروح يتعامل ما بين الفرنسية والإنجليزية. ولا يوجد في السوق وتتم الترجمة الخامة أو المحققة داخل مكاتب الشركة
وتقول الشركة أن الطاقة الإنتاجية لنظامها تصل إلى 200000ك/س على الأقل ومولد مسردي ب 500000ك/س وهي أرقام ضخمة.

Metal
ميتال هي اختزال لعبارة : الترجمة وتحليل اللغات, وكانت بدايات المشروع في جامعة تكساس في 1961 للترجمة من الألمانية إلى الإنجليزية. وتخلت الجامعة عن المشروع لصالح شركة سيمنس الألمانية التي عرضت في الثمانينات أوائل منتوجها للترجمة في ما بين العديد من اللغات –الفرنسية الهولندية الألمانية الإسبانيةـ وهي برامج ناجحة في مجال الاتصالات.
وميزة النظام أنه مركب من وحدات قابلة للتغيير مع مجموعة من القواعد النحوية المحددة يمكن الرجوع إليها كلما دعت الضرورة وقت التحليل وهكذا نحصل على عدة تمثيليات مقبولة للجملة وترفض أقل التمثيليات قبولا. ورغم أن نظام الوحدات المستقلة يسمح بالتطوير الدائم والتحسين إلا الزيادة المعجمية والبرمجية تؤدي إلى نتائج سلبية.

PC-translator
الحاسوب المترجم قد تجدونه في الأسواق على شكل حواسيب جيبية : وهو نظام يختلف عن باقي الأنظمة الأخرى. فشركة المنتوجات اللغوية تعرض بثمن بخس برامج ثنائية اللغة ـ من وإلى الإنجليزية : الفرنسية/ الدنماركية/السويدية/النرويجية/الإسبانية/الهولندية/الألمانية/الإيطالية....
والبرنامج ليس مؤللا بالمعنى الدقيق فهو يكتفي ببعض المواصفات اللسانية وبعض الوحدات اللغوية وقلة من القواعد التركيبية فهو أقرب إلى برنامج مساعد منه لبرنامج آلي أو مؤلل.

Gigatext
مثل مدرسي لما يجب الابتعاد عنه : خسارة ملايين الدولارات الكندية في برنامج يترجم النصوص القانونية ما بين الفرنسية والإنجليزية ولكن النتيجة صفر.

Winger
نحت شركة وينجر للنسيج منحى الترجمة الآلية من الإنجليزية إلى الدنماركية مستغلة قاعدة معلوماتها الضخمة. والبرنامج يعوض نقص الجانب التركيبي بالتفاعلية إذ أنه يمنح المستعمل عدة حلول يختار منها أحسنها. وهو أقرب إلى برنامج ألي مساعد للترجمة. وتعرض الشركة حاليا عدة برامج للترجمة بين اللغات الإنجليزية والإسبانية والروسية.

PaTrans


نظام للترجمة بين اللغتين الإنجليزية والدنماركية متخصص.


Tovna
برنامج إسرائيلي لم يخرج للسوق إلا في 1985 للغتين الفرنسية والإنجليزية والروسية. وميزته التقنية أنه يستفيد من تدقيقات الترجمات الخامة ويستغلها في ترجمات لاحقة.

Lexi-Tech
برنامج كندي موجه لخدمات عسكرية محددة وبداية بهدف ترجمة 100000 صفحة ذات علاقة مع الترسانة البحرية. ويحوي معجمها 75000 عبارة ولفظة مع برامج توسط بني خاصة بالشركة.

البرامج اليابانية
ولنا معها عودة خاصة
متابعة للسوق التجاري الدولي وللتطور العلمي والتقاني فقد واجهت الشركات اليابانية مشكلة الترجمة بين اليابانية والإنجليزية. ولذلك أصبحت الترجمة الآلية مع الجيل الخامس من الحواسيب من المهمات الأولية منذ 1980 وقامت الحكومة اليابانية بمجهود ضخم وشجعت الأبحاث في المجال وكان للأستاذ ماكوتو نجاو ـ مشروع حكومي ـ تأثير في توجيه الأبحاث نحو تحليل تركيبي شجري.
وهناك توجه كبير لتوسيع البرامج إلى لغات أسيوية أخرى كالصينية والكورية وغيرها من اللغات العالمية.
ومن الشركات اليابانية ذات الباع العالي في المجال
توشيبا, و فيجيتسو, و ميتشوبيشي وهيتاتشي....
وكل مشاريعها واعدة على مستويات الترجمة ومعالجة الصوت {ترجمة المكالمات الهاتفية آليا}.
ورغم أن إنتاجية الكثير من برامج الترجمة المعروضة وتتطلب تدقيقا مكلفا إلا أن اليابان يعد من أكثر البلدان توسعا في التجهيز والاستعمال ويعتبر أن المستقبل هو للترجمة الآلية فلا خيار لها نظرا لانعزال اللغة اليابانية وقلة العارفين بها عالميا والمترجمين منها وإليها.
مراكز علمية
الصين حاولت الصين الشعبية تطوير برنامج jet لترجمة إلى الصينية من اللغات الإنجليزية والفرنسية والألمانية والروسية. ولكن المشروع لم يعطي لحد الساعة نتائج
مجموعة الدول المستقلة
PARS
هو نظام للترجمة بين الروسية والإنجليزية يخص النصوص العلمية والاقتصادية. وهو يعتمد على نتائج جامعة جورج تاون للترجمة لغة إلى لغة.
SPRINT
خاص بمجالات الحاسوبيات والاقتصاد وهو إنجليزي روسي اللغة وعرضته مجموعة الترجمة لعموم روسيا.
ASPERA
هو من نوعية الأنظمة المعجمية روسي إنجليزي اللغة.
ETAP
نظام إنجليزي روسي اللغة خاص للنصوص الحاسوبية و للعلوم المعلوماتية.
ولبقية المراكز سنعود إليها في موضع آخر.

GETA
Ariane & Callipe

جامعة جرونبل الفرنسية ومركزها للدراسات والترجمة المؤللة الذي أداره بجدارة الأستاذ فوكوا لسنوات وقد اهتم مركزه بأوجه متعددة للمعالجة الآلية للغات. وكانت الترجمة من الروسية أحد مرتكزات العمل في المعهد.

Susy
بدأ مشروع سيزي في 1972 في جامعة شروبروك الألمانية للترجمة من الألمانية إلى الروسية. وتوجه الاهتمام نحو إضافة لغات أخرى الفرنسية والإنجليزية والدنماركية والهولندية وأولى المركز أهمية للغة الإسبرنتو. واستعمل البرنامج للفهرست الوثائقية وتحليل النصوص وإدماج المصطلحات الخارجية..
DLT
برنامج هولندي. تفاعلي متعدد اللغات يمن من توليد نصوص في إطار شبكة حواسيب. مع بنك معلومات معرفية بين اللغات . وتتم الترجمة عبر لغة توسطية هي لغة الإسبرنتو التي تستعمل للتواصل بين الحواسيب النهائية. فهو إذن موجه للتواصل أكثر من توجهه للترجمة رغم ما يزعم واضعوه.
Rosetta
أول برنامج من القطاع الخاص في أروبا. من شركة فيليبس. وقد نتجت عنه تجارب بين الإنجليزية والأسبانية والهولندية.
LMT
هو برنامج لشركة إبم المعروفة وهو برنامج ذي هدف متواضع ويتعامل مع اللغات : الفرنسية والإنجليزية والألمانية والدنماركية وغيرها. والمعجم والمسارد معروضة على الشاشة وعلى المستعمل التعرف على الترجمات المعروضة.
Pangloss
من عمل جامعتي المكسيك وكاليفورنيا الجنوبية وهو موجه لمنصة عمل المترجم.
ArchTran
من نتائج تايوان.
Systran

سيستران هي اختزال للعبارة الإنجليزية الترجمة الآلية, نظام أمريكي من تصور بيتر توما, اعتمدته وطورته لجنة المجموعة الأوروبية في أواخر السبعينات لمصالحها الترجمية وصدرته للأسواق. ورغم ما يعاب عليه من حيث المستوى الجمالي واللساني هو أكثر البرامج في الوقت الراهن عمليا وظيفية التي تساير متطلبات الترجمة الآلية ويمكن ترجمة صالحة مباشرة دون تدقيق وإن كانت النصوص الخارجة غير صحيحة مائة في المائة على المستوى التركيبي والنحوي.
وقد خضع تطويره لعدة مراحل ولم يتم تصوره مباشرة كتطبيق لنظرية محددة وإنما تميز بتكون متنام مجزئ المراحل وهو ما يعيبه عن البرنامج أصحاب الموقف النظري .
ويتعامل سيستران في المجموعة الأوروبية مع أزيد من 14 زوج ـ لغة. بتفاوت في الإنتاجية بين الأزواج فأقدمها تعطي نتائج متميزة عن الأخرى.
وطورت الشركة صاحبة المشروع, كاشو, نظام مصلحة ترجمة مباشرة على الخط لعدة لغات.
وبلغت إنتاجية البرنامج لبعض الأزواج : 500000 ك/س أي 1000 ص/د وهو ما يقارب عشرين صفحة في الساعة.
وحاولت شركة كاشو في مراحل تطوير نظام عربي سنتطرق له في جانب البرامج الخاصة بالعربية. ولأن هذا برامج سيستران هي المعتمدة في المجموعة الأوروبية فسنعود إليها تفصيلا لاحقا.





Eurotra

اختزال لعبارة الترجمة وأوروبا. منتوج أوروبي خالص, بدأ التفكير فيه عام 1977 على المستوى الأكاديمي بعرض تشجيع البرامج الأوروبية, ودعمته المجموعة الأوروبية. وكان الهدف محاولة إيجاد مترجم آلي يتعامل مع كل اللغات الرسمية في المجموعة الأوروبية وهي كانت تقارب الثمانين زوجا آنئذ واليوم تفوق 300. وميزة البرنامج أنه بني انطلاقا من نظرية متميزة تعتمد على [تمثيل] تصوير وسطي ودلالي مجرد بين اللغة الأصل ولغة الهدف ونمط التحويل. عكس البرامج المطورة حول محور والتي تتطلب لغة ثالثة شديدة الهيكلة.
وفي برنامج أوروترا يتشكل التصوير من تراكيب اللغة الأصل مع معلومات معجمية عن الألفاظ و بنية النص مرفوقة أحيانا بتصوير لمعلومات دلالية. وتصوير اللغة الهدف هو منسوخ عن تصور لغة الأصل. ويتدخل التجريد في تصوير المرحلة الوسطية. ورغم أن نمط المحور هو أكثر اقتصادية إلا أن الاختيار وقع في هذا البرنامج على نمط التحويل وهو يتطلب لكل لغة ـ هدف كتابة ثلاث وحدات أنماط : نمط التحليل ونمط التحويل ونمط التوليد ـ عكس نمط , بل أنماط المحور التي تتطلب فقط كتابتين : التحليل والتوليد غير أنها عمليات صعبة تتطلب تعمقا كبيرا في النص الأصلي. وتوليدية معقدة وعلى العكس ففي نمط التحويل يكفي تطبيق قواعد التركيب النحوية.
وهناك أسباب أخرى تفسر هذا الاختيار راجعة لطبيعة اللغات المراد التعامل معها.
فأمام اللغات المتقاربة صنفا وتركيبيا كاللغات الأوروبية يستحسن استعمال نمط التحويل لتشابه المعجم وتقارب التركيب, أما إذا تعلق الأمر بمزج بين لغات متباينة الصنف كالإسبانية والصينية مثلا فيفضل نمط المحور لما يتطلب ذلك من تصور شديد التجرد مشترك بين اللغتين وكما قلنا فهذا البرنامج موجه أساسا لخدمة اللغات الأوروبية المتقاربة.



إحالة : الزوج اللغوي
للدقة يجب التمييز حين الحديث عن الأزواج اللغوية زوج ـ لغة يعني من لغة س إلى ص أما من ض إلى س فذلك زوج آخر والمابين لغتين تعني إذا زوجين.
وحين تسمع ببرنامج يتعامل : من س إلى ص
ومن س إلى ن
لا يعني أنه يتعامل من ص إلى ن
لأن هندسة اللغويات الحاسوبية تأخذ بعين الاعتبار تأثير النقل والانتقال للغوي فالقواعد المتحكمة في الانتقال من لغة إلى أخرى تخلف عن قواعد النقل المعاكس. ولذلك قد تجد برنامجا ذي إنتاجية عالية في الترجمة من لغة إلى أخرى وضعيف الانتاجية حين يتعلق الأمر بالترجمة المعاكسة لنفس اللغتين وقد تنعدم هذه الأخيرة في بعض البرامج أي تنجد مترجما آليا من لغة س إلى لغة ص حصرا وليس العكس.

إحالة : في الحدود بين الآلي والمساعد الآلي
أن هدف الترجمة الآلية هو الاغتناء عن العنصر البشري وبقدر ما قل تدخل هذا الأخير يعد البرنامج آليا وحين يتطلب تدخلا كبيرا يعد البرنامج مساعدا. وتتحدد الفروق أيضا إذا اعتبرنا نوعية وسعة المعجم وطريقة هندسة البرنامج ذاته. فإذا كان البرنامج يكتفي بترجمة كلمة إزاء كلمة فهو مساعد لا أكثر لأنه يفتقد آليات العمل المؤلل.


إحالة : المحورية أو التحويل

إن نمط المحور يتشكل من وحدتين نمطيتين : التحليل الذي ينتج عنة تصوير/ تمثيل للنص الأصلي في لغة جديدة مستقلة ونمط توليد يترجم هذه اللغة الجديدة إلى لغة الهدف, والعملية الوسطية تهتم بالمفاهيم المجردة والعلاقات بينها وليس بالتركيب الجملي وقد تحمل معلومات خالسانية. ففي نمط المحور يتجاوز التصوير حدود الجملة إلى النص حاملا معه معطيات خطابية وذلك يستحيل قي نمط التحويل الذي يتعامل مع كل جملة على حدا
ومنه يمكن أن نتخيل أن النمط المحوري أقرب إلى معنى النص وإن ابتعد عن هيكلة النص الأصلي. ومع يضل نمط التحويل أسهل لأنه في آخر المطاف يكتفي بالجانب اللساني من عملية الترجمة.

أن كل برامج الترجمة المؤللة تهدف في ما تهدف إلى مساعدة المترجم في :
الترجمة في للشركات الكبرى تتبعا لسوقها العابر للحدود من أجل محو هذه الحدود.
خدمة للتجسس الصناعي والتتبع التقاني, لتتبع واستباق ما قد يبدعه الخصم من جديد في حرب تنافسية.
من أسلحة الحرب باردة أو حامية.
هذه أبرز المشجعات على تطوير برامج الترجمة المؤللة وإن تم إدخال نتائج التطوير في مجالات أهلية وإلى استعمالات شخصية أو سلمية.
والملاحظ هو أن البلدان ذات التعدد اللغوي المؤسس هي التي تبنت وأنتجت أحسن البرامج.

سيستران حفريات تاريخية.
SYSTRAN

حفريات تاريخية
في الخمسينات وفي جو الحرب الباردة بدأت الولايات المتحدة تتخوف من التطور التقاني السوفياتي. وتخيل الأمريكان أنه لو تمت ترجمت خيرة الوثائق العلمية الروسية لتمكن خبراء الغرب من استباق تقدم الروس وتحديد قدراتهم.
وكان مصب همهم هو كل ما تعلق واقترب من القدرات والتقنيات العسكرية من وثائق بما فيها البحوث الروسية النووية والفضائية.
ولأن ترجمة بشرية لكم هائل من الوثائق و بالسرعة المطلوبة لم يكن ممكنا فقد انصب التفكير على آلية وآلة مترجمة.
وفي خضم الصراع على السبق الفضائي لم تعد ترجمة الوثائق الروسية قضية علمية فحسب بل مسألة مصير وبالتالي سياسية. ذلك أن الروس أطلقوا في الرابع من تشرين 1957 صاروخ سبوتنيك نحو الفضاء, ودار الملاح الروسي يوري جاجرين حول الكرة الأرضية في الثاني عشر من نيسان 1961. وبمجرد وصول الرئيس الأمريكي كيندي إلى البيت الأبيض طالب ببدل الجهد لمحو العار الذي لحق بالولايات المتحدة.
وتزامن ذلك مع تطور الحاسبات الآلية وتطور الإليكترونيات ودخولها ميدان الحسابات العلمية المتخصصة. و بدأ البعض يفكر في ربط معالجة اللغويات مع التحليل بالمقدرات الإليكترونية.
وفي 30حزيران1966 نزلت مركبة أمريكية على القمر و تم إطلاق أول قمر صناعي, أبولو 8 , أمريكي آهل حول القمر في 1968 , ووطأت قدم أمريكية سطح القمر في الواحد والعشرين من حزيران 1969.
وإن لم يكن لتأليل اللغويات والترجمة دور في ذلك فإن المرحلة صبغت بطابعها الدراسات في الميدان ومنحت للبحوث في الترجمة الآلية نفسا قويا. وخصصت الحكومة والشركات الكبرى مبالغ ضخمة للتجارب في الترجمة الآلية.
وكانت جامعة جورج تاون بواشنطن أولى الجامعات التي دخلت الميدان حيث بدأ طاقمها في اللسانيات قبل المهندسين بترميز المعارف اللسانية.
وأعطت تلك المجهودات : منظومات ترجمة روسية/إنجليزية مثل مارك1 ومارك 2 لـ إ.ب. م. التي وجهت للاستعمال في سلاح الجو الأمريكي وكذلك نظام جورج تاون الذي دخل الخدمة بمركز لجنة الطاقة الذرية ومركز الأبحاث الذري.
وكان للمهندس من أصل بلغاري بيتر توما دورا متميزا في مجال معالجة اللغة آليا, حيث اقتنع بضرورة التواصل من وإلى الروسية بحكم عمله كضابط اتصال خلال الحرب.
وبدأ بيتر توما في 1956 بتطوير فكرته وتطبيق معارفه عن اللغات في هندسة تقانة الحواسيب. هادفا ابتكار برنامج عملي للترجمة الآلية. عارضا عن اللسانيين فهو لم يتخيلهم أبدا بقادرين على حل المعضلة وحسب رأيه ـ وهي مدرسة في معالجة اللغات آليا ـ فإن على معالجة اللغات أن تنقاد للحاسوب وليس العكس.
وابتكر توما في معهد كاليفورنيا للتقنيات, في الستينات نظام أوتوتران autotran وبعدها تكنوتران technotran وأخيرا سيستران العامل على إ.ب.م. 360 في سنوات64- 1963 .
ولما ظهر أن البحوث في مجال تأليل اللغات لا يعطي النتائج المرتقبة أصدرت لجنة مراقبة تأليل اللغات في 1967 تقريرا منتقدا مطالبا بتقليص الاعتمادات المالية في الميدان ورغم أن التقرير لم يطالب بإلغائها فقد أثر التقليص على الكثير من برامج البحث.
إلا أن توما وكعادته فسر خلفيات التقرير بأنها راجعة لتقوقع أصحاب نظريات غير عملية وتطبيقية.
ونجح في نقل مشاريعه إلى شركة ألمانية والتي أخرجت في 1968 برنامجا عاملا على إ.ب.م. 3460-50.
بعدها مباشرة اعترفت مديرية التقانات الأجنبية في سلاح الجو الأمريكي بتميز منظومة سيستران على باقي الأنظمة واشترت أول نظام ترجمي منه في 1969 , . ومنذ ذلك الوقت ونظام سيستران يتطور بنجاح وفي 1973 دخل الخدمة في وكالة الفضاء الأمريكية في مشروع اتصالات سيوز-أبولو ومولت الوكالة برنامج ترجمة روسية إنجليزية. [ عد لما قلناه بخصوص الأزواج اللغوية].
وتوجه البحث في اتجاه الإنجليزية الفرنسية عام 1974 بتشجيع من مكتب الترجمات الرسمية بكندا وشركات فورد وجينرال موتورز.
و الجدير بالذكر أن البرامج الأولى المقتناة كانت بهدف التجسس العسكري.

حفريات منهجية

وصولا لهذه الفترة من تاريخ الترجمة الآلية نلاحظ:
أن كل البرامج كانت ثنائية اللغة ولم تظهر فكرة لغة محورية تدور حولها عدة لغات إلا لاحقا.
البرامج المعروضة هي برامج عملية وليست ذات تعمق نظري لساني موجهة لأهداف محصورة ومحددة فاعلة مما يغضب أصحاب التنظير الذين لا يرون في برامج سيستران إلا كشكولا ومن هذه الناحية يمكن اعتبار سيستران نقيضا على صعيد منهج العمل لأورورترا, مثلا , وغيره من البرامج التي تأخذ بعين الاعتبار مسألة تحديد مسبق لمواصفات اللغات بهدف الوصول لتحديد لغة محورية تكون قاعدة للترجمة. ومع هذه الانتقادات تبقى منظومة سيستران أكثر البرامج فعالية وإنتاجية في ميدان الترجمة الآلية.


حفريات
لم يكل بيتر توما من العمل وفتح الأسواق الجديدة, إذ أنه توجه للمنظومة الأوروبية عارضا عليها برامجه ومنهجيته. وتزامن ذلك مع دخول برنامج أورونيت euronet ميدان الخدمة في المديرية الثالثة عشرة في المنظومة الأوروبية ...... وهو برنامج يهدف إلى توحيد وسيلة استجواب قواعد المعلومات الوثائقية في عموم أوروبا ولذلك طورت المخازن متعددة اللغات. ولرفع المردودية فقد توجه التفكير إلى الترجمة الآلية.
واعتمدت المديرية برنامجي سيستران وتيتوس في 1976.
فالأول هو البرنامج الوحيد الذي يتعامل مع النصوص كاملة للترجمة من الإنجليزية إلى الفرنسية ويتوافق مع تجهيزات المديرية الحاسوبية. وقد يمكن من ترجمة كاملة لقاعدة معلومات وثائقية تهم المنظومة عامة, من الإنجليزية إلى الفرنسية وربما من الفرنسية إلى الإنجليزية لاحقا.
وتيتوس برنامج ذي تراكيب مختزلة عامل بين الإنجليزية والفرنسية والألمانية والإسبانية [عد للتعريفات] وخممت المديرية في توسيع تركيبه ولأسباب زمنية تخلت عن هذا البرنامج ليبقي سيستران البرنامج الوحيد المطلوب تطويره . وهكذا انطلقت مرحلة إعداد معاجم لترجمة ملخصات قاعدة علم التغذية والتقانة وهي قاعدة مرتبطة بأورونيت, و حقق البرنامج تطورا في ترجمة زوج اللغة إنجليزية/ فرنسية وبدأ تطوير أزواج أخرى.
ومع ذلك فلم يصبح برنامج سيستران عام التوظيف في المجموعة الأوروبية إلا في بداية الثمانينات.

يستعمل حاليا نظام سيستران في لجنة المجموعة الأوروبية وسلاح الجو الأمريكي وكبريات الشركات الدولية وغيرها من المواقع.
وحيث أن كل مجال وكل موقع له حاجته المختصة من المعجم فذلك يعني أن معاجم المنظومة الترجمية في تطور لأن كل مجال يتطلب تطوير معجم خاص, وأن آليات الوصول إليها يجب أن تتحسن لتدخل برامج المنظومة حيز الحواسيب الشخصية ومنصات العمل الترجمي الشخصية مع ما يعني ذلك من سعة الانتشار والاستعمال.
أما في ما يتعلق بالمنصات الكبرى ذات المراكز الحاسوبية الضخمة, فلا منافس لسيستران إطلاقا من حيث : سهولة الوصول إلى الهدف و إمكانية التجديد والتحيين والشمولية وهي ميزات مهمة لكل برنامج حاسوبي ويعزى هذا السبق لأقدمية تجربة المنظومة
المنهجية
أولى القائمون على مشروع سيستران منذ البداية أهمية لتعدد استعمالات المنظومة وتوافقها مع مختلف الحالات ولم يحصروا اهتمامهم في مجال عملي ضيق. وكان الهدف منذ البداية حسب بيتر توما اختزال عملية التأليل الترجمي إلى ما يمكنه منطق الرياضيات والمعلوميات من سبل.
ولم يضيق القائمون على المشروع على أنفسهم بقواعد نحوية محددة قاهرة. وحسب البعض من معارضي المشروع فإنه يستحيل الحصول على نتائج صحيحة في برنامج يعدم مثل تلك القواعد النحوية.
ثم أن توسيع المجال يمكن من الاستعمال في كل الحالات لنفس البرنامج الترجمي : محاضر اجتماعات ووثائق تقنية والبيانات التقنية... وطبعا ذلك يعني وقتا زائدا لاختيار الترجمة الموافقة لكل حالة على حدا من بين العديد من الترجمات المطروحة.
وبتلخيص شديد فإن منهجية المنظومة جمعت بين السطحية والعملية والفعالية. أليست العبرة بالنتيجة لا في ما يسبقها من كلام وتنظير؟.
والفرق بين المنهجيتين, ولنا عودة بتوسيع أكثر لهذه النقطة, يتلخص في موقف ينطلق من العملي وشروط ومتطلبات التقانة والمنطق الرياضي و منطلق يولي أسبقية لتصور نظري لساني شامل قبل الجانب التقاني وهذا لا يعني انعدام أرضية منطقية في هذا التصور كما سنرى فيما بعد.
والقضية, بتعبير أوضح مع شيء من الغلو, هي من يقهر أو ينصهر للآخر الإلكترونيات أم اللغويات؟


مكونات النظام
النظام الأساسي يتحكم ويدعم المكونات الأخرى. وكتب بلغات المجمع 360 و لغة س. تفوق قواعده المائة ألف غامضة. ويحوي بعض البرامج موحدة لكل الأزواج تجمع في:
برامج توسيط وتناول للنصوص
برامج تسيير وتحيين المعاجم
برامج خلق وصول إلى معاجم الترجمة
برامج مراقبة الترجمة والتأكد من المعجم
مكونات مختلفة
برامج الاستعمال الروتينية.
ووحدات الوصول إلى المعجم هي مكونات أساسية للبرنامج ولا تحتاج لنظام قاعدة معلومات مستقلة تستند إليها.
وهذا يعني أن المنظومة يمكن تثبيتها مباشرة على الحاسوب وخاصة إذا توافق مع منظمة ما بعد إ.ب.م. 360 وما بعدها, بدون حاجة إلى برامج توسيطية أخرى. ويصعب نقله إلى منصة عمل عاملة تحت مستغل يونكس أو دوس.
وأظهر النظام الأساسي صلابة ومسايرة ولم يحتاج طوال فترة استغلاله إلى تحسينات مهمة مسجلا قلة العطب مما يسند منهجه و مقولة حاجة الترجمة الآلية إلى الرضوح لمتطلبات المعلوميات الضيقة .

البرامج اللسانية,
ورغم أن البرامج اللسانية, أي جانب تحليل اللغة, في المنظومة كتبت بنفس اللغات البرمجية كبقية النظام, إلا أنها أكثر سهولة وتلائما من السابقة, وحيث أنها في أغلبها كتبت خصيصا لسيستران فإن لها ميزات تفوق بها لغات البرمجة العامة بتضمنها لأوامر برمجية موجهة خصيصا للترجمة مثل :
Cw= كلمة مستعملة , SKCAT = لصنف الدلالات وغيرها مما يجعل النظام في متناول المستعملين غير البرمجيين ويتطلب تشغيله دراية دنيا بأدغال البرمجيات.
ويتم الرجوع إلى البرامج اللسانية تراتبيا وتحلل لغة المنبع باستقلالية عن لغة الهدف بخطوات منها :
حل مشكل المتشابه النحوي, تحليل حدود الملفوظ, أعداد مختلف مستويات الترابط التركيبي.
واختزل برنامج التحويل إلى المعجمية الروتينية وتحل في هذا المستوى إشكاليات ثنائية اللغة والتراكيب والبنيات المعقدة. وعلى مستوى لغة الهدف تحل مسائل الصرف والتركيب وترتيب الكلمات.
وعكس ما قد نتخيل فإن هذه المسيرة معقدة.
المعاجم
سنعود لمسألة المعاجم في توسع خاص بالمعجمية الحاسوبية. ونحتفظ هنا بتقدم بعض خاصيات معاجم منظومة سيستران تقريبا للمعنى.

ميزة معاجم سيستران
السعة أي كبر المعجم,
الوظيفية والعملية فلا يكفي أن يكون العجم واسعا كبيرا لكي يكون صالحا وسهلا ومفيدا في الاستعمال.
الشمولية ويقصد بها شمولية المجال المراد .
ومعاجم سيستران ذات مداخل إما على شكل كلمة وحيدة أو كلمات متعدد حين تتعدد الدلالات أو تتنوع السياقات .
وتحوي معاجم لغة المنبع معلومات صرفية ونحوية وتركيبية ودلالية وقسم الكلمة إذا كانت مشكلة.
والمداخل المتعددة تشمل تعابير لمختلف الأصناف وتقعيدا للسياق تتعلق بالترابط وخصائص كلمة أو كل كلمات العبارة.
وفي لغة الهدف فالمعنى المعطى لكل حالة يبدأ من المقابل العام لكلمة إلى الترجمات الخاصة الإلزامية لعبارة في سياق سابق التحديد أخذا بعين الاعتبار الملفوظ والظرف والمجال. وبتحديد المجال والسياق يمكن أن نمنح إلزاما, كصنف خاص, للتعبرة والكلمة مقابلا محددا يعوض المعنى العام والمقابل العام في كل المعجم إذا حددنا المجال في أوامر و طلبات الترجمة.

إحالة
قد يتساءل البعض عن جدوى النعوت التي تتابع في كتابتي حول المنظومة.
تلك الكلمات وما يتبعها من نعوت هي من صلب المصطلح وضرورة للدقة.
وفي حديثي عن الترجمة المؤللة تعترضني دائما مشكلة المقابل العربي. وقد اخترت كعادتي وكموقف شمولية التعريب فاستعملت ما هو معروف ومشهور, طبعا نعدم معجما موحدا, وابتكرت في الكثير من الحالات بما يساير المضمون والمجال.
وعلى سبيل التنكيت حضرت عرضا في اللسانيات قدمه أستاذ كبير من القاهرة فإذا هو يسمعنا كلمات البراجمتيك, والسيمانتك, والهيد ينطقها بفخامة وفي اللقاء الجانبي اكتشفت أن صاحبنا لم يؤتى من العلم شيئا في المجال وأن علمه بالــ hpsg و tag لا يزيد عن نطقه بها أعجمية ثقيلة. فكان بحق نعم الأستاذ الدكتور المفرخ.
ولمن يجد صعوبة في التتبع لا يزعج طرحه سؤالا, وقد يجد الجواب طي التعريفات العديدة التي أقدمها.
إحالة
كلمة الغموض بل مصطلح الغموض وقد وردت هنا كثيرا.
من هو المترجم الذي لم يتصارع مع الغموض في ترجماته.
وأصعب ما تتعرض له الترجمة الآلية والمؤللة قضية الغموض. وهو أنواع عديدة.
فهناك غموض المشترك اللفظي والأضداد كما يقول النحاة العرب وهي مسألة تحل بالمعاجم وبالمكانز السياقية.
وهناك غموض كتابي, أو المشترك الكتابي في اللغات الغربية.
والغموض الشكلي في الكتابة العربية الخالية من الحركات. فحين نكتب مثلا دخل الدولة السنة الماضية لا نعرف إلا بالسياق ما المقصود هل فعل الدخول أم المصدر.
وقد نعطي مثلا آخر: ضرب مصطفى موسى ولو لم تكن هناك قاعدة أسبقية الفاعل على المفعول في هذا النوع من الجمل لتعذر علينا معرفة من الضارب والمضروب. وطبعا فالترتيب يحل الكثير من الغموض والترتيب غير عام في اللغة العربية كما نعرف وحتى في اللغات الهندية الأوروبية ذات الترتيب المحدد تجد مع ذلك جملا غامضة.
وحيث أن نحاة العرب تكثر من فعل الضرب في أمثلتها لو كتبت سيرا على خطاهم: ضرب النساء واجب أو مذلة, لفهم أغلب قراء الجملة أنني أقصد ما ورد في القرآن الكريم في شأن بعض الزيجات. ولو قلت لهم أن فاعل الضرب هو النسوة لوجدتَ القراء بعد تردد قد ولجت باب الحديث عن طغيان النسوة في هذا الزمن الرديء. هذا الصنف من الجمل يعد غامضا. ولا يفهم إلا بالسياق أو بالذاكرة الثقافية والاجتماعية للفرد. وهي ذاكرة غربالة ومتغيرة وآنية مضطربة يتحكم فيها الظرف والمحيط.
وتختلف عن ذلك ذاكرة الحاسوب فهي مرتبة ممنهجة خارج المجتمع تتعامل بسيل من الأوامر المحددة وليست قط قضية بلادة الآلة أو تفوق البشر.
المسألة بطريقة أخرى كيف نكتب ونصيغ أوامر برمجية منطقية حاسوبية تحت محدد الرياضيات الحازم ليفهم الحاسوب المقصود. وهذا هو صلب مجال التأليل.
ويفسر ذلك في كثير من الحالات كيف تجيب برامج الترجمة المؤللة بطريقة غريبة على مسائل نعتبرها كبشر سهلة يسيرة.


قال الجاحظ : البياض كتابة

فتحت الحوسبة اللغوية أبوابا في النحو لم تكن معروفة.
وكان لمنطق الحوسبة الصارم دورا في إبراز ظواهر لغوية على الأقل في اللغات الغربية لم تكن في حساب النحو التقليدي. وظهر أن جداول وتصنيفات النحاة لا تشمل كل جوانب اللغة والكلام.
النحو التقليدي وصفي في هدفه يصف الكلمة ودورها ومكانتها في الجمل ويمنحها سمات العدد والجنس ومحلها من الأعراب والزمن وترتيب الفعل والفاعل والمفعول. هذا إذا كانت الكلمة واضحة لا تطرح مشكلة غموض وضبابية. وقد يزيد النحاة تفصيلأ وتحديدا لوصف اللغة, فنحن نقول مثلا في العربية [مع مصدر الأكل] أكل الخبز بجر ونصب الخبز معا ونقول مرة أنه مفعول وقام المصدر مقام الفعل ومرة مضافا على اعتبار أن المصدر فقد فعليته وأصبح اسما [وهي ظاهرة واسعة الانتشار في اللغات الأوروبية وتفرد لها أبواب في نحوها], ولك في كتب النحاة العرب من هذه الأعاجيب والحالات ما يخفف عنك وقع الشمس في الظهيرة يكفيك أن تفتح باب المنادى لتسافر عبر حالات واستثناءات طويلة ساعات وأيام طوال.
وهذا الجانب الوصفي لا يكفي في حوسبة اللغة.
تعد ما نسميه بمسألة التنازع النحوي والمشترك من أعقد القضايا في معالجة اللغات آليا.
وتعتبر اللغة الإنجليزية من أكثر اللغات إشكالا من هذه الناحية عكس ما قد نتخيل سلفا وأظهرت بعض المعطيات أن ما يقارب الخمسين بالمائة من كلمات جملها النمطية مشكلة متنازعة.
وتحل المعضلة بالرجوع إلى السياق وتحديد السياق ليس من السهولة كما قد نتخيل ويتطلب ذلك برمجة ضخمة وثقيلة. وهناك طريقتان لحل ولتحديد السياق : إما خطية أي أننا نقلص غموض الكلمة بمعلومات مستمدة من سابقها في الجملة ونستعمل الحاصل لمحو غموض ما يتبعها وهكذا دواليك إلى نهاية الجملة والطريقة الثانية انتقائية : نهتم بالسهل أولا ثم نرجع لما هو أعقد. وكل ذلك يتم بتطبيق نظرية تقاطع المجموعات أو نظرية المحتمل المشروط.
ولتقريب المعنى نورد بعض الأمثلة والقضية تحتاج إلى أكثر من أسطر.
نقول : جاء المطر وحين يقرأ برنامجي هذه السلسلة يبدأ بالكلمة الأولى وانطلاقا من معجمه يحدد أنها فعل غير متعد لا تنازع فيه ومن حلوله الممكنة أنه قد يعتبرها جملة قائمة من فعل وفاعل محذوف وينتظر أن يكون تابعها إما جملة جديدة أو حشوا أو فاعلا أو صفة , علما أن معجمه يأخذ بعين الاعتبار كون المطر اسما لأنه معرف. وقد تعرف البرنامج على الفعل بسهولة لأن الفعل هنا ينتمي إلى مجموعة محددة العناصر لا تسمح بالتنازع فيها. كما لا يتنازع اثنان في تحديد تالي حرف جر أ اسم أم فعل هو.

وقد يجد البرنامج عقدة في تحديد : أكل الرجل الأسد, فسلسلة أكل قد تكون فعلا معلوما أو مجهولا أ أو مصدرا أو اسما والأسد فاعل أو مفعول أو بدل.... ومكره أخوك لا بطل وجائني أسدا ودخل القاضي امرأة وغيرها من عجائب الدنيا السبع في لغتنا الجملية مما يسعد أصحاب الكسائي سهرا ومتعة ويسهر من جراها أهل البرجمة في شركة سيستران ليالي غم و سهاد.

وما يلي نوع آخر من معضلات الترجمة الآلية:

خذ : في نص ما السلسلة 2.5 هل هي عدد كسري أم رقم ترتيبي أم شيء آخر؟ المشكلة في النقطة.
وفي بعض النصوص نكتب بدل الأرقام الهندية أو المغربية حروفا وهكذا نجد: اب و دن وغيرها من عجائب الكائنات وطبعا حاسوبي البليد لا يميز بين دن الخمر وقرابة الأبوة و بين الرقم المكتوب بحروف أبجدية.
ولنعقد المسألة بعض الشيء نحن نكتب : واحد من عشرين وواحد في المائة وخمسة على عشرة وصفر على الهامش أو اليدين.... ولا نلاحظ أنها جمل تتطلب توقفا. فما أتعس هذه الآلة التي لا تفقه ما يفقه صغار التلاميذ !!! من يقول هذا لم يرى أن هذه المتواليات الرمزية غامضة وتحاج لتوضيح وبرنامج روتيني ليفهم حاسوبي المترجم متى يتعلق الأمر بنقطة الفصل والنهاية ورقم كسري وترتيب فصول ومتى يكون دني رقما أو وعاءا و... متى يكون الواحد صفة للخالق الجبار أو رقما ... وهذه محددات لا تجدها في النحو الوصفي التقليدي.

وبدأت كلامي بذكر الجاحظ وبياضه
النص وأي نص هو توال سلاسل رمزية من بداية المقال مثلا إلى آخره. ولكن النص يحوي سلاسل خاصة كالعنوان وعناوين الفقرات ونصوص مدخلية وهو إخراج منسق ومشكل ومزع ومهيكل فيه فراغات ورجوع إلى السطر.... كل هذه المشكلات يجب أن تكون مضبوطة قابلة للبرمجة.

التنقيط :
دخلت علامات التنقيط إلى بلاد العرب في ما دخل من المورد ولازال هناك من يعتبرها بدعة حرام. ومن شاء أن يسهر ليال في إعداد أطروحة للدكتورة أوجهه لدراسة استعمالات علامات التنقيط في اللغة العربية الحالية وأظنه أنه سينتحر قبل انتهاء بحثه. ولنفتح أي منشور عربي سنجد أن الفواصل والنقط ونقط الفاصلة تسير بما سارت به ركبان الإبل العمياء. وليسوا الوحيدين وأنا أسأل ــ دفاعا عن عروبتنا ــ العارفين باللغات الغربية ما هي القواعد المحددة المضبوطة في استعمال علامات التنقيط؟ طبعا ليس المطلوب جواب مستمد من كتب المبتدئين !!!
يقال أن الجملة تنتهي بنقطة ولكننا نقول أيضا على ذمة نحاتنا الكبار أنها تنتهي بتمام معناها ومتى ينتهي المعنى يا سادة النحو ؟ بنهاية النص, طبعا, هذا إذا كان للنص معنى.
والحلول البرمجية التي قدمت لهذه المسألة في سيستران حلول استمدت من التجارب العملية ومن سياقات النصوص ونوعيتها.
وللحديث بقية في انتظار ذلك هل فكرتم لماذا نكتب في العربية : وجاء ثم جاء مرة بإلحاق حرف العطف ومرة بفصله وأنا متأكد أن صاحبنا, وأنتم تعرفون من أقصد ابن مدينة الضباب, سيثقلني بإحالات من كتب النحو والإملاء لتعليل ذلك ولن يفهم حاسوبي الساذج شيئا من ذلك لأنني سبقت ودربته على معرفة الفراغ فإذا الفراغ هنا يتحول شيئا آخر, فكيف تريدونه أن يتصاحب معه, أقول ذلك وأنا أعلم بوسائلي الخاصة أنه لا يفارق حاسوبه ليل نهار وقد هددته زوجته بالخلع على ذلك. معذرة ودمتم بخير.

إحالة
المصطلح والاصطلاح دائما
يستعمل في الكثير من النشريات العربية مصطلح البرنامج الداعم للعربية في الحديث عن برامج الترجمة المؤللة. وللتذكير فقد بدأنا في استعمال هذه التعبرة وقت الحديث عن البرامج الحاسوبية التي تمكن من الكتابة بالحرف العربي. وهي ترجمة حرفية للتعبرة اللاتينية. فيقال مثلا برنامج ويندوز داعم للعربية. وهذا ليس بمزعج . ويختلف الوضع حين الحديث عن الترجمة.
مفهوميا ماذا يعني الدعم في حالة الترجمة؟ وقد نفترض أن الأمر يتعلق ببرامج تساعد في الترجمة إلى العربية. ومن خلال تقص بسيط نفهم أن المقصود بالدعم هو المساعدة والترجمة الآلية في نفس الوقت. ولا أفهم لماذا لا نتحدث عن برنامج مساعد وبرنامج مترجم. زد لذلك أن أغلب البرامج المقصودة أبعد ما تكون عن برامج مساعدة هي أقرب ما تكون برامج شبه مساعدة !!!
فلا يكفي أن يكون البرنامج متضمنا لمعجم بسيط وبعض القواعد ليفي بالغرض. وأعلب تلك البرامج المعروضة بخصوص العربية لا تملك من الزاد ما يكفي للحديث عن برنامج آلي للترجمة فهي لا تتضمن في غالبها قواعد قياس ومعاجمها ليست بقواعد معطيات علاقية مثلا.
إحالة
قضية المعجم
ولنا عودة إليها بشكل مطول لا حقا.
المعجم الحاسوبي المؤلل معجم من نوع خاص, جمعت مواده بطريقة أنظمة قواعد المعطيات العلاقية وهي تختلف عن أبناك المعلومات في نسقها وهندستها. وتحوي الكثير من المعلومات التي لا توجد في معجم ورقي عادي. وإن معجما شاملا وناجعا كفيل برفع نتائج برنامج ترجمة. وللأسف فأغلب ما يستعمل في المجال العربي لا يف بأقل شروط هذه المعاجم.
قد أسجل لسان العرب بكامله في البرنامج دون أن أحصل على برنامج معجمي عملي. والدراسات العربية في المجال قليلة أو عديمة الجدية.

أزواج اللغة
كيف اختيرت أزواج اللغة في منظومة سيستران؟ وما هي الصعوبات التي تعرضت كل تأليف وزوج؟ وما هي التعقيدات التي قد تتعرض سيستران عند زيادة زوج جديد؟
قلنا بداية أن سيستران تعامل مع الروسية إلى الإنجليزية وبدخوله الخدمة داخل المنظومة الأوروبية توجب توسيع أزواج اللغات العاملة. ومن البداية ظهر أن أزواج الإنجليزية ــ الفرنسية أزواج أساسية. فأول برنامج قدمته سيستران للجنة الأوروبية, للإنجليزية/ الفرنسية, كان برنامجا لم يتم فحسب تجريبه بل وسع للعديد من المجالات والنصوص. وزوج اللغة الفرنسية الإنجليزية تحول بسرعة إلى برنامج عملي تام بعد أن كان قد برمج أولا للبرهنة على فعالية منهجية سيستران.
انطلاقا من قواعد وثائقية متواجدة مختلفة في سياقاتها ومعطياتها عن ما هو متداول في اللجنة تم تكوين معاجم.
وتم إدخال الزوج إنجليزية/ إيطالية للبرهنة على إمكانية دمج لغة هدف جديدة أخرى في نظام سيستران ونظرا لعدد الناطقين بالإيطالية في المجموعة الأوروبية, وحيث أن اللغة الإيطالية شبيه باللغة الفرنسية كلغات لاتينية فقد تمت عملية الدمج بيسر مع الاحتفاظ بمعجم لغة المنبع للاثنين. ولم يتم اختيار الألمانية حينذاك لأن اللجنة تخليت أن برامج أوروترا سوف تحل هذه المسألة ولما ظهر أن برامج أوروترا لن تكون عملية في القريب, طلب من شركة سيستران تطوير برنامجها الإنجليزي الفرنسي وطلب من شركة توما تطوير برنامج فرنسي ألماني.
طرحت اللغة الألمانية الكثير من المعضلات نظرا لاختلافها من حيث ترتيب الكلمات في الجمل ونحوها وقواعد تركيبها, ولم تكن النتائج في مستوى الأزواج السابقة حتى بعد سنوات من العمل والتطوير.
وطلبت اللجنة الأوروبية تطوير الأزواج : الفرنسية الهولندية والإنجليزية الهولندية. علما أن سيستران لم تكن سبق لها وأن تعاملت بأي شكل مع هذه اللغة.. وقد أعطت العملية نتائج أحسن من نتائج جانب الألمانية.
كل هذا التوسع جرى وسط تجاهل شبه مطلق من المترجين داخل اللجنة لقضية الترجمة الآلية ــ ويلاحظ قلة المترجمين الذين شاركوا في عملية التطوير ــ وهو موقف لازال قائما لحد الساعة بين المترجمين الذين لا يرون في المترجم الآلي إلا مضيعة وقت أو منافسا خطيرا على لقمة عيشهم وربما فسر التجاهل وعدم التحمس لما هو آلي بكون الكثير في عالم الترجمة هم ممن يتخيلون الترجمة فنا ووحيا لا مجال فيه للبرمجة الآلية وقد برهنت السنوات التالية على جهلهم و غلطهم كما سنرى فيما بعد.
بتوسع حدود السوق الأوروبية إلى دول أخرى فقد تم دمج أزواج إنجليزية/أسبانية وإنجليزية /برتغالية لاستعمالات محصورة. ومن ترجمة بعض المتعاملين مع برامج سيستران داخل اللجنة الأوروبية وسعادتهم بنتائج الترجمة بين لغات مختلفة فقد شجعوا العمل على دمج أزواج لغات متقاربة كالفرنسية والإيطالية. وبالفعل فلم يتطلب هذا البرنامج وقتا طويلا ليصبح فعالا وتجاوز في نتائجه باقي أزواج اللغات وأعطى البرنامج في مجالات ولبعض النصوص نتائج تقارب نتائج الترجمة البشرية.
وتم دمج زوج إنجليزية / يونانية لا حقا.
ومن جانب اللغة الأسبانية فقد تم الاستفادة من برنامج الإسبانية/ الإنجليزية, ــ الذي كان قيد التجريب في سلاح الجو الأمريكي كما قلت عاليه ــ, وتوجه التفكير نحو تطوير أزواج الفرنسية/ الإسبانية مع الاستفادة من تجربة الإيطالية.
وبهذا نكون قد وصلنا في متابعتنا لاستعمال برنامج سيستران في اللجنة الأوروبية تاريخيا إلى 1990. وبذلك تنتهي الحفريات وندخل مرحلة مختلفة من تاريخ سيستران نفصل لها حيزا خاصا.
وأول ما يمكن أن نقول عن هذه الفترة السابقة أنها قصيرة 20 سنة !!! وما أشبه الليلة بالبارحة. أقول ذلك ثلاثا لأن الكثيرين من التراجمة أو أنصافهم يتجاهلون هذه الحقيقة البسيطة, وأن عجلة التاريخ تسير, كره من كره. وان ما حققه التأليل في هذه الفترة الزمنية القصيرة خيالي. زد لذلك أن عدد المبرمجين والعاملين في كل زوج لغة قليل وتحسب الفترات الزمنية ب سنة/شخص العمل على أصابع اليد الواحدة.
وأتذكر في بداية دراستي كيف كنا نتمنى وجود برنامج داعم للكتابة العربية, وكانت أول البرامج المعروضة علينا تعد ثورة وكانت لا تمكن إلا من القليل وأتذكر كيف كان يجيبني أحد الأساتذة كلما رأى ما أنقره : ’’لا تضيع وقتك في اللعب على ذلك التلفاز !!‘‘
أستاذي الكبير كان يعتبر كل ما خرج عن التقليد بدعة وأن ’’التلفاز‘‘ ما وجد إلا لفرجة الأشرار وأخال أنه لازال حاله.

إحالة
وكما نعلم فمن الناحية المنهجية فكل قضية وكل مسألة عندما تطرح بجلاء وتحدد في مراميها وتحصر أسسها تعتبر شبه محلولة أي أنه من الممكن وجود جواب لها. وبالعكس فإذا خلطنا المنطلقات والمنهجيات كما يفعل بعض أصحابنا جهلا وتطاولا على ميدان معطاء آنذاك لن نحصل إلا على خليط غريب.
وعاليه طرحت قضية البرنامج الداعم للعربية في الترجمة !!! وكما لا يخفى عليك فشعر رأسي ينتصب غضبا وغيرة حين أسمع كلاما عير مضبوط وتغذوا المسألة ليس وجود برنامج داعم للعربية بل شخص داعم للعربية.
حصيلة النتائج
إن كل برنامج لا يمكنه أن يتجاوز نقاط ضعفه إذا لم يقيم ويقوم.
فتقييم النجاحات إذا كان موضوعيا يقدم حلولا توجيهية وسوقية. ونظام سيستران لم يخرج عن القاعدة واستفاد من انتقادات ورد فعل المترجمين في تحسيناته وإصداراته التالية. وقد انصب التقييم في البداية على دراسة عدد الأخطاء وصنفها وفعالية الإخراج ووضوح النص الحاصل قراءة ومعنى.
ومن خلال هذا التقييم يتم وضع خطط سوقية إما لتحسين البرنامج داخليا [فترة ما بين 75-] و إما لتوسيع استعمالاته إلى مجالات أخرى . ونظرا لانتقادات بعض المترجمين لجدية التقييم من حيث شروطها ولتمكين غير المختصين في البرمجة من متابعة التقويم فقد طور برنامج خاص أقليديس يمكن من ترجمة لغة البرمجة الخاصة بسيستران إلى اللغة الطبيعية ليتمكن المنتقدون من غير المختصين بفهم هيكلة أوامر النظام مما خفف من حدة النقد وبرهن على تعقيد أوامر البرنامج .
و نتائج المتابعة الإحصائية في كارلسلو لــوضوح الفهم و أخطاء النقر وأخطاء الكلمات والمصطلحات والأخطاء النحوية و التركيب .... أوضحت أن نسبة الغلط في الترجمة الخامة انحصرت من ثلاثمائة إلى40 غلطا تقريبا بينما ارتفعت نسبة وضوح الفهم لتقارب نتائج الانتخابات العربية مما أدى في بعض المواقع إلى اعتماد الترجمة الخامة دون التدقيق النهائي.
موقف المترجمين من النظام.
رغم أن لجنة الترجمة في المنظومة الأوروبية طلبت من مترجمين مهنيين تقييم البرنامج وتحديد مجالات استعمالاته الفعالة ورغم أن النتائج كانت مقبولة في الكثير من المجالات إلا أن غالبية المترجمين بقيت على هواها ونتيجة هذا التقييم قرر استعمال سيستران لترجمة دقائق اجتماعات رؤساء المديريات..
وقد طالب تقرير في 1990 بضرورة صياغة سيستران بلغة برمجة متطورة واستعمال قاعدة معلومات علاقية لتسيير المعجم وتقريبه من المستعمل.


مرة أخرى أؤكد على انعدام برنامج مترجم كامل الفعالية وناجح لعدة أسباب. وأننا حين نتحدث عن الترجمة الآلية يجب أن نضيف الحيز والمجال والنوعية فبدون هذا التحديد فإننا سنخبط خبط عشواء. الترجمة الآلية تضاهي الترجمة البشرية بل تتجاوزها حينما يتعلق الأمر بترجمة تقنية محددة المجال محصورة معجما وتركيبا. ويختلف الأمر حين يتعلق بنصوص حرة أو شبه حرة.
أقول ذلك لأن الكثيرين من المترجمين لهم مشكلة ليس فحسب مع الحاسوب والترجمة الآلية بل مع اللغويات بحد ذاتها.
كم عدد المترجمين الذين تعرفون, يقرؤون النص وأي نص بنظرة علمية لسانية؟
وأتحدى أي واحد ممن يكتبون حول لغة الصحافة أن يقدم لي هيكلة متكاملة لهذه اللغة؟ لا أريد أن يكرر لي ما يقرأه التلاميذ في المدارس الابتدائية بهذا الخصوص.
حين نقرأ جريدة عربية وأي جريدة فإننا نواجه عدة مستويات لغوية, وطبعا القارئ المتوسط أو العالي قد يمر من نص جاهلي إلى خبر رياضي دون أن يفطن أنه يتعامل مع تراكيب متنوعة وقد يقول البعض بلغات متنوعة.
المترجم البشري نفسه قد يجد صعوبة في ترجمة نصوص لم يتعود عليها فكيف نطلب من آلة قريبة الحدث أن تترجم ما لا تفهمه ويعجز الإنسان ذاته عن فهمه. ولكي تفهم الآلة يجب أن نقدم لها أوامر صريحة وواضحة ومضبوطة. وإلا فإننا نكرر قصة البدوي الذي لم يفهم كيف أن مذياعه خبره بأخبار بعيدة ولم يخبره بموت بقرته في جواره.
أتوقف هنا لكي لا أرجم.

تعريفات1


توم TAUM
هو اسم مختزل للترجمة الآلية لجامعة مونريال . وكانت الحكومة الكندية في 1965 وراء المشروع . وكان المشروع في بدياته عاما للترجمة ولكن بعد سنوات العمل والبحث تخصص المشروع في متابعة أحوال الطقس كتطبيق أساسي ميداني للبرنامج. ولذلك أصبح اليوم معروفا باسم توم ــ طقس..
هذا البرنامج يترجم المعلومات الطقسية للحكومة الكندية منذ عام 1977 من الإنجليزية إلى الفرنسية ومنذ عام 1989 من الفرنسية إلى الإنجليزية. فالترجمات من الإنجليزية إلى الفرنسية فهي توجه لمناطق فانكوفر وإدمونتن وكالجري ورجينا وتورونتو وهاليفاكس أما الترجمة من الفرنسية إلى الإنجليزية فتهم منطقة مونريال. واليوم فإن كل التوقعات الطقسية الكندية أصبحت مترجمة.
البرنامج يعتمد على 2000 كلمة وتعبرة. ويترجم ساعة بعد ساعة كل التوقعات بمعدل 30000 ألف كلمة في اليوم.
وواقعيا توم ـ طقس هو نظام مستعمل منذ زمن وقد حاز على استحسان الجميع. وللتدقيق يجب التفريق بين استعمال عادي وشامل واستعمال الزبائن من حيث التخصص والتواتر.
ولأن البرنامج شديد التخصص والتميز فهو يحوي مصطلحات محصورة أي ذي معجم محدد وشامل للكلمات المراد ترجمتها وتركيبا جامدا يدور حول عدد قليل من التركيبات الجملية وهو ما يمنح تطابقا كاملا لكل تركيب وهيكلة تعبيرية متكررة, لدرجة أن المترجم الإنساني لن يصبر أمام ملل التكرار أكثر من أشهر. وقد خلت مصلحة الطقس الكندية مشكلتين : الملل البشري ومشكلة لغوية باختيارها وتطويرها لنظام توم ـ طقس.

تعريفات 2

Titus تيتوس

طور برنامج تيتوس في ظروف خاصة ولأهداف محددة.
وكان وراء ظهوره ذلك معهد النسيج الفرنسي. فقد تصور المعهد برنامج تيتوس لترجمة ملخصات المقالات التي تخص النسيج للمهندسين المتخصصين المحتاجين للمعلومات العلمية الجديدة.
يتعامل برنامج تيتوس مع أربع لغات عمل : الفرنسية والإنجليزية والألمانية والإسبانية وكل الأزواج اللغوية فعالة.
وكان من المفروض أن يكون المعجم الأساس صغيرا ولو أنه من غير سابق الحصر. والتركيب محصورا نسبيا والمقالات تساير في عمومها ضرورة الوضوح والبساطة والقصر. وبرمج تيتوس للعمل في إطار تركيب مراقب, وقد شهد عدة تغيرات وخاصة تنوع الجمل المقبولة. وعندما جرب العهد الفرنسي للأبحاث العلمية برنامج تيتوس لترجمة ملخصات المقالات العملية المنشورة ظهر أن محرري الملخصات لا يحترمون شروط الكتابة المرخصة في المعالجة الآلية. وطرح إشكال بشري هل يمكن فرض تركيب مراقب ملزم على المحرر؟ فضرورات المعالجة الآلية لم تغير من عادات التحرير. ويمكن استعمال البرنامج بموازاة بيانات سابقة الإعداد, وهذا يقلص إنتاجيته, فقد أعد تيتوس كبرنامج كامل الآلية. ويمكن استعماله كما هو إذا احترمت بعض الشروط : ترتيب العناصر في الجملة وزمن الأفعال المقبول والملحقات الممكنة. و شيئا فشيئا تحول إلى نظام تفاعلي مع إمكانية إصلاح على الشاشة للمشتركات اللفظية والكتابية.

تعريف 3
Spanam /Engspan
برنامج يترجم من اللغة الإنجليزية إلى اللغة الإسبانية والعكس. وقد أعد خصيصا لمنظمة الصحة لعموم أمريكة في واشنطن التي تنشر وتصدر العديد من الوثائق الطبية الموجهة لأمريكا اللاتينية. وفي البداية أعد البرنامج الموجه نحو اللغة الإسبانية لخدمة مصالح الصحة في القرى النائية ولمقاربة أكبر عدد من الساكنة. وحاليا يستعمل زوجي اللغة بنجاح في مجالات الصحة والتغذية والفلاحة.
وإذا كانت بداية البحث حول البرنامج قد بدأت في جامعة جوج تاون فإنها طورت في منظمة الصحة لعموم أمريكة. وحيث أن المجال محصور ونوعية النصوص محددة فقد سار العمل بوتيرة سريعة. وأول الإصدارت نحو الإسبانية ظهرت في 1976 ودخلت مجال العمل في 1979 وجددت في 1988.... أما النسخة نحو الإنجليزية فهي قريبة العهد ودخلت مجال التطبيق في 1984. والبرنامج من شاكلة برامج سيستران : الترجمة الخامة تتطلب تصحيحا لتغدو النصوص مقبولة. وفي دراسة للانعكاسات ظهر أن المستعملين يحبذون الترجمة المصححة الآلية على الترجمة البشرية اليدوية.
وإنتاجية البرنامج تقارب 6500 كلمة/يوم للمترجم المصحح وهناك محاولات لإصدار يتعامل مع أزواج لغات أخرى.

تعريفات 4
Weidner
كان لجامعة بريغام دور مهم في تطوير العديد من برامج الترجمة الآلية وكان الهدف الأول منذ 1970 ترجمة النصوص المقدسة الخاصة بجماعة المرمون. وتابعت العمل شركة ويدنر منذ تأسيسها في 1977 بمشاركة كوادر الجامعة وحرج أول برنامج من الإنجليزية إلى الفرنسية في 1980. وتبع ذلك أزواج لغات أخرى من الإنجليزية إلى الإسبانية والألمانية والبرتغالية والإيطالية والعربية... ومن الفرنسية إلى الإنجليزية والإسبانية والألمانية إلى الإنجليزية و. ويمكن تشغيل هذه البرامج على حواسيب شخصية إلا البرامج الخاصة بالإنجليزية/العربية والألمانية/الإنجليزية.
وأكبر عائق لهذه البرامج هو صغر المعجم الذي يلائم دائما نوع النص المراد ترجمته وعلى المشغل إعداد معجم وهذا مكلف وضد إنتاجية البرنامج.
وإنتاجية البرنامج العملية : 4000-8000 كلمة/ساعة.
ويستعمل للترجمة في شركات دولية ومنها ماترا موتورولا طومسون بول أيروسباس بيركينس إنجين رانكس كسيروكس ...
واليوم تتوجه المجموعة المنتجة لتطوير برامج موجهة للسوق اليايانية.

تعريفات 5
Alps
بدايات ألبس كانت في جامعة برغام وقد تأسست الشركة في 1980.
ويمتاز برنامج ألبس بمستوياته الثلاثة لترجمة الألفاظ : الاختيار والذاتية والتفاعلية. وتحوي المستويات العليا المستويات الدنيا. والمستوي الأعلى تفاعلي أي أنه يقدم ترجمات جملة لجملة ويطرح أسئلة لمحو الغموض. وعموما يعد المستوى الثاني ـ الذاتية أكثر نفعا غير أن حلف الأطلسي و إحصائيات كندا تستعملان المستوى الثالث مستوى التفاعلية.
ومن اللغات العاملة في البرنامج : من الإنجليزية إلى الفرنسية والألمانية والإسبانية والإيطالية.
من الفرنسية إلى الإنجليزية.
من الألمانية إلى الإنجليزية.
ومن الشركات الكبرى التي تستعمل البرنامج: تكساس أنسترمنت , ونرس داتا, واتحاد المصارف السويسرية, ورانك كسيروكس, وهناك شركات ترجمة تستعمل هذا البرنامج ك أنترلونجوا وملتيسكربت...
ومن عيوب البرنامج المعجم الصغير ويجب أن تكون النصوص المعروضة للترجمة تقنية مكررة مكتوبة بلغة سهلة وبسيطة. ويتعامل البرنامج مع نصوص من 30000كلمة وأكثر من ذلك تتقلص الإنتاجية.
وللبرنامج إصدارات للتشغيل على الحواسيب الشخصية.
تعريفات 6
Logos
تعد برامج لوجوس منافسة لبرامج سيستران من حث جودة الترجمة رغم أن الأخير له معجم واسع ويتعامل بلغات عدة.
ولوجوس شركة أمريكية تطورت في الستينات. وخرجت أول برنامج الترجمة في 1971 خاص بالترجمة من الإنجليزية إلى اللغة الفتينامية متخصص بترجمة وثائق تتعلق بالتجهيزات العسكرية. وطورت لوجوس في الثمانينات برنامجا للترجمة الألمانية/الإنجليزية. وظهرت إصدارت لاحقا خاصة باللغات الفرنسية والإسبانية والإيطالية ولغات أخرى. وطورت شركة لوكوس برامج ترجمة ملحقة لنشر متعدد اللغات.
يمكن تشغيل بعض برامج لوكوس على حواسيب شخصية باستعمال واجهة يونكس.
ويستعمل في عدة شركات عالمية.
تعريفات 7
Smart/ Seppli
تستعمل وزارة الهجرة والعمل الكندية برامج سمارت لترجمة طلبات التشغيل ما بين الفرنسية والإنجليزية, وتنشر النتائج مباشرة على شاشات 4000 حاسوب موزع على مجموع التراب الكندي ويمكن للموظف تدقيقها آنيا وأغلب التدقيقات مع قلتها تمس التركيب ولا يتطلب البرنامج مراقبة التركيب المسبقة وذلك راج لقصر النصوص مما يجعل تراكيبها بسيطة وإن تنوع التحرير, ويستفيد البرنامج من تعدد المعطيات ويدمجها.
وتمكن برامج سمارت ترانسليتر من ترجمة خامة بسرعة 200000ك/س مع حواسيب مركزية.

وطورت جامعة جنيف نظام سيبلي وهو قريب من السابق للتعامل مع الألمانية/الفرنسية والألمانية/الإيطالية لنشر عروض العمل الصادرة في عاصمة الفيدرالية بيرن باللغات الفرنسية والألمانية والإيطالية والتي كانت ترجمتها بشرية. وزيادة على الجانب الاقتصادي في القضية فإن البرنامج يهدف إلى تشجيع الطلاب على التعامل مع المعالجة الآلية للغات الطبيعية.
تعريف 8

Socatra
وسوكترا اختزال لأسم : الشركة الترجمة الكندية. ونظامها المطروح يتعامل ما بين الفرنسية والإنجليزية. ولا يوجد في السوق وتتم الترجمة الخامة أو المحققة داخل مكاتب الشركة
وتقول الشركة أن الطاقة الإنتاجية لنظامها تصل إلى 200000ك/س على الأقل ومولد مسردي ب 500000ك/س وهي أرقام ضخمة.

Metal
ميتال هي اختزال لعبارة : الترجمة وتحليل اللغات, وكانت بدايات المشروع في جامعة تكساس في 1961 للترجمة من الألمانية إلى الإنجليزية. وتخلت الجامعة عن المشروع لصالح شركة سيمنس الألمانية التي عرضت في الثمانينات أوائل منتوجها للترجمة في ما بين العديد من اللغات –الفرنسية الهولندية الألمانية الإسبانيةـ وهي برامج ناجحة في مجال الاتصالات.
وميزة النظام أنه مركب من وحدات قابلة للتغيير مع مجموعة من القواعد النحوية المحددة يمكن الرجوع إليها كلما دعت الضرورة وقت التحليل وهكذا نحصل على عدة تمثيليات مقبولة للجملة وترفض أقل التمثيليات قبولا. ورغم أن نظام الوحدات المستقلة يسمح بالتطوير الدائم والتحسين إلا الزيادة المعجمية والبرمجية تؤدي إلى نتائج سلبية.

PC-translator
الحاسوب المترجم قد تجدونه في الأسواق على شكل حواسيب جيبية : وهو نظام يختلف عن باقي الأنظمة الأخرى. فشركة المنتوجات اللغوية تعرض بثمن بخس برامج ثنائية اللغة ـ من وإلى الإنجليزية : الفرنسية/ الدنماركية/السويدية/النرويجية/الإسبانية/الهولندية/الألمانية/الإيطالية....
والبرنامج ليس مؤللا بالمعنى الدقيق فهو يكتفي ببعض المواصفات اللسانية وبعض الوحدات اللغوية وقلة من القواعد التركيبية فهو أقرب إلى برنامج مساعد منه لبرنامج آلي أو مؤلل.

Gigatext
مثل مدرسي لما يجب الابتعاد عنه : خسارة ملايين الدولارات الكندية في برنامج يترجم النصوص القانونية ما بين الفرنسية والإنجليزية ولكن النتيجة صفر.

Winger
نحت شركة وينجر للنسيج منحى الترجمة الآلية من الإنجليزية إلى الدنماركية مستغلة قاعدة معلوماتها الضخمة. والبرنامج يعوض نقص الجانب التركيبي بالتفاعلية إذ أنه يمنح المستعمل عدة حلول يختار منها أحسنها. وهو أقرب إلى برنامج ألي مساعد للترجمة. وتعرض الشركة حاليا عدة برامج للترجمة بين اللغات الإنجليزية والإسبانية والروسية.

PaTrans


نظام للترجمة بين اللغتين الإنجليزية والدنماركية متخصص.


Tovna
برنامج إسرائيلي لم يخرج للسوق إلا في 1985 للغتين الفرنسية والإنجليزية والروسية. وميزته التقنية أنه يستفيد من تدقيقات الترجمات الخامة ويستغلها في ترجمات لاحقة.

Lexi-Tech
برنامج كندي موجه لخدمات عسكرية محددة وبداية بهدف ترجمة 100000 صفحة ذات علاقة مع الترسانة البحرية. ويحوي معجمها 75000 عبارة ولفظة مع برامج توسط بني خاصة بالشركة.

البرامج اليابانية
ولنا معها عودة خاصة
متابعة للسوق التجاري الدولي وللتطور العلمي والتقاني فقد واجهت الشركات اليابانية مشكلة الترجمة بين اليابانية والإنجليزية. ولذلك أصبحت الترجمة الآلية مع الجيل الخامس من الحواسيب من المهمات الأولية منذ 1980 وقامت الحكومة اليابانية بمجهود ضخم وشجعت الأبحاث في المجال وكان للأستاذ ماكوتو نجاو ـ مشروع حكومي ـ تأثير في توجيه الأبحاث نحو تحليل تركيبي شجري.
وهناك توجه كبير لتوسيع البرامج إلى لغات أسيوية أخرى كالصينية والكورية وغيرها من اللغات العالمية.
ومن الشركات اليابانية ذات الباع العالي في المجال
توشيبا, و فيجيتسو, و ميتشوبيشي وهيتاتشي....
وكل مشاريعها واعدة على مستويات الترجمة ومعالجة الصوت {ترجمة المكالمات الهاتفية آليا}.
ورغم أن إنتاجية الكثير من برامج الترجمة المعروضة وتتطلب تدقيقا مكلفا إلا أن اليابان يعد من أكثر البلدان توسعا في التجهيز والاستعمال ويعتبر أن المستقبل هو للترجمة الآلية فلا خيار لها نظرا لانعزال اللغة اليابانية وقلة العارفين بها عالميا والمترجمين منها وإليها.
مراكز علمية
الصين حاولت الصين الشعبية تطوير برنامج jet لترجمة إلى الصينية من اللغات الإنجليزية والفرنسية والألمانية والروسية. ولكن المشروع لم يعطي لحد الساعة نتائج
مجموعة الدول المستقلة
PARS
هو نظام للترجمة بين الروسية والإنجليزية يخص النصوص العلمية والاقتصادية. وهو يعتمد على نتائج جامعة جورج تاون للترجمة لغة إلى لغة.
SPRINT
خاص بمجالات الحاسوبيات والاقتصاد وهو إنجليزي روسي اللغة وعرضته مجموعة الترجمة لعموم روسيا.
ASPERA
هو من نوعية الأنظمة المعجمية روسي إنجليزي اللغة.
ETAP
نظام إنجليزي روسي اللغة خاص للنصوص الحاسوبية و للعلوم المعلوماتية.
ولبقية المراكز سنعود إليها في موضع آخر.

GETA
Ariane & Callipe

جامعة جرونبل الفرنسية ومركزها للدراسات والترجمة المؤللة الذي أداره بجدارة الأستاذ فوكوا لسنوات وقد اهتم مركزه بأوجه متعددة للمعالجة الآلية للغات. وكانت الترجمة من الروسية أحد مرتكزات العمل في المعهد.

Susy
بدأ مشروع سيزي في 1972 في جامعة شروبروك الألمانية للترجمة من الألمانية إلى الروسية. وتوجه الاهتمام نحو إضافة لغات أخرى الفرنسية والإنجليزية والدنماركية والهولندية وأولى المركز أهمية للغة الإسبرنتو. واستعمل البرنامج للفهرست الوثائقية وتحليل النصوص وإدماج المصطلحات الخارجية..
DLT
برنامج هولندي. تفاعلي متعدد اللغات يمن من توليد نصوص في إطار شبكة حواسيب. مع بنك معلومات معرفية بين اللغات . وتتم الترجمة عبر لغة توسطية هي لغة الإسبرنتو التي تستعمل للتواصل بين الحواسيب النهائية. فهو إذن موجه للتواصل أكثر من توجهه للترجمة رغم ما يزعم واضعوه.
Rosetta
أول برنامج من القطاع الخاص في أروبا. من شركة فيليبس. وقد نتجت عنه تجارب بين الإنجليزية والأسبانية والهولندية.
LMT
هو برنامج لشركة إبم المعروفة وهو برنامج ذي هدف متواضع ويتعامل مع اللغات : الفرنسية والإنجليزية والألمانية والدنماركية وغيرها. والمعجم والمسارد معروضة على الشاشة وعلى المستعمل التعرف على الترجمات المعروضة.
Pangloss
من عمل جامعتي المكسيك وكاليفورنيا الجنوبية وهو موجه لمنصة عمل المترجم.
ArchTran
من نتائج تايوان.
Systran

سيستران هي اختزال للعبارة الإنجليزية الترجمة الآلية, نظام أمريكي من تصور بيتر توما, اعتمدته وطورته لجنة المجموعة الأوروبية في أواخر السبعينات لمصالحها الترجمية وصدرته للأسواق. ورغم ما يعاب عليه من حيث المستوى الجمالي واللساني هو أكثر البرامج في الوقت الراهن عمليا وظيفية التي تساير متطلبات الترجمة الآلية ويمكن ترجمة صالحة مباشرة دون تدقيق وإن كانت النصوص الخارجة غير صحيحة مائة في المائة على المستوى التركيبي والنحوي.
وقد خضع تطويره لعدة مراحل ولم يتم تصوره مباشرة كتطبيق لنظرية محددة وإنما تميز بتكون متنام مجزئ المراحل وهو ما يعيبه عن البرنامج أصحاب الموقف النظري .
ويتعامل سيستران في المجموعة الأوروبية مع أزيد من 14 زوج ـ لغة. بتفاوت في الإنتاجية بين الأزواج فأقدمها تعطي نتائج متميزة عن الأخرى.
وطورت الشركة صاحبة المشروع, كاشو, نظام مصلحة ترجمة مباشرة على الخط لعدة لغات.
وبلغت إنتاجية البرنامج لبعض الأزواج : 500000 ك/س أي 1000 ص/د وهو ما يقارب عشرين صفحة في الساعة.
وحاولت شركة كاشو في مراحل تطوير نظام عربي سنتطرق له في جانب البرامج الخاصة بالعربية. ولأن هذا برامج سيستران هي المعتمدة في المجموعة الأوروبية فسنعود إليها تفصيلا لاحقا.





Eurotra

اختزال لعبارة الترجمة وأوروبا. منتوج أوروبي خالص, بدأ التفكير فيه عام 1977 على المستوى الأكاديمي بعرض تشجيع البرامج الأوروبية, ودعمته المجموعة الأوروبية. وكان الهدف محاولة إيجاد مترجم آلي يتعامل مع كل اللغات الرسمية في المجموعة الأوروبية وهي كانت تقارب الثمانين زوجا آنئذ واليوم تفوق 300. وميزة البرنامج أنه بني انطلاقا من نظرية متميزة تعتمد على [تمثيل] تصوير وسطي ودلالي مجرد بين اللغة الأصل ولغة الهدف ونمط التحويل. عكس البرامج المطورة حول محور والتي تتطلب لغة ثالثة شديدة الهيكلة.
وفي برنامج أوروترا يتشكل التصوير من تراكيب اللغة الأصل مع معلومات معجمية عن الألفاظ و بنية النص مرفوقة أحيانا بتصوير لمعلومات دلالية. وتصوير اللغة الهدف هو منسوخ عن تصور لغة الأصل. ويتدخل التجريد في تصوير المرحلة الوسطية. ورغم أن نمط المحور هو أكثر اقتصادية إلا أن الاختيار وقع في هذا البرنامج على نمط التحويل وهو يتطلب لكل لغة ـ هدف كتابة ثلاث وحدات أنماط : نمط التحليل ونمط التحويل ونمط التوليد ـ عكس نمط , بل أنماط المحور التي تتطلب فقط كتابتين : التحليل والتوليد غير أنها عمليات صعبة تتطلب تعمقا كبيرا في النص الأصلي. وتوليدية معقدة وعلى العكس ففي نمط التحويل يكفي تطبيق قواعد التركيب النحوية.
وهناك أسباب أخرى تفسر هذا الاختيار راجعة لطبيعة اللغات المراد التعامل معها.
فأمام اللغات المتقاربة صنفا وتركيبيا كاللغات الأوروبية يستحسن استعمال نمط التحويل لتشابه المعجم وتقارب التركيب, أما إذا تعلق الأمر بمزج بين لغات متباينة الصنف كالإسبانية والصينية مثلا فيفضل نمط المحور لما يتطلب ذلك من تصور شديد التجرد مشترك بين اللغتين وكما قلنا فهذا البرنامج موجه أساسا لخدمة اللغات الأوروبية المتقاربة.



إحالة : الزوج اللغوي
للدقة يجب التمييز حين الحديث عن الأزواج اللغوية زوج ـ لغة يعني من لغة س إلى ص أما من ض إلى س فذلك زوج آخر والمابين لغتين تعني إذا زوجين.
وحين تسمع ببرنامج يتعامل : من س إلى ص
ومن س إلى ن
لا يعني أنه يتعامل من ص إلى ن
لأن هندسة اللغويات الحاسوبية تأخذ بعين الاعتبار تأثير النقل والانتقال للغوي فالقواعد المتحكمة في الانتقال من لغة إلى أخرى تخلف عن قواعد النقل المعاكس. ولذلك قد تجد برنامجا ذي إنتاجية عالية في الترجمة من لغة إلى أخرى وضعيف الانتاجية حين يتعلق الأمر بالترجمة المعاكسة لنفس اللغتين وقد تنعدم هذه الأخيرة في بعض البرامج أي تنجد مترجما آليا من لغة س إلى لغة ص حصرا وليس العكس.

إحالة : في الحدود بين الآلي والمساعد الآلي
أن هدف الترجمة الآلية هو الاغتناء عن العنصر البشري وبقدر ما قل تدخل هذا الأخير يعد البرنامج آليا وحين يتطلب تدخلا كبيرا يعد البرنامج مساعدا. وتتحدد الفروق أيضا إذا اعتبرنا نوعية وسعة المعجم وطريقة هندسة البرنامج ذاته. فإذا كان البرنامج يكتفي بترجمة كلمة إزاء كلمة فهو مساعد لا أكثر لأنه يفتقد آليات العمل المؤلل.


إحالة : المحورية أو التحويل

إن نمط المحور يتشكل من وحدتين نمطيتين : التحليل الذي ينتج عنة تصوير/ تمثيل للنص الأصلي في لغة جديدة مستقلة ونمط توليد يترجم هذه اللغة الجديدة إلى لغة الهدف, والعملية الوسطية تهتم بالمفاهيم المجردة والعلاقات بينها وليس بالتركيب الجملي وقد تحمل معلومات خالسانية. ففي نمط المحور يتجاوز التصوير حدود الجملة إلى النص حاملا معه معطيات خطابية وذلك يستحيل قي نمط التحويل الذي يتعامل مع كل جملة على حدا
ومنه يمكن أن نتخيل أن النمط المحوري أقرب إلى معنى النص وإن ابتعد عن هيكلة النص الأصلي. ومع يضل نمط التحويل أسهل لأنه في آخر المطاف يكتفي بالجانب اللساني من عملية الترجمة.

أن كل برامج الترجمة المؤللة تهدف في ما تهدف إلى مساعدة المترجم في :
الترجمة في للشركات الكبرى تتبعا لسوقها العابر للحدود من أجل محو هذه الحدود.
خدمة للتجسس الصناعي والتتبع التقاني, لتتبع واستباق ما قد يبدعه الخصم من جديد في حرب تنافسية.
من أسلحة الحرب باردة أو حامية.
هذه أبرز المشجعات على تطوير برامج الترجمة المؤللة وإن تم إدخال نتائج التطوير في مجالات أهلية وإلى استعمالات شخصية أو سلمية.
والملاحظ هو أن البلدان ذات التعدد اللغوي المؤسس هي التي تبنت وأنتجت أحسن البرامج.

سيستران حفريات تاريخية.
SYSTRAN

حفريات تاريخية
في الخمسينات وفي جو الحرب الباردة بدأت الولايات المتحدة تتخوف من التطور التقاني السوفياتي. وتخيل الأمريكان أنه لو تمت ترجمت خيرة الوثائق العلمية الروسية لتمكن خبراء الغرب من استباق تقدم الروس وتحديد قدراتهم.
وكان مصب همهم هو كل ما تعلق واقترب من القدرات والتقنيات العسكرية من وثائق بما فيها البحوث الروسية النووية والفضائية.
ولأن ترجمة بشرية لكم هائل من الوثائق و بالسرعة المطلوبة لم يكن ممكنا فقد انصب التفكير على آلية وآلة مترجمة.
وفي خضم الصراع على السبق الفضائي لم تعد ترجمة الوثائق الروسية قضية علمية فحسب بل مسألة مصير وبالتالي سياسية. ذلك أن الروس أطلقوا في الرابع من تشرين 1957 صاروخ سبوتنيك نحو الفضاء, ودار الملاح الروسي يوري جاجرين حول الكرة الأرضية في الثاني عشر من نيسان 1961. وبمجرد وصول الرئيس الأمريكي كيندي إلى البيت الأبيض طالب ببدل الجهد لمحو العار الذي لحق بالولايات المتحدة.
وتزامن ذلك مع تطور الحاسبات الآلية وتطور الإليكترونيات ودخولها ميدان الحسابات العلمية المتخصصة. و بدأ البعض يفكر في ربط معالجة اللغويات مع التحليل بالمقدرات الإليكترونية.
وفي 30حزيران1966 نزلت مركبة أمريكية على القمر و تم إطلاق أول قمر صناعي, أبولو 8 , أمريكي آهل حول القمر في 1968 , ووطأت قدم أمريكية سطح القمر في الواحد والعشرين من حزيران 1969.
وإن لم يكن لتأليل اللغويات والترجمة دور في ذلك فإن المرحلة صبغت بطابعها الدراسات في الميدان ومنحت للبحوث في الترجمة الآلية نفسا قويا. وخصصت الحكومة والشركات الكبرى مبالغ ضخمة للتجارب في الترجمة الآلية.
وكانت جامعة جورج تاون بواشنطن أولى الجامعات التي دخلت الميدان حيث بدأ طاقمها في اللسانيات قبل المهندسين بترميز المعارف اللسانية.
وأعطت تلك المجهودات : منظومات ترجمة روسية/إنجليزية مثل مارك1 ومارك 2 لـ إ.ب. م. التي وجهت للاستعمال في سلاح الجو الأمريكي وكذلك نظام جورج تاون الذي دخل الخدمة بمركز لجنة الطاقة الذرية ومركز الأبحاث الذري.
وكان للمهندس من أصل بلغاري بيتر توما دورا متميزا في مجال معالجة اللغة آليا, حيث اقتنع بضرورة التواصل من وإلى الروسية بحكم عمله كضابط اتصال خلال الحرب.
وبدأ بيتر توما في 1956 بتطوير فكرته وتطبيق معارفه عن اللغات في هندسة تقانة الحواسيب. هادفا ابتكار برنامج عملي للترجمة الآلية. عارضا عن اللسانيين فهو لم يتخيلهم أبدا بقادرين على حل المعضلة وحسب رأيه ـ وهي مدرسة في معالجة اللغات آليا ـ فإن على معالجة اللغات أن تنقاد للحاسوب وليس العكس.
وابتكر توما في معهد كاليفورنيا للتقنيات, في الستينات نظام أوتوتران autotran وبعدها تكنوتران technotran وأخيرا سيستران العامل على إ.ب.م. 360 في سنوات64- 1963 .
ولما ظهر أن البحوث في مجال تأليل اللغات لا يعطي النتائج المرتقبة أصدرت لجنة مراقبة تأليل اللغات في 1967 تقريرا منتقدا مطالبا بتقليص الاعتمادات المالية في الميدان ورغم أن التقرير لم يطالب بإلغائها فقد أثر التقليص على الكثير من برامج البحث.
إلا أن توما وكعادته فسر خلفيات التقرير بأنها راجعة لتقوقع أصحاب نظريات غير عملية وتطبيقية.
ونجح في نقل مشاريعه إلى شركة ألمانية والتي أخرجت في 1968 برنامجا عاملا على إ.ب.م. 3460-50.
بعدها مباشرة اعترفت مديرية التقانات الأجنبية في سلاح الجو الأمريكي بتميز منظومة سيستران على باقي الأنظمة واشترت أول نظام ترجمي منه في 1969 , . ومنذ ذلك الوقت ونظام سيستران يتطور بنجاح وفي 1973 دخل الخدمة في وكالة الفضاء الأمريكية في مشروع اتصالات سيوز-أبولو ومولت الوكالة برنامج ترجمة روسية إنجليزية. [ عد لما قلناه بخصوص الأزواج اللغوية].
وتوجه البحث في اتجاه الإنجليزية الفرنسية عام 1974 بتشجيع من مكتب الترجمات الرسمية بكندا وشركات فورد وجينرال موتورز.
و الجدير بالذكر أن البرامج الأولى المقتناة كانت بهدف التجسس العسكري.

حفريات منهجية

وصولا لهذه الفترة من تاريخ الترجمة الآلية نلاحظ:
أن كل البرامج كانت ثنائية اللغة ولم تظهر فكرة لغة محورية تدور حولها عدة لغات إلا لاحقا.
البرامج المعروضة هي برامج عملية وليست ذات تعمق نظري لساني موجهة لأهداف محصورة ومحددة فاعلة مما يغضب أصحاب التنظير الذين لا يرون في برامج سيستران إلا كشكولا ومن هذه الناحية يمكن اعتبار سيستران نقيضا على صعيد منهج العمل لأرورترا, مثلا , وغيره من البرامج التي تأخذ بعين الاعتبار مسألة تحديد مسبق لمواصفات اللغات بهدف الوصول لتحديد لغة محورية تكون قاعدة للترجمة. ومع هذه الانتقادات تبقى منظومة سيستران أكثر البرامج فعالية وإنتاجية في ميدان الترجمة الآلية.


حفريات
لم يكل بيتر توما من العمل وفتح الأسواق الجديدة, إذ أنه توجه للمنظومة الأوروبية عارضا عليها برامجه ومنهجيته. وتزامن ذلك مع دخول برنامج أورونيت euronet ميدان الخدمة في المديرية الثالثة عشرة في المنظومة الأوروبية ...... وهو برنامج يهدف إلى توحيد وسيلة استجواب قواعد المعلومات الوثائقية في عموم أوروبا ولذلك طورت المخازن متعددة اللغات. ولرفع المردودية فقد توجه التفكير إلى الترجمة الآلية.
واعتمدت المديرية برنامجي سيستران وتيتوس في 1976.
فالأول هو البرنامج الوحيد الذي يتعامل مع النصوص كاملة للترجمة من الإنجليزية إلى الفرنسية ويتوافق مع تجهيزات المديرية الحاسوبية. وقد يمكن من ترجمة كاملة لقاعدة معلومات وثائقية تهم المنظومة عامة, من الإنجليزية إلى الفرنسية وربما من الفرنسية إلى الإنجليزية لاحقا.
وتيتوس برنامج ذي تراكيب مختزلة عامل بين الإنجليزية والفرنسية والألمانية والإسبانية [عد للتعريفات] وخممت المديرية في توسيع تركيبه ولأسباب زمنية تخلت عن هذا البرنامج ليبقي سيستران البرنامج الوحيد المطلوب تطويره . وهكذا انطلقت مرحلة إعداد معاجم لترجمة ملخصات قاعدة علم التغذية والتقانة وهي قاعدة مرتبطة بأورونيت, و حقق البرنامج تطورا في ترجمة زوج اللغة إنجليزية/ فرنسية وبدأ تطوير أزواج أخرى.
ومع ذلك فلم يصبح برنامج سيستران عام التوظيف في المجموعة الأوروبية إلا في بداية الثمانينات.

يستعمل حاليا نظام سيستران في لجنة المجموعة الأوروبية وسلاح الجو الأمريكي وكبريات الشركات الدولية وغيرها من المواقع.
وحيث أن كل مجال وكل موقع له حاجته المختصة من المعجم فذلك يعني أن معاجم المنظومة الترجمية في تطور لأن كل مجال يتطلب تطوير معجم خاص, وأن آليات الوصول إليها يجب أن تتحسن لتدخل برامج المنظومة حيز الحواسيب الشخصية ومنصات العمل الترجمي الشخصية مع ما يعني ذلك من سعة الانتشار والاستعمال.
أما في ما يتعلق بالمنصات الكبرى ذات المراكز الحاسوبية الضخمة, فلا منافس لسيستران إطلاقا من حيث : سهولة الوصول إلى الهدف و إمكانية التجديد والتحيين والشمولية وهي ميزات مهمة لكل برنامج حاسوبي ويعزى هذا السبق لأقدمية تجربة المنظومة
المنهجية
أولى القائمون على مشروع سيستران منذ البداية أهمية لتعدد استعمالات المنظومة وتوافقها مع مختلف الحالات ولم يحصروا اهتمامهم في مجال عملي ضيق. وكان الهدف منذ البداية حسب بيتر توما اختزال عملية التأليل الترجمي إلى ما يمكنه منطق الرياضيات والمعلوميات من سبل.
ولم يضيق القائمون على المشروع على أنفسهم بقواعد نحوية محددة قاهرة. وحسب البعض من معارضي المشروع فإنه يستحيل الحصول على نتائج صحيحة في برنامج يعدم مثل تلك القواعد النحوية.
ثم أن توسيع المجال يمكن من الاستعمال في كل الحالات لنفس البرنامج الترجمي : محاضر اجتماعات ووثائق تقنية والبيانات التقنية... وطبعا ذلك يعني وقتا زائدا لاختيار الترجمة الموافقة لكل حالة على حدا من بين العديد من الترجمات المطروحة.
وبتلخيص شديد فإن منهجية المنظومة جمعت بين السطحية والعملية والفعالية. أليست العبرة بالنتيجة لا في ما يسبقها من كلام وتنظير؟.
والفرق بين المنهجيتين, ولنا عودة بتوسيع أكثر لهذه النقطة, يتلخص في موقف ينطلق من العملي وشروط ومتطلبات التقانة والمنطق الرياضي و منطلق يولي أسبقية لتصور نظري لساني شامل قبل الجانب التقاني وهذا لا يعني انعدام أرضية منطقية في هذا التصور كما سنرى فيما بعد.
والقضية, بتعبير أوضح مع شيء من الغلو, هي من يقهر أو ينصهر للآخر الإلكترونيات أم اللغويات؟
__________________
مهندس/ رائد حبش
mobile: 0021374323046 Algeria
رد مع اقتباس
  #3  
قديم 06-04-2006, 02:40 PM
الصورة الرمزية RaedHabash
RaedHabash RaedHabash غير متواجد حالياً
عضو رسمي
 
تاريخ التسجيل: May 2006
المشاركات: 279
افتراضي حول المعالجة الآلية للغات

amattouch



شاركت: 15 فبراير 2006
نشرات: 285

ارسل: الاحد فبراير 26, 2006 10:31 am موضوع الرسالة:

--------------------------------------------------------------------------------

نظريات نحو الخصائص
هي نظرية تولي الشروط أهمية كبرى.
يمكن الحديث بعد ظهور نظريات نحو التوحيد عن نظريات تنطلق من المشروطية. وحتى في النظريات التوليدية( برنامج الحد الأدنى مثلا) مبنية على شروط عامة وفي نظرية الحد الأقصى تصبح كل معلومة ممثلة أو مقدمة على شكل شروط غير إلزامية.
و. قد طهرت المشروطية في مجال الحاسوبيات مبكرا ولم تحد صدى إلا في أوساط الذكاء الاصطناعي والأبحاث العملية.
وللذكر فإن مبتكر لغة برولوج ألن ألت كولماور أولى أهمية للمشروطية وجاءت لغة برولوج الثانية أول لغة برمجة تتعامل مع الشرطية جوهريا وليس كبرنامج ملحق. أي أن آليات التوحيد في هذا البرنامج ـ برولوج ـ تعتمد على معالجة نظام معادلات ولا معادلات. هذا التصور الذي طورته لغات البرمجة المنطقية تخت الشرط إلى آليات عامة لتحقيق الشروط ويغدو معها التوحيد فقط حالة للمشروطية مع التمييز في تحقيق الشروط بين الشرط الفعال غيره.
المشروطية تلعب نفس الدور في الحاسوبيات واللسانيات.
ما هي الخصائص التي تمكن من حصر وتحديد مجال متغير وتحدد مسألة تحقيق الشروط بمجموعة محصورة من المتغيرات الشرطية. ويتعين لحل المسألة وتحقيق الشروط إيجاد قيم وأدوار للمتغيرات تساير الشروط. وبتلخيص إن عدد مجموع الشروط قضية أساسية لصياغة القصية بل أيضا لمعالجتها فقبل التشريط يتوجب تحديد المتغيرات.

المشروطية وخصائص اللغة
في اللسانيات وبالأخص في مجالات الصرف والتركيب كثيرا ما يستعمل مفهوم المشروطية للتعبير على حدود مجالات الحالة المدروسة أي الشروط التي تحصر محال الحالة بدقة. وهذه الشروط قد تكون عامة صالحة لمجال واسع تشبه إلى حد ما مبادئ عامة أو شروطا صارمة تضيق المجال إلى أقصى حد كحذف ساكن إذا التقى ساكنين مثلا.
وتهدف الشروط إلى تحديد ما هو منتم من التركيب للغة ما أو لا. وقصية الشروط جوهرية في اللسانيات قبولا أو رفضا. وسنتطرق فيما يلي لما يهم المعالجة الآلية للغات أي البرمجة اللغوية المشروطة.

وبعبارة أخرى فلكي تكون القضية المعالجة تساير الشروط يتوجب تحديد مجموعة محصورة من لمتغيرات مع ذكر مجال تعريفها، والصعوبة الكبرى التي تعرضت لها المعالجة اللسانية المشروطة هي أنها تمس قضايا معقدة يصعب تحديد محال تعريفها سلفا وبالتالي فمعالجتها تتطلب مجموعات غير محصورة من الشروط.
أولي المتطلبات هي أن التطبيق يتناول مواضيع مشروطة يعني أنها مواضيع تستجيب للشروط الخاصة : فعوض أن نولد قيما لموضوع ثم التحقق من الخصوصيات يجب التحقق من هذه الخصوصيات سلفا أي قبل توليد مجال تعريف القيمة موضوع الدراسة.
ومن إيجابيات المشروطية هو أنه يمكن تقديم معلومات عن موضوع دون منحه قيمة محددة. وفي حالات يمكن اختزال منظومة الشروط للحصول على تحديد مضبوط لبعض السمات وبعبارة أخرى إيجاد مقاربة للحلول وذلك كما نفعل حين نقارب الحل بطريقة الحيز، فإننا لا نحصل على حل وقيمة محددة ولكننا باختزال منظومة الشروط (توسيع مجال عملها) يمكن أن نحصل على حيز يحوي الإجابة والحل.
فكرتا أسبقية الشرط الفعالة والمقاربة فكرتان أساسيتان.
وفي الواقع فإن المشروطية بهذا المعنى في اللسانيات لم تعتبر إلا كسمات خاصة يجب التدليل عليها خلال مراحل التحليل ومنه يفهم أن نظرية تحقيق الشروط كما تفهم في مجالات دقيقة استعمال يشوبه تجاوز في اللسانيات. ولا يوجد لحد الساعة محلل تركيبي يحترم بدقة قواعد المشروطية. ويمكن أن نتساءل عما إذا كانت المعالجة الآلية للغة تشكل موضعا في تصور تحقيق الشروط ورغم أن بعض اللسانيين يجيب بالإيجاب إلا أنه يلاحظ الفرق بين وصف الموضوع وتركيبه حاسوبيا فهل هي قضية تلاءم حاسوبي أم لساني؟ وهذا ما سنراه قيما بعد.
أهداف التحليل اللساني
أن اللسانيات الصورية في مجموعها والنظريات الناتجة عن التوليدية لا تطرح إلا سطحيا مسألة التحليل اللساني وأهدافه، فهي من جانب الأهداف تكتفي بربط الناتج الخارج مع بنية مجردة تمثلها (شجرة، بنية سمات أو مجموع مجسدات...). والتساءل المطروح ما هو إذن دور هذه التمثيلية؟
معروف أن النظريات اللسانية تصب اهتمامها على مستوى وحيد من مستويات التحليل اللساني( التركيب والدلالة والصرف...) وفلما توصلت نظرية لسانية إلى الجمع بين الاثنين كما تفعل نظرية نحو رأس المقطع المتحكم التي تمزج بين التركيب والدلالة أو بين الصواتة والصرف، وفي العموم فإن اهتمامات النظرية اللسانية تبقى محصورة في مستوى وحيد.
وهذا الاختزال مضر ولا يمكن الاكتفاء بتكديس التحاليل الجزئية فالتفاعل والتبادل بين مختلف المستويات معقد ومؤثر ويتطلب التحليل تتبع أثر كل العوامل في نفس الوقت.
ومن جانب آخر ليكون التحليل مجديا يجب أن نجمع بين الهدف الوصفي للسان وأهداف المعالجة الآلية وتطبيقاتها.
من مرامي اللسانيات الصورية التقليدية أيجاد آليات تحدد انتماء عنصر ما إلى اللغة أو لا وهو ما نسميه بنحوية أو لا نحوية العنصر(مركزية البنية التركيبية المرتبطة به) إلى جانب ذلك هناك التصور الوصفي الذي يحاول وصف ناتج ما بغض النظر عن نحويته ومقابلته مع معيار محدد ووسمه بمجموع خصائص لاستخراج معلومات قد تكون جزئية. أي أن التحليل يعطي معلومات عن عنصر كيفما كان وهو ما حاولته النظرية القصوية.
أي أننا نعوض النحوية بالتخصيصية.
وأن هدفنا لم يعد أيجاد ملائمة وتوافق بين نح وعنصر وعلاقات الاشتقاق والتوالد بين الاثنين وإنما تخصيص العنصر بمجموع السمات الخاصة به.
وما يهمنا هو هل مجموع السمات هذه يمكن أن تشكل شروطا إلزامية؟ وبطريقة أخرى هل التخصيص تشريط؟
طريقة التصور هذه تتعارض مع أسس التوليدية فالعلاقة بين نحو ولسان عبر سلسلة توليدية ليست بمركزية، ولا يهدف هذا التصور الجديد إلى دراسة العنصر من خلال سلسلة اشتقاقات انطلاقا من نحو ولكنه يكتفي بتخصيص العنصر وتحقيقه للشروط. وحاصل التصور ليس استخراج بنية تركيبية تمثل الاشتقاق بل تقديم مجموعتين من الشروط : ما تحقق وما لم يتحقق.
ويتشعب أصحاب المدرسة الجديدة بخصوص هرمية البنية التركيبية إحدى ركائز التوليدية، فهناك من يعتبرها أساسية ومنهم، كأصحاب، نحو الارتباطات يمثلون المعلومات التركيبية مثلا بالعلاقات بين الكلمات لا غير. وقد نجد في هذه المدرسة من هو مرتبط بفكرة المكونات ولكن بطريقة تختلف بعض الشيء عن التوليدية فلا حاجة لهم لشجرة محلية تبرهن على سمات المكون.
تأليل النظريات اللسانية
ما هي النظرية اللسانية؟
أو بعبارة أخرى ما هي حدود النظرية اللسانية حينما يتعلق الأمر بتثبيت هذه النظرية والتحديد النظري والصوري؟
وبدون الدخول في دقائق الجدل حول مكانة نظرية ما يمكن التسليم بأن النظرية اللسانية تعبر عن عموميات بخصوص موضوعها وهو اللغة.
قد يؤول هذا التعميم كبحث عن مبادئ عامة لغوية تختزل إليها النظرية اللسانية، هادفة في الواقع إلى خلق نحو عام كوني. وما يهمنا أساسا هو إطار عام يحدد الخصائص العامة لمختلف المكونات لتحليل اللغة وعلاقات المكونات فيما بينها. ومنه يمكن وضع نظرية للغة محددة، أي أن نحوا ما هو: نظرية للغة معينة وتصور نظرية للمعلومات المتعلقة باللغة.
والصورنة هي بيواجهة بين النظرية والمستعمل. وفي مجال الحاسوبيات كثيرا ما يخلط بين النظرية والصورنة لدرجة يتعذر فيها التفريق. وبعض اللسانيين يرى أن نحو الرأس الموجه لتركيبات التعبرة والنحو المعمم لتركيبات التعبرة ليستا بنظريات مطلقا، وآخرون يرون أن النحو المعمم لتركيبات التعبرة هي صورنة وأما في نحو الرأس الموجه للتعبرة فيعتبرونه نظرية. وآخرون يرون أن نظريات نحو التشجير الملحق ونحو المعجم الوظيفي نظريات لسانية وليست صورنة أو حاسوبية.
وهذه المواقف ليست بمهمة. فكل نظرية لسانية من أجل تثبيتها تتطلب صورنة. فالصورنة هي تعبير وتمثيل للنظرية وكل نظرية لها كتابة صورية ولذلك يقع الخلط بينهما في اللسانيات الحاسوبية.
هل النظرية مستقلة أو مرتبطة بنظرية أخرى (الما بعد نظرية)؟ فتأويل النظرية هو بالذات من صلب هذه الرؤية أي إيجاد دلالات و مكونات النظرية. مثلا يمكن أن نرى في نظرية النحو الموجه تطبيقا خاصا لنحويات السياق الحر وهو ما دفع البعض إلى اعتبار النحو الموجه كما يمكن أن نأخذ هذا النحو كنظرية كاملة الاستقلالية.
وحين نتعاطي للنحو التركيب الموجه لو توقفنا عند المعلومات :
التحكم المباشر/التحكم الخطي، علما أن التحكم المباشر يهتم بالمعلومات الهرمية بينما يولي التحكم الخطي أهمية للمعلومات الخطية. فإننا نحصل على تأويلين:
*التأويل غير المباشر: إن نحوا ما هو نحو سياق حر إذا استجابت قواعد الترتيب فيه للشروط النظامية ولم ترتبط بالسياق.(الدالة نحو/لغة هي من شاكلة نحويات السياق الحر)
*التأويل المباشر: كل نحو هو مجموعة قواعد خطية ومباشرة, مثلا لنأخذ نحوا ما ’ن‘ وشجرة ’ش‘ في لغة ’ن‘ فإذا كان لكل شجرة محلية قواعد تحكم مباشرة فترتيب فروع ’ش‘ يلائم قواعد التحكم الخطية.
التأويـل الأول هو غير مباشر لأنه ينطلق من نحويات السياق الحر أما الثاني فهو مباشر لأنه يحيل إلى نظرية أخرى.
ولما كان التأويل ذي أثر مؤكد على تثبيت النظرية. فما هو الأجدى التأويل المباشر أم غير المباشر؟
إن لغات السياق الحر لها ميزة أساسية ألا وهي توافقها مع خوارزميات فعالة مما شجع على استعمال هذه الخوارزميات وأدى ذلك إلى اختزال مشكل تثبيت نظرية لسانية في مسألة كتابة حوسبية لنحويات ممثلة ومصورنة كنحو حر السياقات. (أكثر الخوارزميات المستعملة هي خوارزميات أورلي).
وهذه الحل يتهرب من سؤال وهو : هل أن تثبيت نظرية لسانية يمكن أن يكون أو وفيا لهذه النظرية؟ وإلى أي مدى؟ وفي الكثير من الحالات يتم تجاهل هذا السؤال والتعلل بنجاعة معالجة نحويات السياق الحر فيكتفي بالبرهنة على التوافق والتعادل الموجود بين أنحاء السياق الحر والكتابة الصورية. وهذا لا يعد بجواب حاسم لأن:
- مشاكل ترجمة كتابة صورية (صورنة) بأخرى مشاكل معقدة ومتجاهلة،
- مسايرة نمط نظري ليس فحسب تمرينا بل هو دعم وتبن لأسس نظرية والبرهنة عليها تجريبيا وميدانيا. فالتثبيت يمكن من فهم وظائف مكونات النظرية واستيعاب تشكلها وارتباطاتها ويمكن من البرهنة على صلابة هذه النظرية وقدراتها.
فمن إيجابيات التأويل المباشر هو البرهنة على نمط نظري بالذات لا غيره/ مثلا نحو التركيب الموجه قدمت كحل لمحدودية مشاكل النظريات المقطعية المبسطة فهذا التوجيه يمكن من تمثيل شامل للنحو والتعبير عن شروطه باستقلالية عن القواعد المقطعية والتعبير عن الارتباطات بين مواقع وقضايا متباعدة في المنظومة التركيبية.
وفي التأويل الغير المباشر فإن التثبيت هو تثبيت لصورنة مختلفة. والصورنة الأصلية هي في هذه الحالة تعبير عن حالة خاصة. وعلى العكس فالتأويل المباشر لنظرية والذي يهدف إلى تثبيت مباشر لمجموع آليات التحليل التي تمكن من معالجة الصورنة الأصلية.
__________________
مهندس/ رائد حبش
mobile: 0021374323046 Algeria
رد مع اقتباس
  #4  
قديم 06-04-2006, 02:42 PM
الصورة الرمزية RaedHabash
RaedHabash RaedHabash غير متواجد حالياً
عضو رسمي
 
تاريخ التسجيل: May 2006
المشاركات: 279
افتراضي حول المعالجة الآلية للغات

amattouch



شاركت: 15 فبراير 2006
نشرات: 285

ارسل: الاحد فبراير 26, 2006 10:32 am موضوع الرسالة:

--------------------------------------------------------------------------------

الحساب اللامي
1
سأفتح فيما يلي بعض الملفات التقنية مبتدءا بتقديم حساب له أهمية كبرى في المعالجات الآلية للغات الطبيعية وبعده سأقدم منطق التأليف بل إحدى أشكاله علما أن هذا المنطق اتخذ العديد من الأشكال.

الحساب اللامي تحديدا هو لغة برمجة حاسوبية نظرية، ابتكرها الونزو شورش في الثلاثينات من القرن الماضي. ولهذه اللغة أهمية توازي آليات آلن تورين في نظرية تقبل الحسابية.
موضوع اهتمام الحساب اللامي هي الحدود اللامية وهي من ثلاثة أجناس :

المتغيرات : س،ص،......

التطبيقات : إذا كانت م وه حدودا لامية (دوال بالمعنى الرياضي) فإن م(ه) المركب المكتوب م ه هو أيضا حد لامي (حسب القانون الداخلي) : ويمكن أن نعتبر م كدالة وه كطرفها.

التجريد: إذا كانت س متغيرا و م حدا لاميا فإن س*م هي حد لامي، أي أن : : س-ه ؛ وهو ما يعادل م(ه)  الدالة التي تربط "س" و "م" (كبرنامج مثلا : (س)= م ونكتبها س*م وهو ما يمكنا من تعريف الدوال.

وبالفعل فإن التجريد (اللاميات) دوال ونتعامل معها انطلاقا من الدوال التي تشكله.
ولعلل ميدانية ندخل أحيانا ثوابت وعمليات أولية مثل الأعداد الطبيعية وعمليات الجمع والضرب المعهودة. ومن ناحية الحساب اللامي المحض فإن هذه الأوليات تتصرف كمتغيرات بيد أننا نقعدها بقواعد حساب خاصة.
الكتابة
الحساب اللامي له طرف وحيد غير أنه يمكن تجاوز ذلك بالطريقة التالية :  س*(ص*م)
ويمكن أن نرمز لها كتابة : س*ص*م أو س ص*م
وبطرقة التقويس يمكن كتابة
س1 س2 ......... سن = ((س1 س2)......سن)

المتغيرات المستقلة
نعرف مجموعة مت م(ح) متغيرات مستقلة للحد ح بالتكرار:
إذا كان س متغيرا مستقلا فإن مت م(ح) = {س}
إذا كانت م وه حدودا لامية فإن مت م(م ه) = مت م(م) مت م(ه)
إذا كان س متغيرا و ه حدا لاميا فإن مت م (س*ن)= مت م (م)-{س}
قواعد
إذا كان حد لامي لا يملك متغيرات مستقلة نقول عنه بأنه مغلق.
ونعرف تعويض متغير س في الحد اللامي م في حد ح بالبرهان الخلفي على ح ونرمز له ب:
ح[س م] :
إذا كان ح متغيرا فإن ح[س  م] = م إذا كان س = ح و ح وحدها
إذا كانت ح = ه ي فإن ح[س م] = ه[س م]ي[س م]
إذا كانت ح = ص*ه فإن ح[س م] =ص*(ه[س م] إذا كانت س ح و ح وحدها
ففي الحالة الأولى يجب الانتباه لكي لا تكون ص متغيرا مستقلا ل م. وفعلا ففي هذه الحالة تكون مسجونة باللامية الخارجية. وإذا كانت الحالة كذلك نعيد تعيين ص وكل تكراراتها في ه. وهي تحويل ألفبائي يمكن من تحديد ص*ه و ز*ه[صز] يعني أن المتغيرات في اللامية هي متغيرات خرساء.
مثلا:
س* س ص[ص أ] = س* س أ
 س* س ص[ ص س]= ز* زس وهو مختلف عن ص*س س.
الاختزال
نسمي اختزالا : حدا من شاكلة (س*م)ه. ونعرف اختزال (س*م)ه ككونه م[س ه] ونكتب علاقة الاختزال (س*م)ه م[س ه] وبالعكس م[س ه] تسمى اختزال (س* م)ه
وكمثال للاختزال:
(س* س ص)أس ص[س أ ] = أ ص
ونرمز ب * لغلق العلاقة الذاتية المتعدية  المختزِلة و * هي باءاختزال و=ب غلقها وهي ذاتية متشابهة ومتعدية تسمى باءتعويض أو باءتعادل.
ونستمل عملية أخرى تسمى إيتااختزال أو عكسها إيتاتوسع معرفة كالتالي :
س*م س ن م إذا كانت س غير مستقلة في م.
وأخيرا وحيث أننا اخترنا الأوليات فيمكننا أن نثبت طريقتها الحسابية بقواعد  اختزال.
مثلا إذا اخترنا الأعداد الطبيعية وعملية = كحدود إضافية فجداول الجمع ستستعمل قواعد . وحيث أن الأوليات هي تعريفا غريبة تماما عن الحساب اللامي فإن قواعدها الحسابية يمكن أن تأخذ سلفا أي شكل. غير أنه ولتوسيع عمل الخصائص أسفله في حالة الحساب بالأوليات فعلينا تقديم بعض الفرضيات على القواعد الزائدة.
التطبيع: مفهوم الحساب
إن الحد اللامي ت يسمى شكلا طبيعيا إذا لم نكن بقادرين على تطبيق أية ب اختزال عليه، أي أن ت لا تحوي أي اختزال.
نقول بأن حدا لاميا قابل للتطبيع إذا وجدت شكل طبيعي م ومتتالية حدود لامية: ت1،.........تن تكون فيه ت = ت1 و م = تن لكل ي(1ين) تيتي+1 أو ت ي+1تي. وم بهذا الشكل يسمى الشكل الطبيعي لـ ت.
نظرية شورش روسر لنأخذ ت و م كحدين بشرط ت=بم فإنه يوجد حد ه يساير ت*ه و ت*ه.
مقولة تساوي الأضلاع نفترض ت وم1 وم2 حدودا لامية إذا كانت ت*م1 وت*م2. فإذن يوجد حد لامي ه يسايرم1* ه وم2*ه.
وهي نظرية تعادل المقولة السابقة.
ويقال بأن حدا لاميا قابل للحسابية إذا تقبل شكلا طبيعيا، وبنظرية شورش روسر يمكن البرهنة على وحدة الشكل الطبيعي و على ارتباطية نسقية الحساب اللامي أي أن حدين لا يمكن أن يكونا معا ب تعويضين فيما بينهما. ومن الأمثلة التقليدية على عدم حسابية حدين لامين : =س*س س فإن الحد اللامي ليس قابلا للحساب لأن  + .
. أنواع الحسابات اللامية
باستعمال الرمزيات لخلق المواضيع العادية في الحاسوبيات.
الثنائيات
نعرف الثنائي الحقيقي بــ: أ ب*أ والخاطئ بــ: أب*ب. ونلاحظ أن الحقيقي س*ص*س وأن المغلوط س*ص*ص. ونحصل منه على برنامج إذا كان فإن: Y²ب م ه*ب م ه ويمكن أن نتأكد من أن إذا كان فإن صحيح: س ص *س وأن إذا كان فإن: س ص*ص مغلوطة
وانطلاقا من هذا للعمليات الثنائية التقليدية : لا = ب ...ب مغلوط /صحيح و =أب .... أ ب مغلوط أو أ ب ... أ ب أ أو أب ...أ صحيح ب أو أب ...أأب.
الأعداد التامة
نستعمل الأعداد التامة لشورش
ن = دس*د(د(....(دس)....)) مع ن د
مثلا 0=دس*س ، 3= دس*د(د(د(س)).
بعض الدوال
توجد طريقتين لترميز الدوال التابعة. بزيادة دالة في الرأس البداية أو في النهاية:
ن دس*د(ن دس)
ن دس*ن د(د س)
وبنفس الطريقة يمكن القيام بعملية الجمع بإلصاق الحدين اللاميين :ن ف دس*ن د(ف دس)
ولعملية الجمع سنستعمل الدالة د لنشر دالة على كل الحدود:  ن ف دس*ن(ف د)س
مكرِّرات
لترميز الخارزمية نعرف دالة التكرار على الأعداد التامة : تكرار= ن م ه* ن م ه أي أن ه هي الحالة القاعدية و م دالة التكرار مثلا الجمع:
جمع(ن+1،ف) = ف
جمع(ن+1،ف) =(ن+ف) +1
أي أننا سنبرمج بتكرار اللاحق التالي على الحالة القاعدية ف. والحد اللامي هو إذن  ن ف *تكرار ن لاحق ف. ونلاحظ أن جمع * ن لاحق ف .
الأزواج
يمكن أن نرمز الأزواج ب ل=ز*زأ حيث أن أ أول عنصر وب العنصر الثاني. وللوصول للطرفين نستعمل 2=ل*ل(أب*ب) و2=ل*ل(أب*ب). ونتعرف هنا على الثنائي صحيح/ مغلوط في هذه العبارات.
اللوائح
يمكن أن نلاحظ أن التام هو لائحة لا تملك مفتاحا. وبزيادة معلومة نبني لوائح بطريقة مشابهة للأعداد التامة : [ أ1....أن]= ج ي*ج أ1(...(ج أني)...))
مكررات على للوائح
وبنفس الطريقة نقحم تكرارا على التامات واللوائح. والدالة ت لائحة تعرف: =ق س ر*ق س ر ، كما هو للتامات. المفهوم هو نفسه تقريبا ولكن ببعض الاختلافات كما يظهر في المثال التالي :
طول ([]) =0
طول(س : : =1+ طول1
س::1 هو اللائحة بالرأس س وبالنهاية 1 ويرمز لها :  ق.لائحة تق( ي ر.جمع(ف س*ف س)ر) (ف س*س) أو ببساطة  ق* ق(ي ر*جمع1ر)0.
الشجرة و التفريع
المؤلِّف للنقطة الثابتة
المؤلف للنقطة الثابتة يمكن من دوائر غير منتهية. وهذا نافع لبعض البرمجيات كبرمجة دالة إيكرمان.
الحساب اللامي المنوع/الموسوم
ندخل نوعا بسيطا على الحدود ولا نعتبر إلا الحدود الجيدة النوع. وزيادة على الوضوح والفهم فهذا يمكن من تطبيع عالي أي أن كل الحدود وكل الاختزالات تنتهي إلى شكل طبيعي ( وهي وحيدة لكل حد بدئي). وبعبارة أخرى كل الحسابات الداخلة في هذا السياق هي منتهية. وبالمقابل القوة التعبيرية لهذا الحساب محصورة كثيرا فلا يمكننا مثلا تحديد الدالة: ن2ن
وبشكل صوري فإن المنوعات مبنية على الشكل التالي :
النوع القاعدي ي ( وإذا كان لدينا أوليات يمكن اعتبار عديد من النوعيات القاعدية كالتامات والثنائيات ... وهذا لا تأثير له على المستوى النظري)
إذا كان ي1 وي2 نوعيات فإن 1 2 هو نوع أيضا.
وحدسا فإن الحالة الثانية تمثل الدوال المتقبلة للعنصر النوعي من ي1 وتحيل على عنصر من نوع ي2
هو مجموعة من الأزواج على شكل (س،ي) حيث س متغير و ي نوع. وحكم نوعي هو ثلاثي:
 ت :ي ونقول حينئذ بأن ت جيدة التنويع في معرفة بتكرر :
إذا كان (س، ي)   فإن  ت: ي
إذا كان  (س،ي1) و: ي2 فإذن  س *و : ي1ي2
إذا كانت و :ي1 ي2 و  ه : ي1 فإن  وه: ي
وإذا اعتبرنا أوليات فيجب اعتبار نوع (عن طريق). وفي حالة قاعدة التجريد فزيادة س تطمس تكرارا محتملا سابقا للمتغير .
الحساب اللامي المسوم من مستوى ثاني
ولنتمكن من حساب أشياء أكثر ندخل متغيرات نوعية. وهذا يعقد الفهم ولكنه يوسع مجال التعبير.
__________________
مهندس/ رائد حبش
mobile: 0021374323046 Algeria
رد مع اقتباس
  #5  
قديم 06-04-2006, 02:44 PM
الصورة الرمزية RaedHabash
RaedHabash RaedHabash غير متواجد حالياً
عضو رسمي
 
تاريخ التسجيل: May 2006
المشاركات: 279
افتراضي حول المعالجة الآلية للغات

amattouch



شاركت: 15 فبراير 2006
نشرات: 285

ارسل: الاحد فبراير 26, 2006 10:40 am موضوع الرسالة:

--------------------------------------------------------------------------------

نحو طريقة تفاعلية لتحليل المكونات الصرفية والتركيبية آليا


إن وضع التحليل التركيبي الصرفي للغات الإنسانية هو غير مفرح منذ عقود طويلة. فمن جانب إن هذا التحليل هو الطريق الذي يؤدي إلى العديد من التطبيقات العملية في المعالجات اللغوية. ومن جهة أخرى فإن نقصا على هذا المستوى يعيق تحقيق مثل هذه التطبيقات. ولذلك يغدو البحث عن حل لهذه المشكلة مهمة أولية ومستعجلة.
ومن الحلول المقترحة في هذا الميدان الاعتماد على برنامج حاسوبي جزئي إضافي ، مهمته التعامل مع الناتج الكلي وتحييد الحلول المتطفلة وبعبارة أخرى تحييد وإزالة تلك الحلول التي ليست في النص الأصلي ، وهذه البرنامج الجزئية ترتكز غالبا على اعتبارات من نوع ذرائعي. وفيما يلي حلا يهدف إلى سد النقص في الأنماط التحليلية الصرفية التركيبية ويمتاز عن الحلول السابقة الذكر بكونه يحاول حل المشكلة من الداخل. حيث أن طريقة التفكير في النمط هي كيفية تحييد أغلب النقائص الملاحظة في العادة.
ونمطنا يمتاز بالأخص بالأهمية التي يوليها للتحليل اللسانياتي وبالتالي للمتن اللغوي الذي يمَكن من التعامل إحصائيا مع البنيات الصرفية التركيبية للمتن. والجدير بالذكر أن هذا العمل هو نتيجة في نفس الآن لتجارب عملية وتقص ميداني فهو يهدف في الأول إلى تقديم الأهداف التي ننشدها والوسائل التي نتخيلها الآن لتحقيق هذه الأهداف. فهو إذن حصيلة العمل وبرنامج عمل في نفس الوقت.

المشروع ومعللاته.
نقائص طرق المعالجة الآلية للغات(= مآل )
منذ البداية وارتباطا بالترجمة الآلية سلكت وطوَّرت المعالجة الآلية للغات الإنسانية ( = مآل) خوارزميات شديدة التعقد والتطور. ومع ذلك فلم ينتج عن هذا الزخم والتقدم النظري تطبيقات مشهودة في مجالات تأخذ فيها المعالجة الآلية باعتبار أهدافها مكانة متميزة : التوثيق المؤلل كمثل.
عدم ملائمة النظريات اللسانية المعتمدة في المآل.
*تطورت الروابط بين الحاسوبيات واللسانيات تاريخيا في اتجاه ابتعاد متزايد للسانيين عن المآل. وخير مثال على هذا الطلاق هو وتيرة اشتراك اللسانيين في المؤتمرات الدولية المتعاقبة للملتقى الدولي للحاسوبيات اللغوية. فإذا كانت المشاركة في البداية (1961) كبيرة وحماسية، فإن هذه المشاركة تقلصت لدرجة أصبحت شبه منقرضة.
* وقد يفسر هذا الطلاق بالوقائع التالية :
.-اللسانيات بطبعها تتخوف من السبل والمبادرات المستقلة والفرعية. فهذه الأخير هي وليدة انعدام سياسية سَوقية جامعة أو سوقية لا تندمج في نظرية شاملة، فالنظريات اللسانية تهدف إلى التعميم إلى أقصى الحدود ولا تتحمل أن تتعامل مع العديد من الظواهر البنيوية وأن تعالجها كحالات استثنائية.
.- ومن جانب آخر فإن هذه النظريات اللسانية غير قابلة للصورنة في حد ذاتها وعلى شكلها وباستثناء بعض أجراءها التي تمت صورنتها في الواقع ويعني ذلك أنه تم اختزالها إلى بنية ملائمة لمتطلبات النظريات المنطقية والرياضيات. وبالخصوص فإن بعض التعريفات المتداولة في اللسانيات ليس لها وضع صوري يسمح بجواب مستقل عن الشخص الذي يبتكرها. (فالتعريف في النحو مفهوم له العديد من التعريفات قد تصل إلى عدد اللسانين).
• وكنتيجة لذلك فإن "المآل" لا يمكنه إلا استعمال نظريات جزئية وموضعية تعالج نقطا معينة. وفي العموم، فهذه النظريات يتم اختيارها بما يساير مرامي النظام المخصوص. غير أن موضعيتها ومحليتها تفرض تمفصلا وترابطا خارجيا وهو ما يطرح دائما مشاكل عويصة في الحاسوبيات اللغوية. وزيادة على ذلك فإن هذه النظريات في جلها ناقصة الصورية والتجرد وخاصة في تعريفها للمفاهيم المستعملة.
• الثنائية : التوليد والتعرف.
تطغى في الوقت الحالي على اللسانيات نظريات من نوع توليدي (إنتاج الجمل) ذات درجتي حرية : البنية العميقة والقواعد وهي مواضيع ترك شكلها وتحديدها لاختيار المنمط. ووحده يلزم الشكل الناتج ( البنية السطحية) انطلاقا من خصائص اللغة المشاهدة تجريبيا للغة المراد توليدها.
وبالعكس "فالمآل" يشمل رؤية تَعَرَّفٍِ تلزم فيها ـ وفي الآن ذاته ـ : أشكال الجمل ( المقاطع السطحية المحللة) والبنيات العميقة (الهدف المقصود). ودرجة الحرية الوحيد هو مجموع القواعد الضرورية لتحقيق الانتقال من السطح إلى التمثيلية والتصويرية المختارة.
وزيادة، فإن السوقيات المعتمدة في هذا المجال لها في الغالب خصائص تساٍٍو وتسطيح للظواهر اللسانية إلى مستوى مشترك (الصرف التركيب...) أي اختزالها إلى حدود مشتركة وبالعكس ففي التوليد تهيكل هذه الظواهر اللغوية حسب ترتيب تطبيق التحويلات أو القواعد الصرفية الصواتية المستعملة.

ثقل الطرق المستعملة
وإذا تفحصنا الأنظمة الأكثر شهرة واستعمالا في "المآل" فإننا نلاحظ حجم البرامج الكبير والمعطيات وحيز التشغيل الواسع ( وما يتطلب من تجهيز حاسوبي كبير وثقيل). وهذه الضخامة لها علل عديدة فإضافة لما قيل عاليه (عدم ملائمة النظريات وتسطيح الظواهر اللغوية والنحو الأحادي) يلاحظ رؤية كونياتية وشمولية الكثير من هذه الأنظمة التي ُُوظفت في سياقات متنوعة كالترجمة الآلية والحاسوبيات التوثيقية والبحث اللساني....
ومن مظاهر هذه الضخامة حجم النحو وحجم المعاجم المستعملة وما ينجر عن ذلك من تحْيين صعب بل غير ممكن في الكثير من الحالات. وهذا بالطبع يؤدي إلى خلق أدوات جامدة وقوالب غير قابلة للتطوير والتأقلم وذلك يعارض في أساسه المرامي المنشودة للحاسوبيات اللغوية.
اللبس والغموض
وهذا يعد عقبة كبيرة تواجه طرق "المآل"، وقد نتساءل حول جدوى برنامج يمنح لكل جملة محللة كثيرا من الحلول الممكنة المتنوعة (وهو ما نسميه الطرطشة). ودون أن نطلب منه تحييد كافة الحلول المغلوطة فعلى الأقل إننا ولا شك ننتظر منه على الأقل أن يرتب الحلول المحصلة حسب احتمالات متصاعدة. وللذكر بهذا الصدد اللبس الحاصل هنا راجع إلى العدد الكبير من القواعد وتأليفاتها ( وهي على مستوى واحد) ولذلك يقترح النظام تحليلات للجمل بلا تأويل لساني حقيقي. وهذه من اللبس والغموض الذي يجب محاربته وتقويضه أو تحييده.
وإذا افترضنا ( وهي حالة طاغية) أن النظام مقسم على مستويات مستقلة ( وأشهرها الصرف والتركيب). والطريقة العادية المتبعة لإزالة اللبس تتمثل في توريث لبس وغموض مستوى "ي" إلى مستوى "ي+ 1 " وهكذا يرث التركيب الغموض المنتج في مستوى الصرف على افتراض أن المستوى التالي من التحليل قادر على تحييد الحالات الطفيلية ولكن :
المستوى "ي+1" سيخلق غموضا ذاتيا جديدا انطلاقا من الحلول الطفيلية التي ورثها عن المستوى السابق.
وفي آخر المطاف سنرث مجموع الحلول الطفيلية المتراكمة عن المستويات السابقة.
ولذلك فلهذا فإن المستوى الأخير له مكانة خاصة غير أنه لم يمكن ممكنا إيجاد مستوى ناجعا ورغم إقحام الدلالية والذراعية في هذا المستوى فقد بقيت النتائج دون المأمول.
اللغة كعالم معقد
وبحث فإن كثيرا من السلبيات المذكورة (ثقل الطرق، الغموض الطفيلي) هي مترتبة عن كون كل الظواهر اللسانية قد عولجت على نفس المستوى الهرمي وافترضت متساوية الإمكان. ومن المستحيل أن يكون الأمر مختلفا طالما أن هذه الظواهر ضمنت لغة يستحيل استخراج عينة ممثلة منها. وبالتالي فالعمليات الإحصائية التي قد نقوم بها لا معنى نظري لها بل لا نفع منها عملي في "المآل" لأنها تعالج مجموع الظواهر اللسانية المستعملة دون تمحيص وتدقيق.
وبالعكس فإذا افترضنا أن الطريقة هي خاصة بتحليل متن و حورنا النحو ليتابع هذا المتن وربطنا الحسابات الاحتمالية مع القواعد حينئذ سنحصل على حلول سهلة وناجعة للعديد من المشاكل المذكورة عاليه.
المرامي المنشودة
التعرف في اللغة العربية
الطريقة المقترحة قد تطبق على العديد من اللغات الإنسانية مع تحوير ملائم ولكننا سنحصر رؤيتنا على زاوية التعرف وسنحصر التعرف على العربية كمثل. والنظام الذي طور هنا من أهدافه الأساسية الانتقال من السطح اللساني إلى تمثيل وتصوير مرمز.

وواضح في ذهنا أن هذه التمثيلية المرمزة مشروطة بالتطبيق حيث يدخل نظام التعرف ويظهر لنا أن من الضرورة في البداية البرهنة على أن نقائص الطرق المستعملة في "المآل" المذكورة عاليه ليست محتمة بل يمكن تطوير سوقية تعرف سهلة وناجعة.
وبالتالي فإن هدفنا الأول هو الوصول إلى مستوى متواضع : وتحقيق تحليل بالمكونات الذي يمكن المعلومات الأخرى ويشمل كتل المكونات المتقطعة ويكسر ويحل إدغام الصياغم.

تقليل عدد الحلول الطفيلية
من همومنا الرئيسية تقليل عدد الحلول الطفيلية لدرجة لا يتبقى فيها إلا غموض والتباسات النص نفسه وهو غموض ذاتي لا يمكن حله بالمعالجة الحاسوبية. وبالفعل فإننا نرى أنه من غير المجدي أن نقيس جدوى نظام "مآل" من زاوية حاسوبية بحتة (المدة الزمنية الضرورية لتحليل الجملة، حجم الذاكرة الضرورية) إذا كان هذا التحليل ينتج عديدا من الحلول لا يمكن الاختيار بينها. وبالنسبة لنا فإن الجدوى تكمن في الدقة العالية الممكنة للتحليل اللساني. وزيادة على ذلك فنحن متيقنون أن هذا الهدف لا يمكن الوصول إليه بتحييد بعدي للحلول الطفيلية. وبالفعل ففي آخر المطاق والتحليل نكون قد افتقدنا الشروط التي قد يمكن أن تتدخل لرفض تحليل أو قبول حل آخر. ولذلك فنحن نهدف إلى تقليل إلى أقصى ما يمكن من الحلول الطفيلية بخلق أقل ما يمكن منها أساسا ومبدئيا، يعني باستعمال مصاف وطرق تنتقي كل ما سنحت الفرصة.

ملائمة القواعد اللسانية والتحليل الجزئي:
لذلك فنحن نهدف إلى إيجاد ملائمة قصوى للقواعد اللسانية مع الهدف المقصود : والتحليل مركب من تحليلات جزئية يراد فيها السهولة والنجاعة. تحليلات تتمفصل فيما بينها بدقة ومبنية بهدف الابتعاد عن الحلول الطفيلية. وهذه التحليلات الجزئية تقسم الجملة إلى مقاطع أولية وتعبيرات. وإزالة اللبس السياقي . وتستعمل المؤشرات البنيوية. يضاف إليها القواعد العادية لتحليل الظواهر اللغوية الأخرى.
وكل مستويات التحليل ليست منفصلة مستقلة بل هي متفاعلة ومترابطة.

استعمال الطرق الإحصائية:
وهناك نوع أخر من المصافي المستعملة هو مكون من الطرق الإحصائية.
وهذا ممكن بحكم كون مجال العمل هو المتن وليس اللغة. ففي مقاربة أولية يمكن أن نعرف المتن بالثلاثي: (الكاتب، الجنس الكتابي، الموضوع) وهذا بالطبع تحديد ناقص. فالمتن يجب أن يكون له خصائص أخرى متجانسة نسبيا تساير متطلبات الهدف المقصود ؛ وقد ركزنا نحن هنا على الخصائص التركيبية الصرفية في هذا البحث كمتجانس جامع للمتن. وبعبارة أخرى المتن يحدد المتن ويعني ذلك بوضوح أن ذات المتن حين التشغيل هو الذي سيساعدنا في تحديد المفهوم الغامض للمتن.
وزيادة على نفع الإحصائيات في تركيب مصاف فالتعامل مع المتن يدفع بنا إلى ملائمة النحو المستعمل مع النص المحلل وبالتالي تقليل حجمه وتعقيده. ولهذا الاختيار مقابلين:
إيجاد سوقية ناجعة نسبية للإحالات النحوية انطلاقا من عينة متنية.
والتخلي عن فكرة حلم تحليل ناجع كامل. فنحن نعرف أن هذه الشمولية مستحيلة حاليا لأن كثيرا من القواعد تستعمل أساسا للتعرف على جزء يسير من المتن.
وأخيرا فإن التعامل مع المتن يمكن من استعمال نحو قواعده هي ذات احتمالات مطلقة واحتمالات التكرار المشترك وهذا يمكن من إعطاء احتمالات تكرار للبنيات التركيبية . وهذا يمكن أيضا من ترتيب البنيات المتنافسة ويساعد على إزالة اللبس.

وبتلخيص فعامل المتن يمكننا من :
تركيب مصاف إحصائية
إحالات نحوية
مزاوجة القواعد بالاحتمالات.

ومنطلق التعرف يفرض مسارا في اتجاه وحيد ( من السطح إلى البنية) ومن غير الضرورة التساؤل عن الطريقة العكسية. هذا المسار مقسم على مراحل بسيطة ومرتبة.

المنهجية والنتائج
ستتعرض الصفحات التالية لنقاط متنوعة نسبيا بعضها نتائج أبحاث ناضجة وأخرى لازالت افتراضات بحث؛ بعضها مرتبط باللسانيات والأخرى بالمعلوماتية والإحصاءات. وكما سبق وذكرنا فإن التجميع النظري والخوارزمي لم تنهي بعد كليا ولكن الزاوية التي حددناها تلزمنا بتصور هيكل نظري جديد ملائم في الآن ذاته للأهداف المبتغاة ولشروط الحسبنة الأقل تعدقا إذا أمكن ذلك. ونسطر هنا نقطتين هما: استعمال الطرق الإحصائية في التعرف مع ذكر النتائج المحصلة والمقاربة اللسانية التي نتبناها.

الطرق الإحصائية
وبالفعل فإن فكرة تعويض المحيط /اللغة بمحيط المتن هو الذي مكن من استعمال الطرق الإحصائية فبتوجيهنا من البداية اهتمامنا لملائمة مسار التعرف إلى المتن المدروس تمكنا من تطوير مصاف تزيل بعض اللبس وتحدد أدوات الإحالة النحوية. وبذلك خطونا خطوة كبيرة في طريق بناء نظام تعرف خفيف مرن وفعال.
وأسس الطريقة المعروضة هنا حددتها مجموع البحث في المعالجة الآلية للغات بجامعة جرونوبل التي طورت أنظمة حاسوبية تحقق مجموع العمليات الموصوفة هنا وقد حورنا العديد من منطلقاتها لتساير متطلبات معالجة اللغة الغربية (وللذكر فإن الأستاذ فوكوا كان من السباقين إلى المعالجة الآلية للغات الإنسانية).

العملية الأساسية المستعملة تتمثل في دراسة عينة(ممثلة) للمتن المعين: وقد كون مسبقا نمط صرفي وكمل ذلك بمصفاة إحصائية موجهة لإزالة لبس التحليل الصرفي. ونتيجة تحليل العينة اتخذ كمنطلق جديد لتحديد طريقة إحالة نحوية وسنطور فيما هذا المراحل الثلاث:

تكوين ودراسة العينة
تكوين العينة غير الغامضة. كونت العينة بطريقة التكرار: ففي البداية كونت من عدد من الجمل المقابلة تجريبيا لمجموعة من الكلمات وبعدها وإذا قرر اختبار التمثيلية عدم التمثيلية فإن هذه العينة تكبر بعدد محدد من الجمل (10 عموما) وصولا إلى مستوى ممثل. بعدها نقوم بتحليل صرفي لهذا المتن انطلاقا من النمط اللساني المعد سابقا وعبر ناشر مصغر للنصوص مرتبط بالمحلل الصرفي نزيل يدويا الالتباس الناتج عن المحلل. والعينة المحصلة بهذه الطريقة هي المستعملة فيما بعد وبتحديد لائحة الأقسام الأجناس الصرفية الموضحة مرتبطة بوحدات معجمية للمتن المدروس.

حسابات المتن : هذه اللائحة تعالج بنمط الحساب الذي يعطي:
التكرار المطلق لتواتر كل جنس صرفي.
مصفوفة مربعة لكل عنصر: أي ج وعدد تواتر(تكرار) الزوج( مي ، مج ) لكل جنسين صرفيين متتالين في النص.
وتوزيع الأجناس الصرفية يعطي مؤشرات مهمة. ويجب فحص دقيق للأجناس العالية التكرار أو القليلة التكرار بهدف جمعها أو تقسيمها. وبذلك قد نحصل على تغيير للنمط الصرفي البدائي وربما إعادة للعمليات السابقة.
المصفوفة المربعة للعناصر تحول إلى مصفوفة مرتبطة بالطريقة التالية:
نقترض "ن" العدد الكلي للوحدات المعجمية للعينة
ونفترض "حي " عدد المرات التي يظهر فيها الجنس" مي " كأول مكون للزوج
ونفترض" دج " عدد المرات التي يظهر فيها كأخر مكون للزوج
وللزوج (مي، مج) نكون جدول التوازي التالي:


مج مج المجموع
مي أي ج جي-أي ج حي
مي دج- أي ج ن-(حي+دج)+أي ج ن-حي
المجموع دج ن- دج ن


اختبار الترابط والتمثيلية
لدراسة الترابط نقارن الجدول السابق مع الجدول اللاحق الممثل لتوزيع عشوائي متساو للأجناس الصرفية

مج مج المجموع
مي حي دج \ن حي(ن – دج)\ن حي
مي (ن- حي)دج \ن (ن – دج)(ن – حي)\ن ن- حي
المجموع دج ن – دج ن

والاختبار ك2= 2 يمكن من التقرير بنسبة غلط بنسب(1%، 5%، أو10%) في القيمة المعنوية للفروق الملاحظة وبالتالي الترابط أو عدمه بالنسبة للزوج (مي ،مج .). وفي حالة الترابط المعنوي المؤثر نيميز بين حالتين:
بروز الزوج(مي ، مج) المذكور كسمة غالبة على السطح اللساني ونقول حينئذ بأن الترابط إيجابي
عدم بروز الزوج (مي ، مج) كسمة غالبة على السطح اللساني ونقول هنا بأن الترابط سلبي.
ونستحسن هذا الترابط بمقارنة احتمال "ح للحصول على "مج " علما بحصول "مي " واحتمال "ح‘" حصول "مج " علما بحصول "مي ".

وندرس المعادلة/الدالة : ف = ح – ح‘
ف =( أي ج\ن)*(ن\حي) – (دج – أي ج )\ن* (ن\ن-حي)
أي : ف = ( أي ج \ ن) – (دج – أي ج )\(ن – حي)
وإشارة المعادلة فاء تعطينا اتجاه الترابط.

التمثيلية
ونحسب من جهة أخرى تمثيلية المقياس بمساعدة
ك = ف (2 -- ل) - ف ( - 2 - ل)
حيث أن ف هي دالة التوزيع لقانون جوس المركزي المختزل و 2أ قيمة 2 النظرية في مستوى أ
و ل2 = ن2 [(أدنى (حي دج ، (ن – حي) (ن – دج))2)]\[حي دج (ن – حي)(ن –دج)]
والنظام يمكن من تغيير حد التمثيلية ( = 0.1، 0.15 ،0.2، 0.25، 0.3).
وبتلخيص فإن هذه الحسابات تمكن من التعرف لكل زوج (مي ، مج) على تكراره الخام وتكراره المضعف وترابطه واستقلاله الإيجابي أوالسلبي وتثميلية المقياس.
وبتفحص مصفوفة الترابط المحسوبة بالشكل السالف يمكن انتقاد النمط الصرفي.

مصفاة إزالة الالتباس الصرفي
نقول بأن تحليل العينات وصل لحالة استقرار إذا كانت مصفوفة الترابط تتغير قليلا حين نغير حجم العينة. آنئذ نعتبر خصائص هذه المصفوفة معبرة عن سمات المتن المستعمل لإزاحة بعض الحلول التي يقترحها المحلل الصرفي. وبالأخص إذا لاحظنا ارتباطا سلبيا بين جنسين مي و مج . وقد نرفض كل تحليل صرفي ينتج في المتن الجنس مي متبوعا مباشرة بالجنس مج . والملاحظ هو أن محاربة الالتباس هذه تسير على مراحل متتابعة وقد تمكن من إزاحة للالتباس أفقيا وعموديا.
وسنعطي فيما بعد تدقيقا حول جدوى هذه الطريقة ولنلاحظ لتحديد الأفكار أن نسبة إزالة الالتباس مرتفعة مما كنا نترقب لأن هذه الطريقة مكنتنا من إزالة 80% من الغموض والالتباس الصرفي في المتن المدروس وأن نسبة الإزالة المغلوطة أقل من 10%.
ويجب أن توجه اهتمامنا فيما بعد قصد التعمق في اتجاهين:
تحليل متبقي الالتباس: تعدادها ودراستها جانبيا فقد تكون مقابلة لصنف مشاكل مميزة يمكن أن نجد لها حلولا لسانية ناجعة. وقد يمكن أيضا أن نصنف هذه الحلول المتنافسة باستعمال الارتباطات الايجابية الناتجة عن دراسة العينة.
تحليل الخطأ الناتج عن عملية إزالة اللبس: وعلى هذا الجانب فإن التحليل اللساني قد يقلل نسبة الخطأ.

الحصول على نواة قواعد تركيبية
الطرق الإحصائية المذكورة عاليه تمكن أيضا من وضع نواة نحوٍ خارج السياق موجه لتحقيق تحليل تركيبي لجمل المتن. والتجربة التي قمنا بها تتلخص في تكوين المكونات الجزئية إلى اليسار (إلى اليمين في اللغات الغربية) للقواعد النهائية يعني قواعد تكون فيها أجزاءها اليمنى مقطعا والجزء اليساري سلسلة أجناس صرفية. وحول إمكانية تكرار هذه الطريقة لتكوين مقاطع جديدة انطلاقا من المقاطع المحصلة سابقا فالقضية لازالت مفتوحة.
مبدأ الطريقة هو التالي: نعتبر زوج الأصناف الصرفية المرتبطة إيجابيا والممثلة كمرشحات للأجزاء اليسارية للقواعد. والأزواج المحصل عليها هي التي يكون تكوينها ملائما للتقطيع اللساني المقبول (وهكذا نرفض الزوج(اسم، حرف) كجزء يساري للقاعدة). وبعد ذلك نبحث الثلاثيات مي مج مع كمشرحات الجزء اليساري للقاعدة: وهي التي كونت عن طريق الأزواج (مي ، مج) و(مج، مع) الممثلة والمرتبطة إيجابيا. وهنا أيضا فتحليل يدوي للنتائج المحصلة يؤدي بنا لرفض بعض الحلول مثل (فعل، فعل). ونتبع نفس الطريقة بخصوص الرباعيات الخ . غير أن عناصر المضعفات النونية تقل كلما ارتفع حجم النون وتفتقد الطريقة زخمها سريعا بارتفاع قيمة النون.
ملاحظة هذا التعداد يمكن أن يربط بالتشطير إلى المركبات (المقاطع) الدونية وقد تطبق الطريقة الإحصائية المذكورة عاليه على هذه المركبات إذا حددنا تصنيفية.

سوقية التحليل اللسانياتي
منطلقات التحليل الصرفي التركيبي العام تتلخص في ثلاث نقاط :
استعمال المحللات الصرفية الموجودة: ونحن نستعملها كجزء أصيل في مسار التحليل رغم أن النحو الذي بينت عليه يجب أن يحور. فقط سنكتفي بتعديلات تفرضها الملاحظة الإحصائية. ونستعمل المحلل الصرفي في بداية مسار التحليل مع فرق وهو أن مادته الأولية لن تكون المعطيات الخامة فهذه المعطيات ستمرر بمرحلة معالجة سابقة هدفها تسوية بعض الظواهر البنيوية الصغرى. والالتباسات التصنيفية الناتجة عن التحليل الصرفي الأولي سوف تحذف فيما بعد بطرق إحصائية أولا ثم بطرق صرفية تركيبية لاحقا.
والمبدأ الثاني هو التحليل الصرفي ويجب أن نعتبره كبرنامج مصغر( مجزئ وليس وحيدا) للتحليل الصرفي التركيبي. ويعني ذلك أن التحليل الصرفي لا يعتبر منتهيا إلا بعد أن يوسم أي تكرار للصيغم في المقطع ويوضع في خانة وحيدة وأن يكون هذا الصنف هو الموافق. أي أن كل غموض التصنيف الصرفي والتي ليست بناتجة عن بنية النص ذاته تكون موضحة. مثلا وحدة [ أحمد] في هذه الحالة لا يعتبر التصنيف الصرفي منتهيا إلا بعد أن يعطى لهذه الوحدة قيمة وحيدة اسم أو فعل أو تفضيل... . وطبعا فهذا العملية ممكنة بمعلومات يعطيها السياق. وعموما فإن محاربة الغموض واللبس تعني أننا نمتلك معلومات ولو جزئية عن بنيات التركيبية التي تحوي الوحدة المحللة. وهذه المعلومات يمكن أن تكون لها علاقة ببنية مكونات المقطع (مثلا "أحمد" متبوعا بفعل يعني أن أحمد اسم مثلا) ويمكن أن تكون لها علاقة بتصنيف ما يحيط بها ( مثلا "هذا أحمد" محيط هذه الوحدة يقصي تحليل فعل). وبتلخيص شديد: لكي نقوم بتحليل صرفي علينا أن نقوم بتحليل تركيبي ولو جزئي ففي ذهنا إن التحليل الصرفي والتركيبي مرتبطان ومتشابكان.
والمنطلق الثالث: ما سبق يعني تحويرا شاملا لمنظور التحليل التركيبي. فالمحلل التركيبي لا يمكنه بالطبع إتباع مسار وحيد وشامل والاكتفاء بمقارنة بسيطة بين السلاسل المحللة صرفيا ( وهذا كثيرا ما يكون ذلك ملتبسا) وتكهنات خوارزميةِ إعادةِ الصياغة المتنازلة (التي تتكهن بكل التأليف الممكنة للغة). وهذه السوقية الغير موجهة لحل مختار بذاته تؤدي إلى التحصيل على عديد من الممكنات البنائية التركيبية الطفيلية وبالتالي تضعف من غموض ولبس التحليل. ونحن ننطلق من تحاليل جزئية متتابعة تحصر بتطور عدد الحلو الممكنة أي تحصر عدد البنيات المرتبطة بمقطع. وفرضيتنا هي أنه بالارتكاز بداية على معلومات صرفية غير ملتبسة ( مؤشرات بنيوية) من الممكن القيام بتحليل تركيبي جزئي هو ذاته غير ملتبس لبعض المقاطع الدونية. وأن هذا التحليل فيما بعد يعطي معلومات سياقية تمكن من إزالة أنواع من اللبس الصرفي. وحل هذه الأخيرة مكملة ـ جزئيا ـ بالتحليل التركيبي وهكذا دواليك بعدد المرات التي نحصل فيها على نتيجة مشجعة. وفي كل مرحلة تركيبية في هذا المسار المتناوب فإن المقارنة تتم بين تكهنات خوارزمية إعادة الصياغة محصورة على بعض قواعد التكميل ومن جهة أخرى لا يتم ذلك مع بنية جامدة شديدة الغموض الصرفي بل بالعكس مع مقطع ذي بنية مكونات (تفريع) مشكلة بوضوح. وهذه الطريقة ستوجه المحلل بتدرج نحو البنيات الصحيحة في الناتج بشكل يزيل عددا كبيرا من الغموض الطفيلي مما فد يرفع من نسبة نجاح الطرق المستعملة.
التحليل المسبق للسلاسل: ومن المجدي أن نطرح النص المدخلي قبل أي تحليل لمعالجة سابقة قد تسهل العمليات التالية على الأقل في حالتين : الإدغام الصرفي والصياغم المتقطعة. إذا كان المحلل يتعامل مباشرة مع الكلمات كما تعرضها السلسلة المدخلية فمن الضروري تحديد سابق لوضع الأشكال المدغمة واستباقا للتعقيد الذي سينتج عن هذه الأشكال ومن النافع فك كل حالات الإدغام والارتباط في السلسلة (مثلا: إنما). وهذا الفك سيعطي نوعا من التسوية والتقنين والشمولية وسيمكن من تحليل صرفي واضح لكل الأشكال المدغمة. وفي حالة الأشكال المتقطعة (حالة تكون فيها الأشكال المتلازمة مفروقة بكلمة أو كلمات). إن ما قد تطرحه هذه الحالات من التباس قد يسهل تجاوزه بمعالجة سابقة ( بتجميع متتابع لكل الأشكال المفروقة أي تحويل الصياغم المتقطعة إلى صياغم مجمعة).
وقد توسع مجالات هذه المعالجة المسبقة للعديد من الحالات والأشكال : كوضع أشباه الأفعال بئس ونعم ووضع فعل كان هل هو تام أم ناقص. والمعالجة السابقة الأولية قد تلزمنا بتغيير ترتيب مكونات السلسلة النصية.

استعمال مؤشرات البنية
ومبدأ تطبيقها سهل. فانطلاقا من تحديد بعض الكلمات وتعريفها صرفيا يمكن استخراج إحالاتها البنيوية وتموقعها التركيبي . وكل كلمة تمكن من تحديد هذه الإحالات نسميها مؤشر بنيةٍ. ويجب أن تكون هذه المؤشرات وحيدة صرفيا وأن يكون عددها قليلا نسبيا لكي يتم تحديدها في السلسلة بلا جهد طويل. وقد نقول أيضا بأن المؤشرات البنيوية هي أنها كل الأشكال الغامضة صرفيا فغموضها الصرفي يمكننا من قاعدة لها تحدد نوعية جنس تاليها وبحديد التالي نحدد السابق.
وكأمثلة على المؤشرات في العربية حروف العطف والجر والاستثناء والضمائر وغيرها.
ولتوضيح الفكرة نأخذ مثلا : "من سين" فتحديد صنف سين (اسم، فعل، حرف، حرف) قد يحدد صنف "من" هل هو حرف جر مِن أو فعل مَنّ أو اسم مُن أو خرف استفهام مَن . وطبعا فالحلول (فعل، فعل) و(حرف، حرف) مستحيلة تركيبيا. علما أننا نتعامل مع هذه السلسة كرموز كلمات غير معربة أو مشكلة ففي حالة الأعراب نلاحظ نقص عدد الحالات الممكنة بشكل كبير جدا : من سين /ــِ/ تختزل الحلول الممكنة إلى كون من اسما علما أو حرف جرف جر بلا حل ثالث وبالعودة للمعجم المضمن فإننا نكون أمام حل لا يقبل تأويلات مختلفة.
وهذه النوع من الكلمات نعتبرها مؤشر بنية.
وإيجابية مثل هذه الأنواع من الأشكال أن عددها محصور في اللغة وبالتالي فالتركيز عليها يقدم العديد من الميزات. ويمكن ذلك سلفا من تحديد البنية المتماشية في كل حالة. ولا نسى أننا في حالة تحليل وبرنامج ترددي (لعبة الكر والفر) حيث أن كل نتيجة محصلة في نقطة ما تفيد في نقطة تالية. وليست كل المؤشرات ثقيلة كما هو الحال ل"من" وللتوضيح لنأخذ اسم الإشارة "هذا" فبكل يسر نحدد بنية ما يليه ( مع الافتراض أن كاتب النص لا يغلط في الألف المقصورة أو الطويلة وباستثناء أن يكون هذا اسم علم ) والبنيوية المنبثقة عن هذا المؤشر لا تترك مجالا للشك. وكذلك اسم الموصول "الذي" علما أن هذا المؤشر يقدم معلومات عن سابقيه ولاحقيه في السلسلة النصية. وبعبارة أخرى فإن المؤشر يلعب دور النواة.
وحين نتكلم عن القواعد هنا فالمقصود ليس دائما قوالب مسبقة فقد تكون هذه القواعد عامة وأحيانا جزئية موضعية لأن وضع القواعد هدفه إبراز المعلومات البنيوية مع ابتغاء مردودية عالية من هذه القواعد. وأما بخصوص ترتيب استعمالها فقد حاولنا قدر المستطاع الخروج من مأزق الدوامة الفارغة "الجهنمية" (وللتذكير فهذه القواعد تستعمل في كر وفر متواصل).


الهيكل العام للنظام
__________________
مهندس/ رائد حبش
mobile: 0021374323046 Algeria
رد مع اقتباس
  #6  
قديم 09-12-2006, 09:04 AM
الصورة الرمزية tarck
tarck tarck غير متواجد حالياً
عضو منتسب
 
تاريخ التسجيل: May 2006
المشاركات: 31
افتراضي _MD_RE: حول المعالجة الآلية للغات

رد مع اقتباس
  #7  
قديم 06-20-2007, 08:30 AM
الصورة الرمزية s___s
s___s
Guest
 
المشاركات: n/a
افتراضي حول المعالجة الآلية للغات

رد مع اقتباس
رد

الذين يشاهدون محتوى الموضوع الآن : 1 ( الأعضاء 0 والزوار 1)
 
أدوات الموضوع
طرق مشاهدة الموضوع

تعليمات المشاركة
لا تستطيع إضافة مواضيع جديدة
لا تستطيع الرد على المواضيع
لا تستطيع إرفاق ملفات
لا تستطيع تعديل مشاركاتك

BB code متاحة
كود [IMG] متاحة
كود HTML متاحة

الانتقال السريع إلى

المواضيع المتشابهه
الموضوع كاتب الموضوع المنتدى مشاركات آخر مشاركة
إشكالية المعالجة اللغوية والحاسوب والخروج من الشرنقة الأولى s___s اللسانيات والحاسوب والمعالجة اللغوية Compu-linguistics 11 08-09-2008 05:11 AM
المجلة الأوربية للغات عبدالرحمن السليمان دعوة للمشاركة Call for Participation 0 06-03-2008 11:29 AM
اليوم الأوروبي للغات omtarek قضايا عامة General Issues 0 09-27-2007 10:31 AM
الندوة الدولية حول المعالجة الآلية للغة العربية - يونيو 2007 JHassan دعوة للمشاركة Call for Participation 8 03-09-2007 07:19 PM
الندوة الدولية حول المعالجة الآلية للغة العربية amattouch اللسانيات والحاسوب والمعالجة اللغوية Compu-linguistics 0 01-15-2007 01:10 PM


جميع الأوقات بتوقيت GMT. الساعة الآن 10:38 PM.




Powered by vBulletin
Copyright ©2000 - 2023, Jelsoft Enterprises Ltd. تعريب » حلم عابر