عرض مشاركة واحدة
  #4  
قديم 03-23-2019, 06:50 AM
الصورة الرمزية حامد السحلي
حامد السحلي حامد السحلي غير متواجد حالياً
إعراب e3rab.com
 
تاريخ التسجيل: Nov 2006
الدولة: سورية
المشاركات: 1,323
افتراضي

and Eric Laporte
هل بإمكان مهندسي الصرف العربي الحاسوبي
إعادة النظر بمقارباتهم المراهقة؟

ألكسي عميد نعمة ـ إيرك لابورت

Translation to Indonesian

في نهاية التسعينات، اكتسبت اللغة العربية لدى المهندسين الحاسوبيين الشهرة بأن الصرف فيها "أكثر خصوبة وتعقيداً" (rich and complex) من اللغات الغربية لدرجة أن نِصْف المقالات العلميّة المخصّصة لمعالجة اللغة العربية تبدأ بهذه العبارة.

من دون شك، إنّ خصوبة الصرف العربي بَدِيِهِيّة، وعلى سبيل المثال لدى الأسماء العربية ومتغيّراتها أربعة سمات صرفيّة ونحويّة (الجنس، العدد، التعريف، الحالة الإعرابية)، في حين لدى الأسماء الفرنسية سميتين اثنتين.

إما للتعقيد وجهان:

أ- تعقيد تفاصيل المعطيات الصرفية والتي لا مفرَّ منها؛

ب- تعقيد تخزين هذه المعطيات والخوارزميات المرتبطة بها وهذا متعلق بالبرامج.

هذه الصورة النمطية الشائعة للمورفولوجيا وهذا خلط بين وجهيْ التعقيد يؤدي إلى حجب الأول للثاني أي وجه عدم ملائمة المنهج المتّبع لدى المهندسين في تخزين المعطيات وعدم فعاليّة خوارزمياتهم.



استناداً إلى النموذج التقليدي، تمّ تنفيذ نماذج عديدة للصرف من قِبَل مختبرات متخصّصة في المعالجات الحاسوبية. هذه التطبيقات لديها نقطتان مشتركتان:

أولاً، تم إعتماد كلياً أو جزئياً النموذج التقليدي دون التدقيق أو التشكيك بأهدافه ومفاهيمه أو ملاءمته للمعالجات الحاسوبية؛

ثانياً، لم تُنتج هذه المختبرات أي مورد لغوي دقيق حتى الآن.



أدناه، مقتطفات من منشورات فريق جامعة كولومبيا الذي يُعتبر من أفضل الفِرَق الحاسوبية التي تعمل منذ عام 2005 (على الأقل) على معالجة اللغة العربية كما لديه إلمام وافر في المورفونولوجيا. هذا الفريق إقتبس لتطبيقيه النموذج التقليدي وإعتمد منهج الجذر/الوزن/قواعد (مورفونولوجية وإملائية).

"من صيغ جمع التكسير، نستثني الجذور غير الثلاثية والسالمة من برنامج التحليل الصرفيّ لأننا لا نحاول معالجتهم في قواعد نسخة البرنامج المعتمدة حالياً."
"مشروعنا الحالي للأسماء يتضمن جموع التكسير. القواعد تتناسب فقط مع صيغ الجذور الثلاثية لجموع التكسير: إننا لا نقيّم التغطية المعجمية لقاموسنا …ولاحقاً سنعمل على مسألة إنتاج وتقييم قاموس شامل."
(Altantawy et al., 2010:856)

وبعبارة أخرى، كان ترميز جزء فقط من قواعد جموع التكسير ومن دون الجموع السالمة التحدي الأكبر لفريق جامعة كولومبيا، ويكاد يكون من المستحيل في منهج الجذر/الوزن/قواعد لمعجم شامل. ففي هذا المنهج، لا يتم ترميز التغيرات مورفونولوجية للجذر بشكل مستقلّ لكل فئة تصرفيّة، ولكن يوجد منظومة واحدة من القواعد المورفونولوجية المطبّقة لكامل المداخل المعجمية. بناء على ذلك، قلّص فريق كولومبيا التغطية المعجمية لبرنامجه أي تخلّى عن التغطية الشاملة لجموع التكسير لإنقاذ المنهج المتّبع !



أن صياغة سلسلة من القواعد في منظومة واحدة وتحديثها هي مهمة معقّدة جداً. في عام 2009، في نظام الناطق الآلي للّغة العربية، والذي يُستخدم حالياً على موقع http://translate.google.com، لقد كتبنا منظومة من القواعد لتحويل النص ألإملائي إلى مخرّجات صوتية مستندين على قواعد إملائيّة => فونولوجية. فكان تقييم أي تغيير في المنظومة (إدراج قاعدة جديدة، وتعديل قاعدة، وتغيير ترتيب القواعد) مبني على مقارنة تقربيّة وفطريّة للناتج الفونولوجي الجديد مع الناتج المرجع لمنظومة سابقة والمفترضة الأفضل حتى الآن. إذاً كان كل تغيير يتطلب عملية تجربية وتقدير الصواب والخطأ، حيث كل ناتج يُظهر بعض التحسُّنات وبعض الأضرار بالنسبة للمرجع السابق. إن عملية إيجاد المنظومة الأنسب للقواعد وصقلها تجريبياً كانت بالنسبة لنا كرجلٍ يتحسس طريقه في الظلام.



قبل خمسة عشر عاما من مقال فريق جامعة كولومبيا (2010)، أشار "بيسلي" في نموذجه الخاص إلى مسائل مماثلة وذات صلة، وهو إن التعقيد الناجم عن الحروف الأصلية للجذر هي عديمة الفائدة، أي توصيف المداخل المعجمية بإستخدام الجذر الأصل وليس الظاهر. إعتبر "بيسلي" هذا الترميز اليدوي لتوصيف الجذر وتحديث قواعده

"مهمة مملّة وشاقّة وغالباً ما تؤثر على الخبير اللغوي لتبسيط قواعدها مستنداً على الحرف الظاهر بدل الأصل." (Beesley، 1996: 91)



لماذا المهندسون الحاسوبيون يعتبرون النموذج التقليدي والجذر الأصل بالتحديد أمراً مفروغاً منه؟

لأنهم مهتمون أكثر بالخوارزميات وليس بعلم الصّرف. وليس لديهم الفضول ولا الميول للتفكير النقدي في علم الصرف.

من الممكن أن يكون المفهوم اللغوي المجرد "الجذر الأصل" (deep root morpheme) مفيد للصرف التقليدي وأهدافه؛ لكنه يضاغف التعقيدات قي الصرف الحاسوبيّ لأنه يفترض مفهوم "الجذر غير الأصل" أي "الجذر الظاهر". فبالإضافة إلى النقاشات العقيمة داخل الفريق الحاسوبي الواحد حول ما هو الأصل وما هو الظاهر، يتضمّن النموذج فعلياً مفهومين بدل من مفهوم واحد. إذاً يجب إدارة في نموذج مُتَمَاسِك مفهومين مجردين وإرتباطهما بعشرات الآلاف من المداخل المعجمية.



من ناحية أخرى، يفتقر منهج القاعدة المعتاد إلى مفهوم التصنيف التصريفيّ المعجميّ. في منظومة من القواعد، تؤثر كل قاعدة على أصناف عدة من المداخل المعجمية لأنها لا تحصر مجال تطبيقها على مداخل معجمية محددة بمؤشر خاص بكل قاعدة. فالقاعدة أداة بالغة القوة، ويميل المهندسون الحاسوبيّون لإخفاء عيوب تلك القوة المفرطة. فإذا زاد عدد القواعد في المنظومة الواحدة، يزيد ترابطهم بشكل ملحوظ، ويتأجج الترابط والتعقيد بشكل مطّرد. وعلاوة على ذلك، تراتبية تطبيق القواعد ضمن المنظومة الواحدة مهمّ ويجب أن تتقرر وتُرمّز. إن التحَقُّق وتصحيح وتحديث هكذا منظومة من القواعد هي من المهامّ الشائكة والثقيلة أو شبه المستحيلة.



بالعكس، في إطار منهج يتضمن مفهوم التصنيف التصريفي المعجمي، فتبعيات قاعدة تقتصر على صنف واحدٍ، أي محصورة في مداخل معجمية محددة. يسمح مفهوم التصنيف التصرفيّ في المعاجم المصمّمة لمعالجة اللغات بتَلْفِيق منظومة صغيرة من القواعد ومشتركة بين المداخل المعجمية لصنف واحد؛ فالتعقيد مرتبط بعدد الأصناف (عادة بضعة مئات) بدل إرتباطه بعدد المداخل المعجمية (في العشرات من آلاف). وتبيّن التجربة أن التعامل مع منظومات مستقلة هو أبسط وأكثر ملاءمة للبرمجة والتصحيح، حتى لو كان ذلك على حساب تكرار بعض القواعد بين الأصناف.

إنّ خبير في الصرف العربي قادر على إعطاء توصيف دقيق ومفصّل للظاهرات التصرفيّة ومعجم مصنّف تصريفياً مع تفاصيله كاملة لبرمجة الصرف العربي بطريقة مضبوطة وأسهل؛ رغم أن المهندسين الحاسوبيين يجدوا أنّ نفس التفاصيل مملَّة وحتى مزعجة.

في الواقع، جزء من تعقيد الصرف العربي هو أصيل ومرتبط بمعطيات الصرف وتفاصيله، ولكن يمكننا الاستغناء عن التعقيد الذي ينشأ عن منهج الجذر/الوزن/ منظومة القواعد.



لماذا سيستمرّ المهندسون الحاسوبيون بفشلهم في إنتاج موارد معجمية غير دقيقة؟ وما العمل؟

ما لم يفكر المهندسون الحاسوبيون خارج منهج منظومة القواعد الواحدة، وهم يحاولون منذ 25 عاماً، وسوف يعاودون المحاولة مجدداً وعبثاً ومن دون جدوى لإثبات مدى “ملاءمة وفَعّالِيّة” منهجهم وخوارزمياتهم .
بالإضافة إلى إهتمامهم بالخوارزميات، فإنهم يحتاجون إلى إعادة النظر في النموذج التقليدي وفقاً لأهداف وأغراض الصرف الحاسوبيّ.
ما لم يكن لديهم الصبر للتفحّص الدقيق لتفاصيل التصريف ومتغيراته، فإنهم محكمون أن يتفاعلوا مع خبراء هذا الحقل.



منذ 25 عاما، تدعم الجهات الراعية المهندسين الحاسوبيين ومقارباتهم المراهقة للصرف العربيّ. إلى متى؟
__________________
إعراب نحو حوسبة العربية
http://e3rab.com/moodle
المهتمين بحوسبة العربية
http://e3rab.com/moodle/mod/data/view.php?id=11
المدونات العربية الحرة
http://aracorpus.e3rab.com
رد مع اقتباس