قراءة في المقاربة الإلصاقية لمعالجة اللغة العربية

تقليص
X
 
  • تصفية - فلترة
  • الوقت
  • عرض
إلغاء تحديد الكل
مشاركات جديدة
  • حامد السحلي
    إعراب e3rab.com
    • Nov 2006
    • 1373

    قراءة في المقاربة الإلصاقية لمعالجة اللغة العربية

    هذه ثلاثة مقالات لمهندس لغوي حاسوربي أظنه لبناني في فرنسة ينتقد الاهتمام بتمثيل الاشتقاق ويدعو إلى مقاربة عملياتية
    مقالات أخرى

    هل يفهم المهندسون الحاسوبيّون عِلم الصَّرف التقليدي فهماً عميقاً؟

    لماذا يفشل المهندسون الحاسوبيّون في إنتاج موارد لغوية دقيقة؟

    هل بإمكان مهندسي عِلم الصرف الحاسوبي إعادة النظر بمقارباتهم المراهقة

    هذه ترجمات عربية ركيكة لأصل باللغة الإنكليزية تجدون روابطها في النصوص
    وهي مثال لتيار آخذ بالازدياد يدعو لمعالجة العربية كلغة إلصاقية
    إعراب نحو حوسبة العربية
    http://e3rab.com/moodle
    المهتمين بحوسبة العربية
    http://e3rab.com/moodle/mod/data/view.php?id=11
    المدونات العربية الحرة
    http://aracorpus.e3rab.com
  • حامد السحلي
    إعراب e3rab.com
    • Nov 2006
    • 1373

    #2
    Alexis Neme
    Alexis Neme
    Computational Linguistics Scientist - FR-AR-PT-EN (alexis.neme@gmail.com)
    11 articles

    6

    0

    Arabic version of "Do computer scientists deeply understand Arabic morphology?", by Alexis Neme and Eric Laporte


    هل يفهم المهندسون الحاسوبيّون عِلم الصَّرف التقليدي فهماً عميقاً؟

    وما الذي يتوجَّب الإبقاء عليه أو إسقاطه من حَوسَبة النموذج الصرفيّ التقليديّ؟
    ألكسي عميد نعمة ـ إيرك لابورت

    Indonesian version



    منذ 1990، تحاول فِرَق عدة من المهندسين الحاسوبيّين برمجة النموذج التقليدي لعِلم الصَرف في اللغّة العربيّة كنظامٍ وكجزءٍ من نُظم معالجة اللغّات الطبيعيّة دون طرح تساؤلات حول أهداف هذا العلم وتعريفاته وفرضيّاته أو غاياته في فترة نشوئه. صمّم النحويّون واللغويّون الأوائل القواعد الصرفيّة والمعجميّة لتناسب العقل البشريّ المجهّز بالأداة الورقيّة والقلم، أما في المعالجة الآليّة للعربيّة، فعلينا تصميمها للعقل البشريّ أيضا ولكن المجهَّز بالحاسوب والذاكرة الإلكترونية. هذه الفوارق لا تبدو واضحة للمهندسين الحاسوبيين.

    سعى النحويّون الأوائل في القرن الثامن إلى إكتشاف ميّزات وخصائص اللّغة العربيّة، وكانت حوافزهم سياسيّة ودينيّة. هؤلاء الروّاد راكموا معرفةً واسعةً في النحوّ والصرف وعِلم الأصوات وتبدّلاتها الفونولوجية وفي تطبيق عِلم الدلالات على المعاجم، وأنتجوا قوائم جرد للمفردات بهدف توحيد معايير اللغّة، فأنتجوا كمّاً كبيراً من القواعد والمعارف اللغويّة في ذلك العصر. وعلى الأرجح، تحوّل تعليم اللغّة العربيّة للناطقين وغير الناطقين بها إلى مسألة ملحّة مع الإنتشار الجغرافي السريع. ولطالما كان ولا زال تعليم اللغّة يرتكز على فهم النص ومعاني المفردات المرتّبة بحسب "الجذر" في المعاجم.



    كبقية اللغّات الساميّة ومنها العربيّة، يتمَحْوَر الصرف فيها حول مفهوم "الجذر"، وهو سياق من أحرف لها معنى مجرّد، غامض أو محدّد. يرتكز الإشتقاق الصرفيّ على مفهوم "الوزن" أيضاً؛ فوظيفة الوزن تحقيق الجذر المجرّد في صيغة أي كلمة ملموسة وصحيحة. فتنشأ الكلمات عبر دمج جذر ووزن أو تقاطعهما أي عبر المعنى المجرّد وصيغة محددة مثل:

    كِتَاب = ك ت ب & فِعَال

    يتألّف الوزن من حروف الجذر المحاطة بالحركات و أحرف المد (ألف، واو، ياء) وأحياناً أحرف زائدة. يتمّ إدخال أحرف الجذر الأصيلة في قالب الوزن الذي بدوره يحدد صيغة المعنى أي نوع الكلمة في سياق الجملة : فعل أو إسم أو صفة؛ وسماتها الصرفيّة (مذكر/مؤَنث، مفرد/مثنى/جمع) والإعرابية (نكرة/مضاف/معرفة، مرفوع/منصوب/مجرور) ودلالاتها المعنويّة مثل:

    كَاتِب: إسم فاعل؛
    مَكْتُوب: إسم مفعول؛
    مَكْتَب: إسم آلة على وزن مَفْعَل؛
    مَكْتَبة: إسم مكان على وزن مَفْعَلة؛
    أسْوَد: إسم صفة للألوان على وزن أفْعَل.



    من ناحية أخرى، فلكلِ حقلٍ من حقول القواعد اللغويّة التقليديّة مقام تراتبيّ:

    في المرتبة الأُولى، النحو والإعراب أي بناء الجملة وتسلسل الكلمات وتراكيبها؛ أي الجملة المؤلفة من الفعل والإسم والصفة مع تحديد وظائفها النحويّة من فاعل ومفعول ومجرور وتابع في سياق الجمل؛ وتتحكم هذه الوظائف بالحالة الإعرابية في آخر الكلمات من حركة وتنوين وحذف.
    في المرتبة الثانية، الصرف الإشتقاقي المبني على نموذج الجذر والوزن: الجذر يحدد المعنى المجرَّد العام والوزن يحدّد صيغته وسماته الصرفية والمعنويّة.
    في المرتبة الثالثة، الصرف غير الإشتقاقيّ وهو الأقل أهميّة بين هذه الحقول كونه يهتم بالتغيُّرات المورفوفنولوجيّة والإملائيّة وتبدلات السمات الصرفيّة والعلامات الإعرابيّة للإسم والفعل؛ أي يهتم بالشكل وليس بالمعنى.



    - وما الذي يتوجب علينا الإبقاء عليه أو إسقاطه من حوسبة النموذج الصرفي التقليدي؟

    مقامات الحقول أو المرتبة ليست موضوع النقاش. هدف الصرف الحاسوبيّ هو تنظيم الأشكال على أسس نظرية وعِلمية واضحة للوصول إلى نتائج عمليّة، أي تغطيّة شاملة للأشكال المكتوبة وليس للمعاني. يمكننا أن نُبقي الإشتقاق خارج أغراض الصرف الحاسوبي، أو على الأقل في المرحلة الأولى، فالنُظم البرمجية التي طبقت إشتقاق الكلمات ولو جزئياً أضافت إلى نُظُمها تعقيدات هي بغنى عنها. فالهدف الأول للصرف الحاسوبي هو الصرف غير الإشتقاقي وهو تصريف الأفعال والأسماء أي الأخذ بعين الإعتبار كل أشكالها الإملائية كما هو حال في الفرنسية والإنكليزيّة.

    يمكن الإعتماد فقط على ترميز المعلومات المتجانسة والمنتظمة أي غير التقريبيَّة من أجل أن تكون صالحة للإستعمال في الصرف الحاسوبيّ. يجب إختزال مفهومَيْ الجذر والوزن إلى صورتهما الإملائيّة كأحرف وحركات. الخصائص النحويّة المستنتجة من الوزن والدلالات المرتبطة بالجذر هي تقريبية أي ممكنة أو محتملة لكن غير منتظمة وغير متجانسة، إذاً لا يمكن البناء عليها في تنظيم أشكال المفردات وتغيُّراتها. لذا، حَوْسبة الصرف يجب أن يُحصر حقل قواعدها على التصريف فقط، نعم، الحقل الأقلّ أهميّة بين حقول قواعد اللغّة العربيّة.

    غالباً ما يتمّ تضمين المحلّل الصرفي المصمَّم من قبل المهندسين دلالات للمعنى وقواعد مستقاة مباشرة من الصرف الإشتقاقي، آملين أن تكون مخرّجات برامجهم أكثر إفادةً لمعالجات حاسوبيّة لاحقة، فتسبّب زيادة المعلومات غير المتجانسة وغير المنتظمة وغير المكتملة فوضى في الموارد اللغويّة وبالتالي في خوارزميّات البرامج الحاسوبيّة. فيتجاوز المهندسون بهذه الزيادة الهدف الأساس لحوْسبة الصرف، أي توصيف منهجيّ ونظيف للموارد كي تكون سهلة التحديث، ومن أجل مخرجات دقيقة للأشكال ومتغيّراتها.



    فكرة تقاطع الجذر والوزن، التي تمّ إختبارها لأكثر من اثني عشر قرناً، هي العمود الفقري للّغات الساميّة، ويمكن تطبيقها مباشرة في العلوم الحاسوبية فيجب الإبقاء عليه في الصرف الحاسوبي. وأيضاً، يمكن تطبيقها مع الكلمات المشتقّة وفي الكلمات الرباعيّة الجذر طالما التصريف هو مجال التطبيق:

    مَنديل ـ مناديل؛ عُنقود ـ عناقيد؛ مَوْعِد ـ مواعيد

    وطالما وزن جمع التكسير هو نفسه فَعَاليل لصيغة : فَعليل ، فَعلول، فعلِل. إذًا، الإنتظام مشروط بالوزن، والمفتاح في حوسبة صرف اللغّة العربيّة هو إعطاء الأولوية للوزن ثمّ إستنتاج الجذر منه.

    بمعنى آخر، عَكَستْ هذه المقاربة مقاربة عِلم الصرف التقليديّة التي هي معادلة (الجذر- الوزن) إلى (الوزن - الجذر). هذه المقاربة المعكوسة سمحت لبرنامجنا التعرّف على أي كلمة في النصّ العربيّ بشكل أسرع وأدقّ وربطها بمدخلها المعجمي والتعرّف على جذرها ووزنها.كما بسّطت هذه المقاربة المعكوسة توصيف وبرمجة مئات القواعد الصرفيّة والفونولوجية والإملائيّة بجعلها غير مترابطة لأنها كانت مترابطة في برمجة النموذج التقليدي.



    بإستثناء بعض الحالات النادرة، يكرّر المهندسون الحاسوبيون في كتبهم ومقالاتهم مفاهيم الصرف التقليديّة دون فَهْمِها ودون أن يتمكنوا من مساءلة هذا التقليد كونهم لا يتقنوه.

    لنعد إلى سؤالنا الأول، هل يفهم المهندسون الحاسوبيون عِلم الصرف فهماً عميقاً؟

    الجواب: لا، إن المهندسين يهتمّون شكلياً بعِلْم الصرف لأنهم أكثر إنشغالاً بالخوارزميّات.
    إعراب نحو حوسبة العربية
    http://e3rab.com/moodle
    المهتمين بحوسبة العربية
    http://e3rab.com/moodle/mod/data/view.php?id=11
    المدونات العربية الحرة
    http://aracorpus.e3rab.com

    تعليق

    • حامد السحلي
      إعراب e3rab.com
      • Nov 2006
      • 1373

      #3
      لماذا يفشل المهندسون الحاسوبيّون في إنتاج موارد لغوية دقيقة؟

      Published on August 3, 2015

      Alexis Neme
      Alexis Neme
      Computational Linguistics Scientist - FR-AR-PT-EN (alexis.neme@gmail.com)
      11 articles

      11

      0

      Original version in English "Why do computer scientists fail to produce an accurate Arabic Lexical Resource?", by Alexis Neme and Eric Laporte

      لماذا يفشل المهندسون الحاسوبيّون
      في إنتاج موارد لغوية دقيقة؟
      ألكسي عميد نعمة ـ إيرك لابورت

      Indonesian version






      في التحليل الصرفي الأوتوماتيكيّ للنصوص الإنجليزية، يوفّر برنامج التحليل لكل إسم وارد بصيغة الجمع صيغته المفردة. فما هو حال النصوص العربية؟ غالباً البرامج لا توفّر لصِيغة جمع التكسير الصيغة المفردة.

      على سبيل المثال، إن كانت كلمة [knives] واردة في النص الانجليزي، فالبرنامج الصرفيّ يوفّر التحليل للإنجليزية:

      knives = {المفرد = "knife"، عدد = "جمع"}؛

      وبالمثل إن كانت كلمة [أسلحة] واردة في النص العربيّ، يجب أن يوفِّر برنامج التحليل للعربيّة:

      أسلحة = {المفرد = "سلاح"، عدد = "جمع تكسير"}.

      عادةً، التحليل الصرفيّ هو المعالجة الأولى من سلسلة معالجات حاسوبية. إحصائياً، فمن كل 10 كلمات في النصوص العربية، كلمة واحدة بالمعدّل تَرِد في صِيغة الجمع. ومن كل 10 كلمات واردة في صِيغة الجمع، 3 تَرِد في صِيغة الجمع السالم و 7 في صِيغة جمع التكسير. إذاً لا توجد وسيلة في البرنامج لتجنُّب صيغة جمع تكسير أو حتى الإلتفاف عليها.

      صيغة الجمع السالم تحفظ صيغة المفرد وهي مبنية على زيادة في آخر صيغة المفرد. أما صيغة جمع التكسير فلا تحفظها، وهي صيغة مبنية على دمج جذر صيغة المفرد بوزن جمع التكسير الملائمة. ويتكوّن الجذر من الحروف الصامتة اي دون الحركات. ويتكون الوزن من أحرف الجذر المحاطة بحركات وأحرف مدّ وحروف زائدة في بعض الأحيان.



      يمكن للناطقين بالعربية أن يربطوا فوراً وتلقائياً صيغة المفرد بصيغة جمع التكسير وبالعكس، على سبيل المثال [سلاح <=> أسلحة]. أما الناطقون المتعلِّمون قادرون على شرح المراحل للحصول على [أسلحة] من خلال صيغة المفرد [سلاح] بالإستناد على معرفة أوّليَّة في الصرف التقليدي بالآتي:

      إستخراج أحرف الجذر من صيغة المفرد: سلاح => س ل ح

      دمج الجذر المستخرَج في وزن جمع التكسير أفْعِلَة : [ س ل ح & أفْعِلَة ] => أسْلِحَة



      بين 25 وزن متاح لجموع التكسير، لا يمكن للناطقين شرح أسباب اختيار هذه الصيغة، هنا أفْعِلَة، وتعليل هذا الاختيار غالباً ما يكون غامضاً ومبهماً. وقد صنّف اللغويّون صيغ جمع التكسير الى قياسيَّة وسماعيّة أي لا تخضع لقاعدة. إنّ جموع التكسير في الصرف هي من أكثر الظواهر اللغوية صعوبة.

      يمكن للناطقين بالعربية أيضاً أن يربطوا فوراً صيغة المفرد بصيغة جمع التكسير في المثل [إمَام <=> أئِمَّة] وبالعكس، وربما بإمكان بعضهم أيضاً أن يلاحظوا أنّ وزن جمع التكسيرهو كما في المثال السابق، أي [أئِمَّة، أسْلِحَة] هما على وزن أفْعِلَة . أما الناطقون المتعلمون ليسوا قادرين على شرح كيفية الحصول على [أئِمَّة] من خلال صيغة المفرد [إمام]. وحدهم الخبراء في المورفوفنولوجيّة قادرون على هذا الشرح [إمام، أئمّة]:

      إستخراج أحرف الجذر من صيغة المفرد: إمام => {ء} م م

      حيث {ء} تمثل 5 أشكال إملائية محتملة للهمزة.

      دمج أحرف الجذر في وزن الجمع أفْعِلَة: [{ء} م م & أفْعِلَة] => أَ{ء} ْمِمَة

      نقل الكسرة الى موضع السكون: أَ{ء} ْمِمَة => أَ{ء}ِممَة

      إدغام الحرف المماثل أي ”م” : أَ{ء}ِممَة => أَ{ء}ِمَّة

      إختيار الشكل الإملائي للهمزة: أَ{ء}ِمَّة => أَئِمَّة



      تشمل سلسلة العمليات أعلاه على شروط مورفونولوجيّة من أجل أنْ تصبح سارِية المَفْعُول قبل تطبيقها؛ بالإضافة الى أنَّ إختيار شكل الهمزة يجب أن يتم عبر مجموعة قواعد إملائية مترابطة وخاصة بها.

      ويجب أيضاً إحترام تسلسل هذه القواعد لتطبيقها في ترتيبمعيَّن ، وهنا، لا يمكن إختيار الشكل الإملائي للهمزة قبل إنتقال الكسرة الى موضع السكون. فهذا يعني أنك يجب أن تكون على معرفة بعديد من الوصفات والعديد من المكوِّنات في كل وصفة وشروط إستعمالها، فلا يمكن أن نقلي البيضة مثلاً قبل وضع وتسخين وتذويب الزبدة في المقلاة.

      علاوة على ذلك، يجب إضافة علامة نحويّة تلحق آخر الإسم والمرتبطة بتعريف الإسم (نكرة، مضاف، معرَّف) وإعرابه (مرفوع، منصوب، مجرور) أي 3x3 = 9 علامات. أخيرا، التاء المربوطة {ة} تتحول إلى تاء مبسوطة "ت" إذا ما إتصّل الإسم بضمير، كما في [أسلحة + هم => أسلحتـهم]. وبالإمكان توصيف هذه المتغيِّرات بواسطة المعادلة التالية:

      أسلح {ة} {علامة الإعراب} [<ضمير متَّصل إختياريّ>]

      ظواهر كهذه هي عديدة في المورفوفونولوجيا لدرجة أنه من المستحيل أن يوجد مورد لغويّ عربيّ دقيق ومستغنياً عن مثل هذا التوصيف المفصَّل.



      دِقّة الموارد المعجمية العربية تتطلب توصيف مورفوفونولوجيّ وإملائي مفصّل، ​​وبالتالي خبير متخصص. ويحدّد الخبير المداخل المعجمية وترميز تغيُّراتها التصرفية الإملائية مستعيناً بمفاهيم مجرّدة كالوزن والجذر، والتبدلات المورفوفونولوجيّة مثل حذف و إدخال واستبدال حرف، وإنتقاله وإدغامه. بالإضافة إلى ذلك، عليه التعامل مع علامات الإعراب، والاختلافات الإملائية وتغيُّراتها، وقواعد السوابق واللواحق وعلاقتها بأشكالها النحويّة والإملائية المجازة، … ينبغي على الموارد المعجمية الدقيقة أن تشمل أيضا الأفعال والأسماء والصفات في جميع أشكالها التصريفية: معلوم/مجهول؛ ماضي/مضارع/أمر؛ المرفوع/ المنصوب/المجزوم /المؤكّد؛ مذكر/مؤنث .…

      الآن، تخيّل إدارة 80000 مدخل معجميّ في قاموس، 10000 منها لها جمع تكسير.



      العودة إلى سؤالنا في البداية، لماذا لا يوفِّر برنامج التحليل الصرفيّ لكل إسم وارد بصيغة جمع التكسير في النص صيغته المفردة؟ ليس من المستغرب أن لا يربط البرنامج صيغة جمع التكسير بصيغته المفردة، لأنها مسألة مُسْتَعْصِية وعسيرة.

      من دون خبير متخصص في المورفوفونولوجيا، لا يمكن للمهندسين الحاسوبيّين التعامل مع 80000 مدخل معجمي والاهتمام الكامل بالنحو، بالتصريف بالمورفوفونولوجيا وبالإملاء واستخدام المفاهيم المجردة المرتبطة بكل تخصص؛ بالإضافة إلى البرمجيات المتخصصة في حقل معالجات اللغات الطبيعية وتفهّمها من أجل إنتاج موارد معجميّة دقيقة.
      إعراب نحو حوسبة العربية
      http://e3rab.com/moodle
      المهتمين بحوسبة العربية
      http://e3rab.com/moodle/mod/data/view.php?id=11
      المدونات العربية الحرة
      http://aracorpus.e3rab.com

      تعليق

      • حامد السحلي
        إعراب e3rab.com
        • Nov 2006
        • 1373

        #4
        and Eric Laporte
        هل بإمكان مهندسي الصرف العربي الحاسوبي
        إعادة النظر بمقارباتهم المراهقة؟

        ألكسي عميد نعمة ـ إيرك لابورت

        Translation to Indonesian

        في نهاية التسعينات، اكتسبت اللغة العربية لدى المهندسين الحاسوبيين الشهرة بأن الصرف فيها "أكثر خصوبة وتعقيداً" (rich and complex) من اللغات الغربية لدرجة أن نِصْف المقالات العلميّة المخصّصة لمعالجة اللغة العربية تبدأ بهذه العبارة.

        من دون شك، إنّ خصوبة الصرف العربي بَدِيِهِيّة، وعلى سبيل المثال لدى الأسماء العربية ومتغيّراتها أربعة سمات صرفيّة ونحويّة (الجنس، العدد، التعريف، الحالة الإعرابية)، في حين لدى الأسماء الفرنسية سميتين اثنتين.

        إما للتعقيد وجهان:

        أ- تعقيد تفاصيل المعطيات الصرفية والتي لا مفرَّ منها؛

        ب- تعقيد تخزين هذه المعطيات والخوارزميات المرتبطة بها وهذا متعلق بالبرامج.

        هذه الصورة النمطية الشائعة للمورفولوجيا وهذا خلط بين وجهيْ التعقيد يؤدي إلى حجب الأول للثاني أي وجه عدم ملائمة المنهج المتّبع لدى المهندسين في تخزين المعطيات وعدم فعاليّة خوارزمياتهم.



        استناداً إلى النموذج التقليدي، تمّ تنفيذ نماذج عديدة للصرف من قِبَل مختبرات متخصّصة في المعالجات الحاسوبية. هذه التطبيقات لديها نقطتان مشتركتان:

        أولاً، تم إعتماد كلياً أو جزئياً النموذج التقليدي دون التدقيق أو التشكيك بأهدافه ومفاهيمه أو ملاءمته للمعالجات الحاسوبية؛

        ثانياً، لم تُنتج هذه المختبرات أي مورد لغوي دقيق حتى الآن.



        أدناه، مقتطفات من منشورات فريق جامعة كولومبيا الذي يُعتبر من أفضل الفِرَق الحاسوبية التي تعمل منذ عام 2005 (على الأقل) على معالجة اللغة العربية كما لديه إلمام وافر في المورفونولوجيا. هذا الفريق إقتبس لتطبيقيه النموذج التقليدي وإعتمد منهج الجذر/الوزن/قواعد (مورفونولوجية وإملائية).

        "من صيغ جمع التكسير، نستثني الجذور غير الثلاثية والسالمة من برنامج التحليل الصرفيّ لأننا لا نحاول معالجتهم في قواعد نسخة البرنامج المعتمدة حالياً."
        "مشروعنا الحالي للأسماء يتضمن جموع التكسير. القواعد تتناسب فقط مع صيغ الجذور الثلاثية لجموع التكسير: إننا لا نقيّم التغطية المعجمية لقاموسنا …ولاحقاً سنعمل على مسألة إنتاج وتقييم قاموس شامل."
        (Altantawy et al., 2010:856)

        وبعبارة أخرى، كان ترميز جزء فقط من قواعد جموع التكسير ومن دون الجموع السالمة التحدي الأكبر لفريق جامعة كولومبيا، ويكاد يكون من المستحيل في منهج الجذر/الوزن/قواعد لمعجم شامل. ففي هذا المنهج، لا يتم ترميز التغيرات مورفونولوجية للجذر بشكل مستقلّ لكل فئة تصرفيّة، ولكن يوجد منظومة واحدة من القواعد المورفونولوجية المطبّقة لكامل المداخل المعجمية. بناء على ذلك، قلّص فريق كولومبيا التغطية المعجمية لبرنامجه أي تخلّى عن التغطية الشاملة لجموع التكسير لإنقاذ المنهج المتّبع !



        أن صياغة سلسلة من القواعد في منظومة واحدة وتحديثها هي مهمة معقّدة جداً. في عام 2009، في نظام الناطق الآلي للّغة العربية، والذي يُستخدم حالياً على موقع http://translate.google.com، لقد كتبنا منظومة من القواعد لتحويل النص ألإملائي إلى مخرّجات صوتية مستندين على قواعد إملائيّة => فونولوجية. فكان تقييم أي تغيير في المنظومة (إدراج قاعدة جديدة، وتعديل قاعدة، وتغيير ترتيب القواعد) مبني على مقارنة تقربيّة وفطريّة للناتج الفونولوجي الجديد مع الناتج المرجع لمنظومة سابقة والمفترضة الأفضل حتى الآن. إذاً كان كل تغيير يتطلب عملية تجربية وتقدير الصواب والخطأ، حيث كل ناتج يُظهر بعض التحسُّنات وبعض الأضرار بالنسبة للمرجع السابق. إن عملية إيجاد المنظومة الأنسب للقواعد وصقلها تجريبياً كانت بالنسبة لنا كرجلٍ يتحسس طريقه في الظلام.



        قبل خمسة عشر عاما من مقال فريق جامعة كولومبيا (2010)، أشار "بيسلي" في نموذجه الخاص إلى مسائل مماثلة وذات صلة، وهو إن التعقيد الناجم عن الحروف الأصلية للجذر هي عديمة الفائدة، أي توصيف المداخل المعجمية بإستخدام الجذر الأصل وليس الظاهر. إعتبر "بيسلي" هذا الترميز اليدوي لتوصيف الجذر وتحديث قواعده

        "مهمة مملّة وشاقّة وغالباً ما تؤثر على الخبير اللغوي لتبسيط قواعدها مستنداً على الحرف الظاهر بدل الأصل." (Beesley، 1996: 91)



        لماذا المهندسون الحاسوبيون يعتبرون النموذج التقليدي والجذر الأصل بالتحديد أمراً مفروغاً منه؟

        لأنهم مهتمون أكثر بالخوارزميات وليس بعلم الصّرف. وليس لديهم الفضول ولا الميول للتفكير النقدي في علم الصرف.

        من الممكن أن يكون المفهوم اللغوي المجرد "الجذر الأصل" (deep root morpheme) مفيد للصرف التقليدي وأهدافه؛ لكنه يضاغف التعقيدات قي الصرف الحاسوبيّ لأنه يفترض مفهوم "الجذر غير الأصل" أي "الجذر الظاهر". فبالإضافة إلى النقاشات العقيمة داخل الفريق الحاسوبي الواحد حول ما هو الأصل وما هو الظاهر، يتضمّن النموذج فعلياً مفهومين بدل من مفهوم واحد. إذاً يجب إدارة في نموذج مُتَمَاسِك مفهومين مجردين وإرتباطهما بعشرات الآلاف من المداخل المعجمية.



        من ناحية أخرى، يفتقر منهج القاعدة المعتاد إلى مفهوم التصنيف التصريفيّ المعجميّ. في منظومة من القواعد، تؤثر كل قاعدة على أصناف عدة من المداخل المعجمية لأنها لا تحصر مجال تطبيقها على مداخل معجمية محددة بمؤشر خاص بكل قاعدة. فالقاعدة أداة بالغة القوة، ويميل المهندسون الحاسوبيّون لإخفاء عيوب تلك القوة المفرطة. فإذا زاد عدد القواعد في المنظومة الواحدة، يزيد ترابطهم بشكل ملحوظ، ويتأجج الترابط والتعقيد بشكل مطّرد. وعلاوة على ذلك، تراتبية تطبيق القواعد ضمن المنظومة الواحدة مهمّ ويجب أن تتقرر وتُرمّز. إن التحَقُّق وتصحيح وتحديث هكذا منظومة من القواعد هي من المهامّ الشائكة والثقيلة أو شبه المستحيلة.



        بالعكس، في إطار منهج يتضمن مفهوم التصنيف التصريفي المعجمي، فتبعيات قاعدة تقتصر على صنف واحدٍ، أي محصورة في مداخل معجمية محددة. يسمح مفهوم التصنيف التصرفيّ في المعاجم المصمّمة لمعالجة اللغات بتَلْفِيق منظومة صغيرة من القواعد ومشتركة بين المداخل المعجمية لصنف واحد؛ فالتعقيد مرتبط بعدد الأصناف (عادة بضعة مئات) بدل إرتباطه بعدد المداخل المعجمية (في العشرات من آلاف). وتبيّن التجربة أن التعامل مع منظومات مستقلة هو أبسط وأكثر ملاءمة للبرمجة والتصحيح، حتى لو كان ذلك على حساب تكرار بعض القواعد بين الأصناف.

        إنّ خبير في الصرف العربي قادر على إعطاء توصيف دقيق ومفصّل للظاهرات التصرفيّة ومعجم مصنّف تصريفياً مع تفاصيله كاملة لبرمجة الصرف العربي بطريقة مضبوطة وأسهل؛ رغم أن المهندسين الحاسوبيين يجدوا أنّ نفس التفاصيل مملَّة وحتى مزعجة.

        في الواقع، جزء من تعقيد الصرف العربي هو أصيل ومرتبط بمعطيات الصرف وتفاصيله، ولكن يمكننا الاستغناء عن التعقيد الذي ينشأ عن منهج الجذر/الوزن/ منظومة القواعد.



        لماذا سيستمرّ المهندسون الحاسوبيون بفشلهم في إنتاج موارد معجمية غير دقيقة؟ وما العمل؟

        ما لم يفكر المهندسون الحاسوبيون خارج منهج منظومة القواعد الواحدة، وهم يحاولون منذ 25 عاماً، وسوف يعاودون المحاولة مجدداً وعبثاً ومن دون جدوى لإثبات مدى “ملاءمة وفَعّالِيّة” منهجهم وخوارزمياتهم .
        بالإضافة إلى إهتمامهم بالخوارزميات، فإنهم يحتاجون إلى إعادة النظر في النموذج التقليدي وفقاً لأهداف وأغراض الصرف الحاسوبيّ.
        ما لم يكن لديهم الصبر للتفحّص الدقيق لتفاصيل التصريف ومتغيراته، فإنهم محكمون أن يتفاعلوا مع خبراء هذا الحقل.



        منذ 25 عاما، تدعم الجهات الراعية المهندسين الحاسوبيين ومقارباتهم المراهقة للصرف العربيّ. إلى متى؟
        إعراب نحو حوسبة العربية
        http://e3rab.com/moodle
        المهتمين بحوسبة العربية
        http://e3rab.com/moodle/mod/data/view.php?id=11
        المدونات العربية الحرة
        http://aracorpus.e3rab.com

        تعليق

        يعمل...
        X