اقتراح لبدء آلية لاستقراء المعجم الاشتقاقي اعتمادا على مشروع الترميز

تقليص
X
 
  • تصفية - فلترة
  • الوقت
  • عرض
إلغاء تحديد الكل
مشاركات جديدة
  • حامد السحلي
    إعراب e3rab.com
    • Nov 2006
    • 1373

    اقتراح لبدء آلية لاستقراء المعجم الاشتقاقي اعتمادا على مشروع الترميز

    السلام عليكم

    د.عبد الرحمن السليمان:

    في ضوء استقرائي للموضوع أتقدم باقتراح بسيط يخص المعجم الاشتقاقي
    نستطيع حاليا توليد فضاء الجذور المحتملة كاملا وقد يتطلب وضع برنامج لهذا الأمر شهرا (نحن نقوم بعمل تطوعي :-D ) ثم يمكن تطوير البرنامج من خلال قائمة بالمشتقات القياسية العربية لتوليد فضاء الكلمات

    بالنسبة للمعجم الاشتقاقي (قراءة الدكتور السليمان) هذا العمل استقراء سريع ويمكن استخدامه لسحب المعجم مرتبا بشكل شجري مع عمل يدوي يمكن تأليل جزء منه

    بالنسبة للمشروع فهي تعطينا قراءة لما يجب عمله وحجم الجهد اليدوي المطلوب للوصول في النهاية إلى نفس الهدف (معجم اشتقاقي معنوي) ولكنه ضمن آلية رقمية توليدية

    إذا كانت هذه الفكرة ممكنة فسأعمل عليها
    إعراب نحو حوسبة العربية
    http://e3rab.com/moodle
    المهتمين بحوسبة العربية
    http://e3rab.com/moodle/mod/data/view.php?id=11
    المدونات العربية الحرة
    http://aracorpus.e3rab.com
  • عبدالرحمن السليمان
    عضو مؤسس، أستاذ جامعي
    • May 2006
    • 5732

    #2
    _MD_RE: اقتراح لبدء آلية لاستقراء المعجم الاشتقاقي اعتمادا على مشروع الترميز

    <p><font size="5"><strong>أخي الكريم الدكتور حامد،</strong></font></p><p><font size="5"><strong>شكرا على همتك العالية واقتراحك الجميل. </strong></font></p><p><font size="5"><strong>هل يمكن تحميل البرنامج الذي ستطوره تحت برنامج الجمعية بحيث يكون العمل في موقع واحد؟ نحن مهتمون بذلك أخي الفاضل، وكلنا في نهاية الأمر متطوعون، فينطلق موضوع المعجم بمعيتك ومعية الأعضاء أجمعين فنقدم عملا رائعا في سبيل لغتنا العزيزة. </strong></font></p><p><font size="5"><strong>موافقون من حيث المبدأ، والفكرة رائعة، فهل لحضرتك أن تقدم للجمعية تصورا بكيفية عمل البرنامج حتى نرى فيما إذا كان البرنامج يفي بالغرض بالنسبة للمسائل اللغوية الاشتقاقية؟</strong></font></p><p><font size="5"><strong>بارك الله فيك.</strong></font></p><p></p>

    تعليق

    • حامد السحلي
      إعراب e3rab.com
      • Nov 2006
      • 1373

      #3
      _MD_RE: اقتراح لبدء آلية لاستقراء المعجم الاشتقاقي اعتمادا على مشروع الترميز

      السلام عليكم ورحمة الله

      أولا أنا لست دكتور؟؟ وقد كان من المفترض أن أوضح ذلك منذ أن خلطني جهاد مع غيري بهذا اللقب فعذرا
      {لاَ تَحْسَبَنَّ الَّذِينَ يَفْرَحُونَ بِمَا أَتَواْ وَّيُحِبُّونَ أَن يُحْمَدُواْ بِمَا لَمْ يَفْعَلُواْ فَلاَ تَحْسَبَنَّهُمْ بِمَفَازَةٍ مِّنَ الْعَذَابِ وَلَهُمْ عَذَابٌ أَلِيمٌ }آل عمران188

      في الواقع إذا كنت أنا سأنجز البرنامج فسيتم ذلك بلغة سي ولا أعلم مدى إمكانية تحميله على مخدم موقع الجمعية
      رغم ذلك هناك أشخاص يمكنهم تحويل البرنامج إلى بي إتش بي يمكنني طلب مساعدتهم

      بغض النظر عن اللغة التي سيكتب بها البرنامج فستكون الخطوات كالآتي

      يتبع...
      إعراب نحو حوسبة العربية
      http://e3rab.com/moodle
      المهتمين بحوسبة العربية
      http://e3rab.com/moodle/mod/data/view.php?id=11
      المدونات العربية الحرة
      http://aracorpus.e3rab.com

      تعليق

      • حامد السحلي
        إعراب e3rab.com
        • Nov 2006
        • 1373

        #4
        _MD_RE: اقتراح لبدء آلية لاستقراء المعجم الاشتقاقي اعتمادا على مشروع الترميز

        <html xmlns="urn:schemas-microsoft-comfficeffice"
        xmlns:w="urn:schemas-microsoft-comffice:word"
        xmlns="http://www.w3.org/TR/REC-html40">

        <head>
        <meta http-equiv=Content-Type content="text/html; charset=windows-1256">
        <meta name=ProgId content=Word.Document>
        <meta name=Generator content="Microsoft Word 10">
        <meta name=Originator content="Microsoft Word 10">
        <link rel=File-List href="واتا.files/filelist.xml">
        <title>المعجم الاشتقاقي</title>
        <!--[if gte mso 9]><xml>
        <oocumentProperties>
        <o:Author>server</o:Author>
        <o:LastAuthor>server</o:LastAuthor>
        <o:Revision>2</o:Revision>
        <o:TotalTime>80</o:TotalTime>
        <o:Created>2006-12-15T00:57:00Z</o:Created>
        <o:LastSaved>2006-12-15T00:57:00Z</o:LastSaved>
        <o:Pages>1</o:Pages>
        <o:Words>325</o:Words>
        <o:Characters>1859</o:Characters>
        <o:Company>DAR.Net</o:Company>
        <o:Lines>15</o:Lines>
        <o:Paragraphs>4</o:Paragraphs>
        <o:CharactersWithSpaces>2180</o:CharactersWithSpaces>
        <o:Version>10.2625</o:Version>
        </oocumentProperties>
        </xml><![endif]--><!--[if gte mso 9]><xml>
        <w:WordDocument>
        <w:SpellingState>Clean</w:SpellingState>
        <w:GrammarState>Clean</w:GrammarState>
        <w:Compatibility>
        <w:BreakWrappedTables/>
        <w:SnapToGridInCell/>
        <w:ApplyBreakingRules/>
        <w:WrapTextWithPunct/>
        <w:UseAsianBreakRules/>
        </w:Compatibility>
        <w:BrowserLevel>MicrosoftInternetExplorer4</w:BrowserLevel>
        </w:WordDocument>
        </xml><![endif]-->
        <style>
        <!--
        /* Font Definitions */
        @font-face
        {font-family:Wingdings;
        panose-1:5 0 0 0 0 0 0 0 0 0;
        mso-font-charset:2;
        mso-generic-font-family:auto;
        mso-font-pitch:variable;
        mso-font-signature:0 268435456 0 0 -2147483648 0;}
        /* Style Definitions */
        p.MsoNormal, li.MsoNormal, div.MsoNormal
        {mso-style-parent:"";
        margin:0in;
        margin-bottom:.0001pt;
        text-align:right;
        mso-pagination:widow-orphan;
        direction:rtl;
        unicode-bidi:embed;
        font-size:12.0pt;
        font-family:"Times New Roman";
        mso-fareast-font-family:"Times New Roman";}
        span.SpellE
        {mso-style-name:"";
        mso-spl-e:yes;}
        span.GramE
        {mso-style-name:"";
        mso-gram-e:yes;}
        @page Section1
        {size:595.3pt 841.9pt;
        margin:1.0in 1.25in 1.0in 1.25in;
        mso-header-margin:.5in;
        mso-footer-margin:.5in;
        mso-paper-source:0;
        mso-gutter-direction:rtl;}
        div.Section1
        {page:Section1;}
        /* List Definitions */
        @list l0
        {mso-list-id:441923232;
        mso-list-type:hybrid;
        mso-list-template-ids:-1732354384 67698693 67698691 67698693 67698689 67698691 67698693 67698689 67698691 67698693;}
        @list l0:level1
        {mso-level-number-format:bullet;
        mso-level-text:\F0A7;
        mso-level-tab-stop:.5in;
        mso-level-number-position:left;
        text-indent:-.25in;
        font-family:Wingdings;}
        ol
        {margin-bottom:0in;}
        ul
        {margin-bottom:0in;}
        -->
        </style>
        <!--[if gte mso 10]>
        <style>
        /* Style Definitions */
        table.MsoNormalTable
        {mso-style-name:"جدول عادي";
        mso-tstyle-rowband-size:0;
        mso-tstyle-colband-size:0;
        mso-style-noshow:yes;
        mso-style-parent:"";
        mso-padding-alt:0in 5.4pt 0in 5.4pt;
        mso-para-margin:0in;
        mso-para-margin-bottom:.0001pt;
        mso-pagination:widow-orphan;
        font-size:10.0pt;
        font-family:"Times New Roman";}
        </style>
        <![endif]-->
        </head>

        <body lang=EN-US style='tab-interval:.5in'>

        <div class=Section1 dir=RTL>

        <p class=MsoNormal dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'><o>&nbsp;</o></span></p>

        <p class=MsoNormal dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'>مازال محور العمل الأساسي بالنسبة لنا في مشروع الترميز
        هو ضبط العلاقات الصوتية والذي يبدو أنه سيستهلك وقتا ليس كما كان متوقعا ولكنها
        مرحلة لا يمكن تجاوزها في رؤيتي فالعربية في النهاية لغة مسموعة ولم تؤثر الكتابة
        في آليات تطورها (رغم أن هناك من يقرأ <span class=SpellE>مائة</span> بالألف
        الممدودة بدل مئة من المتعلمين؟ <span class=GramE>المحدثين</span>)<o></o></span></p>

        <p class=MsoNormal dir=RTL><span class=GramE><span lang=AR-SY style='font-size:
        16.0pt;font-family:"Courier New";color:blue'>في</span></span><span lang=AR-SY
        style='font-size:16.0pt;font-family:"Courier New";color:blue'> ضوء هذا يمكننا
        حاليا تطوير جزء من المرحلة اللاحقة وهي ضبط المشتقات والأوزان وقواعد الشذوذ...<o></o></span></p>

        <p class=MsoNormal dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'><o>&nbsp;</o></span></p>

        <p class=MsoNormal dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'>كما ذكرت سابقا هناك فضاء جذور كلي 28*28*28=21952 وبغض
        النظر عن الرقم الحقيقي يمكننا توليد هذا الفضاء بسهولة ضمن بنية جدولية<o></o></span></p>

        <p class=MsoNormal dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'>طبعا <span class=GramE>يمكن</span> تنقيح هذه البنية
        يدويا بالاعتماد على خبرة عالية وعمل يدوي<o></o></span></p>

        <p class=MsoNormal dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'>الخيار الثاني هو الانتقال إلى مرحلة المشتقات وفق
        التوصيف القياسي والذي يعتقد الدكتور نبيل علي أنه قريب من بضعة عشر <span
        class=SpellE>ومئة</span> <o></o></span></p>

        <p class=MsoNormal dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'>المهم هنا هو وضع جدول بهذه المشتقات مع آلية تصنيف
        لغوية قابلة للتأليل وليس مهما أن يتم حصرها نهائيا في هذه المرحلة كما أن هذه
        البنية التصنيفية قد تُلغى عندما نعتمد تصنيفا صوتيا<o></o></span></p>

        <p class=MsoNormal dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'>عند ذلك يمكن للبرنامج توليد فضاء الكلمات المشتقة
        اعتمادا على فضاء الجذور والرقم الناتج مهول 28*28*28*110=2414720 وليس من المنطقي
        استقراؤه بشريا<o></o></span></p>

        <p class=MsoNormal dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'>يمكننا الرجوع بالعكس اعتمادا على نصوص أو أي مسرد
        كلمات موثوق <span class=GramE>ومشكّلة <span
        style='mso-spacerun:yes'> </span>ومن</span> الطبيعي أن يكون أول نص يمكن
        الاعتماد عليه هو القرآن ثم المعاجم الكبرى... <o></o></span></p>

        <p class=MsoNormal dir=RTL><span class=GramE><span lang=AR-SY style='font-size:
        16.0pt;font-family:"Courier New";color:blue'>سيقارن</span></span><span
        lang=AR-SY style='font-size:16.0pt;font-family:"Courier New";color:blue'>
        البرنامج كل كلمة بموقعها المفترض وهذا سيثبت جذر الكلمة ثم هذا المشتق عندها يمكن
        يدويا استقراء بقية مشتقات هذا الجذر ورفض بعضها أو تعديل البعض وهي الخطوة التي
        ستبني آليات شذوذ المشتق كما يمكن إضافة المشتقات الناقصة واكتشافها بالتتابع<o></o></span></p>

        <p class=MsoNormal dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'>في هذه المرحلة هناك مشكلتان:<o></o></span></p>

        <p class=MsoNormal dir=RTL style='margin-right:.5in;text-indent:-.25in;
        mso-list:l0 level1 lfo1;tab-stops:list .5in'><![if !supportLists]><span
        style='font-size:16.0pt;font-family:Wingdings;mso-fareast-font-family:Wingdings;
        mso-bidi-font-family:Wingdings;color:blue'><span style='mso-list:Ignore'>§<span
        style='font:7.0pt "Times New Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; </span></span></span><![endif]><span
        dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:"Courier New";
        color:blue'>جزء كبير من الكلمات مزيدة في النصوص الطبيعية وهذه لا تشكل مشكلة في
        هذه المرحلة إذ سيتجاوزها البرنامج لدى الدراسة الأولى ولكن المشكلة هي عندما
        تتطابق الكلمة مع مشتق في غير موضعها وهو على الأرجح مشتق غير موجود أو شاذ؟؟ وليس
        من المجدي حاليا التفكير بربط البرنامج مع آلية لتجريد الكلمة ولكن بالإمكان تزويد
        البرنامج بصيغ كاملة ((مزيدة)) شهيرة لتوليدها أثناء المطابقة والبحث<o></o></span></span></p>

        <p class=MsoNormal dir=RTL style='margin-right:.5in;text-indent:-.25in;
        mso-list:l0 level1 lfo1;tab-stops:list .5in'><![if !supportLists]><span
        style='font-size:16.0pt;font-family:Wingdings;mso-fareast-font-family:Wingdings;
        mso-bidi-font-family:Wingdings;color:blue'><span style='mso-list:Ignore'>§<span
        style='font:7.0pt "Times New Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; </span></span></span><![endif]><span
        dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:"Courier New";
        color:blue'>مع سير عمل البرنامج يمكن إضافة الصيغ وتصنيف حالات الشذوذ وربطها
        بأسباب معينة ((في النهاية لكل شذوذ سبب صوتي)) وهذا سيوسع دقة البرنامج وعدد
        الكلمات المقبولة ولكنه يتطلب تعاونا ((وتفاهما وثيقا)) بين المدققين ومطوري
        البرنامج<o></o></span></span></p>

        <p class=MsoNormal dir=RTL style='margin-right:.5in;text-indent:-.25in;
        mso-list:l0 level1 lfo1;tab-stops:list .5in'><![if !supportLists]><span
        style='font-size:16.0pt;font-family:Wingdings;mso-fareast-font-family:Wingdings;
        mso-bidi-font-family:Wingdings;color:blue'><span style='mso-list:Ignore'>§<span
        style='font:7.0pt "Times New Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; </span></span></span><![endif]><span
        dir=RTL><span class=GramE><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'>ستتم</span></span></span><span lang=AR-SY
        style='font-size:16.0pt;font-family:"Courier New";color:blue'> إعادة الدورة إلى
        حين الوصول إلى نتيجة مرضية وهي لا تعني تغطية كامل اللغة ولكن المتبقي سيعتمد
        حتما على النموذج النهائي والتدقيق اليدوي<o></o></span></p>

        <p class=MsoNormal dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'><o>&nbsp;</o></span></p>

        <p class=MsoNormal dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'><o>&nbsp;</o></span></p>

        <p class=MsoNormal dir=RTL><span lang=AR-SY style='font-size:16.0pt;font-family:
        "Courier New";color:blue'><o>&nbsp;</o></span></p>

        <p class=MsoNormal dir=RTL><span dir=LTR style='font-size:16.0pt;font-family:
        "Courier New";color:blue'><o>&nbsp;</o></span></p>

        </div>

        </body>

        </html>
        إعراب نحو حوسبة العربية
        http://e3rab.com/moodle
        المهتمين بحوسبة العربية
        http://e3rab.com/moodle/mod/data/view.php?id=11
        المدونات العربية الحرة
        http://aracorpus.e3rab.com

        تعليق

        يعمل...
        X