Arabic Translators International _ الجمعية الدولية لمترجمي العربية

 


العودة   Arabic Translators International _ الجمعية الدولية لمترجمي العربية > اللسانيات (اللغويات) Linguistics > اللسانيات والحاسوب والمعالجة اللغوية Compu-linguistics

اللسانيات والحاسوب والمعالجة اللغوية Compu-linguistics في اللسانيات والحاسوب والمعالجة اللغوية

« آخـــر الـــمـــشـــاركــــات »
         :: محمود علي مكي : اليهود أتقنوا العربية فأحيوا العبرية (آخر رد :Yousra Mesbahi)       :: هل نجد وصف الرسول محمد في كتب اليهود والنصارى؟ (آخر رد :محمد آل الأشرف)       :: الموت كصاعقة من السماء ،،، (آخر رد :عبدالحليم الطيطي)       :: البناء الشعري في مجموعة سيدة الياسمين لمحمد محضار (آخر رد :محمد محضار)       :: مسرد تجنبا للحرج! (آخر رد :عبدالرحمن السليمان)       :: مجموعة أسئلة (آخر رد :سالم العوام)       :: مشروع لتنشيط حركة الترجمة للعربية بحاجة إلى معلومات (آخر رد :سالم العوام)       :: ملاحظات ومقارنات لغوية (آخر رد :عبدالرحمن السليمان)       :: تأملات في السياسىة (آخر رد :Dr-A-K-Mazhar)       :: بدلا من نظرية المؤامرة (آخر رد :Dr-A-K-Mazhar)      

رد
 
أدوات الموضوع طرق مشاهدة الموضوع
  #1  
قديم 07-13-2011, 12:51 PM
الصورة الرمزية حامد السحلي
حامد السحلي حامد السحلي متواجد حالياً
إعراب e3rab.com
 
تاريخ التسجيل: Nov 2006
الدولة: سورية
المشاركات: 1,323
افتراضي إطلاق مشروع: مسكوك للمتلازمات اللفظية

برمجة linuxscout

يبدو أن الطريق إلى التشكيل محفوف بالعقبات، وأولاها مسألة التلازم اللفظي التي تساعد في تشكيل الكلمة حسب سياقها، مثلا كرة القدم، الوطن العربي، العالم الإسلامي، وغيرها من الكلمات التي تتوارد معا، مما يحتم تشكيلها في هذا السياق بطريقة محددة.

لذا عملنا على قائمة للكلمات العربية المتلازمة لفظيا، وقد استخرجناها من موسوعة ويكيبيديا العربية، واسمينا هذا المشروع على بركة الله “مسكوك“، لأنّ المتلازمات تسمى مسكوكات أو متواردات.

رابط المشروع : http://maskouk.sourceforge.net

المتلازمات اللفظية

يشير مصطلح “المتلازمات اللفظية” إلى كلمة يقترن استخدامها في اللغة بكلمة أو كلمات أخرى وقد يطلق عليها البعض أسماء أخرى مثل” المتصاحبات اللفظية” أو “المتواردات أو المقترنات أو المترافقات اللفظية”(collocating words) و تعرّف أيضاً بأنها: ” تكرار معتاد لمجموعات من الكلمات المفردة، والتي يأتي تكرارها معا من خلال شيوع الاستخدام بحيث تميل لتشكيل وحدة مميزة .”وقد تتكون هذه المتلازمات من:اسم وفعل مثل: (أدى الزكاة) و(أقام الصلاة) و(عبر النهر) و(خاض المعركة). أو اسم واسم مثل: (حقن الدماء) و(أداء الدين)و( الوفاء بالعهد. أو فعل وفعل آخر مثل (جعل يقول) و(طفق يخصف) و(أقبل ينادي) أو صفة واسم مثل (عابس الوجه) و(لّين العريكة) و(طويل الباع) أو اسم وحرف مثل (تخرج في جامعة…). وتعتبر المتلازمات اللفظية من أهم عناصر الربط المسْهمة في اتساق النصوص وهي حروف العطف وأسماء الإشارة والأسماء الموصولة والضمائر الإحالية والتكرار التام والتكرار الجزئي والتوازي. [1].

وقيمةُ البحث في موضوع المتلازِماتِ الاصطلاحيّة تكمنُ في تحديث المعجم العربي، وتطوير منهج البحث الاصطلاحي والمعجمي ، ويساعد في حوسَبَتِه . فالحاجةُ ماسّةٌ إلى جمع التعابير الاصطلاحية والسياقية في العربية اليوم، وتصنيفها بحسب أقسام الكلم، وتحليلِ العَلاقات البنيوية والدلالية التي تربط بين مفرداته. [2].
تطبيقاتها

استخراج المصطلحات
التحليل الدلالي.
البحث.
التحليل النحوي
التشكيل.

المصادر المستعملة

موسوعة ويكيبيديا العربية.
مكتبة ثواب.

أعلى المتلازمات تكرارا في ويكيبيديا
لكرة القدم 54739
الولايات المتحدة 38600
عبد الله 34459
خطوة ثانية 22696
بن عبد 22583
تحويلة مزدوجة 22103
عبد العزيز 20064
ال التعريف 17783
المملكة المتحدة 17621
وصلة مقالة 12815
عبد الرحمن 12499
صيغة التاريخ 12362
قيد الحياة 12307
المصناف الفوري 12173
المتحدة الأمريكية 10511
لغة بديلة 10139
كرة القدم 10001
مقالة مختارة 9960
الحرب العالمية 8914
بن محمد 8874
إزالة التصنيف 8702
الموقع الرسمي 8460
كلمة مستهدفة 7214
بن أبي 6773
التعابير النمطية 6638
مقالة جيدة 6523
بن علي 6347
الأمم المتحدة 5972
العالمية الثانية 5666
الشرق الأوسط 5589
القرن العشرين 5427
الألعاب الأولمبية 5325
العربية السعودية 5273
اللغة العربية 5164
سبيل المثال 4852
عبد الفتاح 4699
المملكة العربية 4383
العربية المتحدة 4107
قائمة المقالات 4015
دائرة انتخابية 3956
تحويلة همزة 3849
القرآن الكريم 3813
ذلك الوقت 3719
نسخة بواسطة 3641
الإمارات العربية 3593
عبد الوهاب 3572
خريطة الانتشار 3507
الأمم الأوروبية 3486
الدول العربية 3479
الأولمبية الصيفية 3475
بن أحمد 3468
كتاب ومؤلفون 3442
عبد القادر 3404
لغة إنجليزية 3368
إضافة سريعة 3354
الناتج المحلي 3256
الأوروبية لكرة 3109
الوطن العربي 3083
عبد الكريم 3067
الدولة العثمانية 3025
عبد الحميد 3012
عبد السلام 2992
الجزيرة العربية 2984
المحلي الإجمالي 2983
مباراة كرة 2946
بن كلثوم 2847
لمعرفة اليوم 2811
اليوم الميلادي 2810
هذا اليوم 2704
ذاتية الحكم 2701
بن سعود 2660
لغة عربية 2654
الاتحاد الأوروبي 2619
المدينة المنورة 2608
درجة حرارة 2561
حالة الحفظ 2529
الأبيض المتوسط 2529
كأس العالم 2528
بطولة العالم 2508
الخطوط الجوية 2487
بذرة مدينة 2486
الاسم العلمي 2473
البحر الأبيض 2458
الاسم الكامل 2422
لكرة اليد 2381
الخليج العربي 2354
أندية كرة 2337
العالم العربي 2336
نفس الوقت 2321
كلمة اليوم 2313
درجة الحرارة 2251
بعض الأحيان 2224
صورة مختارة 2202
سنة الولادة 2173
القوات الجوية 2167
تلك الفترة 2157
القوات المسلحة 2139
جامعة القاهرة 2080
الاتحاد السوفيتي 2080
عبد الناصر 2065

مراجع

[1]- عطاء فياض
[2]- د.عبد الرحمن بودرع
[3]- مبادرة المتلازمات اللفظية العربية

--
__________________
إعراب نحو حوسبة العربية
http://e3rab.com/moodle
المهتمين بحوسبة العربية
http://e3rab.com/moodle/mod/data/view.php?id=11
المدونات العربية الحرة
http://aracorpus.e3rab.com
رد مع اقتباس
  #2  
قديم 07-13-2011, 12:52 PM
الصورة الرمزية حامد السحلي
حامد السحلي حامد السحلي متواجد حالياً
إعراب e3rab.com
 
تاريخ التسجيل: Nov 2006
الدولة: سورية
المشاركات: 1,323
افتراضي

> السلام عليكم
>
> مبارك وجزاك الله خيرا أخي طه على هذا المشروع
> 1- من استعراض سريع لقائمة المتواردات الأكثر ورودا في ويكيبيديا نجد أن هناك هيمنة لأنواع محددة من النصوص.. وهذا يجب استدراكه في رؤيتي بتوسيع البحث إلى مكانز أخرى هل هناك خطة قريبة لهذا؟
نعم هذا من الأهداف المقبلة
طابع ويكيبيديا أنها متنوعة، لكن العربية منها يغلب عليها مقالات معينة، لذا سنثريها من مدونات أخرى.


> 2- ما دامت الغاية هي التشكيل إذا هل سيتضمن مسكوك وسما إعرابيا للكلمات أم سيتم تأجيل هذا إلى مرحلة تالية وسيدرج مسكوك قائمة متلازمات غير موسومة أو مشكولة؟
تماما، نحتاج إلى متلازمات مشكولة، وذلك إما باستخراجها من مدونة مشكولة
أو تشكيل ما لدينا،
أو كتابة متلازمات أخرى مشكولة
ويضاف لها وسوم مثل اسم علم مركب، نعت ومنعوت، ومضاف ومضاف إليه.
، من لديه مدونة مشكولة شكلا تاما؟
__________________
إعراب نحو حوسبة العربية
http://e3rab.com/moodle
المهتمين بحوسبة العربية
http://e3rab.com/moodle/mod/data/view.php?id=11
المدونات العربية الحرة
http://aracorpus.e3rab.com
رد مع اقتباس
  #3  
قديم 07-13-2011, 08:24 PM
الصورة الرمزية ahmed_allaithy
ahmed_allaithy ahmed_allaithy متواجد حالياً
عضو مؤسس_أستاذ جامعي
 
تاريخ التسجيل: May 2006
المشاركات: 3,773
افتراضي

هناك خطأ في عمل هذا البرنامج، يتمثل في أنك حين تبحث عن متلازمات لفظية لكلمة ما تأتي النتيجة بكلمات تحتوي حروف الكلمة التي تبحث عنها. مثلاً، إذا بحثت عن كلمة (أب) خرج لك أبواب كذا، وما أشبه، وكلمة سكر خرجت لك كلمة عسكر وما أشبه.
فينبغي أن يتعدل البرنامج بحيث يعتبر المادة التي يبحث عنها الباحث كلمة كاملة مستقلة بنفسها، وليست جزءً من كلمة أخرى، خاصة أن أغلب كلمات العربية لها أصول ثلاثية، وما أكثر الثلاثي!
__________________
د. أحـمـد اللَّيثـي
رئيس الجمعية الدولية لمترجمي العربية
تلك الدَّارُ الآخرةُ نجعلُها للذين لا يُريدون عُلُوًّا فى الأَرضِ ولا فَسادا والعاقبةُ للمتقين.

فَعِشْ لِلْخَيْرِ، إِنَّ الْخَيْرَ أَبْقَى ... وَذِكْرُ اللهِ أَدْعَى بِانْشِغَالِـي

رد مع اقتباس
  #4  
قديم 07-13-2011, 11:17 PM
الصورة الرمزية وفاء كامل فايد
وفاء كامل فايد وفاء كامل فايد غير متواجد حالياً
عضو مؤسس_أستاذة جامعية
 
تاريخ التسجيل: May 2006
المشاركات: 430
افتراضي تشكيل المتلازمات اللفظية

التشكيل يمكن أن يكون صالحا للمتلازمات الفعلية، التي تبدأ بفعل، مثل اخْترَقَت الطائرةُ حاجزَ الصوتِ، لَعِبَ على وَترٍ حَسّاسٍ، جَرَحَ مَشاعِرَ فلانٍ، غَضّ طَرفَهُ عنْ كذا ..إلخ
أما في المتلازمات التي تبدأ باسم فيلزم أن يتحدد موقع الاسم الأول في الجملة حتى يمكن إعرابه، ومن ثم ضبطه بالشكل. أما الاسم الثاني فيمكن ضبطه حسب موقعه، تبعا للاسم الأول- أو بمعنى آخر: حسب علاقته بالاسم الأول- فقد يكون مضافا إليه كما في : بور سودان، عبد العزيز، غزو الفضاء، جنون العظمة، ناطحات السحاب،.
وقد يكون الاسم الثاني نعتا، كما في: الساحرة المستيرة ، كوميديا سوداء، الذئبة الحمراء، تقليد أعمى، المملكة المتحدة.
__________________
د. وفاء كامل فايد
رد مع اقتباس
  #5  
قديم 05-09-2013, 04:21 PM
الصورة الرمزية abdilra7eem
abdilra7eem abdilra7eem غير متواجد حالياً
عضو منتسب
 
تاريخ التسجيل: Jun 2010
المشاركات: 10
افتراضي

اقتباس:
المشاركة الأصلية كتبت بواسطة ahmed_allaithy مشاهدة المشاركة
هناك خطأ في عمل هذا البرنامج، يتمثل في أنك حين تبحث عن متلازمات لفظية لكلمة ما تأتي النتيجة بكلمات تحتوي حروف الكلمة التي تبحث عنها. مثلاً، إذا بحثت عن كلمة (أب) خرج لك أبواب كذا، وما أشبه، وكلمة سكر خرجت لك كلمة عسكر وما أشبه.
فينبغي أن يتعدل البرنامج بحيث يعتبر المادة التي يبحث عنها الباحث كلمة كاملة مستقلة بنفسها، وليست جزءً من كلمة أخرى، خاصة أن أغلب كلمات العربية لها أصول ثلاثية، وما أكثر الثلاثي!
السلام عليكم
أظن هذا بسبب استخدام تعبير اعتياديّ Regular expression لا يشترط وجود فراغ قبل أو بعد المحارف المدخلة في شريط البحث. قد تكون هذه مقصودة منه أو غير مقصودة. سأحاول مراسلته بخصوص هذا الموضوع.
رد مع اقتباس
  #6  
قديم 04-22-2014, 08:13 AM
الصورة الرمزية الدكتور المصري
الدكتور المصري الدكتور المصري غير متواجد حالياً
عضو منتسب
 
تاريخ التسجيل: Apr 2014
المشاركات: 1
افتراضي

السلام عليكم ورحمة الله وبركاته
هل يمكن الاستفادة من هذا البرنامج بتطبيقه على مدونات نصية أخرى أم هو قاصر على ويكبيديا فقط؟
وهل يشتمل على خدمة البحث عن متلازمات معينة أم يقوم باستخراج كل المتلازمات مرة واحدة ؟
رد مع اقتباس
رد


الذين يشاهدون محتوى الموضوع الآن : 1 ( الأعضاء 0 والزوار 1)
 
أدوات الموضوع
طرق مشاهدة الموضوع

تعليمات المشاركة
لا تستطيع إضافة مواضيع جديدة
لا تستطيع الرد على المواضيع
لا تستطيع إرفاق ملفات
لا تستطيع تعديل مشاركاتك

BB code متاحة
كود [IMG] متاحة
كود HTML متاحة

الانتقال السريع إلى


جميع الأوقات بتوقيت GMT. الساعة الآن 10:42 AM.




Powered by vBulletin
Copyright ©2000 - 2019, Jelsoft Enterprises Ltd. تعريب » حلم عابر