كلية علوم الحاسوب والرياضيات تناقش رسالة ماجستير حول نظام توسيم الكلمات العربية باقسام الكلام

جرت في كلية علوم الحاسوب والرياضيات مناقشة رسالة الماجستير للطالبة (دعاء عبد المجيد عبد الرزاق) والتي سعت من خلالها الباحثة الى مناقشة وتنفيذ نظام توسيم الكلمات العربية باقسام الكلام. بدأ النظام من خلال (1) توسيم 1000 وثيقة من ذخيرة (Corpus) الصباح ، (2) تنفيذ ثلاثة من موسمات (Tags) لاقسام الكلام على هذه الذخيرة ، (3) إقتراح طريقة جديدة لتوسيم الجمل الطويلة العربية ، و (4) تقييم جميع الخوارزميات المستخدمة على نفس الذخيرة. بدأ توسيم الكلمات باستخدام موسم ستانفورد ثم تم تصحيح الإخراج يدويًا لإنتاج ذخيرة قياسية (Golden-Standard) تحتوي 546075 جزء بما في ذلك علامات الترقيم. ثم قدمت طريقة المقترحة لحل مشكلة طول الجملة في اللغة العربية والتي تسبب أخطاء تراكمية خصوصآ الموسمات التي تعتمد على تتابع الكلمات مثل HMM. واعطت أعطت الطريقة المقترحة دقة أعلى من HMM ، N-gram و. perceptron. كما كان أفضل حجم للنافذة هو 10 ، وكان أفضل حجم للتداخل هو 3.

شاهد أيضاً

الكلية تعقد ورشة عمل حول ( بناء قدرات الأستاذ الجامعي في الإرشاد النفسي والتوجيه التربوي سبيلنا لتحصين الطالب الجامعي)

عقدت كلية علوم الحاسوب والرياضيات قسم الرياضيات في جامعة الكوفة ورشة عمل حول (بناء قدرات …

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *