[x]

"وقـل اعمـلوا فسـيرى الله عـملكم ورسـوله والمؤمنـون"


..لمحة عن كليات جامعة دمشق و فروعها... شاركنا تجربتك وكلمنا عن اختصاصك



المحـاضـرات
برنـامج الـدوام
برنـامج الامتحــان
النتـائج الامتحـانيـة
أسـئلة دورات
أفكـار ومشــاريع
حلقــات بحـث
مشــاريع تخـرّج
"وقـل اعمـلوا فسـيرى الله عـملكم ورسـوله والمؤمنـون"
كلية الصيدلة

مواضيع مميزة..


مواضيع ننصح بزيارتها .:Pharmacy:. عش متعة الصيدلة .:Pharmacy:. تقنية الويكي: معاً نحو محتوى عربي رقمي علمي نصنعه معاً .:Pharmacy:. ساحة مشروع ترجمة موسوعة التكنولوجيا الصيدلية .:Pharmacy:. تعو نلازم كلنا سوا .:Pharmacy:. معلومة عالماشي يا صـــــــيــــــــدلــــــي .:Pharmacy:. كل شـــي جـــديــــد .:Pharmacy:. مواقع الشركات الدوائية
مواضيع مميزة:
مـنـتـدى تـرجـمــة وتـدقـيـق أقــســام الـمـوســـوعـة
للتواصل مع الهيئة الإدارية في كلية الصيدلة اضغط هنا
ويكـي فـارما

المركز الإخباري الــصــيدلاني

مشروع ترجمة الموسوعة التكنلوجية الصيدلانية

موسوعة العلوم العربية

مشروع المجلة الطبية Medical Journal

مشروع الأختام الجماعية الدورية

  ملتقى طلاب جامعة دمشق --> كلية الصيدلة --> منتـدى المشاريـع و الأفكار الإبـداعيـة --> مشروع ترجمة موسوعة التكنولوجيا الصيدلية
    آفاق الترجمة الآلية & الترجمة العلمية
عنوان البريد :  
كلمة المرور :  
                    تسجيل جـديد


.آفاق الترجمة الآلية & الترجمة العلمية


bachar jammal

جامعـي اســتثنائي





مسجل منذ: 23-01-2009
عدد المشاركات: 622
تقييمات العضو: 13
المتابعون: 12

غير موجود
اشــترك بالتحديثات
رسالة مستعجلة

آفاق الترجمة الآلية & الترجمة العلمية

16-04-2010 05:55 PM




بسم الله الرحمن الرحيم

بمناسبة إقامة محاضرة مرتقبة لرائد كبير من رواد المعلوماتية  والترجمة الآلية الدكتور أنس طويلة ننقل بعض ما يضيء أساس الموضوع...

ميدان تطلق أول ذاكرة ترجمة مفتوحة المصدر للغتين العربية والإنكليزية

أرسله anas يوم جمعة, 2009-11-06 21:58. على مدونته
http://www.tawileh.net/anas//?q=ar/node/391

تطلق ميدان اليوم أول ذاكرة ترجمة مفتوحة المصدر للغتين العربية والإنكليزية، ويأتي هذا الحدث تجسيداً لالتزام ميدان المستمر بتطوير أبحاث المعالجة الآلية للغة العربية ودعم المترجمين والباحثين في مجال الترجمة الآلية.


تحتوي ذاكرة الترجمة الجديدة والتي سميت (ذاكرة ميدان) ما يقارب المليون كلمة، مرتبة ضمن أزواج من الجمل المترجمة بين العربية والإنكليزية. وتوفر هذا الذاكرة مصدراً قيماً للمترجمين المحترفين والباحثين في مجال اللغويات العربية ومجتمعات المتطوعين، كما تعتبر أول ذاكرة ترجمة بهذا الحجم والتطور يتم إطلاقها ضمن إتفاقية ترخيص مفتوحة.

يمكن الحصول على ذاكرة ميدان بصيغة ملف متوافق مع معايير Translation Memory Exchange (TMX) مما يسهل تضمينها في معظم أدوات الترجمة بمعونة الحاسب أو أدوات إدارة ذاكرة الترجمة.

يمكن للمترجمين المحترفين استثمار ذاكرة ميدان لدعم عملهم في الترجمة وتحسين أدائه، بالإضافة إلى زيادة مستوى الإتساق والجودة لنتاج ترجمتهم. كما يمكن للباحثين أيضاً الإعتماد على هذا المورد أثناء تصميم وتنفيذ أنشطتهم البحثية في مجالات حوسبة اللغة العربية والمعالجة الآلية للغة العربية، مما سيتمخض بدوره عن تطوير جيل جديد من محركات البحث وأدوات وتطبيقات تحليل ومعالجة النصوص والوثائق يتميز بقدرته على التعامل بكفاءة مع خصوصيات اللغة العربية. كما يمكن للجمعيات الأهلية وغير الربحية وتجمعات المتطوعين الاعتماد على ذاكرة ميدان لتسهيل عملية الترجمة بين اللغتين العربية والإنكليزية لما ينتجوه من محتوى بكلفة أقل وزمن أقصر وجودة أعلى.

أطلقت ذاكرة ميدان ضمن إتفاقية ترخيص قواعد البيانات المفتوحة والتي تتيح للمستخدم إستثمار ونسخ وتوزيع هذه الذاكرة واستخدامها في إنتاج أية أعمال وتعديلها وتحويرها والبناء عليها.

يسر ميدان اليوم أن تعلن عن إطلاق هذا الإصدار الأول من ذاكرة ميدان، والتي سيليها المزيد من إصدار البيانات التي يعمل مجتمع الترجمة في ميدان على إنتاجها وإتاحتها ضمن هذا المورد المفتوح.

كما نأمل أن تنضم إلينا المؤسسات والمنظمات الأخرى المهتمة بهذا الموضوع في إغناء وتنمية هذا المورد الفريد والقيم لخدمة اللغة العربية والمحتوى الرقمي العربي، والذي يعد بالدعم الوفير لمشاريع ومبادرات المحتوى العربي.

يمكن الحصول على ذاكرة ميدان من الموقع التالي: http://github.com/anastaw/Meedan-Memory

للمزيد من المعلومات عن ذاكرة ميدان، يرجى الإتصال بعنوان البريد الإلكتروني التالي: [email protected]

الموقع الإلكتروني لشبكة ميدان الإجتماعية العابرة للغات: beta.meedan.net


اقتباس
عن ميدان

ميدان (وتعني بالعربية "ساحة البلدة") هي مؤسسة غير ربحية تهدف إلى نشجيع تبادل المعرفة والمحادثات عبر الحواجز اللغوية والثقافية، وتركز حالياً على اللغتين العربية والإنكليزية. تقوم ميدان بتخديم مستخدمي الإنترنت المهتمين بتبادل الآراء والأفكار من خلال موقعنا beta.meedan.net، كما توفر منصات للتشبيك الإجتماعي وتبادل المعرفة والترجمة التشاركية لشبكة من شركائها. أسست ميدان في العام 2006، ومقرها الرئيسي سان فرانسيسكو. يتوزع فريق عمل ميدان (والذي يطلقون على أنفسهم لقب "ميدانيين") للهندسة والتصميم والترجمة فيما بين القاهرة ودمشق ولندن وبيروت والضفة الغربية وقطاع غزة وجدة والرباط وعمان وتورونتو وبورتلاند.

تعتبر ميدان أحد رواد حركة البيانات اللغوية المفتوحة وأدوات المصادر المفتوحة وتعمل جاهدة على تطوير أساليب مبتكرة للترجمة التشاركية وتجميع وتصنيف البيانات وتمثيلها بيانياً في سياق استخدام شبكة الإنترنت في العالم العربي.






وقد مكروا مكرهم ......
وعند الله مكرهم .....
وإن كان مكرهم .... لتزول منه الجبال
فلا تحسبن الله مخلف وعده رسله
إن الله عزيز ذو انتقام



لسنا مخادعين ،، ولن نسمح للآخرين بخداعنا

سكوتنا ليس رضاً 
وهدوؤنا ليس عجزاً 
الحقيقة ولو مع غيرنا أولى بالاحترام ...   


أنت غير مسجل لدينا.. يمكنك التسجيل الآن.

مشاركة : 2


bachar jammal

جامعـي اســتثنائي





مسجل منذ: 23-01-2009
عدد المشاركات: 622
تقييمات العضو: 13
المتابعون: 12

غير موجود
اشــترك بالتحديثات
رسالة مستعجلة

رد مشاركة : آفاق الترجمة الآلية & الترجمة العلمية

16-04-2010 06:45 PM




فصل الترجمة الآلية

من كتاب

الترجمة العلمية وآفاق التعريب



مقدمة


تعد الترجمة الآلية أحدث الوسائل العلمية و ربما أنجعها
لترجمة الكتب عامة و الكتب العلمية خاصة،لاسيما ان أعداد
الكتب التي تصدرها دور النشر كل عام في زيادة مطرد ة،
يصعب مواكبتها بإعتماد أساليب الترجمة التقليدية . وفي جميع
الاحوال فان ترجمة الكتب تتطلب إعتماد سياسة وطنية على
مستوى البلد الواحد ، تحدد فيها أو لويات النهضة العلمية بتأشير
التخصصات المطلوب الاهتمام بها في كل مرحلة من مراحل
تطور ذلك البلد ، ومن ثم اختيار الكتب العلمية المطلوب
ترجمتها سنويا في إطار خطط علمية مدروسة بعناية فائقة.
لذا ينبغي التفكير جديا بإنشاء دور نشر عربية متميزة لدعم
نشر النتاج العلمي العربي من جهة،و ترجمة النتاج العلمي
العالمي الى اللغة العربية من جهة اخرى بإعتماد أساليب
الترجمة الآلية.

تسلط هذه الدراسة الضوء على الجهود المبذولة عربيا و
عالميا في مجال الترجمة الآلية ومتطلباتها.


الترجمة الآلية .. نبذة تأريخية


ظهرت فكرة الترجمة الآلية اول مرة في منتصف عقد
الخمسينيات من القرن المنصرم في الولايات الم تحدة الاميركية
اولا ثم في روسي ا ثاني ًا، وكانت اول تجربة في هذا الشان هي
وضع قاموس الكتروني اعده قسم اللغات بجامعة جورج تاون
في واشنطن .

وفي اواخر الخمسينيات واوائل الستينيات بدأت مجموعات
بحثية كثيرة عملها لتطوير نظم الترجمة الآلية في الولايات
المتحدة الأمريكية وفرنسا والمانيا وروسيا والمجر
وجيكوسلوفاكيا، وكان هدف تلك المجموعات تزويد محللي
المخابرات بمعلومات علمية وتقنية عن الدول المنافسة.
تركزت كل الجهود ف ي الغرب تقريبا على الترجمة من
الروسية الى الانكليزية، اما في الشرق فقد تركز معظم العمل
على الترجمة من اللغة الانكليزية، واحيانا الفرنسية، وب الإضافة
الى هذ ه المجموعات ، قامت مجموعتان في واشنطن
وكاليفورنيا بالترجمة الآلية من اللغة الصينية الى اللغة
الانكليزية. وقد تم فعلا تنفيذ ثلاثة انظمة للترجمة، اثنان منها


في قسم التكنولوجيا الأجنبية في مركز قيادة القوات الجوية
الأمريكية بقاعدة رايت باترسون في دايتون بولاية اوهايو،
والثالث في ادارة الطاقة الذرية في اوكردج بولاية تنسي.
وفي تلك المرحلة المبكرة من العمل لتطوير الترجمة الآلية
قامت الجامعات في الولايات المتحد ة الأمريكية بالعديد من
المشرعات البحثية في هذا المجال . وقد استطاعت جامعة
جورج تاون تطوير نظام للترجمة الآلية استخدم فعلا في
مؤسسة الطاقة الذرية . ولغرض تنشيط بحوث الترجمة الآلية
قامت الاكاديمية القومية للعلوم في الولايات المتحدة الامر يكية
بالاشتراك مع الهيئات الحكومية التي اشتركت في تمويل
ابحاث الترجمة الآلية مثل المؤسسة القومية للعلوم ، ووزارة
الدفاع وهيئة المخابرات المركزية ، بتأليف لجنة عام 1964
اطلق عليها ، اللجنة الاستشارية للتشغيل الآلي للغات ، وكان
لهذه اللجنة اعمق الاثر في جهود الابحاث في مجال اللغة
بصفة عامة، وفي الترجمة بصفة خاصة.
ولابد من الاشارة ايضا الى منظومة م تل للترجمة الآلية
التي طورها م ركز بحوث اللسانيات في جامعة تكساس في
الولايات المتحدة الاميركية منذ عام 1960 ، اذ استخدمت هذه


المنظومة للترجمة من اللغة الالمانية الى اللغة الأ نكليزية في
، مجال الاتصالات، وجرى اختبارها في السوق عام 1985
ويجري تطوير المنظومة حاليا للترجمة من اللغات الصينية
والاسبانية الى اللغة الانكليزية.
واستطاعت مجموعة الترجمة الآلية في جامعة مونتريال
الكندية تطوير منظومة ترجمة آلية جيدة الدقة تعمل باسلوب
الترجمة التحويلية عبر مرحلتين الاولى معجمية والثانية
تركيبية، ولعل المشروع الياباني للترجمة الالية يحتل موقعا
متميزا للإعتماد عليه جزءا اساسيا ضمن مشروع حاسوب
الجيل الخامس، فقد دعمت الحكومة اليابانية مشروعا بحثيا
عمليا للترجمة العلمية والتقنية بين اللغتين الانكليزية واليابانية.
اما في اوربا، فقد كانت الحاجة الى منظومة ترجمة آلية
يستخدمها اعضاء السوق الاوربية المشتر كة، اذ تم تطوير
منظومة للترجمة بين اللغات المعتمدة في السوق الاوربي ة
المشتركة. قدم الأ تحاد الأوربي دعمه لمشروع خطة خمسية
لمنظومة ترجمة آلية بين سبع لغات اوربية هي : الانكليزية
والفرنسية والالمانية والايطالية واليونانية والدنماركية
والهولندية. طور المركز الد ولي للترجمة الآلية منظومة في


جامعة ملان تعتمد على اسلوب اللغة الوسيطة لفهم الاوجه
المختلفة للمعنى ، وبما يقرب المنظومة من امكانية تمثيل
المعرفة الخبيرة التي يمتلكها المترجم الانسان . تعمل الم نظومة
بإستخدام المعنى من النص المدخل وتمثيله بتركيب من جزأين
رئيسسين، هما تمثيل القواعد ، ولغة تمثيل المعجم . كما ذهبت
بعض الشركات لإنتاج برمجيات تجارية للترجمة الآلية من
لغات معينة، صممت هذه الانظمة على اساليب قريبة للترجمة
كلمة – كلمة وقد لاقت رواجا تجاريا كبيرا.

وفي بلادنا العربية مازالت جهود الترجمة الآلية في
بداياتها الاولى، اذ انجزت بعض منظومات الترجمة الالية
اليسيرة، مثل برنامج المترجم العربي الصادر عام 1995
وبرنامج عربترانز الصادر عام 1996 للترجمة الفورية من
اللغة الانكليزية الى اللغة العربية، ونظام المترجم العربي الذي
انتجته شركة الفراهيدي لتقنية المعلومات في س لطنة عمان ، اذ
يقوم البرنامج بترجمة نصوص كاملة من اللغة الانكليزية الى
اللغة العربية، ويشتمل البرنامج على معجم عام يضم اكثر من
مليوني كلمة وعبارة انكليزية ، وهناك محاولات اخرى متفرقة
هنا او هناك.




وفي ضوء ما تقدم نخلص الى حقيقة مفادها ان الترجمة الآلية
قد قطعت اشواطًا متقدمة في ا لكثير من اقطار العالم، واذ ان
الترجمة بعامة وترجمة الكتب العلمية والتقنية بخاصة تمثل
اطلالة بلادنا الحضارية على نتاجات الامم الاخرى والتفاعل
معها اخذ ًا وعطا ءً بما يسهم بتعزيز جهود التنمية العلمية
والتقنية في بلادنا، مما سيكون له اثره الفاعل في بناء مجتمعنا
الناهض المتطلع دوما الى غد افضل بتوظيف معطيات العلوم
والتقنية المتطورة.

ولأجل الاسراع بعملية الترجمة لغرض مواكبة اخر
مستجدات العلوم والتقنية الحديثة او ً لا باول لابد ان تبذل جهود
وطنية حثيثة باتخاذ الخطوات اللازمة لأرساء قواعد عمل
برنامج وطني للترجمة الآلية، ذلك ان مسيرة الألف ميل كما
يقال تبدأ بخطوة واحدة.

اللسانيات الحاسوبية:

لعب الذكاء الاصطناعي دورا مهما في تمثيل المعرفة
العلمية الآلية، وفي اقامة نماذج حاسوبية لفهم الأداء الشامل
لمنظومة اللغة . ومن هنا دخلت اللغة العربية في تعريب


الحاسوب والبرمجة ، وذلك لمرونتها وخصائصها الصرفية
والنحوية. فكان ان وقع احلال شبه آلي للغة العربية محل نظم
اللغة الانكليزية فاستغلت النظم الانكليزية البسيطة في العربية،
وبسطت العربية بالتقليل من عدد أشكال حروفها.
ولما رأت المؤسسات العربية ما يقوم به الخبراء اللغويون،
لتقديم الخدمات لكل اللغات كان عليهم أن يدعوا الى وضع
البرمجيات في مختلف علوم اللغة، بالتركيز على البحوث
اللسانية وفي حقل اللسانيات الحاسوبية بالذات، وبالتركيز على
البرامج التطبيق ية. وتستهدف اللسانيات الحاسوبية مشكلتين
أساسيتين هما:

-1 فوضى المصطلحات وقصوره ا، اذ يلاحظ وجود الكثير
من المصطلحات الاجنبية من دون ان يقابلها مصطلحات
عربية حتى الان، او وجود اكثر من مصطلح عربي واحد
للمصطلح الاجنبي في احيان اخرى.

2 قصور البحوث والمراجع العربية ، اذ ما زالت المكتبة
العربية u1578 تفتقر الى الكتب والم راجع اللغوية الحديثة،
لاسيما تلك التي تطبق نتائج النظرية الحديثة للسانيات.

وقد تضافرت جهود اللغويين والحاس وبيين العرب للتغلب
على ا لكثير من المشكلات التي تواجهها اللسانيات
الحاسوبية، ومع تطور الحاسوب، فقد توسعت استخداماته
وتطبيقاته اللغوية كثير ا. ولعل التر جمة الالية اهم هذه
التطبيقات على الاطلاق.

تعد الترجمة الآلية احدى اهم تطبيقات معالجة اللغات
البشرية بالحاسوب بهدف بناء منظومات الترجمة الآلية من لغة
بشرية كاللغة الانكليزية مثلا الى لغة بشرية اخرى كاللغة
العربية وبالعكس من دون اية مداخلة بشرية.

ولكي ينجز الحاسوب هذه الترجمة بكف اية واتقان لابد ان
يفهم الحاسوب طبيعة اللغة البشرية، بكامل قواعدها النحوية
ومعاني كلماتها واسلوب تركيب جملها وعباراتها وكل ما له
صلة بصرفها وتفصيلاتها المختلفة.

ولغرض جعل الحواسيب تفهم لغات البشر لابد من توفر
معرفتين اساسيتين يكون الفهم بدونهما مستحيلا"، هما:

-1 معرفة الافكار المتبادلة.


-2 معرفة الطرق التي ادخلت بها تلك الافكار الى اللغة.
إن فهم الحواسيب للغات البشر المكتوبة يعتمد اعتماد ًا كلي ًا
على وصف جوانب لغوية محددة بتلك اللغة، منها:

Syntax -1 التركيب

Morphology -2 الصرف

Semantics -3 الدلالة

Pragmatics -4 المقاميات

-5 مجال المعرفة.

ولإنجاز الترجمة الآلية لابد من انجاز التحويلات النحوية
الاتية

-1 اعادة ترتيب مكونات الجملة المترجمة في اللغة المترجم
اليها.

-2 استبدال قواعد توليد او تحويل في اللغة المترجم منها
بقواعد توليد او تحويل في اللغة المترجم إليها.

-3 الإضافة في اللغة المترجم إليها.

-4 الحذف في اللغة المترجم إليها.


تمر الترجمة الآلية بثلاث مراحل هي :

-1 إعراب الجملة المراد ترجمتها إعرابا نحويا.

-2 التحويل الذي يتولاه المحول.

-3 إعادة بناء الجملة في اللغة المترجم إليها.

هناك مناهج نحوية ع ديدة للغة الحاسوب تتخذ جميعها من
الجملة وحدة للتحليل ، بعضها مستمد من معالجة لغات البشر
مثل :

Case Grammar - نحو الحالات الإعرابية

Semantic Grammar - النحو الدلالي

Transformational - النحو التحويلي التوليدي
Generative Grammar

وبعضها الاخر مستمد من الذكاء الاصطناعي مثل:-

Augmented Transition - نحو الشبكة الانتقالية المعززة
Network

Generalized - نحو الشبكة الانتقالية المصممة
Transition Network

Generalized Phrase - نحو بنية العبارة المصمم
Structure Grammar


تتطلب عملية الترجمة الآلية تعاونا وثيقا بين المخ تصين في
علوم اللغات والمختصين في علوم الحاسوب ، وتواجه عملية
الترجمة الآلية صعوبات جمة u1571 أبرزها الآتي:

-1 صعوبة صياغة قواعد اللغتين حاسوبيا بما ينسجم وقدرات
الحواسيب فيما يتعلق بحجم الذاكرة وسرعة الاسترجاع
ومطابقة الجمل والقواعد.

-2 الاستثناءات التي لا تخضع للقواعد اللغوية.

-3 صعوبة تمثيل المفردات المعجمية حاسوبيا، وما تحمله كل
مفردة من سمات وظيفية ودلالية تصف معناها ومرادفاتها
ضمن الجملة والنص، فضلا عن كيفية اختيار الاساليب
المثلى لتمثيلها حاسوبيا.

-4 تمييز ا لكلمات المركبة وكيفية صياغتها حاسوبيا ضمن
مفردات المعجم من جهة، ومعالجتها من جهة اخرى.

-5 الغموض الصرفي والقواعدي والدلالي وما يرافقه من
غموض لغوي احيانا.


6 بناء النص المتكامل من جمل مترجمة منفصلة لتحقيق
المعنى المطلوب ، اذ يستلزم ذلك ربط الضمائر
وارجاعها الى عائديتها الاصلية في جمل النص.
ولايمكن تجاوز هذه الصعوبات الا بتدخل الانسان لاجراء
بعض عمليات التنقيح لتهيئة النص اللغوي المترجم المطلوب.

الخاتمة

يشهد عالمنا المعاصر تدفقا معرفيا لاحدود له في جميع
التخصصات العلمية والتقنية إذ يصدر عن الجامعات
والمؤسسات العلمية و دور ا لنشر في أرجاء العالم المختلفة
الآف الكتب و الدوريات العلمية بلغات عديدة ،أبرزها اللغات
الانكليزية و الفرنسية والاسبانية ،كونها اللغات الاوسع انتشارا
في العالم .ولأجل تأمين تطور تقدم بلادنا و إدامة زخم نهضتها
لابد من نشر العلوم والمعارف ع لى أوسع نطاق ممكن .
ولتحقيق هذا الغرض ،فإنه يستلزم ان يتم نشرها باللغ ة
العربية ،كونها اللغة القومية التي يفهمها عامة الناس ،شأنهم
بذلك شأن الشعوب الاخرى التي تحرص على نماء وإزدهار
لغاتها الوطنية ، ليس من باب التعصب والمغالاة ،وإنما من


باب التنوع والازده ار الثقافي لجميع شعوب العالم و إسهام كل
منها في الحضارة الانسانية.

وبحكم التطور الراهن لواقع بلادنا العلمي ،فإن الحاجة
تدعو الى الاهتمام الفائق بالترجمة العلمية من اللغات الاجنبية
الحية الى لغتنا العربية ، كي تصبح العلوم والمعارف الحديثة
متاحة لقطاعات واسعة من الناس بسهولة ويسر.
ولأن الترجمة الآلية تعد ث ورة حقيقي ة في ع الم
الترجمة ،ذلك انها توفر انجع السبل و أكثرها كفاية لترجمة
الكتب العلمية الاخذة بالتزايد عاما بعد آخر .لذا لابد ان تبذل
جهود حثيثة للبدء بانشاء دور نشر كبيرة تعتمد الترجمة الالية.
ونظرا لما يتطلبه هذا المشروع من قدرات علمية متميزة
في مجالات اللغة و تقانات الحاسوب ،فضلا عن الامكانات
المالية اللازمة لتحقيقه ،فانه يستلزم تظافر جهود اكثر من قطر
عربي واحد و ذلك منعا لتشتت الجهود من جهة و لإعمام الفائدة
من جهة اخرى__




وقد مكروا مكرهم ......
وعند الله مكرهم .....
وإن كان مكرهم .... لتزول منه الجبال
فلا تحسبن الله مخلف وعده رسله
إن الله عزيز ذو انتقام



لسنا مخادعين ،، ولن نسمح للآخرين بخداعنا

سكوتنا ليس رضاً 
وهدوؤنا ليس عجزاً 
الحقيقة ولو مع غيرنا أولى بالاحترام ...   


أنت غير مسجل لدينا.. يمكنك التسجيل الآن.

مشاركة : 3


bachar jammal

جامعـي اســتثنائي





مسجل منذ: 23-01-2009
عدد المشاركات: 622
تقييمات العضو: 13
المتابعون: 12

غير موجود
اشــترك بالتحديثات
رسالة مستعجلة

رد مشاركة : آفاق الترجمة الآلية & الترجمة العلمية

17-04-2010 05:44 PM




مقال الترجمة الآلية على موسوعة المعرفة

http://www.marefa.org/index.php/%D8%AA%D8%B1%D8%AC%D9%85%D8%A9_%D8%A2%D9%84%D9%8A%D8%A9


الترجمة الآلية هي فرع من فروع اللغويات الحاسوبية وتتناول برامج الحاسب لترجمة نص أو خطاب من لغة إلى أخرى وتقوم الترجمة الآلية بمستوياتها الأساسية باستبدال بسيط لكلمات بلغة معينة إلى لغة أخرى.

تتوفر مجموعة من التقنيات التي يمكن استخدامها لترجمة النصوص الأكثر تعقيدا ،مما يتيح الفرصة لمعالجة الاختلافات على نحو أفضل. وذلك عن طريق التصنيف اللغوي وتمييز العبارات وترجمة التعابير، فضلا عن عزل الحلات الشاذة.

كثيرا ما تسمح الترجمة الآلية حاليا بالتصنيف بحسب المجال أو المهنة (مثل تقارير الطقس)— مما يحسن الناتج عن طريق الحد من نطاق البدائل المتاحة. وتعتبر هذه التقنية فعالة بشكل خاص في المجالات التي تستخدم لغة رسمية أو بيانية. ويتبع ذلك أن الترجمة الآلية للوثائق القانونية والحكومية تكون أفضل منها للمحادثات والنصوص الأقل رسمية.

و يمكن تحسين نوعية الناتج من خلال التدخل البشري. مثلا: باستطاعة بعض برامج الترجمة بدقة أكبر إذا حدد المستخدم دون لبس الأسماء الموجودة بالنص. و بمساعدة هذه التقنيات، أثبتت الترجمة أنها ناجحة حين تساعد المترجم، ومن الممكن أن تنتج في بعض الأحوال نتائج يمكن استخدامها "كما هي".
لكن برامج الترجمة الحالية ليست قادرة على الترجمة بنفس الجودة التي يترجم بها المترجم البشري وخاصة عندما تكون اللغة المستخدمة غير رسمية


أساسيات :


فك الغموض: يهتم فك غموض معنى الكلمة بإيجاد ترجمة ملائمة و ذلك عندما يكون لكلمة معينة أكثر من معنى واحد., ;وكان أول من أثار هذه المشكلة في الخمسينات هو يهوشوا بارهيلل، فقد أشار إلى أن الآلة لن تتمكن من التفرقة بين معني الكلمة بدون 'موسوعة عالمية'.و توجد عدة طرق لتخطي هذه المشكلة. و من الممكن أن تقسم هذه الطرق تقريبا إلى طرق 'سطحية' و طرق 'عميقة'. و لا تفترض الطرق السطحية أية معرفة للنص. فهي ببساطة تطبق طرقا إحصائية على الكلمات التي تحيط بالكلمة غامضة المعنى. و تفترض الطرق العميقة معرفة وافية للكلمة. و حتى الآن، تعتبر الطرق السطحية الأكثر نجاحاً.

كينونة مسماة:و هي متعلقة بتمييز الكينونة المسماة في أصل المعلومة.


تقيييم أداء الترجمة الآلية:


هناك وسائل مختلفة لتقييم أداء أنظمة الترجمة الآليه. أقدمها هو استخدام حكم الإنسان لتقييم جودة الترجمة. وفي الآونة الأخيرة، اشتملت تلك الوسائل على بعض أساليب التقييم الآلية:

بلو(BLEU)
نيست (NIST)
ميتيور.(METEOR)


لكن الاعتماد كلياً على الترجمة الآلية يغفل حقيقة أن الاتصال في لغة الإنسان هو جزء لا يتجزأ من السياق، وأن الإنسان هو القادر على فهم سياق النص الأصلي على نحو كاف. كما أن الترجمة التي يستخدم فيها القدرات البشرية فقط هي عرضة للخطأ. لذلك وحتى نضمن أن تكون الترجمة الآلية عالية الجودة ومفيدة للإنسان، لا بد من أن يقوم المترجم "الإنسان" بمراجعتها وتصحيحها.


ومع ذلك فقد تم التأكد من انه في بعض التطبيقات، على سبيل المثال في مواصفات المنتجات المكتوبة باللغة المتحكم بها، ينتج نظام الترجمة الآلية القائم على أساس استخدام القاموس ، في بيئه إنتاج، ترجمة متقنة لا تحتاج إلى اي تدخل بشري.


النهج العام


الترجمة الآلية ويمكن استخدام طريقة تستند ألى القواعد اللغوية ، مما يعني أن تترجم الكلمات بطريقة لغوية&أنسب الكلمات (المتكلمة شفويا) وهى كلمات اللغة المستهدفة, سوف تحل محل تلك الكلمات من اللغة المصدر. فإنه كثيرا ما يقال أن نجاح الترجمة الآلية تتطلب أن مشكلة فهم اللغة الطبيعية يجب حلها أولا.

عموما ، يقوم على قواعد وأساليب تحليل النص ، وعادة ما يتم خلق وسيط ،و تمثيل رمزي ، والذي منه سوف يخلق النص في اللغة المستهدفة وفقا لطبيعة الوسيط المتمثل فى النص المؤقت , هذا النهج يوصف بأنه الترجمة الآلية بين اللغات أو الترجمة الآلية المعتمدة على النقل . وتتطلب هذه الأساليب على نطاق واسع قواميس مع مورفولوجي نحوي, و الدلالية و المعلومات, ومجموعات كبيرة من القواعد.

و حيثما تتوافر البيانات الكافية, فإن برامج الترجمة الآلية , غالبا ما تعمل بطريقة حسنة بالنسبة للمتكلم باللغة الأم للغة معينة للحصول على المعنى التقريبى, لما هو مكتوب, لمتكلم لغة أم أخرى. الصعوبة هى الحصول على بيانات كافية , من النوعية الصحيحة, كى تدعم الأسلوب الصحيح . فمثلا, مجموعة الكبيرة متعددة اللغات من البيانات الأساليب الإحصائية اللازمة للعمل وليس من الضروري بالنسبة لقواعد اللغة القائمة وأساليب العمل. ولكن بعد ذلك ،نحن بحاجة الى قواعد اللغة وأساليب مترجمين مهرة على علم بالتصاميم اللغوية لتصميم قواعد اللغة التي يستخدمونها, وللترجمة بين لغات شديدة التقارب, فإن تقنية تعرف بالترجمة الألية ذات الإنتقال الضحل يمكن إستخدامها .

============
مصادر للاستزادة
============

برنامج موسى المفتوح للترجمة الآلية

http://en.wikipedia.org/wiki/Moses_(machine_translation)

http://www.marefa.org/index.php/%D9%85%D9%88%D8%B2%D8%B3_(%D8%AA%D8%B1%D8%AC%D9%85%D8%A9_%D8%A2%D9%84%D9%8A%D8%A9)


مقال إنكليزي عن الترجمة الآلية

http://en.wikipedia.org/wiki/Machine_translation




وقد مكروا مكرهم ......
وعند الله مكرهم .....
وإن كان مكرهم .... لتزول منه الجبال
فلا تحسبن الله مخلف وعده رسله
إن الله عزيز ذو انتقام



لسنا مخادعين ،، ولن نسمح للآخرين بخداعنا

سكوتنا ليس رضاً 
وهدوؤنا ليس عجزاً 
الحقيقة ولو مع غيرنا أولى بالاحترام ...   


أنت غير مسجل لدينا.. يمكنك التسجيل الآن.

مشاركة : 4


bachar jammal

جامعـي اســتثنائي





مسجل منذ: 23-01-2009
عدد المشاركات: 622
تقييمات العضو: 13
المتابعون: 12

غير موجود
اشــترك بالتحديثات
رسالة مستعجلة

رد مشاركة : آفاق الترجمة الآلية & الترجمة العلمية

22-04-2010 07:01 PM




قمت بكتابة مقالة نول غوغل عن أنشطة الترجمة  لأوضح بعض الأمور أرجو من المهتمين إغناءها

http://knol.google.com/k/%D8%A8%D8%B4%D8%A7%D8%B1/%D9%85%D8%B1%D9%82%D8%A8-%D8%A3%D9%86%D8%B4%D8%B7%D8%A9-%D8%A7%D9%84%D8%AA%D8%B1%D8%AC%D9%85%D8%A9/3t5qhgro3s2os/2?hd=ns#

وفيها بعض الكلام عن الترجمة العلمية والترجمة الآلية





ملتقى طلاب جامعة دمشق




أنت غير مسجل لدينا.. يمكنك التسجيل الآن.

مشاركة : 5


bachar jammal

جامعـي اســتثنائي





مسجل منذ: 23-01-2009
عدد المشاركات: 622
تقييمات العضو: 13
المتابعون: 12

غير موجود
اشــترك بالتحديثات
رسالة مستعجلة

رد مشاركة : آفاق الترجمة الآلية & الترجمة العلمية

28-04-2010 04:55 PM




فيما يلي مقال مهم عن المعالجة الآلية للغة

---------------------------------

المعالجة الآلية للغة العربية .. جهود الحاضر وتحديات المستقبل

هذا المقال نشر في مجلة لغة العصر وفاز بجائزة الصحافة العربية 2009 كأفضل مقال عربي في تكنولوجيا المعلومات

كاتبه الأصلي : أبو الحجاج محمد بشير ، مترجم مصري

فى دنيا الحاسبات وتكنولوجيا المعلومات توجد قضايا مربكة وغامضة، لأنها من الناحية العملية والعلمية والمستقبلية تعتبر مهمة وحيوية للغاية وذات تأثيرات عريضة النطاق من النوع الذى يرتبط بمصائر الأمم، لكنها فى الوقت نفسه لا تلقى أى نوع من الجذب الجماهيرى العام لكونها معقدة بدرجة تجعلها أقرب إلى الألغاز من كثرة ما تحمله من تعقيد، ومن ثم فهى تقف وحيدة مع متخصصيها وخبرائها، تعانى قلة الاهتمام والفهم والاستعداد للمساعدة والدعم، وبالنسبة لنا فى مصر والمنطقة العربية تبدو قضية المعالجة الآلية للغة العربية من أبرز هذه القضايا الغامضة المربكة التى لا يلتفت لها الجمهور على الرغم مما تمثله من أهمية قصوى لحاضر ومستقبل لغة الأمة وهويتها ومكانتها فى ظل ثورة المعلومات، إذ لم يعد ممكنا لأى أمة أو ثقافة أن تقف موقف المتفرج على التطور التكنولوجى المتسارع الذى يشهده العالم وإلا حكمت على نفسها إما بالتخلف عن ركب العصر أو فقدت لغتها ومن ثم تراثها، فاللغة العربية ـ شأن لغات أخرى ـ تتعرض حاليا لحركة تهميش نشطة بفعل الضغوط الهائلة الناجمة عن طغيان اللغة الإنجليزية على الصعيد السياسى والاقتصادى والتكنولوجى والمعلوماتى، كما تواجه تحديات إضافية نتيجة للحملة الضارية التى تشنها العولمة ضد الإسلام، وبالتالى ضد العربية نظرا لشدة الارتباط بينهما، ولذلك خصصنا ملف هذا الشهر لتفكيك هذه القضية اللغز وشرحها من خلال إلقاء الضوء على جوانبها المختلفة وتبسيطها أمام القارىء، ورصد جهود الباحثين فى مجال المعالجة الآلية للغة العربية المنطوقة والمكتوبة والوقوف على إنجازات معالجة قضايا اللغة العربية وتطويرها وتحديثها حتى تكون أكثر ملاءمة مع تطورات العصر وقادرة على مواجهة تحدياته الكبرى، آملين أن يساعد هذا الجهد فى أن تلقى القضية ما تستحقه من اهتمام ودعم.

الخطوة الأولى لفك اللغز

ما معنى المعالجة الآلية للغة ولماذا ظهرت وما تاريخها؟

المصطلح والمفهوم

الأهداف والأسباب

1- تواصل أفضل مع الحاسب
2- تواصل أفضل بين البشر
3- الوصول الفعال للمعلومات

البداية والتاريخ

تحديات تواجه المعالجة الآلية للغة

1- تقطيع الكلام والأصوات والوحدات المعجمية
2- فك الغموض أو اللبس
3- العبارات الطلبية

تشمل الترجمة والتوليد والتلخيص الآلى للغة وفهم الصوت
10 تطبيقات حالية ومتوقعة للمعالجة الآلية للغة

1- الترجمة الآلية
2- التلخيص الآلى
3- التوليد الآلى للغة
4- استخلاص المعلومات
5- استرجاع المعلومات
6- الإجابة على الأسئلة
7- التنقيب فى النصوص
8- تحويل النص إلى كلام منطوق
9- فهم الصوت
10- التعرف الضوئى على الحروف

تعمل كبيت للذاكرة ونبع متدفق للمعرفة
المكانز الإلكترونية القلب النابض للمعالجة الآلية للغات

مجالات استخدام المكانز

أولا: صناعة المعاجم
ثانيا: المكانز اللغوية وفهم قواعد النحو
ثالثا: المكانز اللغوية وتحديد الدلالة
رابعا: المكانز اللغوية وتحسين تعليم اللغات الأجنبية
خامسا: المكانز اللغوية فى مجالات أخرى

المكانز واللغة العربية
عند المعالجة الآلية للغة العربية
8 خواص لغوية بعضها يعقد الأمر والبعض الآخر يجعله سهلا

اللبس والمعالجة الآلية للعربية

فك اللبس بتمثيل المعلومات آليا

بين طغيان الإنجليزية وتربص الصهاينة

إلى أين وصلت جهود المعالجة الآلية للغة العربية؟

إنجازات المكانز باللغة العربية

المكنز الدولى للغة العربية

مكانز نيملار

مكنز العربية الفصحى Classical Arabic Corpus
مكنز العربية العلمية العامة General Scientific Arabic Corpus
مكنز العربية المعاصرة المنطوقة Spoken Contemporary Arabic Corpus

أشهر برامج المعالجة الآلية للغة العربية

برامج التشكيل والتصحيح الآلي
برامج تلقيب ووصف أجزاء الكلام
برامج التحليل الصرفي
برامج التنقيب فى النصوص
برامج معالجة الكلام المنطوق
برامج الترجمة الآلية

مواقع الترجمة الآلية على الإنترنت

الخبراء يؤكدون

المعالجة الآلية للغة العربية فى محنة قاسية

تحديث المعاجم العربية القديمة

كتب النحو العربى

محركات البحث

الترجمة الآلية

تفوق الغرب

وسائل بدائية

المعجم واللغة العربية

علماء اللغة لا يعرفون الحاسب

غياب الاهتمام الرسمى بالمعالجة الآلية

توصيات عالم كبير


اقتباس

محمد بشير، أبوالحجاج. المعالجة الآلية للغة العربية .. جهود الحاضر وتحديات المستقبل:هذا المقال نشر في مجلة لغة العصر وفاز بجائزة الصحافة العربية 2009 كأفضل مقال عربي في تكنولوجيا المعلومات [الإنترنت]. النسخة 2. Knol. ٢٠٠٩ يوليو ٢٤. متوفرة من خلال: http://knol.google.com/k/أبوالحجاج-محمد-بشير/المعالجة-الآلية-للغة-العربية-جهود/2wqahq5h3ptl1/9.


--------------------------------------------------------------------------------

الخطوة الأولى لفك اللغز
ما معنى المعالجة الآلية للغة ولماذا ظهرت وما تاريخها؟
تفهم الكثرة الغالبة من المستخدمين للحاسبات وتكنولوجيا المعلومات العلاقة بين الحاسب واللغة على أن الحاسب قدم إمكانات كبرى أعانت ـ ولا تزال ـ على دراسة اللغات الإنسانية وتحليلها وتبسيطها وتيسير تعليمها، أما اللغة فكانت ولاتزال هى الوعاء أو الوسيط الذى يتم من خلاله التفاعل بين الإنسان مع الحاسب، بيد أن العلاقة ليست كذلك بالضبط فالخبراء والعلماء والمتخصصون ينظرون إليها نظرة أخرى واضحة الاختلاف، تنطوى على الكثير من التعقيدات والجوانب الغامضة وغير المفهومة بالنسبة للكثيرين، فهم يرون أن القسم الأعظم من هذه العلاقة يقع تحت نطاق المعالجة الآلية للغة، وللوهلة الأولى يبدو المصطلح صعبا وغير مفهوم على الرغم مما يحمله من تحديات جمة ومخاطر عظيمة الشأن خاصة على لغة مثل لغتنا العربية التى تواجه فى هذا السياق تهديدات لا حصر لها، لذلك فإن الخطوة الأولى فى فك اللغز هى أن نعرف ماذا تعنى المعالجة الآلية للغة سواء العربية أو غيرها.

المصطلح والمفهوم


واقعيا تتعدد المصطلحات والتعريفات المعبرة عن هذه قضية المعالجة الآلية للغة، فهناك هندسة اللغة واللغويات الحاسوبية، لكنها تدور جميعا فى دائرة واحدة، وهى تطويع اللغة بكل تعقيداتها وروابطها وشرودها ومجازها لثنائية الصفر والواحد فى برمجيات ونظم الحاسب، ومن أبرز التعريفات السائدة حول معنى المعالجة الآلية للغة التعريف الذى جاء فى موسوعة ويكيبيديا wikipedia.org ومفاده أن المعالجة الآلية للغات الإنسانية  Natural Language Processingهى مجال فرعى يتبع الذكاء الاصطناعى واللغويات الحاسوبية، ويعنى بدراسة مشكلات التوليد والفهم الآلى للغات الإنسانية الطبيعية، وتهدف أنظمة توليد اللغات الطبيعية إلى تحويل البيانات والمعلومات المخزنة فى قواعد بيانات الحاسب إلى لغة بشرية تبدو طبيعية، أما أنظمة فهم اللغات الطبيعية فتحويل عينات ونماذج اللغات الإنسانية إلى تمثيل شكلى يسهل على برامج الحاسب تطويعه والتعامل معه.



وقد قدمت جامعة شيفلد البريطانية http://nlp.shef.ac.uk شرحا آخر لمعنى المعالجة الآلية للغات الإنسانية قالت فيه أن المعالجة الآلية للغة تعنى استخدام أجهزة الحاسب فى معالجة اللغة المكتوبة والمنطوقة من أجل أغراض عملية مفيدة مثل الترجمة الآلية بين اللغات واستخلاص المعلومات من مواقع الويب وقواعد البيانات وبنوك المعلومات المتصلة بالإنترنت للحصول على إجابات للأسئلة أو من أجل إجراء حوار مع الحاسب أو الآلة للحصول على استشارة أو معلومة ما. وما سبق مجرد أمثلة فهناك تطبيقات أقل شيوعا ولكنها شيقة ومثيرة للخيال، مثل قدرة الحاسب على أن يحدد إذا كان الخبر المنشور فى صحيفة ما مقتبس من صحيفة أخرى أم لا.



أما اللغويات الحاسوبية Computational Linguistics فيقصد بها الدراسة العلمية للغة من وجهة نظر حاسوبية، حيث يهدف العلماء إلى تقديم نماذج حسابية لأنواع عديدة من الظواهر اللغوية، وهى وفقا لتعريف هانز أوزكوريت، أستاذ اللغويات الحاسوبية فى جامعة سارلاند الألمانية، علم يقع فى مرتبة وسيطة بين اللغويات وعلوم الحاسب، التى تهتم بالجوانب الحاسوبية لملكة اللغة البشرية، وينتمى هذا العلم إلى فئة العلوم الإدراكية ويتداخل مع الذكاء الاصطناعي، وهى فرع من علوم الحاسب التى تهدف إلى تقدم نماذج حوسبية للإدراك البشري.

يصف الدكتور نبيل على ـ خبير المعلوماتية والمفكر العربى الكبير ـ فى كتاب (الثقافة العربية وعصر المعلومات، عالم المعرفة، 2001) علاقة اللغة بالحاسب بأنها علاقة منفعة متبادلة، فعلى جبهة اللغة يستخدم الحاسب حاليا لإقامة النماذج اللغوية وتحليل الفروع اللغوية المختلفة، ومن أمثلة تطبيقات الحاسب فى مجال اللغويات الصرف الحاسوبى والنحو الحاسوبى والدلالة الحاسوبية والمعجمية الحاسوبية وعلم النفس اللغوى الحاسوبى. وفى المقابل اقتبس علماء الحاسب فى تطويرهم للغات البرمجة الكثير من أسس اللغات الطبيعية ويسعون بخطى حثيثة إلى التقريب بين هذه اللغات الاصطناعية واللغات الطبيعية بهدف تسهيل التعامل مع الحاسب دون وسيط برمجي، فالهدف الأسمى لبرمجة الحاسب هو أن يتعامل الفرد معه مباشرة بلغته الطبيعية بدلا من اللغات الاصطناعية.



وحتى لا نستفيض فى تعريف اللغز سنكتفى بهذه المصطلحات والتعريفات القليلة، ونخلص منها إلى أن المعالجة الآلية للغة هى جهود تحاول إزالة الحواجز ما بين اللغة التى يستخدمها الإنسان العادى فى ظروفه الطبيعية، والحاسب كآلة ذات قدرات عالية فى فهرسة وتخزين ومعالجة واستدعاء البيانات والمعلومات، بما يجعل الإنسان قادر على استثمار أقصى طاقات وإمكانات الحاسب بسهولة ويسر وعبر لغة التعامل الطبيعية، وبما يجعل الحاسب قادر على أن يفهم لغة الإنسان العادية الطبيعية على مستوى الكلمة والجملة والمعنى وينفذ ما يريده الإنسان عبر هذا الفهم.

الأهداف والأسباب
ولكن لماذا المعالجة الآلية للغات؟ يمكن القول أن المعالجة الآلية للغة ظهرت فى الأساس من أجل تطوير وإنشاء وصياغة تطبيقات الترجمة الآلية سواء كانت مكتوبة أو منطوقة، والترجمة الآلية هى الوسيلة الوحيدة التى تستطيع بها الأمم مواكبة الانفجار المعرفى والمعلوماتى فى عصر الإنترنت الساحق وفضاءاتها الإلكترونية الواسعة. حيث لا يستطيع أى مجتمع أو أمة مهما كانت أن تعيش بمعزل عن هذه الثورة المعرفية أمام اكتساح اللغة الإنجليزية لكل المراجع المعرفية والمعلوماتية فى فضاء الإنترنت وانتشارها بشكل يهدد بانسحاق كل الأمم واللغات التى لا تستخدم تكنولوجيا المعلومات والحاسب فى اللحاق بعصر المعلومات.



ومن أحد أهداف وتطبيقات المعالجة الآلية للغة مساعدة المستخدم والإدارى والعالم والمسئول الحكومى فى عصر فيض وطغيان المعلومات على الوصول للمعلومات التى يريدها بسهولة وسرعة من خلال التلخيص الآلى والتحليل الآلى للنصوص بالإضافة إلى البحث الذكى عن المعلومات فى شبكة الإنترنت فى أجيالها الجديدة التى تعرف باسم الويب الدلالية.



ويؤدى التطور فى تطبيقات المعالجة الآلية للغة إلى تسهيل حصول المرء على المعلومة فى أى مكان وأى وقت، ومن أمثلة السيناريوهات المستقبلية لتوضيح هذا الأمر تخيل نفسك أنك تقود سيارتك فى رحلة لقضاء عطلة الصيف فى الساحل الشمالي، وكنت تريد متابعة أسهم شركتك فى البورصة، فماذا ستفعل؟ ستخاطب حاسب السيارة قائلا: أريد تقريرا تفصيليا عن حالة أسهم شركة كذا فى البورصة خلال اليومين الماضيين؟ ماذا الذى سيحدث؟ سيقوم حاسب السيارة بتحويل عبارتك الصوتية إلى أوامر بحث نصية ويرسلها إلى شبكة الإنترنت عبر التقنيات اللاسلكية المتقدمة، وستقوم شبكة الإنترنت بفحص أسهم شركتك خلال اليومين السابقين وترسلها إلى حاسب السيارة مرة أخرى الذى يحول المعلومات النصية إلى كلام منطوق تسمعه بأذنيك لأنك بطبيعة الحال تركز فى القيادة.









ويمكن اختصار أهداف المعالجة الآلية للغات الإنسانية بصفة عامة فى ثلاثة أهداف هى:

1- تواصل أفضل مع الحاسب
تمكن وسائل البحث باللغة العادية الإنسان من التواصل مع الحاسب بالفرنسية أو الألمانية أو العربية أو أى لغة أخرى. فالتواصل مع الحاسب باللغة المنطوقة سيكون له تأثير كبير على بيئة العمل، وستنبثق مجالات جديدة واسعة أمام تكنولوجيا المعلومات.

2- تواصل أفضل بين البشر
من الأهداف الأولى التى ظهرت من أجلها علوم اللغويات الحاسوبية والمعالجة الآلية الترجمة الآلية بين اللغات الحية من أجل مزيد من التواصل بين البشر، ورغم أن تجربة الفشل المريرة قد جعلت العلماء يدركون أنهم بعيدون جدا عن تحقيق هذا الهدف الطموح فى ترجمة النصوص غير المحدودة، تمكن علماء اللغويات الحاسوبية من إنشاء برمجيات تبسط عمل المترجم البشرى وتحسن من إنتاجيته إلى حد كبير، وتقدم الترجمة الآلية الركيكة أو الحرفية مساعدة كبيرة لباحثى المعلومات الذين يبحثون عن المدلول أو المعنى فى كميات كبيرة من النصوص باللغات الأجنبية.

3- الوصول الفعال للمعلومات
تصفح المعلومات على الويب والتنقل بينها وفلترتها ومعالجتها يتطلب تطوير برمجيات يمكنها الوصول إلى المعلومات فى المستندات والوثائق وصفحات الويب، وهكذا فإن تكنولوجيا اللغات الإنسانية لإدارة المحتوى شرط ضرورى لتحويل ثروة المعلومات الرقمية إلى معرفة جماعية، وتعدد لغات المحتوى على الويب يمثل تحديـًا إضافيـًا لتكنولوجيا اللغة، لأنه لا يمكن السيطرة على الويب العالمية إلا بمساعدة الأدوات متعددة اللغات لفهرسة وتصفح الويب، وستذلل أنظمة إدارة المعرفة والمعلومات متعددة اللغات عقبات اللغة أمام التجارة الإلكترونية والتعليم عن بعد.

البداية والتاريخ
لم تظهر المعالجة الآلية للغة فجأة بل كانت جهودا متواصلة متراكمة حققت تقدما لا بأس به حتى الآن، وإذا ما استعرضنا تاريخ هذه القضية المعقدة سنجده يعود إلى أربعينيات القرن الماضى مع أول ظهور للحاسبات، فساعتها ساد الشعور بالتفاؤل فى الأوساط السياسية والعسكرية تجاه إمكانية استخدام قدراته فى التحليل اللغوى والترجمة الآلية، ففى منتصف الخمسينات اتجهت الجهود العسكرية فى الولايات المتحدة إلى استخدام الحاسب فى الترجمة الآلية للنصوص من اللغات الأجنبية وخاصة الدوريات العلمية الروسية إلى الإنجليزية. ولأن الحاسبات قد أثبتت قدرتها الفذة على القيام بالعمليات الحسابية بسرعة أكبر ودقة أعلى من الإنسان، كان هناك اعتقاد شائع بأنه لن يمضى وقت طويل قبل أن تتمكن من معالجة اللغة بنفس كفاءة العقل البشري، وأن الأمر سهل للغاية من خلال إنشاء قواميس آلية ثنائية اللغة، وسرعان ما باءت المحاولات الأولى بفشل ذريع، لأن الحاسب أو أنظمة تشغيله أو لغات برمجته وقتها لم تكن قد بلغت من النضج والتطور ما يؤهلها لدراسة وتحليل تعقيد اللغة وغموضها ومجازها، لأن ذلك لا يتطلب فهم معانى الألفاظ فحسب، بل يتطلب كذلك معرفة عميقة بالعالم الخارجى مع القدرة على استغلال هذه المعرفة بشكل ذكي، واعترف العلماء بصعوبة إخضاع اللغات للمعالجة الآلية قبل أن تتوفر القاعدة المعرفية الكافية، وهكذا ولدت علوم ودراسات اللغويات الحاسوبية ومعالجة اللغات بواسطة الحاسب.



وبعد أن تطورت النظريات الإحصائية والرياضية لدراسة اللغة، كان من المنطقى بل والحتمي أن تأتى المرحلة التالية وهى التقاء الحاسب باللغة، لأن اللغة تجسد النشاط الذهنى للإنسان بكل تجلياته، ولأن هدف الحاسب هو محاكاة القدرات الذهنية للإنسان، وقد تدرج هذا الالتقاء بين الحاسب واللغة حتى وصل إلى درجة عالية من التفاعل والامتزاج لعدة أسباب ذكرها الدكتور نبيل على فى كتابه (العرب وعصر المعلومات، عالم المعرفة، 1994) على النحو التالي:

·        التطور الهائل فى علوم اللغويات وخضوعها للمعالجة الرياضية والمنطقية.

·        التقدم العلمى فى تقنيات الحاسب ومكوناته ولغات برمجته وأساليب الذكاء الصناعى.

·        الاستعانة باللغات البشرية فى تصميم لغات برمجة راقية تتسم بالقوة والمرونة.

·  يتطلب الانفجار المعرفى استحداث وسائل آلية لتنظيم هذا الكم المتزايد من المعلومات وتحسين كفاءة تخزينها واسترجاعها وتوظيفها.

·        انتشار الحاسبات الشخصية والمنزلية بشكل يحتم ضرورة التعامل معها بلغة طبيعية .

·        بفضل الحاسبات السوبر أمكن تطوير نظم لمعالجة اللغة آليا فى حدود الجدوى الاقتصادية والفنية لهذه النظم.

·  ظهور النظم الآلية الخبيرة التى تستطيع تشخيص الأمراض وتقديم الاستشارات الفنية والقانونية والنظم الآلية للتعليم الذاتى، التى تتطلب قدرة على الحوار مع المستخدم البشرى بلغة سهلة مثل لغته الطبيعية.

·        انتشار الحاسب كوسيلة للتعليم والتعلم، وخاصة تعليم وتعلم اللغات.



تحديات تواجه المعالجة الآلية للغة
فهم الحاسب للغات الطبيعية من المشكلات الكبرى التى تواجه نظم المعالجة الآلية للغات الطبيعية، لأن ذلك يتطلب معرفة عميقة بالعالم الخارجى مع القدرة على استغلال هذه المعرفة بشكل ذكي، وفيما يلى نماذج للمشكلات التى تعترض المعالجة الآلية للغات بواسطة الحاسب، ومن ضمنها بالطبع اللغة العربية:

1- تقطيع الكلام والأصوات والوحدات المعجمية
فى أغلب اللغات المنطوقة، تعد الكلمات توليفة من الأصوات المتتالية الممتزجة مع بعضها البعض، ففى الكلام العادى الطبيعي، نادرًا ما توجد أى وقفات بين الكلمات المتتالية ويتأثر الحرف بالحروف المجاورة من عدة نواحي، حيث تمتزج الأصوات ببعضها بشكل ناعم وسلس أو تنفصل أو حتى تكاد تختفي. لذلك يمثل تقطيع الجملة إلى كلمات منفصلة وتحويل الكلمات إلى حروف متفرقة بل وتقطيع الحروف داخل الكلمة مهمة شديدة الصعوبة فى تكنولوجيا التعرف على الكلام .

وعلاوة على ما سبق، من الممكن أن يختلف معنى أى جملة حسب طريقة تقسيمها إلى كلمات، والتقطيع المعجمى السليم يعتمد على السياق والدلالة، وتتداخل هذه المشكلة إلى حد ما مع مشكلة تقطيع النص فى بعض اللغات التى تكتب دون فواصل بين الكلمات مثل الصينية واليابانية واللغات التى تكتب بحروف متصلة مثل اللغة العربية والفارسية والأردية.

2- فك الغموض أو اللبس
فى كل اللغات توجد بعض الكلمات التى تتعدد معانيها ويتحدد معناها حسب موقعها فى الجملة أو السياق، وتعد مشكلة الغموض أو اللبس فى المعنى وتعرف باسم اللبس الدلالى من أكبر التحديات التى تواجه معالجة اللغة العربية آليا وتطبيقاتها وخاصة الترجمة الآلية، بجانب مشكلة الضمائر التى قد تعود على عاقل أو غير عاقل بعكس الإنجليزية التى تفرق بين العاقل وغير العاقل فى الضمائر سواء كانت ضمائر الفاعل أم المفعول أم الملكية. وهناك غموض آخر بسبب بناء أو تركيب الجملة يسمى اللبس النحوي، حيث تعنى الجملة أكثر من معنى أو يمكن تفسيرها بأكثر من طريقة مثل (شاعر النيل العظيم) حيث يمكن أن تعود صفة العظيم على النيل أو الشاعر.

3- العبارات الطلبية
بعض الجمل لا تعنى ما تقوله حرفيا، ويتحدد معناها على الموقف الاجتماعي، كأن تقول لشخص على سبيل المثال: هل من الممكن أن تعطينى الملح بجوارك؟ فهذا ليس سؤالا يحتاج إلى إجابة، ولكنه طلب، وكل أشباه هذه العبارات التى تعنى غير مدلولها الحرفى تمثل مشكلات وتحديات شديدة الصعوبة أمام عقل الحاسب الذى يصعب أن يفهم المواقف الاجتماعية أو يفسرها أو يتصرف وفقا لها.

تشمل الترجمة والتوليد والتلخيص الآلى للغة وفهم الصوت
10 تطبيقات حالية ومتوقعة للمعالجة الآلية للغة


عبر رحلتها التاريخية وما أنجزته خلالها من نجاحات وتطورات متنوعة استطاعت المعالجة الآلية أن تحفر لنفسها مجالات للتطبيق العملى فى مسارات متنوعة، بعضها بدأنا نلمس آثاره عمليا مثل أدوات الترجمة الآلية المتوفرة حاليا مجانا على محركات البحث الشهيرة مثل جوجل، وبعضها الآخر لايزال فى البداية ولم يحقق الانتشار والشعبية المطلوبة، وفيما يلى نتناول بعض تطبيقات المعالجة الآلية للغة والتى تشمل الترجمة الآلية والتلخيص الآلى والتوليد الآلى للغة واستخلاص المعلومات واسترجاع المعلومات والإجابة على الأسئلة والتنقيب فى النصوص وتحويل النص إلى كلام منطوق وفهم الصوت.


--------------------------------------------------------------------------------

1- الترجمة الآلية
وتعنى استخدام برمجيات الحاسب فى ترجمة النصوص أو الكلام من لغة إنسانية لأخرى. وفى مستواها الأساسى، تعمل برامج الترجمة الآلية على استبدال الكلمات باللغة المترجم منها بالكلمات المقابلة لها فى اللغة المترجم إليها. من الممكن استخدام تقنيات المكانز فى إجراء عمليات ترجمة أكثر تعقيدا حيث تساهم المكانز والذخائر اللغوية فى التعامل مع الفروق فى البنية اللغوية والتعرف على العبارات وترجمة المصطلحات بالإضافة إلى عزل الحالات الشاذة.



تتيح برمجيات الترجمة الآلية الحالية تخصيص الترجمة حسب المجال أو المهنة، حيث يتم تحسين الترجمة النهائية من خلال حصر نطاق الاستبدالات المسموح بها، وهذا الأسلوب فعال للغاية خاصة فى المجالات التى تستخدم فيها اللغة الرسمية أو الاصطلاحية، وبصفة عامة تتيح الترجمة الآلية نتائج أفضل فى النصوص الحكومية والقانونية التى تعتمد على قوالب من الجمل والعبارات بعكس النصوص العامة والمحادثات، حيث ما زالت نظم الترجمة الآلية فى حاجة إلى مزيد من التطوير للوصول إلى جودة معقولة.



ومما لا شك فيه أن الترجمة الآلية بصفة عامة وصلت إلى مستوى متقدم جدا، ونجحت فى مساعدة المترجم البشرى على تحسين عمله بل وتفوقت عليه فى أحيان قليلة، غير أنها فى مجملها لم تستطع أن تتغلب على المترجم البشرى فى هذا المضمار، خاصة فى ترجمة الحوارات والمحادثات ويزيد الأمر صعوبة لو كانت هذه الحوارات باللغة العامية أو اللغة غير الرسمية.



وتستخدم الترجمة الآلية طريقة تعتمد على القواعد اللغوية التى تعنى ترجمة الكلمات بطريقة لغوية، حيث يتم استبدال الكلمات المناسبة فى اللغة الهدف بالكلمات المقابلة لها فى اللغة المصدر، وهناك بعض الآراء التى ترى أنه لن يكتب للترجمة الآلية تحقيق النجاح ما لم تحل مشكلة فهم اللغات الطبيعية أولا.



وتوجد عدة طرق للترجمة الآلية هي: الترجمة المعتمدة على القواعد أو المعتمدة على الإحصاء. تقوم لوغاريتمات الترجمة المعتمدة على القواعد بإعراب النص وإنشاء تمثيل وسيط رمزي، يتم منه توليد النص باللغة الهدف، ووفقا لطبيعة التمثيل الرمزي، يوصف منهج الترجمة الآلية بأنه معتمد على التمثيل المحايد أو التحويل. وتتطلب هذه المناهج معاجم شاملة بمعلومات دلالية وتركيبية وصرفية ومجموعة كبيرة من القواعد.



وتحاول الترجمة الآلية الإحصائية توليد الترجمة باستخدام الطرق الإحصائية المعتمدة على ذخيرة لغوية ثنائية اللغة، فإذا توافرت هذه المكانز، يمكن تحقيق جودة ممتازة فى الترجمة الآلية لأى نصوص مشابهة، واول برنامج للترجمة الإحصائية هو CANDIDE من آى بى إم، وقد استخدمت شركة جوجل SYSTRAN لعدة سنوات ثم انتقلت إلى طريقة الترجمة الإحصائية فى أكتوبر 2007، وقامت جوجل مؤخرا بإضافة 200 مليار كلمة من مواد الأمم المتحدة لتدريب أنظمة الترجمة الآلية، حيث تحسنت جودة الترجمة كثيرًا.

2- التلخيص الآلى
تطبيق من تطبيقات المعالجة الآلية للغة يقوم إنشاء نص مختصر من ملف أو مستند بواسطة برنامج حاسب آلي، على أن يحتوى النص المختصر على أهم الأفكار فى النص الأصلي، وتأتى أهمية التلخيص الآلى فى ضوء إغراق المعلومات وزيادتها عن قدرة المرء على الملاحقة والمتابعة. ينبغى على البرمجيات التى طورت لتقدم خلاصات متماسكة أن تأخذ فى الاعتبار عدة متغيرات مثل الطول وأسلوب الكتابة والبناء من أجل إنشاء ملخص مفيد.



ويمكن التمييز بين نوعين من برامج التلخيص الآلي: برامج الاستخلاص والتجريد. تعتمد برمجيات الاستخلاص على نسخ المعلومات التى تعد مهمة إلى الملخص (مثل الجمل الأساسية والفقرات المهمة) أما التجريد أو التركيز فيتطلب إعادة الصياغة، وبصفة عامة، يعد التجريد وإعادة الصياغة أقوى تأثيرا ويركز المعلومات بصورة أكبر من الاستخراج، ولكن البرامج التى تقوم بذلك صعبة للغاية فى البرمجة والتطوير لأنها تتطلب تكنولوجيا توليد اللغة الطبيعية، التى ما زالت حتى الآن مجالا متناميا.

3- التوليد الآلى للغة
يقصد بالتوليد الآلى اللغة إنشاء نص بلغة طبيعية من نظام تمثيل آلى مثل قاعدة معرفة أو استمارة منطقية، وبعض الناس يعتبر التوليد الآلى للغة كمقابل لفهم اللغة الطبيعية، وفى نظم إنشاء التوليد الآلى للغة، يحتاج النظام إلى اتخاذ قرارات بشأن كيفية صياغة أحد المفاهيم. وأنجح التطبيقات للتوليد الآلى للغة أنظمة تحويل البيانات إلى نصوص التى تقوم بإعداد خلاصات نصية للبيانات الرقمية وغير اللغوية حيث تمزج بين تحليل البيانات والتوليد الآلى للغة مثل النشرات الآلية لأحوال المناخ والاقتصاد والبورصة.

4- استخلاص المعلومات
يقصد باستخلاص المعلومات فى معالجة اللغات الطبيعية استرجاع المعلومات، فالهدف هو الاستخلاص الآلى للمعلومات المنظمة المصنفة والمعرفة من حيث السياق والمعنى من مستندات إلكترونية غير منظمة. ومن الأهداف الواسعة لاستخلاص المعلومات استنتاج الاستدلالات من المحتوى المنطقى للبيانات المدخلة، ويأتى هذا الهدف فى ظل نمو المعلومات فى الأشكال غير المنظمة (أى دون بيانات وصف) على الإنترنت، والتى يمكن تسهيل الوصول إليها من خلال ترميزها بأكواد XML. ومن التطبيقات المثالية لاستخلاص المعلومات مسح مجموعة من المستندات المكتوبة بلغة طبيعية وحشو قاعدة البيانات بالمعلومات التى تم التوصل إليها. ومن المهام الفرعية لاستخلاص المعلومات: تمييز أسماء الأعلام تلقائيا وتمييز العبارات الاسمية التى تشير إلى نفس الشيء واستخلاص المصطلحات أى العثور على المصطلحات لمكنز لغوى معين واستخلاص العلاقات بين الأشياء أو الهويات.

5- استرجاع المعلومات
خرجت تطبيقات استرجاع المعلومات من عباءة علم البحث عن الوثائق والمستندات والمعلومات داخل الحاسبات وقواعد ومستودعات البيانات وشبكة الويب العالمية وغيرها، وهناك تداخل فى استخدام هذا المصطلح لاسترجاع البيانات والمستندات والمعلومات والنصوص، واسترجاع المعلومات كعلم متعدد الفروع وتتضافر فيه علوم الحاسب والرياضيات وعلوم المكتبة وعلوم المعلومات وبنية المعلومات وعلم النفس الإدراكى واللغويات والإحصاء والفيزياء. تستخدم أنظمة استرجاع المعلومات آليا فى تقليل فيض المعرفة، فالعديد من الجامعات والمكتبات العامة تستخدم أنظمة استرجاع المعلومات لتسهيل العثور على الكتب والدوريات وغيرها من الوثائق ومحركات البحث هى التجسيد الأسمى لتطبيقات استرجاع المعلومات. تتمثل علاقة استرجاع المعلومات بمعالجة اللغة آليا فى تطوير قدرات محرك البحث أو قاعدة البيانات على فهم العبارات والأسئلة باللغة العادية مثل (أريد كتابا يتحدث عن الفيزياء الفلكية) وفى ربط أنظمة استرجاع المعلومات بأنظمة تحويل الكلام إلى نص وبتحويل النص إلى كلام منطوق.

6- الإجابة على الأسئلة
يعتبر هذا التطبيق من التطبيقات المنتمية استرجاع المعلومات، حيث يفترض بالحاسب أن يستطيع الإجابة على أى أسئلة باللغة العادية من خلال البحث فى مجموعة ضخمة من المستندات والوثائق مثل شبكة الويب العالمية، وتتطلب الإجابة على الأسئلة وسائل معالجة آلية متقدمة للغات مثل استرجاع المستندات، ويعتبرها الكثيرون المرحلة التالية بعد محركات البحث، حيث تقوم بطرح سؤال عادى عن شىء معين، وينبغى على الحاسب أو محرك البحث أن يعرض لك الإجابة فقط أو المستندات التى تحوى الإجابة فقط، وبعض الخبراء يقولون إن الإجابة على الأسئلة لن تكون ممكنة إلا بعد تطوير الويب الدلالية خلال السنوات الخمس أو العشر المقبلة، وحتى الآن ما زالت الإجابة على الأسئلة المنطوقة شكل من أشكال الخيال العلمى حيث يسأل الكابتن السفينة الفضائية عن أى شيء وتجيبه بصوت أنثوى رصين.

7- التنقيب فى النصوص
يقصد به عملية استخلاص معلومات عالية الجودة من النصوص، وتستمد المعلومات عالية الجودة من تقسيم الأنماط والاتجاهات من خلال وسائل مثل التعلم الإحصائى للأنماط. وتتضمن عملية التنقيب فى النصوص هيكلة النصوص المدخلة من خلال الإعراب (الفك إلى الوحدات اللغوية) مع إضافة مزايا لغوية مشتقة وإزالة مزايا أخرى والإدخال التالى فى قاعدة البيانات واشتقاق الأنماط داخل البيانات المهيكلة وفى النهاية تقييم وتفسير المخرجات. تتضمن مهام التنقيب فى النصوص تصنيف النصوص وعنقدتها واستخراج المفاهيم والهويات وإنتاج التصنيفات المتدرجة وغيرها. وتستخدم تقنيات التنقيب فى النصوص فى تطبيقات الحماية والرعاية الطبية والبرمجيات والتطبيقات وتحسين نتائج البحث وأغراض التسويق والتطبيقات الأكاديمية.

8- تحويل النص إلى كلام منطوق
من التطبيقات المهمة للمعالجة الآلية للغة، فهو يقوم بقراءة النصوص أو تحويل الكلام المكتوب إلى صوت مسموع وكلام منطوق مفهوم، ويسمى نظام الحاسب (برمجيات أو أجهزة) المستخدم لهذا الغرض بمولف الكلام، ويقوم نظام تحويل النص إلى كلام بتحويل نص اللغة العادية إلى كلام، أما الأنظمة الأخرى فتعمل على تحويل الرموز اللغوية الصوتية إلى كلام. يمكن إنشاء الكلام المولف من خلال ضم أجزاء متسلسلة من الحديث المسجل المخزن فى قاعدة بيانات هى المكانز المنطوقة، وتختلف الأنظة فى حجم وحدات الحديث المخزنة، وفى مجالات استخدام معينة، يتيح تخزين كلمات كاملة أو جمل كاملة إنتاج كلام عالى الجودة. وهناك طريقة أخرى هى تضمين نموذج من جهاز النطق وغيرها من خصائص الصوت الإنسانى لإنتاج صوت مولف بالكامل.



ويتم الحكم على جودة مولف الكلام بدرجة تماثله مع الصوت البشرى أو بمدى فهمه، ويتيح برنامج تحويل النصوص إلى كلام مفهوم للمكفوفين والمعاقين بصريا الاستماع إلى الأعمال المكتوبة من خلال الحاسب المنزلي، وقد تضمنت العديد من أنظمة تشغيل الحاسب مولفات كلام منذ بداية الثمانينات. المشكلة التى تواجه إنتاج مولفات كلام باللغة العربية هى غياب علامات التشكيل، ولهذا لابد من إنتاج المشكل الآلى حتى يمكن تحويل النصوص العربية إلى كلام منطوق.

9- فهم الصوت
يختلف هذا التطبيق Speech Recognition  عن السابق فى أنه لا يتعرف على نص مكتوب ويحوله إلى كلام منطوق، بل يستمع إلى صوت مسموع ويقوم بالتعرف عليه وتحديد هوية صاحبه، من خلال تحويل الصوت إلى رموز تفهمها الآلة وتتعرف عليه، وهو يختلف كذلك عن مصطلح التعرف على الصوت Voice Recognition ويقصد به التعرف على صوت المتحدث نفسه وليس الكلام الذى يقوله. ومن تطبيقات فهم الكلام الاتصالات الصوتية وتوجيه المكالمات والتحكم فى الأجهزة المنزلية والبحث فى المحتوى بالصوت وإدخال البيانات البسيطة وإعداد المستندات المنظمة وتحويل الكلام إلى نص مكتوب وفى كابينات القيادة بالطائرات.



ومن تطبيقات فهم الكلام المنطوق استخدامها فى القيادة الآلية للطائرات العسكرية والتحكم فى أجهزتها وخاصة فى بريطانيا وفرنسا والولايات المتحدة وفى طائرات الهليكوبتر حيث مشكلة الضوضاء الخلفية بسبب صوت المروحة والهواء وفى إدارة المعارك حيث تتطلب مراكز القيادة الوصول السريع لقواعد بيانات المعلومات المتغيرة بسرعة كما تستخدم فى تدريب مراقبى حركة المرور الجوي، بجانب استخدامها فى مجال الاتصالات التليفونية وألعاب الحاسب والمحاكاة، ولم يتم تثبيت هذه التكنولوجيا فى الأجهزة المحمولة لأنها تتطلب قوة معالجة هائلة، وهذه التكنولوجيا مفيدة للغاية لمن لا يستطيعون تحريك أيديهم، مما يتطلب وسيلة بديلة لإدخال المعلومات فى الحاسب والتحكم فى وظائفه.

10- التعرف الضوئى على الحروف
يقصد بالتعرف الضوئى على الحروف OCR التحويل الميكانيكى أو الإلكترونى لصور الكتابة اليدوية أو الكتابة بالآلة الكاتبة أو النص المطبوع، والتى يتم عادة التقاطها بالماسحة الضوئية إلى نص قابل للتحرير والقراءة فى الحاسب. وقد بلغت تقنية التعرف الضوئى على الحروف شأوا كبيرا فى اللغات اللاتينية بل لم تعد مشكلة على الإطلاق، وفى اللغة العربية توجد تطبيقات متطورة للتعرف الضوئى على الحروف العربية المطبوعة من صخر غير أنها باهظة التكلفة وقليلة الانتشار. وما زال التعرف الضوئى على الكتابة باليد أو الكتابة المنحنية المتصلة مجالا للبحث النشط سواء فى اللغات اللاتينية أو اللغة العربية.





تعمل كبيت للذاكرة ونبع متدفق للمعرفة
المكانز الإلكترونية القلب النابض للمعالجة الآلية للغات
لم يكن ممكنا للمعالجة الآلية للغات أن تتقدم وتفتح لنفسها مجالات التطبيق المتنوعة السابقة ثم تستشرف المستقبل بدون أن يكون لها قلب نابض يستوعب مليارات الكلمات والأصوات، وتكون لديه القدرة على الوصول إلى أى منها وفهم وتحليل ما بينها من علاقات، ليصبح مع الوقت بيتا للذاكرة ونبع متدفق للمعرفة، وعمليا تجسد هذا القلب النابض فيما يعرف بالمكانز اللغوية Corpora التى تعتمد فى عملها على قوة الحاسبات فى المعالجة وقدرات البرمجيات المختلفة فى التحليل والفهرسة والرصد والاسترجاع، وسعات وحدات التخزين فى استيعاب ما لا حصر له من الكلمات والأصوات. فما هى المكانز اللغوية؟


--------------------------------------------------------------------------------



وفقا لموقع جامعة إيسيكس www.essex.ac.uk، فإن هذا المصطلح يشير إلى المجموعات الكبيرة من النصوص أو الملفات الصوتية التى تمثل عينة أو تخصص أو شريحة معينة من اللغة، وهذه النصوص تكون غالبا فى صيغة إلكترونية يستطيع الحاسب قراءتها والبحث فيها، ومن الممكن أن يتكون المكنز اللغوى من نصوص خام فقط بدون أى معلومات أو يحتوى على معلومات لغوية خاصة تسمى بالحواشى أو التلقيب أو الوصف.



وهى إما مكانز نصية تحتوى على مجموعة هائلة من النصوص المكتوبة والمطبوعة مثل النصوص الكاملة للصحف والمجلات والكتب فى مختلف المجالات مثل الآداب والسياسة والعلوم والفنون أو مكانز صوتية منطوقة تحتوى على تسجيلات آلاف المحادثات والحوارات والخطب ونشرات الأخبار الإذاعية والبرامج الحوارية والمسلسلات والأفلام وغيرها.

مجالات استخدام المكانز
للمكانز دور محورى فى بناء القواميس والمعاجم الحديثة وفى التعرف على خصائص اللغة وكذلك حل مشكلاتها المختلفة، وفى بحث قيم بعنوان بناء مدونة عالمية للغة العربية من إعداد الدكتور سامح الأنصارى رئيس مركز لغة الشبكات العالمية فى مكتبة الإسكندرية وأستاذ علم اللغة الحاسوبي بآداب الإسكندرية والأستاذ الدكتور مجدى ناجى رئيس قطاع تكنولوجيا المعلومات بمكتبة الاسكندرية والدكتورة نهى عدلى بكلية الهندسة جامعة الإسكندرية، ذكر الباحثون عدة جوانب لأهمية المكانز فى الدراسات اللغوية نذكر أهمها فيما يلى:



أولا: صناعة المعاجم
تساعد المكانز اللغوية على معرفة معلومات غاية فى الأهمية لبناء المعجم وهى متابعة الكلمات الجديدة التى تدخل اللغة وتحديد وقت دخولها، ومعرفة الكلمات الموجودة بالفعل التى اكتسبت معنى جديدا، ونجد أن أغلب قواميس ومعاجم اللغة الإنجليزية تحتوى على تواريخ مفصلة لكل كلمة وأصلها اللغوى ومتى تم نحتها أو استخدامها لأول مرة، وبمساعدة المكانز الالكترونية يستطيع خبراء صناعة المعاجم البحث فى ملايين الجمل والسياقات المختلفة واستدعاء جميع الأمثلة لكلمة معينة لمعرفة استخداماتها والألفاظ التى ترد عادة قبلها أو بعدها من أجل تحديد التعابير الاصطلاحية والمتتاليات اللغوية، الأمر الذى يسهل تعلم اللغة على الأجانب.

ثانيا: المكانز اللغوية وفهم قواعد النحو
يمكن الاستفادة من المكانز فى دراسة الملامح الصرفية والبحث عن السوابق واللواحق المعينة التى تدخل على الكلمة فكلمة (علم) تتعدد معانيها بإضافة سوابق أو لواحق مختلفة لتصبح (علمية، علمتنا، علماء، تعليم، علوم)، بجانب تحديد توزيع الكلمة وموقعها فى الجملة، وهل تأتى قبل الاسم أم بعد الاسم، وقبل الصفة أم بعد الصفة.

ثالثا: المكانز اللغوية وتحديد الدلالة
فى السنوات الأخيرة، ظهر اتجاه جديد يعتمد على استخلاص معنى الكلمة من المكانز اللغوية، وتتنوع المعلومات الدلالية بين الترادف والتضاد إلى علاقات أكثر تعقيدا، ويمكن استخلاص هذه المعلومات بسهولة من المكانز اللغوية، وينبغى التنبيه، انه يشترط لاستخراج هذه المعلومات أن تكون المكانز شاملة وكاملة بقدر المستطاع، حتى لا يتسرب معنى أو استخدام لا توجد أمثلة له فى المكنز.

رابعا: المكانز اللغوية وتحسين تعليم اللغات الأجنبية
من خلال المكانز من الممكن تحليل مدى تكرار وشيوع الكلمات ومعرفة تأثير السياق أو الموقف على أسلوب اللغة وهى معلومات مفيدة للغاية فى وضع مناهج تعليم اللغة العربية سواء للطلاب الأجانب أو العرب أنفسهم. أيضا باستخدام المكانز اللغوية، يستطيع واضع المراجع والمواد إنشاء تمرينات تعتمد على أمثلة حقيقية تقدم للطلاب فرصة اكتشاف خصائص استخدام اللغة. وبدلا من الاعتماد على البحث فى معاجم تقليدية قديمة، يستطيع الطلاب البحث بأنفسهم فى برامج المكانز اللغوية من خلال برنامج بحث وإحصاء لغوى متخصص (concordance) ويكتشفوا بأنفسهم استخدامات اللغة وقواعدها وخصائصها، ويشجع ذلك على استقلال الطلاب فى التوصل إلى نتائج جديدة بدلا من تعليمهم نتائج متوقعة أو معروفة مسبقا.

خامسا: المكانز اللغوية فى مجالات أخرى
وفى علم اللغويات الاجتماعية، ينصب التركيز على تأثير العمر والنوع والطبقة الاجتماعية والمهنة فى استخدام الأفراد للغة، ولا يمكن دراسة ذلك بشكل سريع ودقيقإلا فى المكانز اللغوية التى تفيد أيضا فى دراسة الأسلوب وتأثره بالمقام أو مقتضى الحال، فالكتابات الأدبية تختلف عن الكتابات السياسية، والكتابات التعليمية تختلف عن المحادثات العادية، وهكذا، وفى كل الأحوال، ينبغى أن تتسم المكانز اللغوية بالشمول، حتى تكون النتائج التى يتم استخلاصها من الدراسة دقيقة وواقعية.

المكانز واللغة العربية
لخص الدكتور سامح الانصارى أهمية المكانز اللغوية لبناء معاجم اللغة العربية فى الجوانب التالية:

1- حصر جميع المعاني: من مميزات البحث الإلكترونى فى المكانز اللغوية إمكانية عرض جميع السياقات التى يمكن أن تظهر فيها الكلمة، وبالتالى إمكانية حصر كل المعانى المختلفة لنفس الكلمة حسب السياقات المختلفة، ومن أمثلة ذلك كلمة (قلب) التى تعنى جوهر وقلب يضخ الدماء ووسط أو منتصف.

2- دراسة مدى شيوع الكلمات: تساهم المكانز اللغوية فى معرفة أكثر الكلمات شيوعا فى اللغة العربية على المستويين المنطوق والمكتوب، وذلك من أجل تعليم هذه الكلمات للأجانب وحتى يتمكنوا من فهم المعاجم العربية، ومما لا شك فيه أن معرفة مستوى شيوع كلمة ما يدل على أهميتها فى كل اللغة المكتوبة أو المنطوقة، وبالتالى ترشد المتعلم إلى معرفة مدى ضرورة تعلمها أو إغفالها من عدمه.

3 - دراسة التنويعات المعجمية: دراسة تكرار الكلمة كمادة أو كفئة معجمية (اسم، فعل، صفة، غير ذلك)، ومن الممكن أن يكون للكلمة الواحدة أكثر من فئة معجمية حسب السياق، مثال ذلك كلمة (عين) التى ترد كاسم وكفعل مع التشديد بمعنى (وظف).

4- دراسة استخدام المترادفات: تحتوى اللغة على كلمات عديدة تعتبر مترادفات لبعضها البعض، ومن خلال المكنز اللغوى يستطيع الباحث بسهولة معرفة مترادفات الكلمة ومعدل شيوعها.

5- شكل الكلمة وفقا لحالتها الإعرابية: يتغير شكل الكلمة وفقا لحالتها الإعرابية (الرفع والنصب والجر)، ويمكن للباحث من خلال المكنز اللغوى معرفة التنويعات فى شكل الكلمة.

6- دراسة الكلمة وفقا لاشتقاقها الصرفي: فهناك كلمات ذات أكثر من اشتقاق صرفى مثل كتب (التى يمكن اشتقاق كاتب وكتاب ومكتبة ومكتوب وغيرها)، فالمكنز اللغوى يفيد كثيرا فى هذه الحالات.

7- معرفة مدى السلامة والصحة اللغوية: أحيانا يكون للكلمة أكثر من جمع أو هى نفسها أكثر من شكل، ويمكن اللجوء إلى ذخيرة المكنز اللغوية الهائلة والبحث فيها لمعرفة أكثر هذه الأشكال شيوعا واستخداما فى اللغة، مثل (شهور وأشهر) و(عيون وأعين)، وهكذا.

8- معرفة المتصاحبات اللغوية والتعبيرات الاصطلاحية: هناك أوصاف أو كلمات دائما تقترن بأوصاف أو كلمات أخرى دون سبب ظاهر أو منطقي، مثل تعبيرات (فتح الباب على مصراعيه) و(رأب الصدع) و(العروة الوثقى) ودراسة المكانز اللغوية تفيد للغاية فى البحث عن أمثلة هذه المتصاحبات، من أجل تسجيلها فى موادها بالمعجم العربى الحديث. فمثلا فى مادة عروة ينبغى أن يذكر القاموس أنه دائما تليها كلمة (وثقى)، وهكذا.



كيف تم وضع قواعد اللغة العربية منذ أكثر من ألف عام؟ وهل القواعد تسبق الاستخدام أم العكس؟ من المعروف أن الاستخدام يأتى أولا ثم تأتى القاعدة بعد ذلك، الأمر الذى مكن النحاة الأوائل من وضع القواعد بناء على الاستخدام أو الاستعمال اللغوي، فقاعدة رفع الفاعل ونصب المفعول وجر المضاف إليه جاءت من دراسة استخدام هؤلاء الأفذاذ للاستعمالات اللغوية فى أبيات الشعر والحديث والقرآن، وبالمثل يمكن الاستفادة من المكانز اللغوية فى استخلاص القواعد اللغوية على مستوى الكلمة والجملة والخطاب والحصول على معلومات عن تركيب واستخدام العديد من التعبيرات اللغوية.

وقد طرحت الباحثة الدكتورة سلوى حمادة الاستاذة بمعهد بحوث الالكترونيات فى ورقة بحثية بعنوان (نحو منهج عربى مقترح لتصميم المدونات اللغوية) طرق عمل المكانز

1- جمع المادة النصية: عن طريق جمع المادة الالكترونية المتوفرة على الأقراص الضوئية أو الشبكات أو من خلال الإدخال اليدوى عن طريق لوحة المفاتيح وعن طريق تحويل المادة المنطوقة إلى مادة مكتوبة إن وجدت عن طريق المحولات الصوتية وتحويل البيانات لصورة يسهل التعامل معها آليا مثل صيغة النصوص text أو عن طريق جهاز المسح الضوئى الذى يحول النصوص فى المستندات الورقية إلى الصيغة الإلكترونية.

2- تجهيز المادة اللغوية وهى مرحلة ما قبل المعالجة: يقصد بذلك عزل الجمل وتقسيم الجمل وعزل الصور وتوحيد الخطوط وحجم الخط وخلافه وعزل علاقات الترقيم وتمييز اللبس والاختصارات والقوائم والشروط بأنواعها.

3- إدخال معلومات الوصف والترميز والتلقيب المناسبة: يقصد التلقيب annotation أو الوصف meta- data أو الترميز markup تحديد المعلومات اللغوية وبيانات المؤلف وتاريخ الإنشاء والعنوان واللغة والمجال وإدخال المعلومات اللغوية مثل فئات أو أقسام الكلام والمشتقات والمعلومات النحوية وبناء الجملة والمعلومات الدلالية ومعلومات عن الأسلوب والصوت بصيغة يفهمها برنامج البحث فى المكنز، وسائر أدوات معالجة اللغة، وتتضمن معلومات الوصف تمييز حدود الجمل والعبارات والفقرات وفك لبس حدود الجمل من خلال النقطة والمسافة وتمييز الكلمة الجذر Lemma ومشتقاتها.

عند المعالجة الآلية للغة العربية
8 خواص لغوية بعضها يعقد الأمر والبعض الآخر يجعله سهلا
بعد كل ما سبق عن المعالجة الآلية تعريفا وتطبيقات ومكونات نصل الآن إلى التساؤل المهم الذى يدور فى أذهاننا جميعا وهو:ما موقف اللغة العربية من المعالجة الآلية؟:هل هى صالحة من الأساس لهذه المعالجة؟ هل خصائصها تسهل المعالجة الآلية أم تجعلها صعبة؟ وهل حقا تسبب طبيعة اللغة العربية صعوبة فى معالجتها آليا وتحول دون تفاعل الحاسب معها؟ ثم ما أهمية المعالجة الآلية للغة العربية؟ هل هى فى أزمة وتحتاج إلى إمكانيات الحاسب وتكنولوجيا المعلومات لكى تخرج منها ؟ وما هو شكل التفاعل بين اللغة العربية وتكنولوجيا المعلومات؟ فى السطور التالية سنحاول الإجابة.


--------------------------------------------------------------------------------

يقول الدكتور نبيل على أن اللغة العربية أشد حاجة من غيرها إلى هندسة اللغة والمعالجة الآلية بسبب كثرة الفجوات فى تنظيرها اللغوى الراهن، حيث تستطيع المعالجة الآلية بأساليبها العملية التجريبية سد جزء من هذا الفراغ، وإذا لم يحدث ذلك، سيطول الوقت انتظارا لاكتمال الأسس النظرية لمعالجة اللغة العربية الآلية، فهندسة اللغة العربية وتطوير التنظير لها لابد أن يسيرا جنبا إلى جنب لأن كل منهما يتغذى على نتاج الآخر، وحسب رأيه فإن المعالجة الآلية للغة العربية بواسطة الحاسب تنقسم إلى جانبين أساسيين: الأول يشمل نظم البرمجة المستخدمة فى المعالجة الآلية بواسطة الحاسب للفروع اللغوية المختلفة مثل قواعد البيانات المعجمية والذخائر اللغوية والقواميس الإلكترونية ونظام الصرف الآلى الذى يقوم بتحليل الكلمات إلى عناصرها الاشتقاقية والتصريفية أو يعيد تركيبها من هذه العناصر ونظام الإعراب الآلى الذى يقوم بإعراب الجمل آليا ونظام التحليل الدلالى الآلى الذى يستخلص معانى الكلمات استنادا إلى سياقها ويحدد معانى الجمل استنادا إلى ما يسبقها وما يتبعها من جمل.



والجانب الثانى يتضمن التطبيقات التى تقوم على النظم اللغوية الآلية والتى تشمل على سبيل المثال الترجمة الآلية والتدقيق الهجائى والنحوى والفهرسة والاستخلاص الآلى والبحث العميق داخل مضمون النصوص وفهم الكلام ونطقه آليا.



وبالنسبة لخصائص اللغة العربية وعلاقتها بالمعالجة العربية يقول نبيل على فى كتاب العرب وعصر المعلومات 1994 أن منظومة اللغة العربية تتصف بمجموعة من الخصائص التى إما تسهم فى تسهيل أو تعقيد معالجتها آليا بشكل يتفاوت من خاصية لأخرى، ويشرح الدكتور نبيل على هذا الأمر بالنسبة لكل خاصية من خواص اللغة العربية على حدة على النحو التالى:



1ـ خاصية التوسط، والمقصود بها الظواهر اللغوية مثل الأبجدية وحالات الإعراب وترتيب الكلمات والتطابق بين الفعل والفاعل وهذا يعنى أن أمور معالجتها آليا ستتعرض للعديد من القضايا، ويمكن لخبراء العرب الاستفادة من الحصاد الهائل المتوافر حاليا من نظم معالجة اللغات الطبيعية للانتقاء والتوفيق منها ما يهم شئون لغتنا الوسطى.

2ـ خاصية الاشتقاق الصرفى الغزير وهو مع غزارته فإنه شبه منتظم، وهذا الانتظام يجعل اللغة العربية مؤهلة للمعالجة الآلية، وفى هذه الحالة يمثل معالج الصرف الآلى المقوم الأساسى فى ميكنة المعجم العربى وتطوير نظم آلية للإعراب الآلى والتشكيل التلقائي.

3ـ خاصية المرونة النحوية والتى تمثل تحديا حقيقيا للتنظير العربى ومعالجة النحو العربى آليا، ومصدر الصعوبة أن النماذج اللغوية الحالية لأغراض المعالجة الآلية صممت لقواعد النحو الإنجليزية التى تتسم بالصرامة النسبية فى ترتيب الكلمات داخل الجمل، مما يعنى أننا فى حاجة إلى بحوث أساسية وتطبيقية لكتابة قواعد النحو الصورى اللازم لمعالجة النحو العربى آليا يراعى فى كتابته جميع البدائل الممكنة لأنماط الجملة العربية بفعل عمليات التقديم والتأخير والحذف والإبدال والإضمار، والبحوث التى أجراها نبيل على توصل إلى أن عدد قواعد الجمل العربية قد يصل إلى 12 ألف قاعدة.

4ـ خاصية الانتظام فى القواعد الصوتية العربية، حيث يتسم نظام مقاطعها الصوتية ونبرها بالبساطة، حيث لابد أن تجمع المقاطع بحرف صامت ولا تتضمن أكثر من صامتين، وهذه الخاصية ذات أهمية كبرى فى توليف الكلام العربى Speech Synthesis وتمييزه والتعرف عليه آليا Speech Recognition بحيث يبدو الصوت المولد طبيعيا لا ميكانيكيا.

5ـ خاصية الحساسية السياقية العالية مقارنة باللغة الإنجليزية فشكل الحروف يعتمد على الحرف السابق واللاحق وعلى مستوى النحو تتمثل هذه الحساسية فى علاقات المطابقة مثل تطابق الصفة مع الموصوف والفعل مع الفاعل، مما يجعل معالجة اللغة العربية آليا أكثر تعقيدا وصعوبة من معالجة اللغة الإنجليزية، ويؤدى إلى صعوبات كثيرة فى معالجة النحو العربى آليا.

6 ـ خاصية غياب تشكيل الكلمات إما بصورة كاملة أو جزئية، والتى تؤدى إلى ظهور حالات معقدة من اللبس، نظرا لتعدد احتمالات قراءة الكلمة مثل كلمة وجد التى يمكن قراءتها لتعنى (عثر على) باعتبار الواو جزءا من الكلمة أو لتعنى (واجتهد) باعتبار الواو حرف عطف. ويمثل غياب التشكيل عقبة أساسية أمام معالجة النصوص العربية آليا، ولهذا تحتاج معالجة النصوص العربية آليا إلى وسيلة برمجية لتشكيل النصوص تلقائيـًا، وقد نجح نبيل على فى تطوير نظام آلى لإعراب النصوص العربية وتشكيلها آليا وهناك الكثير من البرمجيات التى طورتها شركات عديدة تقوم بإعراب وتشكيل النصوص تلقائيا.

7 ـ خاصية اعتماد المعجم العربى على الجذور وليس على الترتيب الأبجدى للكلمات، ورغم صغر نواة المعجم العربى (اقل من 10 آلاف جذر) تتعدد المفردات بصورة هائلة بفضل خاصية الاشتقاق الصرفي، وما زالت بنية المعجم العربى المعقدة دون دراسة أو بحث كافية من قبل معظم المتخصصين، ولا سبيل إلى سبر أغوار بنية المعجم العربى إلا باستخدام نظم المعلومات والمكبيوتر، وميكنة المعجم ليست رفاهية فكرية أو ذهنية، بل مطلبا أساسيا نابعا من طبيعة المعجم وضرورة تحديثه وإعادة تنظيمه بما يلبى المطالب المتوقعة منه وخاصة تسهيل تعلم الأجانب للغة العربية.

8 ـ خاصية التماسك الشديد بين عناصرها، ومن أمثلة ذلك التماسك بين النحو والصرف والتداخل الشديد بينهما وشدة الصلة بين أشكال الصيغ الصرفية ومعانيها وهذا التماسك سلاح ذو حدين على حد قول نبيل علي، فهو من جانب يزيد من صعوبة النظم الآلية حيث يصعب فصل المعالجات الآلية للنحو الآلى عن المعالجات الآلية للصرف العربى والمعجم العربي، ويتطلب ذلك حاسبات ذات إمكانات إكبر وقدرة أكبر على معالجة اللغة العربية آليا، ومن جانب آخر يعمل هذا التماسك على إجلاء اللبس الناجم عن غياب التشكيل حيث توفر قرائن لغوية تكشف اللبس.

اللبس والمعالجة الآلية للعربية
فى بحثها المنشور فى المؤتمر الخامس لهندسة اللغة 2005، أوضحت الدكتورة سلوى حمادة الباحثة فى معهد بحوث الإلكترونيات أن اللغة العربية من أوضح اللغات وأدقها ومواطن اللبس فيها محدودة وذلك لثراء اللغة بالمفردات وإمكانية استغلال الاشتقاق فى التعبير عن المعانى، واللبس الذى يحدث فى الغالب يرجع إلى غياب التشكيل وعلامات الترقيم والمرونة فى ترتيب الكلمات، مما يسمح بإمكانية التقديم والتأخير، والسياق فكلمة (يسير) تعنى سهل وتعنى يمشى، والسياق فقط هو الذى يحدد هذا المعنى. وذكرت الباحثة عدة مصادر للبس فى اللغة العربية منها التطور واكتساب المعانى الجديدة والتحول الدلالى حيث تستخدم الكلمة بمعنى فى اللغة التراثية وتكتسب معنى جديد أو مغاير تماما فى اللغة الحديثة الدارجة مثل كلمة (جريدة) التى كانت تعنى سعف النخل والآن تعنى صحيفة والاستعمال المجازى وظاهرة تعدد المعاني.





وهناك فرق بين اللبس بالنسبة للقارئ البشرى والقارئ الآلى (برنامج ترجمة آلية أو تلخيص آلى أو برنامج تشكيل آلي)، فالقارئ البشرى لا يعتبر أغلب صور اللبس التى ذكرناها لبسا لقدرته على فهمها بسبب ثقافته وإلمامه بالسياق واستخدامه للمنطق، أما القارئ الآلى فسيعانى من اللبس فى الوحدات اللغوية مزدوجة التفسير أو متعددة المعاني، لذلك ينبغى تحويل القيود اللغوية - النحوية والدلالية - إلى لوغاريتمات تساعده على اختيار المعنى المقصود. واللبس من أهم أسباب تأخر الحاسبات فى فهم اللغات المكتوبة والمنطوقة، وهناك عدة مستويات للبس فى معالجة اللغة العربية آليا منها المستوى المعجمي، عندما تنتمى الكلمة لأكثر من فئة معجمية (فتكون اسما وفعلا وظرفا وصفة) وفى هذه الحالة يسبب اللبس المعجمى لبسا تركيبيا ودلاليا ومثال ذلك كلمة (ساعة) التى تعنى (عندما) وتعنى (فترة زمنية) وتعنى (آلة لقياس الوقت). ثم المستوى الصرفى وخاصة فى الأفعال المتعدية لمفعولين والصيغ التى تعنى اسم فاعل واسم مفعول فى نفس الوقت وصيغ المبنى للمجهول ومستوى المركبات والربط بين عدة وحدات لغوية مثل تغير معنى الفعل حسب حرف الجر الذى يأتى بعده (رغب فى ورغب عن) والحال مثل (ضربت الرجل ضاحكا) فمن الضاحك الفاعل أم المفعول وربط الصفة بالموصوف دلاليا ومستوى الحذف عندما تحذف بعض الوحدات اللغوية وتستبدل بها وحدات أخرى مثل مرجعية الضمائر والإضافة والصلة والعطف مثل (رأيت الرجال والنساء الحوامل)، وذكرت الباحثة مصادر أخرى للبس يضيق المجال بذكرها جميعا.



ومشكلة اللبس فى اللغة مشكلة ليست سهلة أو هينة، وتمثل عصب التحدى الذى يواجه المعالجة الآلية للغة العربية، ولحل مشكلة اللبس ينبغى حصر جميع الوحدات اللغوية (الأفعال وحروف الجر والأسماء والمصادر) اللبسية بجميع صور اللبس ووضع التفسير المناسب لكل سياق، ثم عمل القاعدة التى تحدد القيود المعجمية والنحوية والتركيبية والدلالية اللازمة لفك اللبس.



فك اللبس بتمثيل المعلومات آليا
ينبغى بحث كيفية فك حالات اللبس سواء أدركها الإنسان أم لا من أجل تمثيل الحلول حاسوبيا ليتمكن الحاسب فى يوم ما من فك اللبس ومن ثم تحليل النصوص العربية تحليلا دقيقا، عندما يمكن استخدام إمكانياته لدعم اللغة العربية والخوض فى غمارها. وقد طرحت الباحثة فى بحث آخر قدمته فى المؤتمر السادس لهندسة اللغة عام 2006 رؤيتها لتصميم نظام حاسوبى لفك اللبس اللغوى فى النصوص العربية الحديثة، وتقوم رؤيتها على توظيف وتوصيف القرائن اللغوية فى فهم المعنى، ويقصد به تحديد نوعية القرائن المفيدة فى توجيه المعنى وجمع القرائن من مصادرها المختلفة وتوحيد معايير القرائن على نحو يمكن الحاسب من التعامل معها وتغذية الحاسب بتلك القرائن فى صورة هياكل بيانات مترابطة.



وحددت الباحثة خطوات المعالجة الحاسوبية لفك اللبس حيث يبدأ الحاسب بالبحث فى صور تحليل الجملة المعروفة وعندما يتعرض التحليل لأى نوع من أنواع اللبس يختار القيد المناسب الذى يرتبط بالقيد الإحصائى لأعلى نسبة ورود (من خلال البحث فى قاعدة بيانات مثل الجدول السابق أو مكنز لغوى أو قاعدة بيانات لغوية) فإذا فشل يبدأ فى بحث النسبة الأقل فالأقل. وينبغى أن يبدأ الحاسب بالقيد النحوى حيث يمكن أن يرفض الكثير من الحالات مما يقلل نسبة اللبس أو ينهيها ثم يبحث الحاسب فى السياق الداخلى، فإذا فشل يبحث فى السياق الخارجى والعام، وينبغى لكى تنجح هذه الآلية إنشاء معاجم أو قواعد بيانات تحتوى على هياكل بيانات مترابطة مع مراعات القيود الإحصائية التى تحدد نسبة شيوع اللبس والقياس عليها.



بين طغيان الإنجليزية وتربص الصهاينة
إلى أين وصلت جهود المعالجة الآلية للغة العربية؟
يعرف الجميع أن اللغة العربية تعانى من أزمة حادة وضغوط متعددة فى ظل ثورة المعلومات، فمن ناحية هناك طغيان حاد للإنجليزيةعلى لغات البرمجة وعلى شفرات تبادل البيانات المصممة أصلا للغة الإنجليزية وعلى اساليب تخزين واسترجاع المعلومات وعلى المعلومات نفسها على الإنترنت، عن أن القسم الأكبر من البرامج مكتوب باللغة الإنجليزية ومعظم الأبحاث والمراجع والدوريات باللغة الإنجليزية، ومن ناحية ثانية هناك تربص واضح من جانب الصهاينة فى اسرائيل باللغة العربية حيث لا تكف محاولاتهم لاختطاف أمور هذه اللغة من العرب والاستحواذ على كل ما يخصها فى ميدان المعالجة الآلية ومختلف مسارات التفاعل بين التكنولوجيا واللغة، وفى ظل هذه الضغوط والمخاطر العنيفة: ماذا حقق العرب للغتهم فى ميدان المعالجة الآلية؟


--------------------------------------------------------------------------------



لقد فرض طغيان الانجليزية على العرب التحدث باللغة العربية والبحث عن المعلومات باللغة الإنجليزية وتوظيفها بالإنجليزية، لأنه بات من السهل تحويل الكلام الإنجليزى على الورق إلى نسخة إلكترونية، بينما لا نتمكن من ذلك فى العربية، ولأن هناك تقنيات للتعرض الصوتى على الكلام بالإنجليزية ولا توجد مثيلتها فى العربية، وهناك مواقع متقدمة للترجمة الآلية بين اللغات الأوربية، أما الترجمة من وإلى العربية فتكون عادة رديئة وحرفية وأحيانا كثيرة مضحكة.



وفيما يتعلق بالصهاينة نبه الدكتور نبيل على فى كتابه (الثقافة العربية وعصر المعلومات، 2001) إلى ضرورة الانتباه لأن إسرائيل تبدى اهتماما كبيرا بتطبيقات المعالجة الآلية للغات الإنسانية بواسطة الحاسب، وعلى رأسها العبرية، ووصل بها الأمر إلى حد أن تقدمت إسرائيل فى منظمة الوحدة الأوربية لتطوير نظم الترجمة الآلية من لغات السوق الأوربية المشتركة إلى العربية (وليس العبرية)، ومن الخطير للغاية أن تتولى إسرائيل نيابة عنا مهمة معالجة اللغة العربية آليا فعندئذ تكون قد حلت بنا كارثة ثقافية كبرى، وفى هذا السياق نحاول استعراض الجهود التى بذلت على صعيد المعالجة الآلية للغة العربية والنتائج التى حققتها.



من الملاحظ أن الجهود التى تمت فى هذا المجال كان أغلبها إما مشروعات تجارية من الشركات الخاصة أو مبادرات من المنظمات الأجنبية والغربية، وللأسف غابت الجهات الرسمية وجامعة الدول العربية ومجامع اللغة العربية تقريبا عن الساحة، وفى كتاب الفجوة الرقمية (عالم المعرفة، أغسطس 2005، ص 357-360)، يرى الدكتور نبيل على والدكتورة نادية حجازي، أن نظم معالجة اللغات الطبيعية آليا قد قد قطعت شوطا بعيدا على صعيد اللغة المكتوبة، لكنها لم تحقق نفس التقدم على صعيد اللغة المنطوقة، وقد حققت معالجة اللغة العربية آليـًا نجاحا تكنولوجيا واقتصاديا ملحوظا على مستوى الحرف والكلمة والجملة، غير أن هناك قصور شديد فى اللغة العربية على مستوى الفقرة، كما أن التوجه العام نحو تطبيق الذكاء الاصطناعى ونظم معالجة المعارف يتطلب الارتقاء بمستوى المعالجة إلى وحدة البناء الرئيسية للمعرفة ألا وهى المفهوم حتى يتسنى فهم النصوص العربية آليا والنفاذ إلى عمق مضمونها.


إنجازات المكانز باللغة العربية
رغم أن اللغة العربية من اللغات العالمية الرسمية فى الأمم المتحدة وتحتل المركز الثالث بعد الإنجليزية والفرنسية من حيث عدد الدول الناطقة بها، وتعتبر من خامس اللغات عالمياً من حيث عدد المتحدثين بها، إلا أن الاهتمام العربى نفسه بالمكانز اللغوية مازال ضعيفا، والسبب فى هذا عدم اهتمام الدارسين العرب أنفسهم بعملها. ولا يمكن إنكار فضل بعض الدارسين العرب خارج المنطقة العربية وبعض العلماء فى الجامعات المحلية الذين ينحتون فى الصخر فى هذا الصدد، ويمكن الاطلاع على جدول يحتوى على قائمة بأشهر المكانز الموجودة باللغة العربية فى الرابط: www.comp.leeds.ac.uk/eric/latifa/arabic_corpora.htm وللأسف معظمها من إنشاء جامعات وجهات بحثية أوربية وأجنبية. وفيما يلى نبذة سريعة عن أشهرها:



المكنز الدولى للغة العربية
بدأت مكتبة الإسكندرية التى تقوم بدور ملحوظ فى نشر الثقافة والمعرفة ودعم البحث العلمى فى مشروع كبير لبناء المكنز الدولى للغة العربية International Corpus of Arabic، وهى محاولة حقيقية لبناء مكنز عربى حديث ومتطور يحتوى على 100 مليون كلمة، وقد تم تجميع العينات المكتوبة للغة العربية المعاصرة من مصادر متعددة روعى فيها أن تكون ممثلة لقطاع إقليمى كبير من الدول الناطقة باللغة العربية وعاكسة بشكل حقيقى وواقعى لأنماط استخدام اللغة العربية فى أنحاء العالم العربي.



والمصادر التى اعتمد عليها المكنز الدولى للغة العربية هى الصحف والمجلات العامة والمتخصصة والصحافة الإلكترونية ومقالات الإنترنت والكتب والمصادر الأكاديمية. كما تضمن عدد كبير من الموضوعات مثل العلوم الاستراتيجية والاجتماعية والرياضيات والدين والأدب والإنسانيات والعلوم الطبيعية والتطبيقية من أجل تحقيق شروط التمثيل والانتشار والتوازن فى الحجم والمجالات والمصادر.

مكانز نيملار
يهدف مشروع شبكة موارد اللغات اليورومتوسطية المعروف باسم نيملار NEMLAR موقعه على الويب: www.nemlar.org إلى إنشاء شبكة من الشركاء المؤهلين من منطقة حوض البحر المتوسط لدعم تطوير ذخائر وموارد لغوية عالية الجودة للغة العربية وغيرها من اللغات المحلية بطريقة منهجية معيارية، وتضم الذخائر اللغوية العربية فى مشروع نيملار ثلاث ذخائر أساسية هى مكنز نيملار للعربية المكتوبة ومكنز نيملار للكلام المنطوق والأخبار والإذاعة العربية ومكنز نيملار لتوليف الكلام العربي، وجميع هذه الذخائر مملوكة لاتحاد نيملار. يتكون مكنز نيملار للعربية المكتوبة من 500 ألف كلمة فقط من النصوص العربية المعيارية التى تم تصنيفها فى 13 مجالا مختلفا (أخبار سياسية، نصوص إسلامية، عبارات شائعة، نصوص من نشرات الأخبار والأدب العربى والأخبار العامة والصحافة العلمية والصحافة الرياضية والنصوص القانونية وشروح مواد المعاجم)، وتهدف إلى إنشاء مكنز متوازن يقدم تمثيلا حقيقيا وواقعيا للتنوع فى الخصائص الدلالية والتركيبية والسياقية للغة العربية الحديثة، وتغطى هذه النصوص فترة زمنية من 1990 إلى 2005 .



يتكون مكنز نيملار للكلام والأخبار والإذاعة العربية من نصوص 40 ساعة مسجلة من أربع محطات إذاعية مختلفة، أما مكنز نيملار لتوليف الكلام العربى فقد تم إنتاجه للمساعدة فى بناء أنظمة تحويل النصوص إلى كلام، منطوق.

مكنز العربية الفصحى Classical Arabic Corpus
قام بتجميع هذا المكنز عبد الحميد العوا فى جامعة مانشستر البريطانية، ويحتوى هذا المكنز على 5 ملايين كلمة ويتكون من نصوص تتضمن أبيات شعرية قصيرة بداية من عصر صدر الإسلام حتى القرن الحادى عشر، وتم الحصول على هذه المادة من الإنترنت، وتنقسم أنواع النصوص إلى أربعة مجالات هى الفكر والمعتقدات والأدب واللسانيات والعلوم.

مكنز العربية العلمية العامة General Scientific Arabic Corpus
أشرف على إنشاء هذا المكنز أمين المهنى فى جامعة مانشستر البريطانية، وهدف هذا المكنز دراسة صياغة المصطلحات العلمية والتقنية فى اللغة العربية مع التركيز على المصطلحات المركبة، وأخذت المادة اللغوية من موقع مجلة العلم والتقنية الكويتية، وقد تم تلقيب مليون كلمة من هذا المكنز، وتصل دقة التلقيب إلى 92 %، ويحتوى على 100 ألف وصف.

مكنز العربية المعاصرة المنطوقة Spoken Contemporary Arabic Corpus
يشرف على هذا المكنز الأستاذ دانيال نيومان بجامعة ضرهام البريطانية، وما زال هذا المكنز قيد الإنشاء ويتضمن هذا المكنز عدة مكانز فرعية، منها المكنز العام المنطوق ويتضمن نصوص مقروءة بجانب البث الإذاعى والتليفزيونى والخطب الرسمية والمحاضرات والمقابلات واللقاءات والحوارات والمناقشات والمحادثات العادية والمكنز العام اللا منطوق الذى يتضمن نفس العناصر باستثناء أنها مفرغة ومكتوبة بشكل نصي، وأخيرا المكنز الصوتى (الفونيمي) الذى يضم جملا وأحاديث فى شكل تسلسلى متتابع. ويصل عدد ساعات الكلام فى هذا المكنز إلى 5000 ساعة بما يساوى 50 مليون كلمة.

أشهر برامج المعالجة الآلية للغة العربية
برامج التشكيل والتصحيح الآلي
·  برنامج التشكيل الآلى Arab Diac: يقوم هذا البرنامج الذى أنتجته شركة آر دى آى بتشكيل النص العربى الخام بنسبة دقة تصل إلى 96%، وتعد تكنولوجيا التشكيل الآلى الحجر الأساسى لتقنيات الكلام العربىأو تحويل النصوص إلى كلام منطوق.

·  برنامج صخر للتدقيق الإملائى Sakhr Corrector: يكتشف هذا البرنامج الأخطاء الإملائية العربية والأخطاء الشائعة بالإضافة إلى الأخطاء النحوية.

·  برنامج صخر للتشكيل الآلى Automatic Diacritizer: لأن اللغة العربية لا تحتوى على علامات تشكيل، طورت شركة صخر برنامج المشكل الآلى الذى يقوم بوضع علامات التشكيل من أجل تسهيل عملية تحويل النصوص إلى حديث منطوق. ويعتمد هذا البرنامج على مستويات متعددة من معالجة اللغة تبدأ من المستوى الصرفى وتنتهى بفك لبس معانى الكلمة استنادا إلى البحث الأساسى المكثف فى مجال معالجة اللغات الطبيعية، وقواعد البيانات اللغوية الضخمة التى طورتها صخر، وقد حقق هذا البرنامج نسبة دقة تصل إلى 98%.

برامج تلقيب ووصف أجزاء الكلام
يقصد بتلقيب ووصف أجزاء الكلام Part of Speech Tagging  تمييز الكلمات فى النص وفقا للوحدات اللغوية المعروفة (اسم، فعل، حرف، صفة، ظرف، حال، إلخ) وفقا لتعريفها وسياقها، بجانب توضيح العلاقة النحوية بين الكلمات المتجاورة فى العبارة أو الجملة أو الفقرة. وهذه البرامج تمثل الخطوة الأولى نحو التشكيل الآلى والإعراب الآلى وتحويل النصوص إلى كلام منطوق.

·  برنامج تلقيب أجزاء الكلام العربىArab Tagger : تمثل بطاقات التلقيب Tags لأجزاء الكلام العربى العناصر الأساسية للعديد من العمليات فى معالجة اللغة العربية آليا مثل تحليل التركيب والتشكيل والصرف، وقد صمم هذا البرنامج للتوافق مع الصرف والتركيب العربي، وهى سمة أساسية لهذا البرنامج تميزه عن البرامج المنافسة، وهذا البرنامج من إنتاج شركة آر دى آي.

برامج التحليل الصرفي
وظيفة المحلل الصرفى تحدى جذور الكلمات والمعلومات الصرفية والنحوية وللمحللات الصرفية همية بالغة فى معالجة اللغة الطبيعية، ومشكلة العربية هى غياب علامات التشكيل التى تعد مصدرا أساسيا للبس فى الكلام. ومن المحللات الصرفية:



·  برنامج ArabMorpho: يمثل هذا البرنامج المحرك الأساسى للتحليل الصرفى العربى والوسم أجزاء الكلام والتحليل الدلالى المعجمى العربي. ويحلل هذا البرنامج الوحدات الصرفية والمعجمية باستخدام المقاطع، الأمر الذى يعزز من مرونته ونطاق التغطية فيما بعد 99.8%، ويميزه عن البرامج المنافسة التى تحلل الوحدات الصرفية والمعجمية باستخدام ذخيرة الألفاظ، وفى حالة استنفاد القواعد الصرفية، يتم تطبيق تحليل إحصائى ديناميكى من أجل فك غموض الألفاظ بنسبة دقة تصل إلى 96%. وهو من إنتاج آر دي آي.

·  محلل Beesley Xerox: قام بيزلى بتطوير مولد ومحلل صرفى لاستخدام كأداة مساعدة فى التعليم وكجزء من معالجة اللغات الطبيعية، وهو محلل صرفى من مستويين: المستوى الأول للجذور والقوالب والثانى للزوائد وحروف الجر وأدوات التعريف وأدوات الربط التى ترتبط بالكلمة.

·  برنامج باك وولتر للتحليل الصرفي: يستخدم من قبل الاتحاد الألمانى للبيانات اللغوية لتدوين النصوص العربية، ويحتوى على 77800 جذر تمثل 45 ألف مدخل معجمى ويستخدم المحلل لأغراض الترجمة، لكنه يعانى من خلط العربية بالرومانية ولا يتعرف على علامات الترقيم العربية.

·  برنامج صخر للتحليل الصرفي: أنتجت شركة صخر المحلل الصرفى الذى يقدم التحليل الصرفى الأساسى للنحو العربى ويغطى اللغة العربية المعاصرة والكلاسيكية. يقوم هذا البرنامج بإزالة الزوائد والمقاطع السابقة واللاحقة من أجل الكشف عن الجذر أو الكلمة.

برامج التنقيب فى النصوص
تعمل هذه البرامج على تحليل النصوص اللغوية من أجل تحديد الأفكار الأساسية والوصول إلى المعلومات القيمة وتسهيل عمليات البحث عن المعلومات، وهذه البرامج مصممة للبحث فى نصوص باللغة العربية وتتميز بقدرتها على فك الكلمات العربية إلى أصولها وجذورها من أجل بحث أكثر كفاءة.



·  برنامج صخر لاستخراج الكلمات المفتاحية Sakhr Keywords Extractor: يحلل هذا البرنامج المستندات والوثائق العربية ويحدد عبارات النصوص وعناصر البيانات الأساسية بشكل آلي. يساعد هذا البرنامج الشركات على تحويل عمليات الأعمال الأساسية من خلال تحديد البيانات الهامة فى كميات كبيرة من النصوص ثم يستخرج أهم التفاصيل لاستخدامها فى المؤسسة أو الشركة. تساعد الكلمات المفتاحية فى تصنيف المستندات فى شجرة موضوعات يحددها المستخدم من أجل سهولة التصفح والوصول للمعلومات، كما يساعد على تشبيك الروابط بين المستندات بطريقة ديناميكية، ويقلل الوقت المطلوب فى البحث عن المحتوى.

·  برنامج محرك البحث النصى العربى Swift: عبارة عن محرك بحث اشتقاقى فى النصوص العربية ويمكن إجراء البحث بالجذر اللغوى أو النمط أو مستوى الكلمة، ويستطيع هذا المحرك التعامل مع استعلامات بحث متعددة المسارات، ويتوافق هذا المحرك مع الويب ونظام الويندوز ولينكس وغيرها من أنظمة التشغيل. البرنامج من إنتاج شركة آر دى آي.

·        برنامج Arab Dictions: يقوم هذا البرنامج بتحليل الكلمات العربية إلى وحداتها الصرفية ومن ثم يتم ربط كل الأشكال الصرفية بمادة المعجم المقابلة لها التى تعتمد على الجذر. يحتوى هذا البرنامج على مواد معجمية ثرية تسهل على القراء خاصة المبتدئين فهم النصوص العربية على كل المستويات. البرنامج من إنتاج شركة آر دى آي.

·  محرك صخر التصنيف سراج: هذا المحرك يساعدك على تنظيم وتصنيف المعلومات القيمة بكفاءة ودقة فى شجرة موضوعات منطقية أو فئات المحتوى. ويوظف هذا المحرك برنامج التصحيح الإملائى من أجل تصحيح الأخطاء الشائعة فى النص العربى ومستخرج الكلمات المفتاحية، من أجل تحديد القائمة الأولى للكمات المفتاحية.

·  محرك صخر للتلخيص العربى آليا: يحدد هذا البرنامج الجمل المهمة آليا داخل النص ويعرضها فى شكل ملخص نصى قصير. يسهل هذا البرنامج عليك قراءة الجمل الهامة فقط فى الوثائق والمستندات الطويلة، ويقلل بذلك من الوقت المطلوب لقراءة المستندات بشكل يدوي.

برامج معالجة الكلام المنطوق
وفقا لشركة جارتنر، 92% من كل تفاعلات العملاء تتم عن طريق التليفون، و80% من كل المشكلات غير المحسومة عن طريق الويب تنتقل إلى التليفون. فالكلام أو الحديث المباشر هو الواجهة الطبيعية بين الإنسان والحاسب، فالتطبيقات المزودة بالكلام الآلى تفرغ الموظفين للمهام الأكثر تحقيقا للإيرادات. ومن الممكن ربط تقنيات الكلام بتطبيقات الاستجابة الصوتية التفاعلية مثل مراكز الاتصال وأنظمة الرسائل الموحدة والبريد الناطق وأنظمة مساعدة الأدلة وأنظمة الاتصال الصوتي.

·  برنامج ARAB TALK هذا البرنامج الذى طورته شركة آر دى آى يحول النصوص المكتوبة إلى كلام منطوق ويعتمد على برنامج المشكل الآلى الذى طورته نفس الشركة.

·  برنامج إبصار: عبارة عن حل متكامل للمعاقين بصريا والمكفوفين، ويعتمد على محركات صخر للتعرف الضوئى على الحروف وتحويل النصوص إلى كلام منطوق. يمكن إبصار المكفوفين من قراءة الكتب والمستندات المطبوعة بالإضافة إلى الملفات الإلكترونية الخاصة بهم دون أى مساعدة من الخارج، ويمكنهم كذلك من كتابة النصوص باللغة العربية والإنجليزية بالإضافة إلى حفظ هذه النصوص وطباعتها بلغة بريل.

·  نظم صخر آلو: مظلة تجمع كل تطبيقات صخر المزودة بالكلام، وتعتمد على تكنولوجيا التعرف الآلى على الكلام وتحويل النص إلى كلام منطوق التى طورتها شركة صخر وتقوم هذه النظم بتمييز أسماء الموظفين المطلوب الاتصال بهم وبقراءة رسائل البريد الإلكترونى وتحويل الرسائل النصية عبر المحمول إلى كلام منطوق أو العكس.

برامج الترجمة الآلية
طموح العلماء نحو استخدام الحاسب فى الترجمة الآلية كان السبب فى نشوء علوم وتقنيات المعالجة الآلية واللسانيات الحاسوبية، فقد كانت الترجمة الآلية هى أولى التطبيقات المقترحة للحاسبات، وأثبتت التجربة العملية سذاجة التصورات الأولى التى كانت تتخيل القدرة على ترجمة أى نص بضغطة زر، وبعد مرور خمسين عاما على هذه التصورات وبعد كثير من العرق والدموع تمكن الإنسان من تطوير برامج للترجمة الآلية على قدر كبير من الذكاء والجودة.



·  برنامج جهينة: يعمل هذا البرنامج على مراقبة الأخبار حيث يمسح المئات من مواقع الأخبار العربية والإنجليزية التى تركز على منطقة الشرق الأوسط، ويتيح لك قراءة الأخبار العربية بالإنجليزية، ويستخدم هذا البرنامج محرك صخر للترجمة الآلية ليعرض لك كل المقالات العربية باللغة الإنجليزية.

·  نظام صخر للترجمة للمؤسسات: عبارة عن حل يمكن المستخدم من ترجمة أى جملة أو فقرة أو مستند من العربية إلى الإنجليزية والعكس عن طريق أحدث تقنيات معالجة اللغات آليا، وهو محرك للترجمة الآلية يعتمد على طريقة التحويل الذى يقوم بتحليل كل المستويات اللغوية تحليلا عميقا بهدف فهم النص المدخل ومن ثم حل كل أنواع الغموض واللبس قبل الترجمة.

مواقع الترجمة الآلية على الإنترنت
لأن الإنترنت بلغاتها العديدة أسمى تجسيد للعولمة على جميع المستويات، ولأن الترجمة الآلية هدفها ترجمة النصوص من لغة لأخرى، كان من الطبيعى أن تظهر مواقع الترجمة الآلية على الإنترنت لتلبية الطلب العالمى الكبير للتواصل ونقل المعرفة.



·  موقع ترجم  :www.tarjim.comاستخدمت شركة صخر برمجياتها ومحركات القوية فى الترجمة الآلية فى تقديم خدمة الترجمة الآلية عبر الإنترنت للمشتركين فقط، ويستطيع هذا الموقع ترجمة أى نصوص أو صفحات ويب من الإنجليزية إلى العربية أو العكس بسرعة فائقة مع الحفاظ على تصميم صفحات ومواقع الويب.

·  موقع  :www.tarjem.comموقع للترجمة الآلية للمواقع من الإنجليزية للعربية والعكس، كما يحتوى على قواميس متعددة للغات.

·  خدمة المسبار www.almisbar.com: يتيح لك ترجمة النصوص والمواقع من الإنجليزية للعربية والعكس، ويقدم خيارات لترجمة المختصرات وأسماء الإعلام وإظهار حركات التشكيل.

·  موقع ترجمة جوجل translate.google.com: يعتمد على الترجمة باستخدام الإحصاء ويقدم خدمة الترجمة بين اللغات البلغارية والأسبانية والعربية والإنجليزية والفرنسية والألمانية والسويدية والصينية والروسية والرومانية والبرتغالية والبولندية والنرويجية والكورية والإيطالية والهندية واليونانية.




الخبراء يؤكدون
المعالجة الآلية للغة العربية فى محنة قاسية
يجمع خبراء المعالجة الآلية وهندسة اللغة العرب الذين استطلعنا آراؤهم أو تابعنا بحوثهم ومؤلفاتهم على أن المعالجة الآلية للغة العربية تعيش بالفعل واقعا تعسا تحت ضغوط أزمة عنيفة ومحنة قاسية تهدد وجود ومستقبل اللغة العربية فى عصر العولمة وثقافة الإنترنت وتكنولوجيا المعلومات واقتصاد المعرفة، وهذه الأزمة تجعلها تبدو فى نظر البعض ظلما كما لو كانت غير جديرة بأن تكون لغة العلم والمعرفة، وتتجسد أبرز ملامح هذه المحنة أن الدول العربية والجامعة العربية بلا حضور أو دور ولا تلقى بالا للقضية برمتها، والمحاولات العربية الجارية فى معظمها إن لم تكن كلها محاولات فردية لا تحظى بالدعم، وأغلب المبادرات تتم خارج الوطن العربى فضلا عن غياب الكثير من الأدوات والأسس المطلوبة لدفع جهود المعالجة الآلية للعربية وفى مقدمتها لا غياب معجم عربى حديث يستفيد من المعالجة الآلية وتكنولوجيا المعلومات.


--------------------------------------------------------------------------------

·        أغلب المبادرات تتم خارج الوطن العربى

·        لا يوجد معجم عربى حديث يستفيد من المعالجة الآلية

·        المحاولات العربية فردية لا تحظى بالدعم

·        الدول العربية والجامعة العربية بلا حضور أو دور



حول رأيه فى الواقع الحالى لتقنيات معالجة اللغة العربية آليا، يقول الدكتور خالد الغمرى، أستاذ اللغويات الحاسوبية بكلية الألسن جامعة عين شمس: هناك اهتمام غير مسبوق بمشكلات المعالجة الآلية للغة العربية من جانب العديد من الجامعات والمعاهد والمؤسسات البحثية بالإضافة إلى الشركات- فى العالم كله وعلى وجه الخصوص فى أوروبا وأمريكا الشمالية (الولايات المتحدة وكندا). وقد تمثل هذا الاهتمام فى اتجاهين؛ الأول تعديل التقنيات المتاحة للمعالجة الآلية للغة الإنجليزية وتطويعها للتعامل مع خصوصيات منظومة اللغة العربية. وهذه المحاولات يقوم بها الباحثون فى الدول غير العربية. أم الاتجاه الثانى فى العالم العربى - فهو تصميم وتنفيذ تقنيات نابعة تماما من اللغة العربية. والملاحظ فى التقنيات الناتجة عن هذه الجهود أنها تهتم بصورة كبيرة بمشكلات الصرف العربى مع بعض الاهتمام بجوانب من المعاجم الاليكترونية. وقد نجحت بعض هذه المحاولات فى حل بعض من مشكلات هذين الفرعين. أما مشكلات النحو والدلالة (المعنى) فما زال الاهتمام بها فى بدايته، ومستويات الدقة فى حل هذه المشكلات غير مشجع. ولابد ألا ننسى أن عمر هذا الاهتمام المكثف بالمعالجة الآلية العربية قصير جدا.

تحديث المعاجم العربية القديمة
وعن رأيه فى الواقع الحالى لصناعة المعاجم العربية؟ يقول الدكتور الغمرى أن هناك بعض المحاولات الجادة لصناعة معاجم عربية تخدم محاولات المعالجة الآلية للغة العربية. فهناك على سبيل المثال - مشروع WordNet أو الشبكة الدلالية للكلمات. وللأسف هو مشروع غير عربى. أعتقد أن ما نحتاجه بحق هو تحديث وتطوير لمعاجمنا القديمة حتى تلبى أمرين أساسيين فى معالجة اللغة العربية: الأول هو تحديثها باضافة ما جد من الكلمات إليها، وإضافة المعانى الجديدة لكلمات قديمة. أما الأمر الثانى هو اعادة تصميمها وترتيبها بصوره تسهل استخدامها آليا. ولمجمع اللغة العربية مجموعة من المعاجم المتخصصة المسارد- ثنائية اللغة تنتظر من يستخدمها فى المعالجة الآلية للعربية لبيان نقاط قوتها وأوجه القصور فيها حتى يتم تطويرها لتلبى متطلبات المعالجة الآلية. مشكلة المعاجم عامة أنها تحتاج إلى فريق عمل وتمويل لأنها تستغرق وقتا طويلا وجهدا لايستطيع باحث بمفرده القيام به. بصراحة أنا لا أفهم غياب مشروع عربى كبير لمعجم عربى يلبى متطلبات المعالجة الآلية للغة العربية! كل ما أعرفه جهودا فردية غالبا لاتكتمل فى هذا الاتجاه.



اما عن كيف تسهم الإنترنت فى تطوير صناعة المعاجم العربية؟ فيقول الدكتور خالد الغمرى هذه الجزئية هى ملخص اهتماماتى البحثية فى معالجة العربية. والاسهامات الممكنة للإنترنت فى هذا المجال لا حدود لها. فهى أكبر قاعدة نصوص عرفتها البشرية، ومتاحة للجميع، وتنمو بصورة رهيبة.



فالحجم الهائل للإنترنت كقاعدة نصوص سوف يسهل بصورة كبيرة جمع معلومات لغوية دقيقة ومتنوعة عن كل كلمة أو تركيب لوضعها فى المعجم. هذا الحجم يتيح معلومات دلالية عن الاستخدامات المختلفة للكلمة فى المجالات المختلفة. الأمر الثانى إثراء المعاجم بكلمات جديدة لم تكن موجودة من قبل. الأمر الثالث توفير معلومات عن التباين فى استخدام الكلمات العربية بين الدول العربية. الأمر الرابع وهذا هو ما أركز عليه هو أن حجم الإنترنت يتيح كما كبيرا مما يعرف بالسياقات الثرية لغويا وهى السياقات التى تتضمن معلومات عن السمات اللغوية المختلفة للكلمة: هناك أيضا العديد من الأبحاث التى استخدمت الإنترنت فى إزالة مايسمى باللبس الدلالي، وهو تحديد المعنى المستخدم فى سياق معين. فكلمة مثل القاعدة قد تعنى تنظيم القاعدة أو قاعدة بيانات أو قاعدة عسكرية أو قاعدة نحوية .. إلخ. فهذه الأبحاث مهتمة بتحديد السياقات المختلفة لكل معنى من هذه المعاني. ومعظم الأبحاث فى هذا المجال تحاول استغلال الطريقة التى ينظم بها المحتوى على الإنترنت لحل هذه المشكلة.وتوافر مثل هذه المعلومات كما وكيفا سوف يثرى المعجم العربى بصورة كبيرة.



ويضيف الغمرى ان هناك مشكلات وعقبات تعترض صناعة مكانز اللغة العربية وهى وجود هدف وخطة وفريق عمل وتمويل وحل لمشكلات الملكية الفكرية للنصوص التى تتكون منها المكانز. غير إنه هناك محاولات لبناء مكانز عربية فائقة الحجم ولكنها أيضا محاولات غير عربية.



كتب النحو العربى
ويقترح الغمرى عدة نقاط لتعزيز دور تكنولوجيا المعلومات فى خدمة ونشر اللغة العربية والحفاظ على تراثها، وهى إعادة قراءة كتب النحو العربى القديم وتطويعها لمتطلبات المعالجة الآلية. هناك نظريات حديثة كاملة فى علم اللغة أقرأها ملخصة فى سطر أو سطرين من كتاب نحو عربى قديم. الأمر الثانى الاهتمام بالمعاجم العربية القديمة وتحديثها بالطريقة التى ذكرت. هذه المصادر التراثية كنز لغوى يجب أن نحسن استخدامه. اللغة العربية بها من التراث اللغوى مايفيد تكنولوجيا المعلومات. وتكون الخدمة متبادلة. وعن دور مجمع اللغة العربية فى استغلال إمكانيات تكنولوجيا المعلوم





ملتقى طلاب جامعة دمشق




أنت غير مسجل لدينا.. يمكنك التسجيل الآن.

مشاركة : 6


bachar jammal

جامعـي اســتثنائي





مسجل منذ: 23-01-2009
عدد المشاركات: 622
تقييمات العضو: 13
المتابعون: 12

غير موجود
اشــترك بالتحديثات
رسالة مستعجلة

رد مشاركة : آفاق الترجمة الآلية & الترجمة العلمية

20-05-2010 08:56 PM




نعتذر للتكرار الذي قد يوجد بين بعض المنقولات

وهذه محاضرة نشرها مجمع اللغة العربية الأردني في 5-2010




المحاضرة الرابعة

اللغة العربية والترجمة الآلية

الأستاذ الدكتور محمد الصرايرة

قسم اللغة الإنجليزية- جامعة اليرموك

الثلاثاء 22 صفر 1422 هـ- 15 أيار 2001م







مقدمة

أدت الثورة التقنية إلى تطوير حقول المعرفة بشكل عام. وأخذ اعتماد الإنسان على الآلة يزداد يوماً بعد يوم، بل صار إدخال الآلة في عمله من مظاهر التقدم، بينما يعتبر غير ذلك من مظاهر التخلف وضعف الإنتاج. فلا يخفى ما لدخول الآلة في عملية الإنتاج من إيجابيات تتلخص في سرعة الإنجاز ووفرته ودقته. ولم تجد الآلة تحدياً كبيراً في الدخول إلى المصانع، أياً كان نوعها، وتحقيق نجاح باهر في أدائها، بل لعل ذلك أصبح الآن أمراً ضرورياً. ومن الأجهزة التي دفعت بالتقنيات نوعاً وكما هو الحاسوب، الذي يعتبر قمة نتاج البشر حتى الآن، فلا تكاد صناعة أو طريقة عمل تخلو منه. إلا أن المجال الذي يشكل تحدياً لهذا الجهاز هو مجال اللغة، بمحاكاة عمل العقل البشري بالتعامل معها، وخاصة في مجال الترجمة, لأن التعامل هنا يزداد تعقيداً بعدد اللغات المشمولة في عملية الترجمة.

ومع أن الإنسان لا يزال يعتمد على قدراته الذاتية في إنجاز أعمال الترجمة بين اللغات المختلفة، إلا إن الثورة التقنية وتطوير الحاسوب أدى إلى التفكير جدياً في إدخال الحوسبة إلى الترجمة، بما يعرف بالترجمة الآلية Machine Translation (MT) أو بمفهومها الآخر، بشيء من الاختلاف في درجة استخدام الحاسوب في الترجمة، Computer Aided Translation (CAT). وهذا أمر يعتمد على عدة عوامل لقيامه أولاً ثم نجاحه. الأمر الأول هو تطوير الجهاز إلى درجة تمكنه من التعامل مع اللغات في هذا المجال، أما الأمر الثاني فهو إعداد اللغات بشكل يتيح للحاسوب التعامل معها. وتشكل الترجمة أكبر التحديات للحاسوب في مجال اللغات البشرية، وذلك لسبب بسيط هو إن التعامل مع اللغة البشرية أمر يعتمد على الملكة العقلية للبشر، وهذه ليست عملاً آلياً كما هو الشأن في الأمور الأخرى, كعمليات التصنيع وتسيير المركبات بمختلف أنواعها, التي أظهر الحاسوب قدرة هائلة عليها. وقد عبرإلياس (1994) عن ذلك بقوله:

One parameter would be agent. The human translator was until recently the only agent, and one capable of extremely skilful work, such as the translation of poetry. The key advantage of humans is their enormous range and flexibility in making the decisions translation demands.

(Ilyas, 1994: 47)

ولا أريد أن أخوض في مجال إمكانية الترجمة من عدمها. فقد أشبعت هذه الفكرة بحثاً وجدلاً عن الترجمة ككل، ناهيك عن الترجمة الآلية ذاتها. ومع أن الكثيرين ما يزالون يشككون بقدرة الحاسوب على الترجمة، إلا أن الأمل ما يزال يساور آخرين بإمكانية التوصل إلى الترجمة الآلية. وقد يبنى هذا الأمل على أن أي شيء يبدأ متعثراً وبسيطاً، ولكن مع المثابرة على التطوير يمكن الوصول به إلى مراتب متقدمة. فمثلاً أين طائرة اليوم من تلك التي صممها الأخوان رايت في مطلع القرن العشرين؟ مع أن الفكرة الأساسية لا تختلف. والمهم هنا هو البداية وتحسس أماكن القوة لتطويرها وأماكن الضعف لمعالجتها. وقد بدأت بعض المشاريع المتواضعة في الترجمة الآلية، التي يمكن تطويرها إلى مستويات أفضل. وقد وصل الأوروبيون إلى مستوى مقبول في الترجمة الآلية في برنامج() Infoterm الذي جاء من الحاجة إلى وسيلة سريعة لنقل المعرفة بين اللغات الأوروبية، خاصة بعد قيام الاتحاد الأوروبي.

إلا إننا يجب أن نعرف المطلوب (تحديد الهدف) من الترجمة الآلية حتى نستطيع الجزم أولا بإمكانية تحقيقها، قبل الشروع بها. فهل نريد من الحاسوب أن ينقل النصوص المعلوماتية (كما هي الحال في الترجمة التقنية)، أم النصوص الأدبية؟ إذ إن جدلية من يقول بعدم إمكانية الترجمة الآلية ترتكز أساساً على الحديث عن النوع الثاني من النصوص، أي الأدبية. أما جدلية من يقول بإمكانيتها فترتكز أساساً على النوع الأول من النصوص. وهناك، كما هو معروف، فروق شاسعة بين النوعين، لعل أهمها أن النوع الثاني إبداع فكري جمالي (Aesthetic Art), للغة فيه دور أكبر من أنها وعاء لنقل المعلومة، بل إن التعامل مع تراكيب اللغة ذاتها من أهداف مبدع النص، وهذا ليس كذلك في الـنوع الأول مـن الـنصوص، الذي يهــدف فيه الكاتب إلى استـخدام اللغة لـنقل



فكرة معينة، أو معلومة، ليس إلا. () وحتى نحافظ على التفاؤل بتطوير الترجمة الآلية، فإن المطلوب منها هنا هو التعامل مع النوع الأول من النصوص وليس الثاني.إذ لا نتوقع أن يصل بنا الأمل الآن إلى أننا إذا غذينا الحاسوب بقصيدة جون ملتون "الفردوس المفقود" فإنه سيخرجها لنا معلقة عصماء باللغة العربية. وحتى بالنسبة للنوع الأول من النصوص، فليس من الحكمة أن يصل تفاؤلنا إلى أن الآلة ستتولى الترجمة من ألفها إلى يائها بدون تدخل بشري. إذ لا يتجاوز دورها حتى الآن خفض الجهد بنسبة معينة، إذ يصعب على الآلة حتى الآن القيام بعمل يتطلب ملكة عقلية لا يمكن الآن برمجتها بشكل دقيق. وهذا ما ذهب إليه W. Wilss بقوله:

Machine-translation research has taught us that, apart from standardized transfer operations in the routine translation of strictly formatted texts, translation problems cannot be solved by conventional algorithms in any encompassing way. Translation problems typically call for cognitive insights, heuristic procedures, and multiple stages, that do not operate by predetermined standards and algorithms.

(Wilss, 1994: 41)

وتتعزز هذه الفكرة بقول Rey :

. . . computer technology borrows its procedures from neurophysiology, trying to copy the functions of the brain; while being far from achieving this objective, it has achieved slow and partial successes.

(Rey, 1995: 115)

وعلى هذا الأساس أجري هذا البحث، وعليه سيجرى البحثان اللاحقان: الإعداد النحوي، والإعداد الصرفي.

أولاً: خصائص الإعداد الدلالي

لا بد عند الإعداد الدلالي للغة من تحديد العلاقات الدلالية بين المفردات، أو على وجه الدقة بين مجموعات المفاهيم من جهة، وبين المفاهيم في المجموعة الواحدة من جهة أخرى. وهذا يشمل المفاهيم التي تخص حقلاً معيناً، مثل الرياضيات، وعلاقتها بالحقول الأخرى مثل الجبر والهندسة وغيرها، وهكذا. وينطبق هذا على الحقول الأخرى، أي التي لا تنتمي إلى تخصصات أكاديمية. فمثلاً مفهوم "همس" بين المفردات "تكلم" و "صرخ" إلخ، وهي في نطاق دلالي واحد يخص الاتصال الشفوي بين الناس؛ أما "همس" في عبارة مثل "همس النسيم بين الأشجار" فإن لهذا المفهوم صفات دلالية تختلف عن تلك التي وردت له كنوع من الاتصال الشفوي البشري.

العلاقات الدلالية للمفردات

ويكون ذلك بإعداد ملفات أو حقول حسب المتطلبات التالية:

1. تحليل المفهوم

لا بد من الوقوف على كنه المفهوم وما يتفرع عنه من ظلال في المعنى، وخاصة المجازية منها وغيرها، وذلك حتى تتحدد العلاقة بين هذا المفهوم الأساس وفروعه وبين المفاهيم التي يمكن أن تتصل به بشكل أو بآخر، أي العلاقة بينه وبين مجموعات المفاهيم الأخرى، وذلك للوصول في النهاية إلى الجملة أو شبه الجملة. وإن الدقة في هذا المجال تقلل من حالات الترجمة السخيفة بسبب عدم وضوح العلاقة بين مفردات (أو مفاهيم) الجملة (أو شبه الجملة) الأصل، وكذلك الجملة (أو شبه الجملة) الناتجة عن عملية الترجمة. وبعبارة أخرى، فإن الهدف ليس إعداد مسارد مفردات وما يقابلها، وإنما إدراج المفردات في علائق دلالية ليكون بالإمكان الوصول إلى ترجمات باعتبار مضمون النص وليس معاني مفرداته. إذ إن المفهوم السائد في الترجمة بشكل عام هو أن معنى نص معين (جملة أو شبه جملة) ليس حصيلة جمع معاني مفرداته، وإنما تفاعل هذه المفردات لإعطاء معنى. ولا بد، أيضاً، من أخذ الخصائص الصرفية والنحوية للمفردات بعين الاعتبار، إلى جانب الخصائص الدلالية، للوصول إلى أفضل النتائج، وتطوير قواميس آلية خاصة على هذا الأساس. فالعلاقة هنا ليست رياضية متعلقة بمفردات ومقابلاتها، وإنما تعتمد أيضاً على الخصائص التي ذكرتها. والهدف المنشود، إذن، هو الحصول على ذات المعنى وإن اختلفت المفردات التي تعطيه بلغة أخرى. والاقتباس التالي يؤيد ذلك.

The very act of putting this conceptual network into a computer takes the machine a long way toward "understanding" natural language. For example, to figure out that "Please arrange for a meeting with John at 11 o'clock" means the same thing as "Make an appointment with John at 11," the computer simply has to parse the two sentences and show that they both map to the same logical structures in MindNet. "It's not perfect grokking," Jensen concedes. "But it's a darn good first step."

MindNet() also promises to be a powerful tool for machine translation, Jensen says. The idea is to have MindNet create separate conceptual webs for English and another language, Spanish, for example, and then align the webs so that the English logical forms match their Spanish equivalents. MindNet then annotates these matched logical forms with data from the English-Spanish translation memory, so that translation can proceed smoothly in either direction.

(Jensen, 2001)

وتقول (Jensen) إن الوصول إلى هذا الهدف ليس سهلاً، خاصة بالنسبة للغات الطبيعية. وقد نعزي تلك الصعوبة إلى تعقيد العلاقات بين مجموعات مفاهيمها من ناحية، والاستخدام المجازي لهذه المفردات من ناحية أخرى، ناهيك عن حالة التغير المستمرة في اللغات الطبيعية الحية.

1.1العلاقة ما بين المفهوم والتعريف والمفردة

هناك الملايين من الأجسام في العالم، منها المادي ومنها المجرد. وعندما يخطر ببالنا جسم معين، مثل تفاحة، فإن عددا من الخصائص التي تميز ذلك الجسم عن غيره تقفز إلى الذهن. ومجموع هذه الخصائص تكون وحدة ذهنية هي المفهوم الدال على ذلك الجسم أو مجموعة الأجسام التي تنتمي إلى ذلك المفهوم، وفي مثالنا هنا التفاح بأنواعه المختلفة من حيث اللون والحجم والشكل.

فالمفهوم الذي يرتبط بجسم واحد بعينه، أو يدل عليه، هو مفهوم إفرادي، مثل "المريخ." أما إذا ارتبط المفهوم بعدة أجسام بينها نوع من التجانس الذي يضعها في مجموعة واحدة، فإن المفهوم يكون عاماً (بمعناها الضيق هنا)، مثل "كوكب." فهذا المفهوم يدل على جميع الأجسام التي تنطبق عليها خصائص المفهوم "كوكب" ومنها "المريخ." والمفاهيم صور ذهنية مجردة، ولذلك، ومن أجل الحديث عنها في أي مضمون، لا بد من تعريفها والتدليل عليها بمفردة معينة. والتعريف هو جملة تصف المفهوم، والمفردة هي الكلمة التي تعبر عنه. ومع أن لمعظم المفاهيم مفردة واحدة، إلا أن هناك مفاهيم تتطلب أكثر من مفردة للدلالة عليها.

1.2 تعريف المفهوم

ويقصد به الوصف الذي يبين المفهوم ويبرزه ما بين المفاهيم الأخرى، وخاصة تلك التي تقع في نطاقه الدلالي (أي المفاهيم التي تنتمي إلى مجموعة معينة، مثل "قميص" بين الأنواع المختلفة مما يلبس الإنسان). ومع أن هناك اختلافات بين مستخدمي اللغة الواحدة على تعريف بعض المفاهيم، إلا إنه لا بد من تعريفها بشكل دقيق، لأن التعامل الآلي لا يقبل التقريبات. ويذهب بعض المعجميين المهتمين في هذا المجال إلى القول بأن نوعية النتاج المعجمي المعرفي تعتمد بشكل أساسي على نوعية التعريف ودقته. وقد يشمل ذلك المترادفات أيضاً؛ إذ يشيع في وسط الترجمة أنه لا يوجد مترادفات بشكل كامل، اللهم إلا إذا كنا نتحدث عن مستويات مختلفة للغة واحدة، أي اللهجات، وليس هذا مجال اهتمامنا، لأن التركيز في حالة اللغة العربية هو على ما يتعارف علية بالعربية المعيارية (Standard Arabic)، وإن كانت هي الأخرى لا تخلو من مثل هذه المشاكل، باختلاف البلدان العربية.





1.2.1أنواع التعريف

هناك نوعان من التعريف يستخدمان لوصف مفردات (مفاهيم) اللغة

1.2.1.1التعريف المركّز (Intensional Definition)

يتحقق هذا النوع من التعريف بذكر الخصائص التي تميز مفهوما معينا من غيره. وهذا النوع مفيد لأنه يختار الخصائص المميزة من العديد منها، والتي إن ذكرت كلها جعلت التعريف عصياً على الفهم، بسبب كثرة تلك الخصائص. وتهمل هنا الخصائص التي يستدل عليها من الخصائص الأخرى (redundant). ولذلك فإن هذا النوع من التعريف يضع المفهوم في مضمونه الصحيح بين المفاهيم المماثلة. فمثلاً يضع مفهوم "البرتقالة" بين الفواكه، و"عصيرة البرتقال" بين أمثاله من عصائر الفواكه وغيرها مما له عصير(Same Semantic Domain). ولذا يحافظ على الخصائص الدلالية المميزة للمفهوم بين المفاهيم ذات العلاقة (Semantic Distinctive Features)، وأيضا يحفظ خطوط الارتباط الدلالي مع مجموعات المفاهيم التي ترتبط به بعلاقة دلالية ما(Related Semantic Domain). ويمكننا أيضاً إعطاء مثال آخر على هذا النوع: "الغاز النبيل" على أنه "ذلك الغاز الذي يبقى خاملا كيميائيا في حالته الطبيعية."

1.2.1.2التعريف الموسع (Extensional Definition)

يختلف هذا النوع من التعريف عن سابقه بأنه، بدلا من إعطاء خصائص دلالية للمفاهيم، يضع الأجسام التي يشملها المفهوم موضوع التعريف في قوائم. وتشترك هذه الأجسام في خصائص معينة. ويمكن النظر إلى مفهوم "الغاز النبيل" الذي ذكرناه كمثال على النوع الأول من التعريف من هذه الزاوية أيضاً. فنقول "الغاز النبيل هو: الهيليوم، أوالنيون، أوالأرغون، أوالزنون، أو الكريبتون." فهذه الغازات جميعها تشترك في الخصائص المذكورة التي يشملها مفهوم واحد.

1.2.2 الطبيعة النمطية للتعريف

(Systematic Nature of Definition)

من المعروف أن الوضوح في التواصل يتطلب وصفاً واضحاً للمفاهيم والعلاقات والاختلافات في ما بينها. لذلك، فإن من الضروري معرفة كيف ينسجم المفهوم في نظامه عند محاولة وضع تعريف لذلك المفهوم.

وفي أنظمة المفاهيم العامة (Generic Concept Systems)، فإن التعريفات المركزة تبنى دائما على المفهوم التابع للأقرب لها. ثم توضع الخصائص المحددة لتبين العلاقة بين المفاهيم الرئيسية والتابعة من جهة وبينها وبين المفاهيم التي تناظرها من جهة أخرى.

أما في أنظمة المفاهيم الجزئية (Partitive Concept Systems) فإن العلاقة بين المفهوم الرئيسي والتابع تظهر فقط في أحد تعريفات المفهوم. فمثلا تعرف "السنة" على أنها "الفترة الزمنية اللازمة لتدور فيها الأرض حول الشمس دورة كاملة." أما تعريف "الفصل" فيكون "تلك الفترة الزمنية من السنة التي تتميز بظروف مناخية متشابهة."

وأما بالنسبة للعلاقة الارتباطية، فإن التعريف المركز يبدأ عادة بعبارة عامة تمثل مفهوما رئيسياً عاماً يتبعه خصائص تبين العلاقة الارتباطية.

1.2.3 دقة التعريف (Conciseness of Definition)

يجب أن تكون المفاهيم مختصرة قدر الإمكان. والمفاهيم المعدة بعناية تحتوي على المعلومات اللازمة لوضع المفهوم بشكل صحيح في نظام المفاهيم، ويجب وضع أية معلومات إضافية أو أمثلة في ملاحظة، والتي قد تكون مثلاً أهم الصفات غير المهمة، أو قائمة بالأشياء التي تندرج تحت امتداد مفهوم ما.

ويمكن أخذ المثال التالي على تعريف تنقصه الدقة: شجرة دائمة الخضرة: هي شجرة تحتفظ بأوراقها في الفصل البارد عند خطوط عرض معينة حيث تبدو مثل هذه الفصول منتظمة، ولكنها قد تفقد أوراقها في مناخ أكثر برودة، أو أنها شجرة تنمو في مناخ ليس له فصول متتابعة واضحة.

وقد يصوب هذا التعريف ليكون دقيقا على النحو التالي: شجرة دائمة الخضرة: هي شجرة تحتفظ بأوراقها طوال العام. ملاحظة: فيما إذا كانت الشجرة قادرة على الاحتفاظ بأوراقها، وبالتالي تصنف على أنها دائمة الخضرة، فأن ذلك يعتمد على المناخ الذي تعيش فيه.

1.2.4 مبدأ الإحلال (أو التعويض) (Principle of Substitution)

تحل العبارات والتعريفات محل بعضها في النصوص. وهذا يعني أنه، عند الضرورة، يمكن لتعريف أن يحل محل عبارة، مع إمكانية إجراء تعديلات طفيفة على النص. وتجرى هذه العملية لاختبار صحة التعريف وذلك بوضعه في محل العبارة التي يصفها، ثم ينظر فيما إذا حدث تغيير في معنى النص أو بقي كما هو.

1.2.5 التعريف المَعيب (Deficient Definition)

هناك ثلاثة أنماط من هذا النوع من التعريف، نوجزها في ما يلي:

1.2.5.1 التعريف المدور (Circular Definition)

يحدث هذا النوع من التعريف المعيب عندما يعرف مفهوم بنفسه بشكل مباشر أو غير مباشر. وهذا التعريف لا يزيد الباحث عنه أي فهم. ويقع هذا التعريف في نوعين هما:

أ‌- ضمن تعريف مفرد

يكون ذلك عندما يكرر المفهوم على أنه المفهوم الرئيسي، أو أنه أحد الخصائص في التعريف.

مثال 1: الماء هو الماء.

مثال 2: شجرة دائمة الخضرة: هي شجرة ذات أوراق دائمة الخضرة.

ب- ضمن نظام مفاهيم

هنا يعرف مفهومان أو أكثر كل منهما بالآخر.

مثال 1: غابة عذراء: هي الغابة التي تتكون من مجموعة أشجار طبيعية.

مثال 2: مجموعة أشجار طبيعية: هي مجموعة أشجار تنمو في غابة عذراء.

مثال 2 مصوباً: هي مجموعة أشجار تنمو بدون تدخل الإنسان.

1.2.5.2 التعريف السلبي (Negative Definition)

في الأساس يصف التعريف كنه المفهوم بما يتوفر فيه من صفات، وليس بما لا ينطبق عليه من صفات. إلا أن بعض المفاهيم تتطلب هذا النوع من التعريف (أي التعريف السلبي)، وذلك لأن نقص صفة معينة من الصفات التي تكون ذلك المفهوم سمة مهمة فيه، تميزه عن غيره من المفاهيم.

مثال على تعريف سلبي غير مقبول:

شجرة متساقطة الأوراق: هي شجرة غير تلك دائمة الخضرة.

والأولى أن يكون التعريف كما يلي: هي شجرة تفقد أوراقها (خضرتها) حولياً.

مثال على تعريف سلبي مقبول:

مادة غير غذائية: مادة لا تستعمل كغذاء.

1.2.5.3 التعريف الناقص (Incomplete Definition)

يجب أن يكون التعريف دقيقاً في وصف المفهوم الذي يرتبط به حتى يكون مفيدا. وبذلك يجب أن لا يكون واسعاً أكثر مما يجب، أي أن لا يشمل غير المفهوم المقصود منه. وكذلك أن لا يكون ضيقا، فيخرج بعض عناصر المفهوم الذي يصفه من ذلك المفهوم. ولذلك فإن هذا النوع من التعريف يشمل نمطين هما:

1.2.5.3.1 التعريف الفضفاض (Broad Definition)

ويكون التعريف فضفاضاً إذا لم يحو المعلومات (الخصائص) اللازمة لتحديد المفهوم الذي يصفه.

مثال: شجرة: هي نبات طويل يعمر لعدة سنين.

والمشكلة في هذا التعريف هي أنه يشمل نباتات بهذا الوصف ولكنها لا تعتبر أشجاراً، مثل النباتات المتسلقة، فهي طويلة وتعمر عدة سنين ولكنها ليست أشجاراً. ولذلك يجب أن يصوب التعريف بإضافة صفة مهمة للشجرة وهي أن لها ساقاً تحملها. وبذلك فإن النباتات التي لا تنطبق عليها هذه الصفة (أي ساق تحمل النبتة) تخرج منه.





1.2.5.3.2 التعريف الضيق (Narrow Definition)

يكون التعريف ضيقاً إذا اشتمل على صفات من شأنها أن تستثني بعض عناصر المفهوم التي تكون جزءاً منه. وهذا ينطبق أيضا على التعريف الذي يوضع بشكل يجعله صادقاً فقط على مجموعة منه ويستثنى مجموعة أخرى يجب أن يشتمل عليها. ()

مثال على تعريف ضيق:

الخصوبة الجنسية: هي قدرة الشجرة على التكاثر.

والمشكلة هنا هي أن هذا التعريف يستثني أحياء لها القدرة على التكاثر، ويحصر الخاصية في الشجرة.

ويمكن تعديل التعريف على النحو التالي:

الخصوبة الجنسية: هي القدرة على التكاثر.

وعلى هذا الأساس لا ينصح بتعريف شئ عام على أنه جزء من جسم (أو مفهوم) واحد. مثل تعريف "العجلة" على أنها جزء من الدراجة الهوائية فقط، وذلك لأنها تشكل جزءاً من مفاهيم غير الدراجة الهوائية. وهنا ينصح بتعريف العجلة بأدائها وليس بالجسم الذي توجد فيه.

1.2.5.3.3 التعريف الموسع الناقص

(Incomplete Extensional Definition)

يجب في حالة التعريف الموسع وضع قائمة للأجسام التي يشملها المفهوم الذي يصفه هذا النوع من التعريف. ويجب تجنب عبارة مثل الخ في مثل هذه القوائم عندما نحضرها للاستخدام الآلي، والسبب أن الآلة لا تعرف بقية القائمة من تلقاء ذاتها.

1.2.5.3.4 التعريف الداخل في آخر

(Hidden Definition within Another)

يجب أن يصف التعريف مفهوماً واحداً فقط. وإذا كان لا بد من أن يتعرض التعريف لأكثر من مفهوم، فيجب أن يوضع كل مفهوم في فقرة إدخال منفصلة، طالما أن للمفاهيم الأخرى صلة بحقل الموضوع الذي يتعامل التعريف معه.

كما إنه لا يجوز أن تفسر العبارات المستخدمة في التعريف داخل التعريف ذاته. وبذلك فإن التعريف يصف فقط المفاهيم التي تعد لمستخدم معين، أو تلك التي قد عرفت في مكان آخر من المشروع.

مثال: شجرة: هي نبات له جذع صلب يحمله وفروع، وهي تفرعات تنمو من الجذع، وتعيش لعدة سنوات.

والشكلة هنا، في الواقع، نوعان: الأول أن تعريف الشجرة يحتوي تعريف مفهوم آخر هو الفرع. والثاني أن تعريف الفرع جاء مقاطعاً لتعريف الشجرة. وقد يظن أن عبارة "وتعيش لعدة سنوات: تعود على الفروع مباشرة، وليس تابعة لتعريف الشجرة.

2. العبارات (Terms or Signifiers)

لقد ورد في مرحلة سابقة من هذا العرض أنه لا بد من استخدام عبارات للتدليل على المفاهيم المعرفة. إذ بدون هذه العبارات فإن المستخدم، سواء كان أنساناً أم آلة، لا يستطيع استخدام المفهوم، لأنه بدون المفردة كأنه لا وجود له. ومن ناحية أخرى فإن عدم وجود عبارة محددة يفتح المجال أمام الاجتهاد لعدد من المستخدمين، وهذا بدوره يؤدي إلى تعدد العبارات التي تدل على مفهوم واحد، الأمر الذي سيخلق نوعاً من الإرباك عند وروده في نصوص مختلفة بصور مختلفة. وتسمى هذه الحالة في مجال الترجمة "عدم الثبات" (Inconsistency). وهي حالة لا يحبذ وجودها في الترجمة التقنية بالذات. وتبدو هذا التعدد كظاهرة عندما يتعلق الأمر مثلا بالأدوات، فهي تأخذ أسماء متعددة حسب المجال الحرفي الذي تستعمل فيه. وقد أشار (Diderot) إلى ذلك بقوله:

The language of crafts is grossly inadequate for two reasons: the scarcity of suitable words and the abundance of synonyms . . . In the language of crafts, a hammer pincers, an auger, a shovel, etc. have almost as many names as there are crafts.

(Diderot, 1969)

3. أنواع العبارات (Types of Terms or Signifiers)

قد تتكون العبارة من مفردة واحدة مثل "العولمة،" وقد تتكون من مركب مثل "رأس مال" أو "عبد الله" أو عدة مفردات مثل "معدات شبكة رقمية." ويمكن هنا الإشارة، بدون توسع إلى الطرق المستخدمة، مثلاً، في حالة استيراد مفاهيم من لغة إلى لغة أخرى. فقد تجلب العبارة الأجنبية مع المفهوم، كما في "ستوديو" باللغة العربية، أو أن مفردة تشتق من أخرى للدلالة على المفهوم الجديد مثل "حاسوب" أو تستعمل كلمة موجودة مثل "سيارة" أو تعرف بعدة مفردات، مثل "جهاز مراقبة"، وهكذا.

4. متطلبات اختيار العبارات وتشكيلها

(Requirements of Selection and Formation of Terms)

يجب أن تكون العبارة المختارة للدلالة على أي مفهوم سليمة لغوياً. وهذا يتطلب أن تراعي هذه المفردة قواعد النظام الصرفي والنظام الصوتي في اللغة. وعلاوة على ذلك فإنه لا بد من أن تظهر في المفردة بعض خصائص المفهوم التي تعبر عنه، أي العلاقة ما بين المفردة وكنه المفهوم. كما يجب أن تكون العبارة قصيرة قدر الإمكان، وتسمح، على الأقل في معظم الحالات، باشتقاق عبارات أخرى منها لتلبي حاجات المستخدم للدلالة على الحدث (اشتقاق الفعل) للدلالة على التسبب (اشتقاق الفاعل)، وهكذا() .

5. العبارات المفضلة (Preferred Terms)

ترادف العبارات من صفات اللغات الطبيعية. ولكن عند دخول مفهوم جديد إلى لغة ما، فيجب استخدام واحدة من هذه المترادفات لتعبر عنه، وليس أياً من المفردات المترادفة الأخرى، وذلك من أجل عدم إرباك المستخدمين لها. وإن تطلب الأمر استخدام أكثر من مفردة واحدة لمفهوم واحد، فيجب الإشارة إلى ذلك، مع أن هذا أمر مستقبح في هذا الباب. وعادة ما توضع قوائم بالعبارات المسموح بها للتعبير عن مفهوم معين. وهنا تجب الإشارة إلى خطأ شائع في هذا المجال وهو تعمد استخدام المرادفات لتجنب التكرار، ولو كان ذلك على حساب المعنى. ويعزو الصرايرة (1994) ذلك إلى الأسباب التالية:

Many factors probably contribute: the lack of standardization across different Arab countries or even inside one country; the translator's inattention or unfamiliarity with a technical field; or even the mistaken idea that 'stylistic variation' should be achieved through 'the use of different terms for the same referent' by means of 'purposeful verbal avoidance' (De Ward & Nida, 1986).

(Saraireh, 1994: 80)

وينطبق هذا على المختصرات أيضا. فهي إما أن تكون من ضمن المرادفات المسموح بها، أو إنها هي المفردات المعتمدة أولاً، مثل "الأنروا" أو "دي دي تي" وهكذا، لأنها هي الأكثر شيوعاً في هذه الحالات. أما بالنسبة للشكل الكامل، فإنه يوضع مع المرادفات كخيار ممكن، إن أراد المستخدم استعماله. وكثيراً ما تكون المفردات التي على ألسن المستخدمين لها في حقل ما افضل من تلك التي يعينها مختصون لغويون بعيدون عن ميدان استخدامها. ولذلك يفضل إجراء مسح للمفردات المتداولة واستخدام ما يمكن منها، أو إجراء تعديل على بعضها لتكون مناسبة، فإن ذلك أفضل من توظيف مفردة لا يستسيغها المستخدم، وبذلك لن تجد طريقها إلى الحياة العملية في حقلها.

6. مواءمة المفاهيم والعبارت

(Harmonization of Concepts and Terms)

نحتاج إلى هذه الخطوة للمواءمة بين العبارات والمفاهيم بين مختلف حقول الموضوعات في اللغة الواحدة وبين اللغات المختلفة. والهدف من المواءمة هو خفض أو القضاء على الاختلافات الصغيرة فيما بين مفهومين أو أكثر بينها علاقة. وتعتبر الموائمة بين المفاهيم من أهم خصائص عملية التوحيد القياسي (Standardization).

6.1 مواءمة المفاهيم وانظمة المفاهيم

(Harmonization of Concepts and Concept Systems)

تتطلب عملية مواءمة المفاهيم وجود مقارنة بين أنظمة المفاهيم المختلفة. إلا إنها لن تتطلب وجود عملية نقل مباشر لنظام مفهوم من لغة إلى أخرى. ومن أجل إقامة موائمة فإن جميع الأنظمة المتوفرة ستقارن، بغض النظر عن أصلها اللغوي، أي سواء أكانت خضعت لعملية توحيد قياسي داخل لغة الأمة أم كان ذلك على مستوى عالمي. ولعله من المفيد أن لا يقتصر التحليل على اللغات الرسمية فقط، فقد يوجد في المستويات اللغوية الأخرى ما ينفع في علمية الموائمة ككل.

6.2 مواءمة العبارات وانظمة العبارات

(Harmonization of Terms and Term Systems)

لا تكون مواءمة العبارات والأنظمة العبارات ذات دلالة إلا بعد إجراء مواءمة المفهوم. إذ من المهم، خلال عملية المواءمة، أن لا يضلل المرء بتشابه المفاهيم الظاهري. ويجب، خلال عملية المواءمة هذه، أن لا يكون هناك ضغط على اللغات حتى تتبنى عملية تشكيل عبارة غريبة على نظامها الصرفي أو الصوتي. والأولى أن نجد في اللغة الطريقة السليمة صرفاً وصوتاً لإيجاد عبارة نعبر فيها عن المفهوم الذي نتعامل معه. وهذا لا يمنع محاولة إيجاد مقابلات بطريقة واحد إلى واحد، ولكن بدون الالتفاف على قواعد اللغة الصرفية أو الصوتية من جهة أو إجهاد نظامها الدلالي من أجل ذلك. إذ لا بأس من تحديد مجموعة من المفردات لتشكل عبارة تشير إلى مفهوم معين.

07 مراحل مشروع المصطلحات الفنية

Phases of a Terminology Project))

تقدم القائمة التالية مقترحاً استرشادياً لمثل هذا المشروع. وهو مستقى من خبرة من قام بإعداد مشاريع مشابهة. ويمكن للمتصدي لهكذا مشروع أن يأخذ به أو يعدل عليه حسب حاجته. وذلك لأن اللغات تختلف في متطلباتها عن بعضها بعضاً، فليس كل ما يصلح العمل به في اللغة الإنجليزية، مثلاً، يصلح أيضاً في اللغة العربية أو غيرها.

· تقييم الحاجات وتحديدها.

· تحديد المجموعة المستهدفة.

· التعرف على المفاهيم.

· جمع المعلومات وتسجيلها.

· إنشاء قائمة العبارات.

· إنشاء أنظمة المفاهيم.

· صياغة التعريفات.

· اختيار العبارات وصياغتها.

· مراجعة المفاهيم.

يراعى هنا حقيقة أن بعض هذه المراحل تتداخل.



7.1 فريق العمل (Working Group)

يبدو من خبرة من عمل في هذا المجال أن العدد المثالي للمجموعة هو ما بين خمسة إلى ثمانية أفراد. ويجب أن يكون من بين هؤلاء الأعضاء من لهم الخبرة الكافية في العمل بالمصطلحات الفنية. وعند الحديث عن فريق العمل فإن الفكرة هنا أن يكون فيه أعضاء يكملون بعضهم في شتى الاهتمامات المطلوبة لإنجاز مثل هذا العمل. فمثل هذه التركيبة من شأنها تسريع العمل وتحسين نوعيته وتقليل الأخطاء.

7.2 تعيين الموضوع (Subject Delimitation)

يجب تعيين حقل الموضوع حسب الهدف من المفردات وحاجات مجموعتها. وهذا التحديد يتطلب وصفاً تفصيلياً لحقل الموضوع وتقسيمه إلى فروع ممكنة.

7.3 المصادر (Sources)

يجب الرجوع إلى آية مادة ذات علاقة في الحقل. وذلك لأن أمثلة وتطبيقات وأنظمة مفاهيم وعبارات يمكن أن توجد في أنواع مختلفة من النصوص. وهذا يعزز من القدرة على شمولية القوائم. ومن النصوص التي يجب تفحصها تلك التي تتعلق بالقانون والتعليمات والتوجيهات والمعايير والكتب المقررة والأطروحات والدوريات وتعليمات التشغيل والتقارير وقوائم المفردات والمعاجم والموسوعات وقواعد البيانات الخ. وتدرس هذه النصوص للوقوف على علاقتها بالموضوع قيد الدرس وكذلك درجة الاعتماد عليها. إلا أن الحذر واجب عند الرجوع لمواد مترجمة من لغة أخرى. وذلك لأنه لا يمكن ضمان الدقة في الترجمة أصلاً.

ومن المهم جدا إجراء تحليل للخطاب في هذه المصادر، وذلك لأن العبارات تأخذ معانيها في مضامينها، وليس بمعزل عنها. وليس من الغلو القول بأن معاني العبارات تتعدد بتعدد مضامينها المختلفة. بل إن (Rey) تعتبرها أول أهم خطوة في هذا المجال.

Discourse analysis is, nevertheless, the compulsory starting-point for every analysis of lexical units from an empirical point of view, which is in fact that of the linguist. The terminologist must adopt a different point of view and presuppose that the constitution of terminological structures does not only depend on morphosyntacitc rules but also, and primarily on operational schemes, documented , preserved, and transmitted by symbolic systems, including natural languages. These schemes may be theoretical, classificatory or practical, etc., and the unit of access is epistemological and semiotic. Linguistic reduction would have a paralyzing effect in this area.

(Rey, 1995: 28)









7.4 عدد المفاهيم (Number of Concepts)

يجب أن يكون عدد المفردات التي يتعامل معها فريق المصطلحات الفنية محدوداً، وذلك لأن التعامل مع عدد كبير من هذه المصطلحات يؤدي في الغالب إلى حالات من التضارب وحالات أخرى تغفل فيها المفاهيم، ناهيك عن أن العدد الكبير يؤدي إلى ضياع الكثير من الوقت في أمور خارجة عن العمل الحقيقي، كتصفح قوائم طويلة. ويقول أصحاب الخبرة إنه إذا زاد عدد المفاهيم كثيرا عن 200، فمن الأفضل تقسيمها إلى قوائم فرعية، تعمل عليها فرق عمل إما بشكل متزامن أو متتابع. ويجب أن نعلم هنا أن الدقة في العمل أهم من السرعة التي ينتج عنها أخطاء في هذه القوائم، والتي يصعب اكتشافها فيما بعد، أو أن تصويبها يأخذ وقتا وجهدا وكلفة يمكن تجنبها أثناء العمل.

7.5 الجدول الزمني (Schedule)

يجب وضع جدول (أو خط زمني) زمني للمشروع تحدد فيه فترات زمنية لكل مرحلة، وكذلك مسؤوليات كل فريق عمل والأفراد المعنيين به. بهذه الطريقة، يعرف منظمو المشروع مقدار التقدم، وذلك بالرجوع إلى الجدول ومعاينة الإنجاز في حينه.

7.6 جمع البيانات المصطلحية واختيارها

(Collecting and Selecting Terminological Data)

يجب تحليل نصوص المصادر من أجل التعرف على المفاهيم المتعلقة بحقل الموضوع. ولا ينصح، في هذه المرحلة، بالمبالغة في تحديد عدد المفاهيم والعبارات التي جمعت. ويجب الإشارة بوضوح إلى مصادر البيانات التي جمعت، وذلك ليتمكن فريق العمل المعني

بها من الرجوع لهذه المصادر إذا لزم الأمر بسهولة، لتوفير الوقت والجهد لأمور أجدى من مجرد البحث ثانية عن مكان مفهوم أو عبارة في نص ضائع بين المئات أو ربما الآلاف من النصوص.

والتقسيم التالي للمفاهيم إلى أربع مجموعات قد يعين على تقرير فيما إذا كان من الضروري اعتماد مفهوم ما أم لا:

· مفاهيم خاصة بحقل الموضوع.

· مفاهيم شائعة بين العديد من حقول المواضيع.

· مفاهيم مقترضة من حقول مواضيع قريبة.

· مفاهيم تستعمل في اللغة بشكل عام.

ويجب أن يشمل قائمة المصطلحات المفاهيم الرئيسية العائدة لحقل موضوع معين (أ)، وعدد محدود من المفاهيم المذكورة في (ب و ج)، أما المفاهيم الواردة في المجموعة (د) فلا تسرد إلا في حالات استثنائية. فالمقصود هنا هو قوائم المصطلحات الفنية وليس الشائعة في اللغة العادية.

7.7 أنظمة المفاهيم والتعريفات

(Concept Systems and Definitions)

يجب ترتيب المفاهيم المختارة ووضعها في أنظمة مفاهيم وذلك حتى يعطى كل مفهوم مكاناً محدداً في نظامه. وينصح بأن يبدأ بالعلاقات العامة ثم المرور إلى المفاهيم ذات العلاقات الجزئية ثم ذات العلاقات الترابطية. ويمكن وضع رسم بياني قائمة نظام تبين العلاقات بين المفاهيم وذلك من أجل ترتيب نظام المفاهيم.

8. كتابة المصطلحات الفنية (Terminography)

8.1 شكل التعريف (Form of Definition)

· تكتب العبارة والتعريف بصيغة المفرد، إلا إذا كان المفهوم الذي يعرف بصيغة الجمع.

· يجب أن لا يبدأ التعريف بعبارة مثل "عبارة تستعمل لوصف"، ولا عبارة مثل "هو يعني هو كذا."

· لا يبدأ التعريف بأداة، إلا إذا كان هناك سبب لذلك.

· في حالة اللغات التي تكتب بالحرف اللاتيني، فإن الحرف الأول يكون صغيراً ولا تنتهي الفقرة بنقطة.

· إذا اقتبس التعريف من أي نص فيجب الإشارة إليه بين [ ] في نهاية التعريف.

· لا يدخل في التعريف إلا العبارات المفضلة.

· تعلم العبارات الواردة في التعريفات إذا ورد لها تعريفات في أماكن أخرى.

8.2 شكل المدخلات (Form of Entries)

يجب أن يحوي مدخل المصطلح الفني العناصر التالية كحد أدنى وذلك لأغراض التوحيد القياسي (Standardization):

· رقم الإدخال.

· العبارة المفضلة.

· تعريف المفهوم.

ويمكن إضافة معلومات أخرى إذا لزم الأمر.

8.3 ترتيب المدخلات (Order of Entries)

يحب وضع المدخلات في نظام معين كلما كان ذلك ممكناً. والشائع هو وضعها في ترتيب هجائي حسب نظام اللغة المعنية. أما إذا كان الهدف منها استعمالها في الحوسبة، فإن المدخلات تأخذ شكل قاعدة بيانات ترتبط فيها مجموعات المفاهيم والمفردات بعضها ببعض، وهذا مهم لتكون قابلة للاستعمال في حالة الترجمة الآلية. ولا يهم هنا أن ترتب هجائياً أو لا ترتب، لأن التعامل معها ليس على أساس يدوي، كما هو الحال مع المعاجم الورقية. ويكن لها أن تكون شاملة أيضاً. لأن الوصول إلى محتواها لا يتطلب تقليب صفحات مجلد تقليدي، بل يمكن إعطاء العبارات رموزاً تحدد الحقل، أو الحقول، التي تنتمي إليها. وهذا غير ممكن في حالة المعاجم الفنية الورقية، لأنها غير اقتصادية، حتى إذا كان تنفيذ الفكرة ممكناً صناعياً. فال يستطيع القارئ العادي ولا حتى المتخصص اقتناء مثل هذه المعاجم التي ستكون حتماً عدداً كبيراً من المجلدات، ناهيك أن استخدامها ليس عملياً.

ثانياً. علم المصطلحات الفنية وصناعة المعاجم

Terminology and lexicography

قد يتبادر إلى الذهن أنه لا فرق بين علم المصطلحات الفنية وصناعة المعاجم (أو المعجمية). والحقيقة أنه بالرغم من التشابه الكبير بينهما، إلا أن هناك خصائص تميز أحدهما من الآخر. ومن أجل إجراء مقارنة بين الاثنين، يجب أولاً معرفة الخطوط التي تحدد حقل كل منهما، وكذلك توضيح أهدافهما التعليمية والعملية، وثانياً، يجب تعريف كل منهما.

بداية، تعتبر صناعة المعاجم فناً (أو علماً) تطبيقياً. وهي، كما هو حال في جميع التطبيقات، كما وصفه (1968) Claude Levi-Strauss بالإشارة إلى علم دراسة الإنسان (Anthropology)، على أنها "حرفة" ولكن ليس من منطلق سلبي. فالحرفة هي الطريقة الأفضل اقتصادياً والأنجع لتلبية مطلب ما، نظرياً وتطبيقياً. إن صاحب الحرفة يعمل بأدوات ضمن إطار نظري، ولذلك عليه أن يوفق بين هذين الجانبين، النظرية والتطبيق، ليحقق مطالب المستخدمين. وعند الحديث عن العاملين في هذه الصنعة (أي صناعة المعاجم)، لحساب ناشرين، يجب أن يكون في حسابنا تحقيق ربح مادي لهم. ولهذا السبب نتحدث عن هذه الصناعة على أنها حرفة، إلا أن ذلك لا يعني استثناء تطوير نظرياتها، فلكل حرفة نظرياتها الخاصة بها، لا تتطور إلا بتطوير هذه النظريات، كما يؤكد Levi-Strauss (1966).

يخفي هذان التعبيران (أي علم المصطلحات الفنية وصناعة المعاجم) عدة حقائق وراءهما. أولها هو الاختلاف الذي يدركه آي متفحص لهما. فتقدم المعاجم أحادية اللغة أو ثنائية اللغة حقيقتين تتضمنان طريقتي إنتاج مختلفتين تتعلقان بأهداف مختلفة لهما. ويتبع علم المصطلحات الفنية الطريقتين ذاتهما ولكن ضمن شروط مختلفة جداً عن صناعة المعاجم. وليس علينا أن نتحدث عن وجود المعاجم الثنائية أو متعددة اللغات إلا في حالتين هما الترجمة وصناعة المعاجم والترجمة وعلم المصطلحات الفنية.

أما الاختلاف المهم الثاني بين هذين المفهومين فهو محاولة بعض المعاجم العامل بـفرضية الأداء الـكلي Totality) (Functional بتوفير ما يحتاجة المستخدم لإنتاج جمل بشكل غير مقيد، وهذا ما ذهب إليه Noam Chomsky (1966) في نظرياته. وهذا يعني أن هناك معاجم عامة تعين المستخدم على تركيب ما يمكن أن يكون خطاباً (Discourse)، يقابلها معاجم مصطلحات فنية لا تصلح لمثل هذا الغرض، وذلك لأنها تفتقر إلى مفردات النحو، والأفعال الرئيسية، والمفردات العامة المألوفة. وهذه هي التي تسمى المعاجم الفنية المتخصصة، لأنها تهتم بعبارات التخصص في حقل ما دون غيره.

إن صناعة المعاجم تعتمد على عدد من حقول المعرفة، ولها روابط قوية بعلم المصطلحات الفنية. وهي تعتمد أساساً على اللغويات وليس على علم المصطلحات. وترجع أهمية ذلك إلى أنه ليس من الممكن وضع المعاجم، حتى المتخصصة منها، بدون أخذ عناصر حقول اللغويات، علم الأصوات Phonetics والنحوsyntax والصرف morphology وعلم الدلالة semantics إلخ، بعين الاعتبار.

أما الملاحظة الثالثة حول صناعة المعاجم فتتعلق بتطور أساليبها. وعلاقتها بعلم المصطلح الفني في هذا المجال واضحة أيضا. ويمكننا التحدث عن ثورتين مهمتين: الأولى تتعلق بالنهضة الأوروبية (Renaissance) وبالتحديد اختراع الطباعة. أما الثانية فهي تقنية الحاسوب وتطويره خلال العقود الأربع الماضية. ولعل الثورة التي سببها دخول الحاسوب في صناعة المعاجم لا تقل أهمية في تطور صناعة المعاجم عن الثورة التي أحدثها اختراع الطباعة من قبل. إذ لكل منهما دوره البارز في جعل هذه الصناعة جزءاً من عالم التجارة في المنشورات إجمالاً. ولعل دخول الحاسوب عالم المعاجم جعل من الممكن تطويرها حتى ليمكننا القول إنها أصبحت تشبه دوائر المعارف في محتواها، وكذلك القدرة على إجراء تعديلات عليها، من تنقيح وزيادة إلخ بكل يسر وبأقل كلفة، بدلا من إعادة صفها بالكامل، كما كان الحال في السابق.

1. طبيعة علم المصطلحات الفنية (The Nature of Terminology)

يعتبر علم المصطلحات الفنية من العلوم اللغوية التطبيقية أيضاً. وهو يمتاز بثلاث خصائص مترابطة، نوردها في الفقرات التالية.

الخاصـية الأولـى هـي أنه تطبيق معرفي (Cognitiv Application)، وهذه خاصية أساسية لأنها ترتبط بالبعد العلمي لعلم المصطلح الفني(Wuster, 1978) وهذه الخاصية، التي تتغير حسب الحقل الذي نتعامل معه، هي أساسية لأنها تصل الخاصية اللغوية (الخاصية الثانية) بالخاصية الاجتماعية (الخاصية الثالثة). وبغياب مثل هذا الربط بين الخاصيتين (اللغوية والاجتماعية)، فإن علم الصطلحات الفنية لا يعدو كونه فصلاً في صناعة المعاجم.

والخاصية الاجتماعية لهذا العلم ملازمة للخاصيتين الأخريين. إذ هناك إجماع عام على أن المعرفة تنشأ وتتطور في المجتمعات البشرية. وينتجها مبدعون والذين قد يكونون مبدعين للمفاهيم مثل الفلاسفة وعلماء المنطق وعلماء الرياضيات أو الباحثين أو المبدعين في الفنون.

ولعل من أهم ما يميز علم المصطلح الفني عن صناعة المعاجم، أنه يهتم بالمفهوم ليس من وجهة نظر لغة واحدة، بل يتعدى ذلك، وبدون مبالغة، إلى لغات العالم. والسبب أن هذا العلم يهتم بالمفهوم، الذي يمكن أن يوجد أو يدخل إلى أي لغة في العالم. وتتعزز هذه الفكرة بقول Rey الذي اقتبس منه النص التالي:

This occasional multilingualism, which is rare in lexicography, is certainly not inevitable in terminology because there are monolingual terminologies; but by its nature and to the extent that it follows the onomasiological approach, terminology can designate an object of though or a class of objects in all the languages of the world.

(Rey, 1995: 121)

2. علم المصطلحات الفنية والترجمة الآلية

(Terminology and Machine Translation)

كما ذكر سابقاً فإن علم المصطلح الفني يضع المفاهيم في إطار لغوي يجعل من الممكن تطويره ليكون مفيداً في عدد من اللغات. وهذه خاصية مفيدة جداً في الترجمة الآلية. وقد أستغل الأوروبيون هذه الخاصية في التخفيف من أثر الحواجز اللغوية في ما يتعلق بنقل المعرفة بين اللغات الأوروبية بسرعة ملحوظة وبجهد وكلفة في تناقص مستمر.

أما بالنسبة للغة العربية، فإن نصف الطريق، أو قرب ذلك، قد اكتمل، وذلك لأن وضع المعاجم الفنية قد ذهب هذا الشوط البعيد في أوروبا، ولم يبق إلا القيام بخطوة جريئة للإفادة منها، وتطوير المعجم الفني العربي قياساً على تلك التي طورت في أوروبا. صحيح أن هناك مشاكل كثيرة تتعلق بالمفردات الفنية، ولكن لا بد من انطلاقة، وإن لزم، توضع المفردات المتعددة للمفهوم الواحد كمرادفات، حتى يتسنى تنقيح هذا المعجم الفني في وقت لاحق.

ومن التطبيقات العملية على مثل هذه المعاجم الفنية، ما يستعمل في ترجمة النصوص ليس على أساس المفردة الواحدة وما يقابلها، بل على أساس المفردة في مضمونها النحوي الدلالي. وأورد الوصف التالي لأداء هذا التطبيق:

Desktop Translator is a program that translates from English to Spanish, French, Italian, German and Portuguese, and from French, Spanish, and German into English. One can translate typed text, dictated text, files, documents, Web pages and e-mail into a selected language. Using a technique called Machine Translation, Desktop Translator translates a word in relation to sentence structure and parts of speech rather than translating words in isolation. The result is a higher level of accuracy and comprehension.

(Collete, 1999)

قد لا يلبي هذا التطبيق الطموح المرجو منه، لكنه يعطي فكرة عن إمكانية تطوير برامج قادرة على التعامل مع النصوص كخطاب، وليس على أساس أنها مسارد مفردات تعطي مقابلات في لغة أخرى. وهذه الطريقة مبنية على أساس علم المصطلح الفني، وكذلك تستفيد من المعاجم العادية الإليكترونية في الوصول إلى شكل من أشكال الترجمة الآلية. ويجب أن لا نتوقع الحصول على نتائج مذهلة منذ المحاولة الأولى، لأن هذا سيكون مشروعاً جديداً بحاجة إلى المزيد من التطوير والمتابعة.

وحتى نكون متفائلين في إنجاز شئ، لا بد من قيام مؤسسة تجارية بهذه التجربة. لأن انتظار المؤسسات الرسمية قد يطول، وقد لا تكون هذه الأمور على جدول اهتماماتها أصلاً. وقد قيل بأن الأوروبيين قلصوا الجهد البشري في الترجمة التقنية إلى ما يقارب 20-30% فقط، وذلك في منتصف التسعينيات. وهم يقومون باستمرار على تطوير قاعد البيانات الداخلة في الترجمة الآلية.

إذن، هناك تجربة أثبتت درجة عالية من الدقة، وهي قابلة للتطوير، وهذه خاصية مهمة. وما علينا إلا أن نبدأ بوضع الخطوات العملية لتطوير المعجم الفني للغة العريبة، لتكون جاهزة لمثل هذا النوع من الترجمة.

المراجع

Beaugrande, De R. (et al). (eds.) 1994. Language, Discourse and Translation in the West and Middle East. John Benjamins publishing company, Amsterdam.

Chomsky, N. 1966. Cartesian Linguistics: A Chapter in the History of Rationalist Thought. New York: Harper & Row.

Collete, J., 1999. "The desktop Translator" The Journal, Dec99, Vol. 27 Issue 5, p54.

Diderot, D. 1969. The Encyclopaedia of Diderot and d'Alembert: Selected Articles. Cambridge: Cambridge University Press.

Gordon, J. 1990. "Essai de typologie des texts sources, dans le cadre de la traduction assistee par ordinateur." Agard.

Ilyas, Asim, 1994. "A Typology of Translation." In Beaugrande, De Robert (et al) edits, Language, Discourse and Translation in the West and Middle East. John Benjamins publishing company, Amsterdam, pp. 45-53.

Jensen, K. 2001. "Natural Language Processing," Technology Review, Jan/Feb., Vol. 104 Issue 1, p107.

Levi-Strauss, C. 1968. Structural Anthropology. London: Allen Lane.

Levi-Strauss, C. 1966. The Savage Mind. Chicago: Chicago University Press.

Najjar, Al- Majid, 1984. Translation as a Correlative of Meaning: Cultural and Linguistic Transfer between Arabic and English. Unpublished PhD. Thesis, Indiana University, Bloomington.

Rey, A. 1995. Essays on Terminology. Translated by Juan Sager. John Benjamins Publishing Company Amsterdam.

Sager, Jane C., 1993. Language Engineering and Translation: Consequences of Automation. John Benjamins Publishing Company, Amesterdam/ Philadelphia, pp. 291-2.

Saraireh, Muhammad. 1994. "Terminological Inconsisitencies in English-Arabic Translation." In Beaugrande, De Robert (et al) edits, Language, Discourse and Translation in the West and Middle East. John Benjamins publishing company, Amsterdam, pp. 79-82.

Waard, J. De & E. Nida. 1986. From One Language to Another: Functional Equivalence in Bible Translation. Camden, NY: Thomas Nelson.

Wilss, Wolfram. 1994. "Translation as a Knowledge-Based Activity." In Beaugrande, De Robert (et al) edits, Language, Discourse and Translation in the West and Middle East. John Benjamins publishing company, Amsterdam, pp. 35-43.

Wuster, E. 1978. Einfuhrung in die allgemeine Terminologielehre und terminologische Lexicographie (2 vols) Wien: Springer.


http://www.majma.org.jo/majma/res/data/seasons/19/s19_7.doc




وقد مكروا مكرهم ......
وعند الله مكرهم .....
وإن كان مكرهم .... لتزول منه الجبال
فلا تحسبن الله مخلف وعده رسله
إن الله عزيز ذو انتقام



لسنا مخادعين ،، ولن نسمح للآخرين بخداعنا

سكوتنا ليس رضاً 
وهدوؤنا ليس عجزاً 
الحقيقة ولو مع غيرنا أولى بالاحترام ...   


أنت غير مسجل لدينا.. يمكنك التسجيل الآن.
 








ملتقى طلاب الجامعة... منتدى غير رسمي يهتم بطلاب جامعة دمشق وبهم يرتقي...
جميع الأفكار والآراء المطروحة في هذا الموقع تعبر عن كتّابها فقط مما يعفي الإدارة من أية مسؤولية
WwW.Jamaa.Net
MADE IN SYRIA - Developed By: ShababSy.com
أحد مشاريع Shabab Sy
الإتصال بنا - الصفحة الرئيسية - بداية الصفحة