الكوربوس: عندما تدخلت التكنولوجيا لتقدم أعظم خدمة للغات
سبعة عشر عامًا انقضت منذ خطونا إلى القرن الحادي والعشرين، استطاعت خلالها التكنولوجيا أن تقفز إلى آفاق سحرية لم يتخيلها أكثر الحالمين جموحًا قبل عقدين من الزمان، وانعكس هذا التطور على جميع المجالات، بدءًا من الطب وعلوم الفضاء وحتى صناعة الترفيه، ولحسن الحظ فإن التكنولوجيا لم تبخل بلمستها السحرية على علوم اللغة، وبالذات علم اللسانيات.
يبدو غريبًا أن نربط بين التكنولوجيا وعلم اللسانيات «اللغويات»، وهو علم يضطلع بدراسة تراكيب اللغات وخصائصها، ومواضع التشابه والاختلاف فيما بينها، وغالبًا ما يمضي دارسوه حياتهم في قراءة المراجع السميكة والأعمال الأدبية، ولكن نعم.. قدمت التكنولوجيا أعظم خدمة للغات العالم كلها، وقفزت بدراسات اللغات ألف خطوة إلى الأمام عندما ساهمت في انبثاق «الكوربوس».
ما هو الكوربوس Corpus؟
مع تطور تكنولوجيا الحاسبات، ووصول سعات تخزين الكمبيوتر إلى حدود خيالية، ظهر اتجاه جديد في علم اللسانيات يهدف إلى استغلال قدرات الكمبيوتر لتسهيل البحث اللغوي، من خلال تسجيل آلاف النصوص الأدبية والمعلومات، وإتاحة البحث فيها إلكترونيًّا، لاختصار أكبر قدر من الوقت والجهد الذي يحتاجه اللغويون للتحقق من قضية لغوية.
ويعرف الكوربوس، أو ما يطلق عليه «علم المتن»، بأنه مجموعة هائلة من النصوص تم تخزينها ومعالجتها إلكترونيًّا، وحفظها على الكمبيوتر بهدف استخدامها في التحليل اللغوي، واختبار الفرضيات اللغوية، والتحقق من استخدام القواعد اللغوية في آلاف النصوص ومقارنتها ببعضها، ما يُسهِّل من عملية تتبع تطور اللغة وقواعدها، ودراسة التحور الدلالي لألفاظها، بجانب تحليل أنماط استخدام اللغة وتغير سلوكياتها من عصرٍ إلى آخر.
دعني أسهل عليك الأمر، لنفترض أننا نريد معرفة تطور لفظ معين في اللغة العربية، بدأ استخدامه بمعنى ما في العصر الجاهلي، وتحور إلى معنى مختلف تمامًا في عصرنا الحالي، ولنأخذ من كلمة «الأدب» مثالًا.
في العصر الجاهلي كانت كلمة «الأدب» تشير إلى الدعوة إلى الطعام، ومنها اشتقت كلمة «المأدبة» وهي الوليمة، ثم جاء الإسلام لتنسحب كلمة «الأدب» على التهذيب والتحلي بالأخلاق، ثم تطور اللفظ أكثر ليكتسب بعدًا تعليميًّا في العصر الأموي ليعني دراسة الدين والفقه والتاريخ والسيرة وغيرها، حتى وصل إلينا اللفظ في عصرنا الحالي بمدلولات أكثر اتساعًا، فهو يعني الأخلاق الرفيعة، ويعني أيضًا خلاصة الإبداعات الإنسانية في مجالات الشعر والرواية والقصة والمسرح وغيرها.
رحلة طويلة مرت بها كلمة «أدب»، ولكن ماذا نفعل لنتتبعها منذ البداية؟ قبل عقود كان علينا أن نطالع عشرات الكتب والأعمال الأدبية التي تمت لعدة عصور سابقة، ونبحث عن مواضع استخدام كلمة «أدب»، ونسجل في أي سياق وردت، وبأي معنى استخدمها الكاتب، وبعد أشهر أو سنوات سيمكننا أن نجد نتيجة مرضية ومقبولة، ولكن بفضل الكوربوس صارت كل تلك العملية المعقدة تُجرى في لحظات.
يعتمد الكوربوس على إدخال أكبر عدد ممكن من النصوص الأدبية إلى الكمبيوتر وتسجيلها، ومعالجة المعلومات وتخزينها، ثم إتاحة البحث عن كلمة بعينها، أو قاعدة لغوية محددة، في آلاف النصوص، ليخرج لك بنتيجة بحث تتضمن مواضع استخدام الكلمة، ومن هنا يمكنك اختبار فرضيتك، ومقارنة النصوص وبعضها للخروج بهدفك من البحث، مستشهدًا بمئات المصادر الموثقة والمسجلة إلكترونيًّا.
وهكذا يكون بإمكانك فتح برنامج الكوربوس، وكتابة كلمة «أدب» في مربع البحث، لتخرج لك جميع الأشعار التي ذُكرت فيها، وجميع القصص والروايات، ومواضع استخدامها في «ألف ليلة وليلة»، و«كليلة ودمنة»، و«البخلاء»، وأي كتاب أو عمل عربي آخر. ومن تواريخ تلك الأعمال والعصور التي ظهرت فيها، سيمكنك تحليل التطور الدلالي للكلمة، ومراحل تشكلها حتى أصبحت بمعناها الحالي.
ما الفائدة التي يقدمها الكوربوس للبشرية؟
حسنًا، لدينا وسيلة تكنولوجية تمكننا من تحليل الظواهر اللغوية في ملايين النصوص المسجلة على ذاكرة الحاسب، فما الخدمة التي يقدمها الكوربوس للبشرية؟ أليس المستفيد الوحيد هنا هم اللغويون الذين ينجزون دراساتهم بوتيرة أسرع؟
دعونا نتفق أولًا على أهمية اللغة كوسيط ثقافي ومعرفي يضمن التواصل بين البشر، ويقرب المسافات بينهم، ما يمهد لعالم أكثر تفاهمًا وقدرة على استيعاب الآخر، كما أن اللغة هي أداة اتصالنا بالعلوم والفنون التي تركها لنا أجدادنا خلال مسيرة الحضارة، ومع الأخذ في الاعتبار أهمية الفنون الأدبية التي تفتح آفاق العقل وتحرر الخيال وتسمو بالعاطفة، وهي فنون لغوية بالأساس، تبرز لنا أهمية الحفاظ على ذلك الوسيط الباهر الذي صنع حضارتنا.
لا حضارة دون قراءة، ولا قراءة دون لغة، وهكذا يمكننا النظر إلى اللغة باعتبارها اللبنة الأولى للحضارة والتقدم، إنها الصمغ الذي يربط بين أجزاء الصورة الكبيرة التي تشكل وجودنا كبشر على الأرض.
من هنا يصير تطوير القنوات العلمية التي تخدم علوم اللغات ضرورة كبيرة، وقد ساهمت الدراسات التي اعتمدت على الكوربوس في وثبات كبيرة، ساعدتنا على تطوير الموارد اللغوية الأساسية من معاجم وقواميس، وجعلتنا نعيد النظر في كثير من القواعد اللغوية وطرق استخدامها في عصور سابقة.
كذلك منحنا الكوربوس القدرة على التعامل مع كم كبير من المعلومات بناءً على «عيِّنات لغوية» حقيقية، وأتاح لنا استخدام الأساليب الإحصائية في تتبع ظواهر لغوية بعينها، ورصد تطور الكلمات والمصطلحات في العديد من العصور التاريخية، وبحث أصولها، ومنابع اشتقاقها من لغات سابقة ميتة، أو لغات أخرى حية تطورت لتصبح لغة أخرى بخلاف اللغة موضع الدراسة.
تطبيقات الكوربوس الناجحة عالميًّا
لم تبق فكرة الكوربوس حبيسة الرءوس طويلًا، بل شهدت تطبيقًا عمليًّا ناجحًا اختبرته عدة لغات، منها الإنجليزية والفرنسية، ولعل من أشهر نماذج الكوربوس الناجحة عالميًّا هو كوربوس اللغة الإسبانية على موقع الأكاديمية الملكية الإسبانية.
يوفر كوربوس اللغة الإسبانية البحث عن الكلمات والمصطلحات الإسبانية في ملايين الكتب والأعمال الأدبية، وعدد لا يحصى من المجلات والجرائد، والصادرة في جميع الدول الناطقة بالإسبانية حول العالم، والبالغ عددها تسع عشرة دولة.
كما يوفر كوربوس اللغة الإسبانية الأول عالميًّا إمكانية البحث عن الكلمة أو المصطلح المطلوب في المصادر العلمية فقط، أو التاريخية فقط، أو المتعلقة بالأدب، أو أي مجال يتم اختياره، ليعرض لك جميع مواضع استخدامه. فإذا كنت تدرس اللغويات الإسبانية فأنت أمام كنز يجب ارتشافه حتى الثمالة.
ولم تُحرم اللغة العربية من هبة الكوربوس، إذ أعدت جامعة بريغام يونغ بالولايات المتحدة الأمريكية كوربوس اللغة العربية، والذي يعد قبلة لكثيرين من دارسي اللغويات ومعدي الأبحاث حول لغة الضاد.
وفي رحاب دراسات القرآن والعلوم الدينية، فهناك كوربوس القرآن، والمعد للبحث عن الألفاظ التي وردت فيه، والذي يمكنك من اكتشاف مواضع ذكر كلمات بعينها، ومقارنة المعنى بين سياق وآخر، بجانب تقديم الإعراب السليم لآيات القرآن والموجه في الأساس لغير الناطقين باللغة العربية.
مصطلح الكوربوس Corpus في اللغة العربية
ترجع كلمة الكوربوس إلى أصل لاتيني هو Corpus، والتي تعني الجسد، ورغم وضوح المصطلح في اللغات الأوروبية، فإنه واجه صعوبة في ترجمته في العالم العربي، ولم يوحد المترجمون العرب طريقة تعاطيهم معه حتى اليوم.
ففي مصر تعتمد ترجمة «علم المتن» أو «علم لغة المدونة»، وفي المغرب يترجم الكوربوس رسميًّا إلى «المتن اللغوي»، ثم تتنوع الأسماء ما بين «المكنز»، و«المكنز النصي» و«المدونة اللسانية» و«المدونة اللغوية»، و«اللغويات المخبرية» باختلاف الدول العربية والجامعات التي تدرس علم اللغويات، ويبدو أن الوقوف على مصطلح موحد سيتأخر كثيرًا.
رغم هذا يبقى الكوربوس أحد أعظم إنجازات التكنولوجيا في التاريخ، فقد ساهم في حفظ ملايين النصوص الأدبية بعدة لغات، واختصر كثيرًا جدًّا من جهود اللغويين في اختبار فرضياتهم اللغوية ودراساتهم، بكل ما يعنيه هذا من حفظ سبل التواصل البشري، وتقريب اللغات والشعوب والثقافات، وخدمة الأدب والثقافة على مستوى العالم.
ليس الكوربوس مجرد برنامج، بل انتصار عظيم للعلم والإنسانية.
- دراسة علم اللغويات لأربع سنوات بالجامعة
- كتاب "لغويات إسبانية" للدكتورة دعاء سامي، جامعة القاهرة