مفاجأة جديدة للثقافة الإنسانية ولكن بعيدا عن العرب..!

3 1321

هناك أسلوب في تحليل الكتب والخطب والأدب يقوم على دراسة عدد الكلمات المذكورة في نص ما، والحصول على نتائج من هذه الدراسة الكمية، وذلك بناء على قوائم معينة لمعاني هذه الكلمات. فعلى سبيل المثال، هناك برامج كمبيوتر تقوم من خلالها بتحميل نصوص كاتب معين أو خطب رئيس دولة لتستنتج من خلالها أن الكاتب محافظ أو ليبرالي، أو أن الكاتب مناصر لحقوق المرأة أو العمال أو مضاد لها، وذلك لأن علماء اللغة أوجدوا ''قاموسا'' للكلمات والجمل التي إذا تكررت أكثر من الكلمات المضادة لها في حديث شخص ما، فهذا يعني أن هذا الشخص له ميول في اتجاه معين.

هذا الأسلوب جزء من اتجاه علمي لتحليل التاريخ والثقافة والأدب بناء على معايير كمية تبحث عن مؤشرات من هذا النوع لمعرفة قيمة شيء ما خلال حقبة زمنية معينة، وهذه البرامج والأدوات موجودة فقط باللغات الإنجليزية والفرنسية والألمانية ولا وجود لها باللغة العربية بكل أسف.

''جوجل'' في تجاوب منها مع هذا الاهتمام العلمي والذي يتزايد عبر السنين قامت بتطوير أداة علمية تقوم بتحليل سريع لنحو 5.2 مليون كتاب تتضمن أكثر من 500 مليار كلمة، ويتراوح تاريخ نشرها بين 1500م وحتى يومنا هذا، بحيث تعطيك عددا لا حد له من النتائج عن الثقافة الإنسانية من خلال تلك الكتب.

لو ذهبت إلى هذا الموقع: http://ngrams.googlelabs.com فستجد هذه الأداة التي يمكن استخدامها ببساطة، وتعطيك نتائج عن تكرر استخدام كلمات معينة حسب السنة التي نشر فيها الكتاب. ضع مثلا كلمة عربي ومسلم لتجد أن كلمة عربي كانت مستخدمة بشكل أكبر بكثير من كلمة مسلم في الثقافة الغربية وذلك حتى الخمسينيات الميلادية، حيث ازداد استخدام كلمة مسلم عن كلمة عربي، ولكنه من الملاحظ تماما من الرسم البياني الذي يزودك إياه الموقع أن الاهتمام بالمسلمين والعرب تزايد بشكل غير مسبوق تاريخيا في السنوات العشر الأخيرة.

هذه نتيجة بديهية طبعا، ولكن أحببت من خلال هذا المثال المبسط أن أشرح كيفية استخدام هذه الأداة في مجال التحليل الثقافي واللغوي.

إطلاق هذه الأدوات وقواعد المعلومات المرتبطة بها (والذي استهلك أربع سنوات من العمل المتواصل) أحدث ضجة في الأوساط الأكاديمية الغربية، كل في مجاله، وذلك لما تعطيه من نافذة على فهم وتحليل الثقافة الإنسانية، وقد أعلنت جامعة هارفارد الأمريكية أنها ستنشر عدة دراسات خلال الأسابيع المقبلة تشرح أثر هذه الأدوات على فهم الثقافة واللغة والاتصال وتدفق المعلومات عبر القرون الخمسة الأخيرة، بل إن هذه الدراسة جاءت تحت اسم علم جديد اسمه ممزوج من كلمتي اقتصاد وثقافة culturomics.

ولكن المشروع الحقيقي هو ما قامت به ''جوجل'' عبر سنوات عديدة رغم التكاليف الطائلة ورغم الضجة السلبية حول الموضوع (بسبب مسائل حقوق النشر) من عملية مسح ضوئي لملايين الكتب الموجودة في المكتبات حول العالم (والتي لا توجد لها نسخة إلكترونية)، الأمر الذي سيمثل طفرة في حفظ الثقافة الإنسانية وإتاحتها للاستفادة العامة للبشرية، ويمكن  ملامسة الإنجاز الذي حققته ''جوجل'' عندما ترى أن الأداة المذكورة موجودة باللغات الإنجليزية والفرنسية والإسبانية والصينية والألمانية والروسية، كما أن ''جوجل'' أعلنت أنها قامت حتى الآن بمسح 11 في المائة من الكتب في تاريخ الإنسانية والتي تضم نحو تريليوني كلمة.

بالنسبة للثقافة العربية، فإن أحد التحديات المهمة أنه حتى الآن لا توجد لدينا برامج مسح ضوئي تستطيع قراءة النص العربي المطبوع وتحويله إلى نص إلكتروني قابل للبحث والتعديل بنسبة محدودة من الأخطاء. هناك طبعا برامج من هذه النوع منتجة بطريقة تجارية تتناسب مع حجم السوق العربي المتواضع، ولكنها تنتج نصوصا بنسبة عالية من الأخطاء، لا يمكن الاعتماد عليها وتتطلب تدخلا بشريا في تعديل النصوص، وهذا ما يجعل مثل هذه المشاريع غير قابلة للتنفيذ حاليا، هذا فضلا عن أنه لا توجد أصلا قواعد للمعلومات في العالم العربي حتى للكتب المتوافرة بنسخ إلكترونية لدى دور النشر والمؤلفين، كما لا توجد قاعدة معلومات واحدة لرسائل الماجستير والدكتوراه.

الواقع العربي أليم من حيث الاهتمام الثقافي على مختلف المستويات، ولكن من يدري؟ قد تأتي ''جوجل'' إلى منطقتنا، وتقوم بتطوير برامج المسح الضوئي حتى تنفذ مشاريعها العملاقة، تماما كما حصل في حالة برامج التعرف على الصوت وتحويله إلى نص، والذي قامت شركات أمريكية بتطويره إلى اللغة العربية حتى تستطيع أجهزة الأمن والاستخبارات الغربية التجسس على المكالمات الهاتفية العربية ضمن حملة الحرب على الإرهاب، وإن كانت هذه البرامج ما زالت حبيسة ''أدراجهم'' ..!!

مواد ذات صلة

المقالات

المكتبة