بينما ينزوي رائدا الفضاء بول و ديفيد في حجرة صغيرة بعيدًا عن مسمع «هال 9000»، وهو كمبيوتر ذكي يدير المركبة ديسكفري التي تقل الرواد إلى كوكب المشتري، تظهر عين «كاميرا» هال وهي تراقب شفاه الرائديْن اللذين يتآمران على فصل قدراته المعرفية بعد أن أثار سلوكه مخاوفهما، ليقرر بدوره القضاء عليهما، هكذا يقدم المخرج «ستانلي كوبريك» مهارة قراءة الشفاه من قبل الذكاء الاصطناعي في فيلمه العبقري «2001:A Space Odyssey» الذي تم إنتاجه عام 1968.

نوفمبر 2016 يتصدر اسم شركة الذكاء الاصطناعي «DeepMind» الصفحات الأولى للمجلات والمواقع العلمية، بعد أن أعلنت الشركة التي أصبحت تابعة لجوجل قبل عامين، عن تطويرها لنظام ذكي يستطيع قراءة الشفاه باحترافية تفوق حتى أكثر البشر إتقانًا للمهارة بأربعة أضعاف!.

كانت الشركة التي تم إنشاؤها عام 2010 باسم «DeepMind Technologies»، قد أبهرت العالم والباحثين في مجال الذكاء الاصطناعي قبل عدة شهور، عندما انتصر برنامج ذكي صنعته الشركة باسم «AlphaGo» على أفضل المحترفين في اللعبة الصينية القديمة «جو» التي اكتسبها فيها البشر خبرة تزيد عن 2500 عام، وليس ذلك وحده هو المبهر، بل هو التكنيك الذي يتلقى به البرنامج تدريبه والذي يعرف بـ«التعليم المتعمق Deep learning»، حيث أن البرنامج لا يقيس كافة الاحتمالات الممكنة ثم يقرر، بل إنه يبارز نفسه بعد تلقيه مبادئ أساسية للعبة، وثم يتعلم أن يتفادى أخطاءه السابقة ليطور نفسه بنفسه، وهو يواصل فعل ذلك بينما تكمل أنت قراءة هذه المقالة!


الكلمات الأولى

وفقًا لدراسة نشرت في دورية «Proceedings of the National Academy of Sciences» عام 2012، فإن الأطفال من سن ستة أشهر حتى إتمام عامهم الأول يراقبون بدقة حركة شفاه من حولهم، في عملية طبيعية تؤهلهم لتطوير قدراتهم اللغوية ونطق أولى الكلمات.

أما بالنسبة للنظام الآلي المطور حديثًا، فقد اعتمد تدريبه على برامج BBC، إذ لقنه الباحثون من جامعة أكسفورد بالتعاون مع «DeepMind» قرابة 5000 ساعة من برامج مختلفة، تحوي قرابة 180 ألف كلمة. وعلى غرار دماغ الطفل الصغير، الذي يتلقى المعلومات الأساسية مرارًا وتكرارًا، ثم يعمم ما تعلمه إلى مهارة واسعة تعينه على فهم تراكيب جديدة من اللغة، يتمكن البرنامج الذكي من خلال تقنية «التعليم المتعمق» أن يمرن نفسه، ليستطيع بعد اكتسابه المهارة العامة اجتياز اختبارات جديدة لم تقدم له خلال فترة تدريبه.

وبعد انتهاء الباحثين من تدريبه على تلك البرامج التلفزيونية التي بثت بين شهري يناير 2010 وديسمبر 2015، تم اختبار قدراته على قراءة الشفاه في برامج أخرى بثت بين شهري مارس وسبتمبر من هذا العام؛ ليتمكن النظام الذكي من فك شفرات جمل كاملة ذات كلمات مميزة ومعقدة من مثل «نحن نعلم أنه سيكون هناك مئات الصحفيين هنا كذلك»، بالاعتماد فقط على حركة شفاه المتحدثين.

وقد سجل النظام الجديد رقمًا قياسيًا عندما استطاع فك شفرة 46.8% من كل الكلمات التي نطق بها المتحدثون دون خطأ واحد؛ ليتقدم بذلك الرقم على محترفي قراءة الشفاه من البشر بقرابة أربعة أضعاف، وعن سواه من أنظمة قراءة الشفاه السابقة.

الجدير بالذكر أنه قبل صدور نظام «DeepMind» بأيام قليلة،حقق نظام آخر طوره أيضًا باحثون من جامعة أكسفورد، وبتمويل من شركة DeepMind أيضًا، نسبة نجاح في فهم حركة الشفاه وتحويلها لجمل سليمة لغويًا، وصلت 93.4%، متغلبًا على المحترفين من البشر الذين خاضوا نفس الاختبار، والذين حققوا نسبة نجاح تصل إلى 52.3%.

من ميزاته أنه لا يقوم بتحليل مقاطع صغيرة من حركة الشفاه مع الوقت، بل إنه يحلل جملاً كاملة سويًا، بحيث يؤهله ذلك إلى تصحيح أخطائه من خلال المعنى العام للجملة، ويعد ذلك مهمًا للغاية؛ لأن عدد الأصوات التي يستطيع البشر نطقها تفوق عدد أشكال الشفاه المحتملة بكثير.

إلا أنه وفقًا لتقرير «technologyreview»، فإن النظام الذي طورته «DeepMind» لهو أكثر مهارة وأقرب للتطبيق من النظام الآخر الذي حمل اسم «LipNet»، رغم تفوق نسبة نجاح «LipNet» على نظيره الذي طورته الشركة التابعة لجوجل.

ويرصد التقرير لمساندة تلك الرؤية، أن نظام «DeepMind» اعتمد في تدريبه واختباره على مشاهد حقيقة من برامج تلفزيونية متنوعة، حيث يزيد ثراء اللغة وتتغير ملامح المتحدث والإضاءة على وجهه كثيرًا، في حين اعتمد «LipNet» على مجموعة بيانات تعرف بـ «GRID»، وهي عبارة عن فيديوهات لأشخاص وهم ينطقون جملاً قصيرة، تتبع نفس النمط والقواعد، تحت إضاءة محددة وزاوية ظهور واضحة لشفاه المتحدثين.

وعن التطبيقات المنتظرة للتقنية الجديدة، يشير «يانيس أصيل» أحد مطوري نظام «LipNet»، إلى أن التقنية سيكون لها تطبيقات عملية عدة، منها مساعدة ذوي العلل السميعة، وتسهيل التواصل عبر برامج مثل «سكايب» وغيره، خاصة في الأماكن ذات الضوضاء الصوتية الشديدة، كما أن «Siri» -وهي المساعد الشخصي في منتجات شركة أبل- لن تحتاج إلى سماع صوتك أكثر من مرة، على حد قولها.

إذا كنت تظن أن قراءة الشفاه هي مهمة بسيطة، يمكنك اختبار مهارتك من خلال الرابط التالي: