’’بايدو’’ تطلق برنامجها Speech Recognition للتحدث مع الأجهزة الالكترونية ..

البرنامج طفرة فى عالم الذكاء الاصطناعى اعتمادًا على تقنية Deep Speech

القاهرة : ماجدة أحمد 2015-01-12

كشف مركز الابحاث والتطوير التابع لشركة بايدو Baidu ، الصينية المتخصصة فى مجال تقديم خدمات الانترنت ، عن اطلاق برنامجها للتعرف على الكلام Speech Recognition والذى يعتمد على مفهوم التعلم العميق Deep Speech احد اهم تقنيات الذكاء الاصطناعى أو تعلم الكمبيوتر وذلك يهدف الى توفير أفضل تجربة بحث ممكنة عن طريق الاوامر الصوتية على شبكة الانترنت في جميع الاسواق التى تعمل بها الشركة حاليا .

ونجح مركز ابحاث بايدو من خلال اجراء العشرات من الابحاث المتخصصة فى تقنيات Deep Speech فى تحسين نتائج البحث عبر الصوت ومهمات الحوسبة عن طريق تدريب أجهزة الكمبيوتر على العمل أكثر على غرار العقل البشري خاصة فى مجال الاستجابة للأوامر الصوتية والصور الرقمية والتى تتطلب أجهزة وبرمجيات يمكنها أن تتعلم التعرف على الأغراض، وفهم السياق، وتقوم بالربط كما يفعل أي شخص .

اوضحت الشركة في عصر تزايد الاعتماد على الهواتف الذكية والأجهزة اللوحية فأن أبحاث التعلم العميق أصبحت مسألة أكبر بكثير بالنسبة لشركات تقديم خدمات البحث عبر الانترنت الا ان اهم ما يميز ابحاث بايدو فى مجال تقنيات التعليم العميق امتلاكها فرصة كبيرة لتحقيق طفرة مملوسة فى عالم الذكاء الصطناعى لتجاوز كل ما هو معروف حاليا فى مجال تقنيات التعليم العميق من خلال قدراتها الفائقة على بناء شبكة عصبية Recurrent Neural Net مكونه من المئات من اجهزة الكمبيوتر الخادمة السيرفرات ،والتى تستخدم وحدات معالجات الرسومات GPUs ،ويمكنها خلق وتوليد 100 ضعف من المعلومات مقارنة بما تتيح المشروعات المماثلة لكل من محركات جوجل و مايكروسوفت .

أكدت الشركة ، انه بناء على نتائج اختباراتها الاخيرة فى مجال التعلم العميق ، فأنها تمكنت بصورة حقيقية فى زيادة وتحسين كفاءة برنامج التعرف على الكلام وتخفيض معدل الخطاء الى نحو 16.5 % فقط كذلك نجحت الشركة فى تخطى كل من جوجل ومايكروسوفت وأبل في مجال التعرف على الكلام Speech Recognition بنسبة تتجاوز 10 % من حيث صحة المعلومات التى يوفرها البرامج مقارنة مع المشروعات المماثله فى كل جوجل Google Web Speech, wit.ai وكذلك مايكروسوفت ing Speech Services وشركة ابل Apple Dictation كما ان نظام Deep Speech ، الذى طورته بايدو غير مسبوق لأنه يستطيع التعرف على الكلام مع وجود الضوضاء (مثل الزحام، في المطعم،..الخ) بكفاءة تصل إلى 81%، بينما بلغت أفضل درجة للأنظمة التي تنتجها شركات مثل جوجل ومايكروسوفت ، والتي لم تُصمم أصلًا للعمل في الضوضاء، نحو 65% فقط . الأمر لا يتوقف على الشركات التُجارية فحسب، بل إن نظام بايدو يتفوق حتى على الأنظمة المُستخدمة في الجامعات البحثية.

وقال الدكتور أندرو نج، كبير العلماء في بايدو وعالِم الكمبيوتر الشهير والخبير في مجال الروبوتات والتعلّم الآلي ، ان أبحاث الشركة المتنامية في أحد فروع الذكاء الاصطناعي المعروفة باسم التعلّم العميق وانتاج اكثر من 100ألف ساعة من Synthesized Data ، تهدف إلى تحسين نتائج البحث والتعرف على الكلام الامر الذى يفتح الباب على مصراعيه امام ما يعرف بمفهوم انترنت الاشياء وتزايد اعتماد مئات الملايين من البشر على الهواتف المحمول الذكية والاجهزة اللوحية مؤكدا ان الفائز فى مجال الذكاء الاصطناعي هو من سيستطع الفوز والسيطرة على سوق خدمات الانترنت سواء فى الصين أو في كافة أنحاء العالم واعتقد ان بايدو تملك أفضل فرصة لتحقيق ذلك .

وأكد الدكتور دان جيرفسكى ، أستاذ اللغويات وعلوم الحاسب الآلي في جامعة ستانفورد ، ان احد اهم مزايا نظام Deep Speech الذى تطوره بايدو هو البساطة والسهولة فى وضع نظام هندسى لجمع البيانات ، وذلك اعتمادا على مهاراتها فى البرمجة ، بجانب توظيف سرعات معالجة الرسومات ومرونتها العالية وقدرتها على المرونة والتطوير اذ تشير النتائج لنجاح بايدو فى اظاهر بعض الاتجاهات المثيرة حقا على المدى القريب فى مجال برامج التعرف على الكلام، وخاصة فى البيئات صاخبة والمهام الصعبة الكلام Noisy Environments and Challenging Speech Tasks والتى ما تزال صعبة وتشكل تحدى كبير للشركات المافسة وم ثمة تمتلك بايدو فرصة كبيرة لتصبح لاعباً أساسياً في مجال التكنولوجيات الحديثة مثل الذكاء الاصطناعي وهى أحد المجالات التي يمكها ان تمييز نفسها عن الآخرين .

ووصف الدكتور إيان لين، أستاذ مساعد بحوث الهندسة جامعة كارنيجي ميلون، ابحاث بايدو فى مجال التعلم العميق بالابتكارية اذ تساعد على انتقالا خطوة واسعة فى مجال التحدث بشكل طبيعى مع الاجهزة الذكية الهواتف المحمولة والكمبيوترات اللوحية والروبوتات و الاجهزة القابلة للارتاد وحتى فى البيئات الصاخبة موضحا انه منذ تزايد أهتمام شركات التكنولوجيا العالمية بتقنيات التعلم العميق من 4 سنوات تقريبا ، ظهرت قدراتها وتطبيقاتها المحتملة باستخدام هذه التقنية والتى يمكنك بناء أنظمة تتعلم ذاتيًا بدون توجيه صريح Unsupervised Learning .