مايكروسوفت تبتكر أداة ذكاء إصطناعي قادرة على تحويل صورة ومقطع صوتي إلى وجه متكلم

تمكن باحثون من شركة «مايكروسوفت» من إبتكار أداة ذكاء اصطناعي توليدي، تستطيع تحويل صورة وجه ومقطع صوتي إلى وجه متكلّم، وأشارت إلى أن الهدف من هذه الأداة ليس لعمل محتوى مخادع أو مضل، مشيرة إلى أنّ الأداة يمكن أن تُستخدم لأهداف مسيئة أو انتحال شخصية ما.

مخاوف كثيرة

ويثير نمو «الذكاء الاصطناعي» المتسارع الذي يوفر إنتاج كافة أنواع المحتوى «نصوص وصور وأصوات» بكل سهولة وجودة عالية، مخاوف عديدة وخاصة فيما يتعلق بالاستغلال لغرض الاحتيال أو النصب، وأكّدت مايكروسوفت أن الأداة المبتكرة تركز على الصور الرمزية الافتراضية (أفاتار)، وأنها ستعارض أي سلوك يهدف إلى إنشاء محتوى ضار.

إلتقاط صورة وجه

ويقوم برنامج (VASA-1) بإلتقاط صورة وجه بسيطة، ويسجل مقطع صوتي ويحولهما إلى مقطع فيديو يظهر وجهاً يتحرك ويتكلم بشكل واقعي، وأشارت «مايكروسوفت» إلى أنّ فوائد ابتكار تلك الأداة، هي تعزيز المساواة بمجال التعليم، ومساعدة الذين يعانون من صعوبات في التواصل مع البشر، وتوفير الدعم العلاجي لكل من يحتاج إليه.

شركات أخرى

وهناك شركات أخرى تعمل على تلك التقنية، مثل شركة «Runway» المتخصصة في الذكاء الاصطناعي التوليدي للفيديو، وأنشأ بعض الباحثين من جوجل برنامج ذكاء اصطناعي يدعى «فلوغر» يستطيع عمل مقاطع فيديو واقعية بوجوه متكلمة، ولا تعتزم Microsoft إتاحة الاداة الجديدة أو تقديم أي معلومات عنها إلا بعد التأكد من صحة إستخدامها.

تحكم دقيق للمستخدم

ويتيح نموذج توليد الفيديو الذي بعمل بتقنية الذكاء الاصطناعي التوليدي، تحكم دقيق للمستخدم في مختلف جوانب المقطع، المتمثلة في اتجاه نظرة العين ومسافة الرأس، حيث تساعد تلك العناصر كثيراً في التحكم في وضعية الرأس ذات الأبعاد الثلاثة وديناميكيات الوجه، مما يساهم في تعديل الإخراج بحسب توجيهات المستخدم.

مايكروسوفت تبتكر أداة ذكاء إصطناعي قادرة على تحويل صورة ومقطع صوتي إلى وجه متكلم

مخاوف كثيرة

إلتقاط صورة وجه

شركات أخرى

تحكم دقيق للمستخدم

عن الكاتب

عرض المزيد من