طور باحثون في شركة جوجل نظامًا جديدًا للذكاء الاصطناعي يمكنه إنشاء مقاطع فيديو واقعية لأي شخص موجود في أي صورة ويظهرهُ وهو يتحدث ويتحرك بشكل واقعي. تستخدم التقنية المسماة VLOGGER نماذج متقدمة للتعلم الآلي لتجميع مقاطع فيديو واقعية لكن بنفس الوقت هذه الميزة أثارة مخاوف بشأن انتشار التزييف العميق والمعلومات الكاذبة مع هذه التقنية.
قدم باحثو جوجل تقنية VLOGGER للذكاء الاصطناعي في مقال. ويبدو أنهُ يمكن لهذا الذكاء الاصطناعي إنتاج مقطع فيديو بصوت شخص ما من خلال دمج صورة الشخص مع مقطع صوتي. تتضمن مقاطع الفيديو الخاصة بهذا الذكاء الاصطناعي أيضًا تعبيرات الوجه وحركات الرأس واليد. مع ذلك بشكل عام لا يزال هناك عيوب في مقاطع الفيديو هذه ولكن يمكن إصلاحها بمرور الوقت.
استخدم باحثو جوجل نوعًا من نماذج التعلم الآلي يسمى نماذج الانتشار (Diffusion Models) لتطوير هذا الذكاء الاصطناعي. أظهرت نماذج الانتشار مؤخرًا أداءً رائعًا في إنشاء صور واقعية للغاية عبر كتابة نص وصفي. ومن خلال توسيع هذه النماذج لتشمل مجال الفيديو؛ تمكن الباحثون من إنشاء نظام ذكاء اصطناعي يمكنه جعل الصور تتحرك بطريقة واقعية.
يمكن أن يكون لهذا الذكاء الاصطناعي تطبيقات مختلفة في العديد من المجالات. على سبيل المثال يمكن للممثلين إنتاج نماذج ثلاثية الأبعاد دقيقة لاستخدامها في جزء من الفيلم. كما يمكن أيضًا استخدام هذه التقنية لإنشاء صور رمزية واقعية في سماعات الواقع الافتراضي وألعاب الفيديو.
ومع ذلك بنفس الوقت يمكن إساءة استخدام هذه التكنولوجيا. على سبيل المثال يمكن استخدامها في التزييف العميق. وأيضًا نظرًا لأن هذا الذكاء الاصطناعي يمكنه إنشاء مقطع فيديو قابل للتصديق باستخدام صورة وملف صوتي فقط فمن المؤكد أنه سيثير بعض المخاوف.