قام فريق من الباحثين في Google Research بتطوير أداة جديدة للذكاء الاصطناعي تسمى Lumiere "لوميير" والتي يطلق عليها الجيل التالي من أدوات إنتاج الفيديو بالنص. تقول جوجل أن Lumiere يمكنه إنشاء مقاطع فيديو كاملة بحركات متسقة وسلسة وواقعية.
تواجه العديد من نماذج الذكاء الاصطناعي لإنتاج الفيديو الحالية صعوبة في تمثيل الحركة وحتى لو تمكنت من القيام بذلك بشكل جيد فقد تكون العناصر الأخرى ضعيفة. للتغلب على هذه المشكلات استخدمت جوجل أسلوبًا مختلفًا لإنتاج الفيديو بلغة لوميير، والتي ربما سُميت على اسم الأخوين لوميير من أبرز الأسماء في عالم السينما. في الواقع يقوم Lumiere بإنشاء الفيديو بأكمله في عملية واحدة بدلاً من تجميع إطارات منفصلة معًا ويمكنه إدارة مواقع الأشياء وحركتها في وقت واحد.
لا تزال Lumiere مشروعًا بحثيًا، لكنها تُبشر بمستقبل جديد لصناعة الفيديو |
لا يزال الذكاء الاصطناعي الخاص بـLumiere مشروعًا بحثيًا لذا لا يمكنك استخدامه حاليًا. ومع ذلك فقد شاركت جوجل مقطع فيديو قصيرًا لإمكانياتها والذي يمكنك مشاهدته أدناه.
لوميير: مستقبل صناعة الفيديو؟
وكما هو موضح في الفيديو أعلاه، يمكن استخدام Lumiere كأداة لتحويل النص إلى فيديو صور. يمكنك أيضًا منحه النمط الذي تريده لإنتاج الفيديو النهائي بناءً عليه. بالإضافة إلى ذلك يمكنك تحرير الفيديو الخاص بك من خلاله باستخدام الأوامر النصية.
قامت جوجل ببناء نموذج الذكاء الاصطناعي الخاص بها على أساس هندسة الزمكان؛ بمعنى أن لوميير يمكنه أن يأخذ بعين الاعتبار جميع جوانب الحركة والموقع. فهو يمكنهُ أن يفهم أين يقع موضوع الصورة أثناء عملية إنتاج الفيديو كما أنه يتحقق من أشياء مثل الوقت وكيفية تحرك الكائنات لصنع الفيديو.
يقول الباحثون: "يتعلم نموذجنا كيفية إنشاء فيديو منخفض الدقة وبمعدل إطار كامل بشكل مباشر من خلال معالجته على نطاقات مكانية وزمانية متعددة."
لم يتم إصدار لوميير للجمهور بعد ولكن إذا كنت مهتمًا بمعرفة المزيد حول روبوت الذكاء الاصطناعي هذا فيمكنك التوجه إلى الصفحة الخاصة به على جيت هاب والتي تعرض بعض مقاطع الفيديو التجريبية.