جوجل تكشف النقاب عن ميزة ذكاء اصطناعي جديدة لـ Gemini يمكنها فهم الصور في الوقت الفعلي

ردًا على GPT-4o، عرضت Google الميزة الجديدة للإدراك البصري لجيميناي

أعلنت جوجل عن ميزة جديدة لـ Gemini تسمح للذكاء الاصطناعي بفهم الصور في الوقت الفعلي. تُعد هذه الميزة منافسة مباشرة لـ ChatGPT-4o من OpenAI، والتي تم الكشف عنها مؤخرًا.

ردًا على GPT-4o، عرضت Google الميزة الجديدة للإدراك البصري لجيميناي

قبل ساعات قليلة من مؤتمر المطورين I/O أعلنت جوجل عن ميزة جديدة مثيرة للاهتمام لـ Gemini وأصدرت الشركة مقطع فيديو قصيرًا يعرض ميزة الذكاء الاصطناعي الجديدة. باستخدام هذه الميزة، يستطيع جيميناي التعرف على الفور على ما هو موجود في إطار الصورة.

نشرت شركة جوجل مقطع فيديو على شبكة التواصل الاجتماعي أكس حيث قام أحد الأشخاص بفتح كاميرا هاتف جوجل بكسل الخاص به ونرى أيضًا كلمة I/O على المسرح. يتم طرح السؤال "ماذا برأيك يحدث هنا؟" على جيميناي ويجيب الذكاء الاصطناعي: "يبدو أن بعض الأشخاص يستعدون لحدث كبير ربما مؤتمر أو عرض تقديمي".

جوجل تتنافس مع ChatGPT-4o

وفي فيديو الكشف عن نموذج ChatGPT-4o تناولت OpenAI أيضًا القدرة على فهم الصور والأصوات في الوقت الفعلي وفي فيديو الشركة رأينا أن ChatGPT-4o يمكنه التعرف على الفيديو والصوت بأقل قدر من التأخير وإخبارك بأنك على ما يبدو جاهز لتقديم عرض تقديمي ويبدو الان أن فيديو جوجل هو الرد القاسي لنفس قدرة الذكاء الاصطناعي والتي لم تتوقعهُ أوبن أيه آي.

ومع ذلك لا يزال الغموض يدور حول الميزة الجديد ولا توجد الكثير من المعلومات على الرغم من أنها تحمل أوجه تشابه مع Google Lens أو البحث المعتمد على الكاميرا الخاص بالشركة ومع ذلك يبدو أن هذا الذكاء الاصطناعي يعمل على الاستجابة في الوقت الفعلي ويستجيب للأوامر الصوتية تمامًا مثل الذكاء الاصطناعي متعدد الأوجه في نظارات ميتا الذكية. ومن المثير للاهتمام أيضًا أن هذه الميزة تظهر على هاتف بكسل في هذا الفيديو حيث أنهُ غالبًا ما تصدر جوجل ميزات الذكاء الاصطناعي الجديدة أولاً في سلسلة Pixel الخاصة بها.

وعلى الرغم من أنه من غير المعتاد إصدار مثل هذا الفيديو قبل ساعات قليلة من مؤتمر I/O فمن الممكن أن تكون جوجل قد صنعت هذا الفيديو ردًا على فيديو الكشف عن قدرات نموذج GPT-4o.

إرسال تعليق (0)
أحدث أقدم