Gemini 1.5 Pro يدعم الان معالجة صوتية مُتقدمة تتفوق على أحدث نماذج الذكاء الاصطناعي

أعلنت جوجل في مؤتمر Cloud Next أن طراز Gemini 1.5 Pro يدعم الان المعالجة الصوتية. يمكن لنموذج الذكاء الاصطناعي هذا الآن الاستماع إلى الملفات الصوتية التي تم تحميلها، والمكالمات الصوتية بالإضافة إلى صوت الفيديو وفهمها دون الحاجة إلى ترجمة نصية. وقالت جوجل أيضًا إنها ستجعل Gemini 1.5 Pro متاحًا للجمهور لأول مرة من خلال منصة Vertex AI الخاصة بها.

وبحسب تقرير ذا فيرج فإن الإصدار الجديد من Gemini Pro والذي كان من المفترض أن يكون العضو الأوسط في عائلة جيميناي يتفوق حاليًا على أكبر وأقوى عضو في هذه العائلة والذي يُطلق عليه Gemini Ultra. ومن حيث الأداء تقول جوجل أن Gemini 1.5 Pro يمكنه فهم التعليمات المعقدة وهو أسرع من Gemini Ultra.

جوجل تُطلق Gemini 1.5 Pro: معالجة صوتية مُتقدمة تتفوق على أحدث نماذج الذكاء الاصطناعي

جيميناي برو 1.5 برو نموذج جوجل للذكاء الاصطناعي

وقالت جوجل سابقًا أن Gemini 1.5 Pro يتفوق على Gemini 1.0 Pro في 87 بالمائة من المعايير بل ويتفوق على Gemini Ultra 1.0 في بعض الميزات. كما أُعلن سابقًا أن المستخدمين بهذا النموذج يمكنهم معالجة ساعة واحدة من الفيديو و11 ساعة من الصوت وأكواد تحتوي على أكثر من 30 ألف سطر أو أكثر من 700 ألف كلمة في نفس الوقت.

قفزة نوعية في معالجة الذكاء الاصطناعي: Gemini 1.5 Pro يُقدم فهمًا متقدمًا للنصوص الصوتية

إن Gemini 1.5 Pro ليس نموذج Google AI الوحيد الذي تمت ترقيته. فقد تم أيضًا تقديم تحديث جديد من نموذج تحويل النص إلى صورة الخاص بـ Imagen 2 مما يسمح للمستخدمين بإضافة أو إزالة عناصر مختلفة من الصور. أيضًا تمت إضافة القدرة على تحويل النصوص إلى صور متحركة إلى هذا النموذج. وأتاحت جوجل أيضًا ميزة العلامات المائية الرقمية SynthID على جميع الصور التي تم إنشاؤها من خلال نماذج Imagen.

Gemini 1.5 Pro متاح حاليًا فقط لأولئك الذين لديهم إمكانية الوصول إلى منصة Vertex AI.

Gemini 1.5 Pro يدعم الان معالجة صوتية مُتقدمة تتفوق على أحدث نماذج الذكاء الاصطناعي

جيميناي برو 1.5 برو نموذج جوجل للذكاء الاصطناعي

نموذج الاتصال