تطبيق Gemini من Google يتيح تحويل الصور إلى فيديوهات مع دعم صوتي

لندن-راي اليوم
في خطوة جديدة تعزز قدرات الذكاء الاصطناعي التوليدي، أعلنت شركة غوغل عن دعم ميزة تحويل الصور إلى مقاطع فيديو داخل تطبيق “Gemini”، وذلك باستخدام نموذج الفيديو المتطور “Veo 3″، الذي تم الكشف عنه خلال مؤتمر Google I/O للمطورين في مايو الماضي.
ووفقًا لما نقلته منصة Mashable، فإن الميزة أصبحت متاحة اعتبارًا من اليوم، حيث بات بإمكان المستخدمين تحميل صورة واحدة إلى “Gemini” وتحويلها إلى فيديو بصوت باستخدام أوامر نصية بسيطة. وتأتي هذه الإضافة في ظل تنامي شعبية أدوات الذكاء الاصطناعي التي تحوّل الصور الثابتة إلى فيديوهات حركية، مثل “Luma” و”Kling”.
ما الذي يميز Veo 3؟
نموذج “Veo 3” يعد قفزة نوعية في عالم توليد الفيديو عبر الذكاء الاصطناعي؛ إذ يتميز بدعم الصوت مع الصورة، وهي ميزة لم تكن متوفرة في الإصدارات السابقة. وأكدت “غوغل” أن جميع الفيديوهات الناتجة من Veo 3 تتضمن علامة مائية مرئية وأخرى غير مرئية عبر تقنية “SynthID”، لضمان الشفافية وتقليل خطر التضليل باستخدام المحتوى المُولد.
كيف تعمل الميزة؟
سيظهر خيار “الفيديوهات” ضمن أدوات المساعد الذكي لمستخدمي باقات “AI Pro” (بتكلفة 20 دولارًا شهريًا) أو “AI Ultra” (بتكلفة 250 دولارًا شهريًا). ومن خلاله، يمكن للمستخدم تحميل صورة واحدة وإدخال وصف نصي يُستخدم كأساس لتحريك الصورة وإنشاء فيديو متكامل.
من يمكنه استخدام الميزة؟
يجب أن يكون المستخدم بعمر 18 عامًا فأكثر.
يجب امتلاك حساب شخصي على غوغل، إذ لا تعمل الميزة مع حسابات الشركات أو المدارس.
يتطلب الاشتراك في واحدة من باقات “Gemini” المدفوعة (AI Pro أو AI Ultra).
بداية جديدة في عالم الفيديو والألعاب؟
يرى بعض الخبراء أن نموذج “Veo 3” يمكن أن يمثل بداية حقيقية لتطبيقات الذكاء الاصطناعي في صناعة ألعاب الفيديو، نظرًا لقدرته على توليد محتوى بصري وصوتي متكامل انطلاقًا من مدخلات بسيطة. ويُتوقع أن تفتح هذه التكنولوجيا الباب أمام أدوات تصميم جديدة لصناع المحتوى والمطورين على حد سواء.
بهذه الخطوة، تدخل “غوغل” المنافسة بقوة في سوق أدوات تحويل الصور إلى فيديو، وتُثبت أن مستقبل الذكاء الاصطناعي في صناعة الوسائط البصرية ما يزال في بداياته.