جدول المحتويات:
- هذه هي الطريقة التي تعمل بها خوارزمية Google
- التصحيح التلقائي مع مراعاة السياق
- ربما سنرى هذه التكنولوجيا في Pixel
طور باحثون من Google ومعهد ماساتشوستس للتكنولوجيا خوارزمية تسعى إلى تصحيح العيوب في اللقطات ذات الزاوية الواسعة.
ربما تكون قد رأيت أن وجوه بعض الأشخاص تبدو مشدودة أو مضغوطة قليلاً أو بها بعض التشويه في الصور. على الرغم من أن ذلك قد يرجع إلى المهارات القليلة للمصور الفوتوغرافي ، إلا أن الحقيقة هي أن اللقطات بالعدسة ذات الزاوية العريضة من الأجهزة المحمولة عادةً ما تسبب تشويشًا للأشياء أو الأشخاص الموجودين على حافة الصورة.
هناك طرق مختلفة تحاول حل هذه المشكلة ، ولكن حتى الآن لم تكن أي منها فعالة مثل اقتراح Google الجديد. على الرغم من أنه قد يبدو من السهل إصلاحه ، إلا أنه ليس كذلك ، لأنه يتطلب تحريرًا محليًا معقدًا لا يؤثر على بقية الكائنات في الصورة.
هذه هي الطريقة التي تعمل بها خوارزمية Google
كما أوضح الباحثون ، تكتشف هذه الخوارزمية الوجوه وتخلق شبكة تسمح تلقائيًا بعكس هذا النوع من التشويه عند التقاط لقطة بزاوية واسعة كما هو موضح في الصورة:
يمكننا معرفة الفرق عند تطبيق هذه الخوارزمية في الصور التالية. إنها صورة سيلفي تم التقاطها بعدسة بزاوية عريضة مع مجال رؤية 97 درجة.
تُظهر الصورة الأولى التشوهات في الوجوه وتوضح الثانية كيف أعادت الخوارزمية أشكال الوجه إلى حالتها الأصلية.
أي أن هذه العملية يتم تفعيلها تلقائيًا عند استخدام العدسة ذات الزاوية العريضة ، مما يوفر هذه المساعدة الخاصة للوجوه ، ولكن دون إحداث تغييرات في باقي الصورة. وبالطبع ، فإن سرعة هذا التصحيح التلقائي (حوالي 920 مللي ثانية) تجعل من المستحيل على المستخدمين اكتشافها.
وفقًا لاختباراتهم ، تعمل هذه الخوارزمية بنجاح في نطاق 70 درجة إلى 120 درجة في مجال الرؤية ، وتغطي جميع الاحتمالات تقريبًا من جهاز محمول.
للاستفادة من إمكانات هذه الخوارزمية ، لن يضطر المستخدم إلى اتخاذ أي إجراء أو تنشيط أي وضع كاميرا خاص. لن يتم تنفيذ هذه الوظيفة تلقائيًا إلا عندما تكتشف أن العدسة ذات الزاوية الواسعة مستخدمة.
التصحيح التلقائي مع مراعاة السياق
يمكننا أن نرى ديناميكيات هذه الخوارزمية في الفيديو التالي:
تصحح الخوارزمية تلقائيًا مع مراعاة بقية الكائنات التي تظهر على المشهد ، مما يضمن تطابق سياق الصورة بالكامل. النتائج طبيعية بدون تفاصيل توضح أن الصورة قد تم تعديلها على الإطلاق.
شارك الفريق الذي يقف وراء هذا المشروع معرضًا للصور على Flickr يوضح كيف تعالج الطرق المختلفة هذه المشكلة مقارنة بديناميكيات الخوارزمية الخاصة بهم. هناك أكثر من 160 صورة (مثل تلك التي تراها في بداية المقال) تساعدنا في تقييم النتائج.
ربما سنرى هذه التكنولوجيا في Pixel
يمكننا أن نأمل أن يتم تطبيق هذه الخوارزمية أو بعض التقنيات المشتقة في الجيل التالي من Pixel ، نظرًا لأن الفريق الذي يشارك في هذا المشروع هم موظفون في Google.
ومع ذلك ، في المستند الذي شاركوه ، لم يذكروا أي شيء عنه. نجحت هذه الاختبارات الأولى للخوارزمية في العمل في إظهار مرة أخرى كيف يمكن لإمكانات الذكاء الاصطناعي تحسين ديناميكيات الأجهزة المحمولة وتسهيل الحياة على المستخدمين.
نظرًا لأنه بدون شك ، فإن وجود ديناميكية مماثلة في أجهزتنا المحمولة سيوفر الكثير من الصداع والوقت في محاولة تعديل هذه التشوهات في الصور.