الرؤية الحاسوبية هي قدرة الآلات على "الرؤية". ليس مجرد تسجيل البكسلات مثل الكاميرا، بل فهم ما تمثله تلك البكسلات.

يقوم كاشف الكائنات بمسح صورتك ورسم مربعات حول العناصر التي يتعرف عليها.

النموذج: COCO-SSD

نستخدم نموذجاً مدرباً على مجموعة بيانات COCO. يمكنه التعرف على 80 فئة من العناصر الشائعة، بما في ذلك:

  • النقل: سيارة، دراجة، طائرة، قطار.
  • الحيوانات: شخص، قطة، كلب، حصان.
  • المنزل: كرسي، أريكة، تلفزيون، كمبيوتر محمول.

كيف يعمل

نظرت نماذج الذكاء الاصطناعي القديمة إلى الصورة آلاف المرات. هذا كان بطيئاً. النماذج الحديثة مثل YOLO تنظر إلى الصورة مرة واحدة وتتنبأ بجميع المربعات في وقت واحد. هذا يجعلها سريعة جداً.

حالات الاستخدام

1. العد الآلي

هل تحتاج إلى عد عدد السيارات في ساحة انتظار؟ أو عدد الأشخاص في حشد؟ دع الذكاء الاصطناعي يقوم بذلك.

2. إمكانية الوصول

تدعم هذه التقنية "قارئات الشاشة" للمكفوفين، حيث تصف الصور بصوت عالٍ.