2.3 Bild- und Objekterkennung

Überblick

Computer Vision (CV) bringt Maschinen wie CulinAIBot bei, die visuelle Welt zu verstehen und zu interpretieren. Dazu gehören Aufgaben wie die Erkennung, Klassifizierung und Segmentierung von Objekten in Bildern und Videos. Insbesondere die Objekterkennung ist eine entscheidende Aufgabe, bei der es darum geht, Objekte in einem Bild oder Video zu identifizieren und zu lokalisieren.

Für die Objekterkennung können verschiedene Frameworks verwendet werden, darunter YOLO (You Only Look Once), SSD (Single Shot MultiBox Detector) und Faster R-CNN. Unter diesen sticht YOLO durch seine beeindruckende Geschwindigkeit und Genauigkeit hervor. Die Weiterentwicklung von YOLO bis zur neuesten Version YOLOv10 hat erhebliche Verbesserungen gebracht. YOLOv10 ist besonders für seine hohe Leistung in Bezug auf Geschwindigkeit und Genauigkeit bekannt.

In meinem Projekten nutze ich für Object Detection Yolo8x (Ultralytics, 2023) zum Training von Modeln.

CulinAIBot

CulinAIBot basiert aktuell auf 53 Klassen aus Lebensmitteln, Koch-Utensilien, und weiteren Objekten in der Küche.

Die Zahl der durch das Model erkannten Klassen entwickle ich durch weitere Aufnahmen (Fotos, Videos) stetig weiter.

2.3 Bild- und Objekterkennung

Überblick

CulinAIBot

Related Articles

Leave A Comment Antworten abbrechen