• Home
  • Inline Documentation
  • Private Doc
  • Search
  • Home
  • Inline Documentation
  • Private Doc
  • Search
  • 1 Praktische Relevanz und Innovationskraft
    • 1.1 Das Ziel des Projekts CulinAIbot
    • 1.2 Die praktische Relevanz von CulinAIBot
    • 1.3 Anwendungsfälle und Nutzung der Ergebnisse
    • 1.4 Innovationskraft
  • 2 Workflow und Eingesetzte Methoden
    • 2.1 Architektur
      • 2.1.1 Hardware
      • 2.1.2 Software
    • 2.2 Sprach Dialogsystem
      • 2.2.1 Spracherkennung und Sprachverarbeitung
        • 2.2.1.1 Daten
        • 2.2.1.2 KI-Modelle
      • 2.2.2 Spracherzeugung
        • 2.2.2.1 Daten
        • 2.2.2.2 KI-Modelle
    • 2.3 Bild- und Objekterkennung
      • 2.3.1 Daten
      • 2.3.2 KI-Modelle
    • 2.4 Multimodales Dialogmanagement: Kombination von Sprache und visuellen Daten
    • 2.5 Wahrnehmung und Kartierung
    • 2.6 Action Management
    • 2.7 Autonome Navigation und Mobilitätssystem
    • 2.8 Präzisionsmanipulation und Steuerung der Roboterarme
  • 3 Anwendungen und Ergebnisse
    • 3.1 Bilder des CulinAIBot
    • 3.2 Rezepte suchen und generieren
  • 4 Kritische Reflexion des Projekts
    • 4.1 Auswertung des Projekts
    • 4.2 Herausforderungen während der Umsetzung
    • 4.3 Potential des Projekts
    • 4.4 Schwachstellen des Projekts
    • 4.5 Nächste Schritte
  • 5 Programm Code
  • 6 Zusätzliche Daten
  • 7 Video Pitch
  • 8 Literaturverzeichnis
  • 9. Abkürzungsverzeichnis und Glossar
  • 10 Das Team

2.3 Bild- und Objekterkennung

7 views 0[print-me printstyle="pom-small-grey" tag="span" id="2000" target=".title-content-print"]

Written by admin
September 20, 2024

Überblick

Computer Vision (CV) bringt Maschinen wie CulinAIBot bei, die visuelle Welt zu verstehen und zu interpretieren. Dazu gehören Aufgaben wie die Erkennung, Klassifizierung und Segmentierung von Objekten in Bildern und Videos. Insbesondere die Objekterkennung ist eine entscheidende Aufgabe, bei der es darum geht, Objekte in einem Bild oder Video zu identifizieren und zu lokalisieren.

Für die Objekterkennung können verschiedene Frameworks verwendet werden, darunter YOLO (You Only Look Once), SSD (Single Shot MultiBox Detector) und Faster R-CNN. Unter diesen sticht YOLO durch seine beeindruckende Geschwindigkeit und Genauigkeit hervor. Die Weiterentwicklung von YOLO bis zur neuesten Version YOLOv10 hat erhebliche Verbesserungen gebracht. YOLOv10 ist besonders für seine hohe Leistung in Bezug auf Geschwindigkeit und Genauigkeit bekannt.

In meinem Projekten nutze ich für Object Detection Yolo8x (Ultralytics, 2023) zum Training von Modeln.

CulinAIBot

CulinAIBot basiert aktuell auf 53 Klassen aus Lebensmitteln, Koch-Utensilien, und weiteren Objekten in der Küche.

Die Zahl der durch das Model erkannten Klassen entwickle ich durch weitere Aufnahmen (Fotos, Videos) stetig weiter.

Was this helpful?

Yes  No
Related Articles
  • 2.5 Wahrnehmung und Kartierung
  • 3.1 Bilder des CulinAIBot
  • 2.7 Autonome Navigation und Mobilitätssystem
  • 2.8 Präzisionsmanipulation und Steuerung der Roboterarme
  • 9. Abkürzungsverzeichnis und Glossar
  • 2.6 Action Management

No luck finding what you need? Contact Us

Leave A Comment Antworten abbrechen

Previously
2.2.2.2 KI-Modelle
Up Next
2.3.1 Daten
Copyright 2024 CulinAIBot.de. All Rights Reserved