• Home
  • Inline Documentation
  • Private Doc
  • Search
  • Home
  • Inline Documentation
  • Private Doc
  • Search
  • 1 Praktische Relevanz und Innovationskraft
    • 1.1 Das Ziel des Projekts CulinAIbot
    • 1.2 Die praktische Relevanz von CulinAIBot
    • 1.3 Anwendungsfälle und Nutzung der Ergebnisse
    • 1.4 Innovationskraft
  • 2 Workflow und Eingesetzte Methoden
    • 2.1 Architektur
      • 2.1.1 Hardware
      • 2.1.2 Software
    • 2.2 Sprach Dialogsystem
      • 2.2.1 Spracherkennung und Sprachverarbeitung
        • 2.2.1.1 Daten
        • 2.2.1.2 KI-Modelle
      • 2.2.2 Spracherzeugung
        • 2.2.2.1 Daten
        • 2.2.2.2 KI-Modelle
    • 2.3 Bild- und Objekterkennung
      • 2.3.1 Daten
      • 2.3.2 KI-Modelle
    • 2.4 Multimodales Dialogmanagement: Kombination von Sprache und visuellen Daten
    • 2.5 Wahrnehmung und Kartierung
    • 2.6 Action Management
    • 2.7 Autonome Navigation und Mobilitätssystem
    • 2.8 Präzisionsmanipulation und Steuerung der Roboterarme
  • 3 Anwendungen und Ergebnisse
    • 3.1 Bilder des CulinAIBot
    • 3.2 Rezepte suchen und generieren
  • 4 Kritische Reflexion des Projekts
    • 4.1 Auswertung des Projekts
    • 4.2 Herausforderungen während der Umsetzung
    • 4.3 Potential des Projekts
    • 4.4 Schwachstellen des Projekts
    • 4.5 Nächste Schritte
  • 5 Programm Code
  • 6 Zusätzliche Daten
  • 7 Video Pitch
  • 8 Literaturverzeichnis
  • 9. Abkürzungsverzeichnis und Glossar
  • 10 Das Team

2.2.1.2 KI-Modelle

3 views 0[print-me printstyle="pom-small-grey" tag="span" id="1988" target=".title-content-print"]

Written by admin
September 20, 2024
  • CNN Model für die „Wake Word Detection“:
    • die Ergebnisse des CNN mit den Ergebnissen mit dem Model VOSK vergleichen zu können.
    • Für das CNN der „Wake Word Detection“ nutze ich aktuell 100 Sprach-Samples von „Hey CulinAIBot“ Trainingsgenauigkeit von 90%. Bei der Wake Word Detection Erkennung wurden am Anfang ähnlich klingende Worte auch als Wake Word erkannt worden. Dies ließ sich durch ein größeres Trainings DataSet verbessern.
  • VOSK
    • VOSK wird in der BWKI Abgabe wie im Abschnitt 2.2.1 Spracherkennung und Sprachverarbeitung beschrieben eingesetzt. Die VOSK Spracherkennung funktioniert ohne Probleme.
  • OpenAI
    • OpenAI ChatGTP API wird in der BWKI Abgabe wie im Abschnitt 2.2.1 Spracherkennung und Sprachverarbeitung beschrieben eingesetzt.
  • Rasa
    • Im nächsten Schritt wird Rasa in Kombination mit dem LLM Llama 3.1 eingesetzt werden
  • Llama 3.1
    • In Zukunft werde ich mich mit dem Fine-Tuning von LLMs beschäftigen. Hierfür werden dann Daten aus dem Kontext der Küche, Rezept-Datenbanken, usw. benötigt.

Was this helpful?

Yes  No
Related Articles
  • 2.5 Wahrnehmung und Kartierung
  • 3.1 Bilder des CulinAIBot
  • 2.7 Autonome Navigation und Mobilitätssystem
  • 2.8 Präzisionsmanipulation und Steuerung der Roboterarme
  • 9. Abkürzungsverzeichnis und Glossar
  • 2.6 Action Management

No luck finding what you need? Contact Us

Leave A Comment Antworten abbrechen

Previously
2.2.1.1 Daten
Up Next
2.2.2 Spracherzeugung
Copyright 2024 CulinAIBot.de. All Rights Reserved