- CNN Model für die „Wake Word Detection“:
- die Ergebnisse des CNN mit den Ergebnissen mit dem Model VOSK vergleichen zu können.
- Für das CNN der „Wake Word Detection“ nutze ich aktuell 100 Sprach-Samples von „Hey CulinAIBot“ Trainingsgenauigkeit von 90%. Bei der Wake Word Detection Erkennung wurden am Anfang ähnlich klingende Worte auch als Wake Word erkannt worden. Dies ließ sich durch ein größeres Trainings DataSet verbessern.
- VOSK
- VOSK wird in der BWKI Abgabe wie im Abschnitt 2.2.1 Spracherkennung und Sprachverarbeitung beschrieben eingesetzt. Die VOSK Spracherkennung funktioniert ohne Probleme.
- OpenAI
- OpenAI ChatGTP API wird in der BWKI Abgabe wie im Abschnitt 2.2.1 Spracherkennung und Sprachverarbeitung beschrieben eingesetzt.
- Rasa
- Im nächsten Schritt wird Rasa in Kombination mit dem LLM Llama 3.1 eingesetzt werden
- Llama 3.1
- In Zukunft werde ich mich mit dem Fine-Tuning von LLMs beschäftigen. Hierfür werden dann Daten aus dem Kontext der Küche, Rezept-Datenbanken, usw. benötigt.