Machbarkeitsstudie zur audiobasierten Detektion von Zugvogelrufen

Wichtigsten Punkte auf einen Blick

  • Ergebnis Machbarkeitsstudie Nocmig (kein Demonstrator)
  • Nächtliche Aufnahmen von Vogelrufen über mehrere Jahre zur Studie von Zugvögeln
  • Bisher: Aufwändige manuelle Durchsuchung und Annotation der Spektrogramme für Vogelrufe
  • Stattdessen: Training von KI Modell auf bestehenden Daten
  • Modell kann 97% der Vogelrufe finden, menschlicher Experte muss nur noch Vogelart bestimmen

Kurzbeschreibung

Während LLM-basierte KI Systeme zur Zeit stark im Vordergrund stehen, sollten „klassische“ Deep-Learning Ansätze keinesfalls vernachlässigt werden. Viele monotone und zeitaufwändige Arbeiten können auch weiterhin mit beschränkter Hardware und herkömmlichen Datenbeständen automatisiert werden.

Im Hobby-Projekt Nocmig (Nocturnal Migration) wurden über mehrere Jahre nächtlich die Rufe von Vögeln aufgenommen und von Ornithologen mühsam per Hand annotiert. Das Ziel ist es, Daten über die Migration von Zugvögeln zu sammeln.

Anhand dieser Daten wurde vom TZLR ein leichtgewichtiges KI Modell (Basis ResNet-18) trainiert, um das detektieren der Vogelrufe zu automatisieren. Das Modell kann 97% der Vogelrufe finden, eine deutlich bessere Leistung als herkömmliche frei verfügbare Modelle. Anstatt die gesamten Aufnahmen per Hand zu durchsuchen, können sich die menschlichen Experten nun darauf fokussieren, für die vom Modell gefundenen Vogelrufe die Vogelart zu bestimmen.

Das gleiche Prinzip kann auf viele Datenbestände, die z.B. in Forschungseinrichtungen oder kleinen und mittelständischen Unternehmen bereits existieren, angewendet werden.

Transfer und Nachnutzbarkeit

Das Prinzip kann auf zahlreiche Anwendungsfälle übertragen werden. Die Studie zeigt, wie monotone, zeitaufwendige, und damit teure, Prozesse auch ohne LLMs durch KI automatisiert werden können.

Genutzte Hardware

  • PC mit beliebiger moderner NVIDIA Grafikkarte