Das Fraunhofer-Institut für Digitale Medientechnologie IDMT hat ein auf künstlicher Intelligenz basierendes System entwickelt, das automatisch erkennt, ob Träger von Mund-Nasen-Bedeckungen diese richtig aufgesetzt haben.
Mit dem neuen System können bis zu zehn Personen gleichzeitig im Vorbeigehen hinsichtlich des korrekten Tragens der Alltagsmaske überprüft werden, wie das Fraunhofer IDMT weiter erläutert. Die Personen müssten sich nicht gezielt vor dem Gerät positionieren. Das System trägt den Namen „Mask Cognizer“.
Feedback per Audio oder visuell
Für die Lösung setzen die Wissenschaftler Technologie von Fraunhofer zur KI-basierten Gesichtsanalyse und Detektion ein. Außerdem ist in dem Prototypen eine intelligente Audiosystemtechnik des Fraunhofer-Instituts verbaut.
»Durch eine angepasste und positionsgenaue Sprachausgabe wird eine Verständlichkeit der Ansage, auch in lauten Umgebungen, gewährleistet«, erklärt Jan Wellmann, Gruppenleiter Audiosystemtechnik und Automatische Spracherkennung am Standort für Hör-, Sprach- und Audiotechnologie HSA des Institutes. In leisen Umgebungen, wo ein akustisches Feedback nicht erwünscht ist, lässt sich das Gerät auch nur mit einem visuellen Feedback, mittels Display ausstatten. Dazu zählen beispielsweise Bibliotheken, Museen oder Restaurants.
Privatsphäre im Blick
Es lässt sich gut in Situationen einsetzen, wo viele Menschen möglichst schnell durch Einlasssysteme gelangen wollen, so das Fraunhofer-Institut. Es sei dort sinnvoll, wo aktuell das Personal zusätzlich zu seiner eigentlichen Tätigkeit überprüfen muss, ob die Menschen den Maskenschutz einhalten.
Der Schutz der Privatsphäre des Einzelnen werde dabei eingehalten. Die Lösung speichere oder verarbeite so zu keinem Zeitpunkt personenbezogene Daten. Das Auswerten des Kamerabildes und ein entsprechendes Signal an die jeweilige Person erfolgt dazu in Echtzeit lokal im Gerät.
Das System ist als integrierbares Software-Modul lizenzierbar. Es lässt sich auch mit kostengünstiger Hardware umsetzen, erklären die Wissenschaftler. Den ersten Prototypen haben sie mit einem Nvidia Jetson Nano realisiert. Er verfügt über eine Ausgabe per Sprache und per Lichtsignal. Weitere technische Fakten hat das Institut hier auf seiner Webseite zusammengestellt.