Kategorie

Kontakt

Was ist Anomalieerkennung?

Definition, Anwendungsbereiche und die fünf grössten Herausforderungen bei der Erkennung von Abweichungen in Daten.

Definition

Anomalieerkennung (englisch: Anomaly Detection) bezeichnet das automatisierte Aufspüren von Datenpunkten, Mustern oder Ereignissen, die signifikant vom erwarteten Verhalten abweichen. Formal ausgedrückt: die Suche nach Strukturen in einem Dataset, die sich nicht erwartungsgemäss verhalten.

In der Praxis heisst das: Aus einer grossen Menge von Daten – Sensormessungen, Transaktionen, Bildern, Zeitreihen – diejenigen Werte identifizieren, die auf ein Problem hindeuten. Anomalieerkennung verbindet Methoden aus dem maschinellen Lernen, der Statistik und dem Data Mining.

Bildnachweis: dbta.com

Wo wird Anomalieerkennung eingesetzt?

Die Anwendungsbereiche sind breit – und je nach Domäne unterscheiden sich die Methoden erheblich:

Industrielle Fertigung: Ein Hersteller von Medikamentenkapseln überwacht das Gewicht jeder Kapsel. Weicht das Gewicht um 20% ab, liegt offensichtlich ein Produktionsfehler vor. Aber was bei 2%? Oder 5%? Genau diese Grenzwertentscheidungen machen Anomalieerkennung komplex. Wir setzen solche Systeme im Kontext von Predictive Maintenance ein – von Vibrationsanalyse bis zur optischen Deformationserkennung.

Qualitätssicherung: Bei der Bilderkennung von Defekten werden Computer-Vision-Modelle darauf trainiert, Abweichungen in Produkten oder Infrastruktur zu erkennen – etwa Risse in Tunnelwänden oder fehlerhafte Bauteile auf dem Shopfloor.

Betrugserkennung: Kreditkartenanbieter analysieren Transaktionsmuster. Wenn plötzlich ein Kauf über mehrere tausend Franken registriert wird, obwohl die Karte normalerweise nur für Zugfahrkarten genutzt wird, deutet das auf Missbrauch hin.

IT-Sicherheit: Anomalieerkennung in Netzwerkverkehr und Logdaten erkennt Cyberangriffe, bevor sie Schaden anrichten.

Prozessdaten im ÖV: Bei der Schienenkopfkonditionierung für Bernmobil erkennen Sensoren frühzeitig, wann eine Schmierung nötig wird – basierend auf Abweichungen in den Messwerten.

Die Schlüsselelemente einer Anomalieerkennungsproblematik: Daten, Informationen, Art der Anomalie, Algorithmus und erwartetes Ergebnis.

Die fünf grössten Herausforderungen

Anomalieerkennung klingt einfach: Finde das, was nicht normal ist. In der Praxis steckt die Komplexität im Detail.

1. Wo liegt die Grenze zwischen normal und anormal?

Das Medikamenten-Beispiel zeigt das Problem: 20% Abweichung ist klar problematisch. Aber bei 5%? Oder 4,9% vs. 5,1% bei einem Grenzwert von 5%? Statische Schwellenwerte funktionieren selten. Die Herausforderung wächst, wenn mehrere Dimensionen gleichzeitig betrachtet werden müssen – Gewicht, pH-Wert, Temperatur, Produktionsgeschwindigkeit.

Moderne Ansätze arbeiten deshalb mit probabilistischen Modellen, die statt eines harten Grenzwerts eine Wahrscheinlichkeit für eine Anomalie berechnen. Der Mensch entscheidet dann, ab welcher Schwelle reagiert wird – ein klassisches Human-in-the-Loop-Szenario.

2. Anomalien, die sich tarnen

Bei Cyberattacken oder Betrug versuchen die Verursacher aktiv, ihr Verhalten als normal erscheinen zu lassen. Die Definition einer Anomalie wird damit dynamisch – der Algorithmus muss nicht nur bekannte Muster erkennen, sondern auch neuartige Abweichungen.

3. Was heute normal ist, kann morgen anormal sein

In manchen Bereichen verändert sich die Definition einer Anomalie über die Zeit. Ein Beispiel: Eine schlecht regulierte Maschinenbewegung verursacht Reibung zwischen zwei Metallteilen, erkennbar an einem Quietschgeräusch. Mit der Zeit schleift sich das Metall ab – das Geräusch verschwindet, aber die Reibung bleibt. Der Algorithmus muss solchen Concept Drift erkennen und sich anpassen.

4. Rauschen vs. Anomalie

Sensordaten enthalten immer Messrauschen. Die Herausforderung: Rauschen von echten Anomalien unterscheiden. Manchmal sind die gesuchten Anomalien selbst subtile Veränderungen im Signal – etwa ein leicht verändertes Frequenzspektrum bei einem sich abnutzenden Lager.

5. Keine Universallösung

Ein Algorithmus, der für Temperaturüberwachung in der Pharmaproduktion funktioniert, versagt bei der Analyse von Finanztransaktionen. In der Medizin ist eine einzelne Abweichung der Körpertemperatur sofort relevant. An den Finanzmärkten sind Abweichungen alltäglich. Die Methode muss immer auf das spezifische Problemfeld abgestimmt werden – Domänen-Know-how ist ebenso wichtig wie die technische Expertise. Genau hier setzt unsere Arbeitsweise an: Wir verbinden Data Science mit tiefem Branchenverständnis in Industrie, öffentlichem Verkehr und Verwaltung.

Nächster Artikel

Im zweiten Teil dieser Serie gehen wir auf die drei Arten und drei Szenarien der Anomalieerkennung ein: Wann spricht man von einer punktuellen, kontextuellen oder kollektiven Anomalie? Und wie beeinflussen die verfügbaren Daten den Lösungsansatz?

Verwandte Artikel

kontakt

Wir freuen uns, von Ihnen zu hören!