Publikationen

DGLR-Publikationsdatenbank - Detailansicht

Titel:

Identifikation und Behandlung von Ausreißern in Flugbetriebsdaten für Machine Learning Modelle

Autor(en): S. Baumann, M. Gnisia, P. Feifel, U. Klingauf
Zusammenfassung: Operationelle Flugbetriebsdaten können teilweise auffällige Datenpunkte enthalten, die sich nicht den charakteristischen Verlauf des aufgezeichneten Parameters zuordnen lassen und man als Ausreißer bezeichnet. Zur Bereinigung von Ausreißern und zur Steigerung der Datenqualität sind geeignete Methoden zur Identifizierung, Kategorisierung und Behandlung (bspw. durch Korrektur) notwendig, die in diesem Beitrag zusammengetragen, diskutiert und anhand exemplarischer Untersuchung an realen Flugbetriebsdaten analysiert werden. Der vorliegende Beitrag widmet sich der Identifizierung und Behandlung von Ausreißern für Sensorparameter in Flugbetriebsdaten (Full Flight Data). Dabei erfolgt eine Einteilung unterschiedlicher Strategien, um Ausreißer zu identifizieren, wobei auch Vor- und Nachteile dieser Methoden diskutiert werden. Bei der Ausreißerbehandlung stehen zwei Aspekte im Fokus: einerseits wird das Ausmaß der Verzerrung der Datenreihe durch die Ausreißer analysiert und andererseits erfolgt eine Einteilung in unterschiedliche Ausreißerarten zur geeigneten Korrektur der Ausreißer. Erläutert werden geeignete Filter und Glättungsansätze sowie Algorithmen-basierte Verfahren aus dem Bereich Machine Learning. Für deren Bewertung werden statistische Metriken wie Lagemaße als Gütekritierien anhand von Testdaten bewertet. Durch die angebrachten Vorgehensweisen können Ausreißer entsprechend ihrer Art passend identifiziert und behandelt werden, sodass die Qualität der Datenreihen gesteigert werden kann. Damit kann ein Beitrag zur geeigneten Auswahl von Modellierungsparameter geleistet und die Güte der iterativen Lernmodelle gesteigert werden.
Veranstaltung: Deutscher Luft- und Raumfahrtkongress 2018, Friedrichshafen
Verlag, Ort: Deutsche Gesellschaft für Luft- und Raumfahrt - Lilienthal-Oberth e.V., Bonn, 2018
Medientyp: Conference Paper
Sprache: deutsch
Format: 21,0 x 29,7 cm, 11 Seiten
URN: urn:nbn:de:101:1-2018122112071383744624
Stichworte zum Inhalt: Ausreißeridentifikation, Ausreißerbehandlung, Vorverarbeitung, Datenanalyse, Flugbetriebsdaten, Full Flight Data, Machine Learning, k-means, MAD, Hampel, DFFITS
Verfügbarkeit: Download - Bitte beachten Sie die Nutzungsbedingungen dieses Dokuments: Copyright protected
Kommentar:
Zitierform:Baumann, S.; Gnisia, M.; et al. (2018): Identifikation und Behandlung von Ausreißern in Flugbetriebsdaten für Machine Learning Modelle. Deutsche Gesellschaft für Luft- und Raumfahrt - Lilienthal-Oberth e.V.. (Text). urn:nbn:de:101:1-2018122112071383744624.
Veröffentlicht am: 21.12.2018