DGLR-Publikationsdatenbank - Detailansicht
Titel:
Titel (EN):
Identification and Handling of Outliers in Flight Operations Data for Machine Learning Models
Autor(en):
S. Baumann, M. Gnisia, P. Feifel, U. Klingauf
Zusammenfassung:
Operationelle Flugbetriebsdaten können teilweise auffällige Datenpunkte enthalten, die sich nicht den charakteristischen Verlauf des aufgezeichneten Parameters zuordnen lassen und man als Ausreißer bezeichnet. Zur Bereinigung von Ausreißern und zur Steigerung der Datenqualität sind geeignete Methoden zur Identifizierung, Kategorisierung und Behandlung (bspw. durch Korrektur) notwendig, die in diesem Beitrag zusammengetragen, diskutiert und anhand exemplarischer Untersuchung an realen Flugbetriebsdaten analysiert werden. Der vorliegende Beitrag widmet sich der Identifizierung und Behandlung von Ausreißern für Sensorparameter in Flugbetriebsdaten (Full Flight Data). Dabei erfolgt eine Einteilung unterschiedlicher Strategien, um Ausreißer zu identifizieren, wobei auch Vor- und Nachteile dieser Methoden diskutiert werden. Bei der Ausreißerbehandlung stehen zwei Aspekte im Fokus: einerseits wird das Ausmaß der Verzerrung der Datenreihe durch die Ausreißer analysiert und andererseits erfolgt eine Einteilung in unterschiedliche Ausreißerarten zur geeigneten Korrektur der Ausreißer. Erläutert werden geeignete Filter und Glättungsansätze sowie Algorithmen-basierte Verfahren aus dem Bereich Machine Learning. Für deren Bewertung werden statistische Metriken wie Lagemaße als Gütekritierien anhand von Testdaten bewertet. Durch die angebrachten Vorgehensweisen können Ausreißer entsprechend ihrer Art passend identifiziert und behandelt werden, sodass die Qualität der Datenreihen gesteigert werden kann. Damit kann ein Beitrag zur geeigneten Auswahl von Modellierungsparameter geleistet und die Güte der iterativen Lernmodelle gesteigert werden.
Zusammenfassung (EN):
Operational flight data can sometimes contain unusual data points that do not follow the characteristic pattern of the recorded parameter and are referred to as outliers. To remove outliers and improve data quality, suitable methods for identification, categorization, and treatment (e.g., correction) are necessary. These methods are compiled, discussed, and analyzed in this article using exemplary investigations of real flight data. This article focuses on the identification and treatment of outliers for sensor parameters in flight operational data (full flight data). Different strategies for identifying outliers are presented, along with a discussion of the advantages and disadvantages of each method. Outlier treatment focuses on two aspects: first, the extent of distortion of the data series caused by the outliers is analyzed, and second, different types of outliers are categorized to allow for appropriate correction. Suitable filters and smoothing approaches, as well as algorithm-based methods from the field of machine learning, are explained. For their evaluation, statistical metrics such as measures of central tendency are assessed as quality criteria using test data. The appropriate procedures allow outliers to be identified and handled according to their nature, thus improving the quality of the data series. This contributes to the suitable selection of modeling parameters and increases the quality of iterative learning models.
Veranstaltung:
Deutscher Luft- und Raumfahrtkongress 2018, Friedrichshafen
Verlag, Ort:
Deutsche Gesellschaft für Luft- und Raumfahrt - Lilienthal-Oberth e.V., Bonn, 2018
Medientyp:
Conference Paper
Sprache:
deutsch
Format:
21,0 x 29,7 cm, 11 Seiten
URN:
urn:nbn:de:101:1-2018122112071383744624
Stichworte zum Inhalt:
Ausreißeridentifikation, Ausreißerbehandlung, Vorverarbeitung, Datenanalyse, Flugbetriebsdaten, Full Flight Data, Machine Learning, k-means, MAD, Hampel, DFFITS
Verfügbarkeit:
Download
- Bitte beachten Sie die Nutzungsbedingungen dieses Dokuments: Copyright protected
Kommentar:
Zitierform:
Baumann, S.; Gnisia, M.; et al. (2018): Identifikation und Behandlung von Ausreißern in Flugbetriebsdaten für Machine Learning Modelle. Deutsche Gesellschaft für Luft- und Raumfahrt - Lilienthal-Oberth e.V.. (Text). urn:nbn:de:101:1-2018122112071383744624.
Veröffentlicht am:
21.12.2018
