Resumen:
La precisión y fiabilidad de un sistema de detección de intrusos basado en anomalías dependen de la calidad de los datos utilizados para construir un perfil de comportamiento normal. Sin embargo, la obtención de estos conjuntos de datos no es trivial debido a problemas de privacidad, obsolescencia e idoneidad. Este artículo presenta un enfoque para la desinfección de huellas de tráfico basado en la identificación de patrones anómalos en un espacio de entropía tridimensional de los datos de flujo de tráfico capturados de una red de campus. Los conjuntos de datos libres de anomalías se generan filtrando los ataques y las piezas de tráfico que modifican la posición típica de los centroides en el espacio de la entropía. Nuestros análisis se realizaron en trazas de tráfico de la vida real y muestran que los conjuntos de datos desinfectados tienen homogeneidad y consistencia en términos de centroides de racimo y distribuciones de probabilidad del espacio de entropía transformada por PCA.
Descripción:
The accuracy and reliability of an anomaly-based network intrusion detection system are dependent on the quality of data used to build a normal behavior profile. However, obtaining these datasets is not trivial due to privacy, obsolescence, and suitability issues. This paper presents an approach to traffic trace sanitization based on the identification of anomalous patterns in a three-dimensional entropy space of the flow traffic data captured from a campus network. Anomaly-free datasets are generated by filtering out attacks and traffic pieces that modify the typical position of centroids in the entropy space. Our analyses were performed on real life traffic traces and show that the sanitized datasets have homogeneity and consistency in terms of cluster centroids and probability distributions of the PCA-transformed entropy space.