Los outliers son datos anormales dentro de un conjunto de datos. Para que lo tengamos mas claro, los outliers son valores extremadamente altos o extremadamente bajos en comparación con el punto de datos más cercano y al resto de valores del conjunto de datos que estas trabajando como se muestra en la siguiente imagen.
Existen diferentes técnicas para tratar estos valores, la gran mayoría de las veces es mejor tratarlos porque afectan de manera considerable por ejemplo la media o los percentiles cuando hacemos un análisis exploratorio de los datos. Por lo tanto sino los detectamos afectarán nuestro modelo de aprendizaje computacional.
Top comments (0)