Durante mi formación en el Máster de Data Science, Big Data y desarrollo de Inteligencia Artificial en Evolve, he completado una práctica final de estadística y probabilidad utilizando Python.
El objetivo principal de este proyecto ha sido aplicar diferentes técnicas estadísticas de forma práctica, organizando el trabajo en varios ejercicios independientes y documentando los resultados obtenidos durante el proceso.
Objetivo del proyecto
El objetivo de esta práctica ha sido reforzar conceptos clave de estadística utilizados en Data Science y aplicarlos mediante Python.
El proyecto está dividido en diferentes bloques, cada uno centrado en un área concreta del análisis estadístico:
- Estadística descriptiva
- Inferencia estadística
- Regresión múltiple
- Análisis de series temporales
Esta estructura me ha ayudado a entender cómo se pueden aplicar distintas técnicas estadísticas a conjuntos de datos reales y cómo Python permite automatizar, visualizar e interpretar los resultados.
Estructura del repositorio
El repositorio contiene los siguientes archivos y carpetas principales:
-
data/: carpeta que contiene el dataset utilizado en el proyecto. -
output/: carpeta con los resultados generados, gráficos y métricas. -
README.md: explicación general del proyecto. -
Respuestas.md: respuestas, interpretaciones y conclusiones. -
ejercicio1_descriptivo.py: análisis estadístico descriptivo. -
ejercicio2_inferencia.py: ejercicios de inferencia estadística. -
ejercicio3_regresion_multiple.py: análisis de regresión múltiple. -
ejercicio4_series_temporales.py: análisis de series temporales.
Esta organización facilita la revisión del proyecto y permite ejecutar cada parte del análisis por separado.
Herramientas utilizadas
Las principales herramientas y librerías utilizadas en este proyecto han sido:
- Python
- Pandas
- NumPy
- Matplotlib
- Análisis estadístico
- Regresión múltiple
- Análisis de series temporales
- GitHub
Proceso de desarrollo
La primera parte del proyecto se centra en la estadística descriptiva. En esta sección trabajé con medidas estadísticas básicas y visualizaciones para comprender mejor el dataset.
La segunda parte se centra en la inferencia estadística. Esta parte me ayudó a practicar cómo extraer conclusiones a partir de los datos y entender cómo los métodos estadísticos pueden apoyar la toma de decisiones.
La tercera parte del proyecto está basada en la regresión múltiple. Esta técnica resulta útil para estudiar la relación entre varias variables independientes y una variable objetivo.
Por último, la cuarta parte se centra en el análisis de series temporales, donde el objetivo fue analizar datos que cambian a lo largo del tiempo e identificar posibles patrones o tendencias.
Resultados
El proyecto genera diferentes salidas, incluyendo visualizaciones, métricas, análisis de correlación, resultados de regresión y gráficos de series temporales.
Estos resultados se almacenan en la carpeta output/, lo que facilita revisar tanto el código como los resultados finales de cada ejercicio.
Lo que he aprendido
Este proyecto me ha ayudado a reforzar conceptos importantes de estadística aplicada a Data Science.
También me ha permitido mejorar la forma en la que organizo un proyecto técnico en GitHub, separando el código en diferentes archivos y documentando el proceso de manera clara.
Una de las partes más útiles del proyecto ha sido ver cómo Python permite aplicar conceptos estadísticos de forma práctica y reproducible.
Repositorio del proyecto
Puedes ver el proyecto completo en GitHub aquí:
https://github.com/adeltoutouh-lab/Statistical_Analysis-Adel_Toutouh_El_Bouchti-
Muchas gracias.
Top comments (0)