Nuri Data Science – Plataforma de Ejercicios de Ciencia de Datos, SQL, Python y Machine Learning
Series de Tiempo
Suavizado, descomposicion y pronostico con ARIMA en tiempo real
Modelo
Patron
Ventana (w)
7
Horizonte pronostico
12
% Ruido
15%
N periodos
80
Serie original + ajuste del modelo + pronostico
--- = pronostico
—
MAE
—
RMSE
—
MAPE %
—
Sig. valor
📚 ¿Que estas viendo?
La linea gris es la serie original generada sinteticamente con tendencia, estacionalidad y ruido configurable.
La linea de color es el ajuste del modelo seleccionado sobre los datos historicos.
La linea punteada es el pronostico hacia el futuro.
Media Movil Simple (SMA) promedia los ultimos w periodos — suaviza el ruido pero genera un retraso (lag). SES asigna mas peso a los valores recientes con el parametro α: α alto = mas sensible, α bajo = mas suavizado. Holt extiende SES agregando un componente de tendencia (β). Holt-Winters agrega ademas un componente estacional (γ) — ideal para series con ciclos regulares. Las metricas MAE, RMSE y MAPE miden el error in-sample del modelo sobre los datos historicos.
Media Movil Simple (SMA) promedia los ultimos w periodos — suaviza el ruido pero genera un retraso (lag). SES asigna mas peso a los valores recientes con el parametro α: α alto = mas sensible, α bajo = mas suavizado. Holt extiende SES agregando un componente de tendencia (β). Holt-Winters agrega ademas un componente estacional (γ) — ideal para series con ciclos regulares. Las metricas MAE, RMSE y MAPE miden el error in-sample del modelo sobre los datos historicos.
⚠ Limitaciones (Media Movil y Suavizado)
Evaluacion in-sample optimista
MAE, RMSE y MAPE se calculan sobre los mismos datos usados para ajustar el modelo. En la practica se necesita un conjunto de prueba (holdout) para estimar el error real de pronostico fuera de muestra.
SMA introduce retraso (lag)
La media movil simple siempre retrasa la respuesta al modelo respecto a los datos reales. Con ventana grande el suavizado mejora pero el retraso aumenta — existe un tradeoff inherente entre sesgo y varianza.
Holt-Winters requiere periodo conocido
El modelo estacional necesita que el periodo T sea conocido de antemano (diario=7, mensual=12). En datos reales detectar la estacionalidad requiere analisis espectral, ACF o inspección visual previa.
Parametros α, β, γ no se optimizan
En esta simulacion los parametros se ajustan manualmente. En produccion se minimizan por MLE o minimizando el SSE sobre el conjunto de entrenamiento, lo que puede dar resultados muy distintos a la intuicion.
Sin intervalos de confianza
El pronostico mostrado es puntual (un solo valor por periodo). Los modelos reales generan intervalos de prediccion que se ensanchan con el horizonte — la incertidumbre crece exponencialmente con el tiempo.
Solo series univariadas
Estos modelos solo usan el historial de la propia variable. En la practica las series de tiempo dependen de variables externas (regresores exogenos) que pueden incorporarse con ARIMAX, Prophet o modelos de ML.
Asuncion de patrones estables
SMA y SES asumen que el patron observado en el pasado continuara en el futuro. Ante cambios estructurales abruptos (quiebres) el modelo falla. Se necesitan tecnicas como deteccion de cambio de punto o modelos adaptativos.
Datos sinteticos vs realidad
La serie generada tiene componentes independientes y ruido Gaussiano homoscedastico. Las series reales pueden tener heterocedasticidad (varianza creciente), valores atipicos, datos faltantes y dependencias no lineales.