Economía 11 min de lectura

El flujo completo para analizar series de tiempo en una tesis

El error más común en trabajos aplicados con datos económicos es regresar Y sobre X sin verificar si las series son estacionarias. Este es el paso a paso que todo evaluador serio espera ver, con las cuatro calculadoras que necesitas.

Imagina que tu tesis pretende explicar el consumo agregado por el PIB. Tomas datos trimestrales, corres OLS, obtienes un R² de 0.97 y un coeficiente significativo al 1 %. Decides que has encontrado evidencia robusta. Pasa el tiempo, presentas el trabajo, y el evaluador te pregunta: "¿revisaste estacionariedad?". Te das cuenta de que no, lo defiendes débilmente, y tu nota termina siendo regular.

Este error es tan común que tiene nombre propio: regresión espuria. Granger y Newbold lo demostraron en 1974: dos series I(1) totalmente independientes pueden producir regresiones con R² altos y t-statistics enormes, todo por puro azar. La buena noticia es que evitarlo requiere solo cuatro pasos. Este artículo es el mapa.

El pipeline en cinco pasos

Cualquier análisis serio con series de tiempo económicas pasa por la siguiente secuencia:

  1. Inspección visual y descomposición: ¿hay tendencia? ¿estacionalidad? ¿quiebres?
  2. Test de raíz unitaria en niveles (Dickey-Fuller Aumentado).
  3. Si no son estacionarias, repetir el test en primeras diferencias para confirmar I(1).
  4. Si ambas son I(1), test de cointegración (Engle-Granger o Johansen).
  5. Si están cointegradas, estimar Modelo de Corrección de Error (ECM). Si no, trabajar con primeras diferencias.

Saltarse cualquier paso es una bandera roja. Hacer los cinco te diferencia inmediatamente de la mayoría de trabajos estudiantiles. Vamos uno por uno.

Paso 1: Inspección y descomposición

Antes de cualquier test formal, grafica tus series. Una serie con tendencia clara o estacionalidad obvia da pistas sobre qué especificación usar en los tests. Para series mensuales o trimestrales, vale la pena descomponerlas en tendencia + estacionalidad + residuo usando el método clásico de medias móviles.

Esto se hace fácil con la calculadora de series de tiempo: pegas tus datos, eliges período estacional (4 trimestral, 12 mensual), y te entrega los cuatro paneles. Si el residuo ya tiene varianza casi constante y no muestra patrones obvios, gran señal. Si el residuo sigue mostrando tendencia, la descomposición no fue suficiente.

El otro gráfico clave aquí es la función de autocorrelación (ACF): si ACF(1) es muy alta (cercana a 1) y decae lentamente, casi seguro tienes raíz unitaria. Es un diagnóstico cualitativo previo al test formal.

Paso 2: Dickey-Fuller Aumentado en niveles

Llega el momento de la prueba formal. El test ADF prueba:

  • H₀: la serie tiene raíz unitaria (no estacionaria, I(1) o superior).
  • H₁: la serie es estacionaria (I(0)).

La especificación de la regresión auxiliar importa. Tres opciones:

  • Sin constante ni tendencia: para series sin deriva visible alrededor de cero. Raro en economía.
  • Con constante (drift): el caso estándar para variables económicas en niveles.
  • Con constante y tendencia: cuando la serie tiene tendencia clara y quieres saber si la desviación respecto a la tendencia es estacionaria.

El número de lags adicionales también importa. Demasiado pocos = autocorrelación en residuos (test inválido). Demasiados = pérdida de potencia. Regla de Schwert: p_max = floor(12·(n/100)^0.25). En la práctica: 1-2 para anuales, 4-8 para trimestrales, 12 para mensuales.

Usa la calculadora Dickey-Fuller para hacer este paso. Te entrega el estadístico ADF, los valores críticos de MacKinnon a 1, 5 y 10 % y la decisión clara. Aplícalo a cada serie por separado.

Paso 3: Confirmar el orden de integración

Si en el paso 2 no rechazaste H₀, la serie probablemente es I(1). Pero hay que confirmar. Aplica el ADF a la primera diferencia ΔY = Y_t - Y_{t-1}. Si ahí sí rechazas, confirmas que tu serie original es I(1): integrada de orden 1, requiere una diferencia para volverse estacionaria.

Si la primera diferencia tampoco es estacionaria, tendrás que diferenciar dos veces (serie I(2)). Esto es raro en economía pero pasa con índices de precios en hiperinflación. Si llegas a I(2) o superior, el análisis se complica - usualmente se trabaja en logaritmos para suavizar.

Para que el siguiente paso (cointegración) tenga sentido, ambas variables Y y X deben tener el mismo orden de integración. Si una es I(1) y la otra I(0), no se pueden cointegrar - simplemente regresa sobre la diferencia de la I(1).

Paso 4: Test de cointegración Engle-Granger

Aquí está el truco más elegante de la econometría moderna. Si Y y X son ambas I(1) y crees que tienen una relación de largo plazo, puedes preguntarte: ¿existe una combinación lineal de Y y X que sea estacionaria? Si la respuesta es sí, las series están cointegradas.

El test de Engle-Granger es directo, en dos etapas:

  1. Estima por OLS la regresión Y_t = α + β X_t + u_t. Guarda los residuos û_t.
  2. Aplica un ADF (sin constante) sobre û_t. Si rechazas la nula de raíz unitaria en û, hay cointegración.

El truco es que los valores críticos no son los del ADF estándar. Como los residuos OLS tienen por construcción menor varianza que un proceso AR(1) general, los valores críticos del EG son más estrictos. Engle y Granger publicaron tablas específicas; las versiones modernas usan los valores asintóticos de MacKinnon (1996).

Usa la calculadora de Cointegración Engle-Granger: pegas dos columnas (Y y X), eliges la especificación y los lags ADF, y te entrega el diagnóstico completo - incluyendo el gráfico de los residuos, que debe oscilar alrededor de cero sin tendencia si hay cointegración.

Paso 5: Modelo de Corrección de Error o primeras diferencias

El resultado del paso 4 determina cómo modelar la relación:

Si HAY cointegración: ECM

Estima el Modelo de Corrección de Error:

ΔY_t = γ_0 + γ_1 ΔX_t - λ û_{t-1} + ε_t

Donde û_{t-1} es el residuo rezagado de la regresión cointegradora del paso 4. Los términos importantes son:

  • γ_1: efecto de corto plazo de un cambio en X sobre Y.
  • β (del paso 4): efecto de largo plazo, el cointegrating vector.
  • λ: velocidad de ajuste hacia el equilibrio de largo plazo. Debe estar entre 0 y 1, y ser negativo en signo cuando lo escribes como . Un λ de 0.3 significa que cada período se corrige el 30 % del desequilibrio acumulado.

El ECM es la formulación más rica: te dice tanto cómo se relacionan en el corto plazo como en el largo, y cómo el sistema vuelve al equilibrio cuando se aleja. Es el estándar dorado para series I(1) cointegradas.

Si NO hay cointegración: primeras diferencias

Si las series son I(1) pero no cointegradas, no puedes regresarlas en niveles sin caer en regresión espuria. La salida estándar es regresar las primeras diferencias:

ΔY_t = α + β ΔX_t + ε_t

Pierdes información de largo plazo, pero al menos las regresiones son válidas. Es lo mejor disponible en ausencia de cointegración.

Errores comunes que delatan a un trabajo apurado

Después de haber revisado docenas de trabajos de econometría aplicada, estos son los errores que aparecen una y otra vez:

  1. No testear estacionariedad antes de regresar. El más grave de todos. Hace todo el análisis sospechoso.
  2. Usar t-tests estándar sobre coeficientes en series no estacionarias. Los t-statistics inflados son la marca registrada de la regresión espuria.
  3. Confundir cointegración con correlación alta. Dos series pueden tener correlación de 0.95 y no estar cointegradas. La cointegración es estacionariedad de la combinación, no co-movimiento aparente.
  4. Estimar ECM sin verificar cointegración previa. Sin pasar el test EG, el ECM es solo otro número que no significa nada.
  5. Reportar el R² como evidencia principal. En series I(1) no cointegradas, el R² siempre será alto si hay tendencia común. No prueba nada.
  6. Ignorar quiebres estructurales. Una serie estacionaria en dos tramos pero con un quiebre en el medio puede dar ADF rechazado falsamente. Si conoces eventos importantes (crisis de 2008, pandemia 2020), considera Zivot-Andrews o estima por subperíodos.

Checklist final para tu tesis o paper

Antes de entregar cualquier trabajo aplicado con series, verifica:

  • ☐ Gráficos de las series en niveles y en logs (si aplica).
  • ☐ Estadísticas descriptivas y descomposición STL si hay estacionalidad.
  • ☐ Test ADF en niveles para cada serie, con justificación de especificación y lags.
  • ☐ Test ADF en primeras diferencias para confirmar orden de integración.
  • ☐ Si ambas son I(1), test de cointegración Engle-Granger (o Johansen si tienes más de 2 variables).
  • ☐ Si hay cointegración: ECM con interpretación del λ.
  • ☐ Si no hay cointegración: regresión en primeras diferencias.
  • ☐ Verificación de supuestos del modelo final: residuos no autocorrelacionados, homocedásticos, normales.
  • ☐ Discusión honesta de las limitaciones.

Este checklist es lo que un evaluador competente espera ver. No es exhaustivo (hay temas más avanzados como cointegración fraccional, modelos VEC con múltiples vectores, tests con quiebres estructurales) pero cubre el 90 % de los casos que vas a encontrar en una tesis de pregrado o máster en economía.

Cinco calculadoras, un flujo coherente

El sitio tiene ya el conjunto de herramientas que necesitas:

  1. Series de Tiempo: para inspección visual, descomposición y ACF.
  2. Dickey-Fuller Aumentado: para tests de raíz unitaria en niveles y diferencias.
  3. Engle-Granger: para el test de cointegración.
  4. Regresión Múltiple OLS: para estimar el ECM (regresas ΔY contra ΔX y û_{t-1}).
  5. Regresión Lineal Simple: para la regresión cointegradora de la etapa 1.

Las cinco son 100 % gratuitas, calculan en tu navegador (no envían datos a ningún servidor) y producen salidas que puedes copiar directo al apéndice de tu tesis.

Lo que te diferencia

La mayoría de estudiantes hacen una regresión OLS, miran el R², y se quedan ahí. Si tú haces el pipeline completo de cinco pasos, discutes el orden de integración de cada variable, presentas el test de cointegración con valores críticos correctos y estimas el ECM si corresponde, ya estás haciendo trabajo de mejor calidad que el 80 % de lo que circula por las universidades latinoamericanas.

Eso no requiere talento - requiere disciplina y conocer el flujo. Las calculadoras hacen lo demás.

Lectura relacionada