Los datos de series temporales son una secuencia de observaciones recogidas a intervalos regulares. Este formato estructurado permite a los científicos de datos y a las herramientas de visualización de datos analizar patrones y relaciones que se desarrollan a lo largo del tiempo.

Qué son los datos de series temporales

Los datos de series temporales se refieren a una serie de puntos de datos ordenados en el tiempo. Introduce una dependencia de orden entre un conjunto de observaciones. Las series temporales son omnipresentes en el mundo actual impulsado por los datos. Como todo acontecimiento sigue la flecha del tiempo, estamos en constante interacción con diversos datos de series temporales.

Por lo general, se supone que las series temporales se generan a intervalos regulares de tiempo y se denominan series temporales regulares. Sin embargo, los datos dentro de esa serie temporal no tienen por qué generarse a intervalos regulares. Tales casos abarcan series temporales irregulares en las que los datos siguen una secuencia temporalmente escalonada. Esto implica que las mediciones podrían no producirse a intervalos regulares.

Sin embargo, los datos podrían generarse a intervalos de tiempo discretos o como una ráfaga. Las retiradas del cajero automático o los ingresos en cuenta son ejemplos de series temporales irregulares.

Técnicamente, en una serie temporal, una o más variables cambian a lo largo de un periodo de tiempo determinado. Si una sola variable varía con el tiempo, se denomina serie temporal univariante. Por ejemplo, consideremos un sensor que mide la temperatura de una habitación cada segundo. En este caso, sólo se genera un valor de temperatura unidimensional en cada instante (es decir, segundo).

Por el contrario, cuando más de una variable cambia a lo largo del tiempo, se denomina serie temporal multivariante. Por ejemplo, consideremos la economía bancaria. En estos casos, las series temporales multivariantes se utilizan para comprender cómo los cambios de política de una variable, como el tipo repo, pueden afectar a otras variables (por ejemplo, el desembolso de préstamos para los bancos comerciales).

Los datos de series temporales encuentran su aplicación en todas las disciplinas, desde las finanzas, la geología, la meteorología, la industria manufacturera hasta la informática, el IoT y las ciencias físicas y sociales. Se utilizan para hacer un seguimiento de los cambios meteorológicos, la tasa de natalidad, la tasa de mortalidad, las fluctuaciones del mercado, el rendimiento de las redes y muchas otras aplicaciones. Algunos de sus principales casos de uso son la supervisión, la previsión y la detección de anomalías.

Por ejemplo, la previsión de series temporales desempeña un papel fundamental a la hora de determinar la popularidad de los sistemas de gestión de bases de datos. La siguiente figura muestra la creciente popularidad de los SGBD a lo largo de los años (2019-2021) en un gráfico de series temporales.

Fuente: Influxdata

Componentes clave de los datos de series temporales

Los factores que influyen en los valores de una observación en una serie temporal se tratan como sus componentes clave.

Las tres categorías de componentes incluyen:

  1. Tendencia o movimientos a largo plazo
  2. Movimientos a corto plazo
    • Variaciones estacionales
    • Movimientos aleatorios o irregulares
  3. Variaciones cíclicas

Tendencia

La tendencia de los datos a aumentar o disminuir durante un largo periodo de tiempo se denomina tendencia o componente a largo plazo. Sin embargo, es importante tener en cuenta que el movimiento ascendente o descendente no tiene por qué ser necesariamente en la misma dirección a lo largo de un periodo de tiempo determinado.

Las tendencias pueden subir, bajar o permanecer estables en diferentes tramos de tiempo. La tendencia general, sin embargo, siempre debe equivaler a un patrón ascendente, descendente o estable. Estas tendencias de movimiento son evidentes en ejemplos como la productividad agrícola, la tasa de mortalidad, los aparatos fabricados, el número de fábricas, etc.

Tendencia lineal y no lineal

El trazado de los valores de las series temporales frente al tiempo en un gráfico revela el tipo de tendencia en función del patrón de agrupación de los datos. Si la agrupación de datos está más o menos alrededor de una línea recta, entonces la tendencia se denomina tendencia lineal.

De lo contrario, el patrón de agrupación de datos muestra una tendencia no lineal, ya que la relación de cambio entre dos variables no es estable o constante. Por lo tanto, tales tendencias también se denominan correlaciones curvilíneas.

Movimientos a corto plazo

En una serie temporal, estos componentes tienden a repetirse durante un periodo de tiempo. Tienen ráfagas cortas irregulares y afectan a las variables objeto de estudio. Los dos tipos de categorías bajo movimiento a corto plazo incluyen:

Variaciones estacionales

Se producen de forma regular y periódica a lo largo de un periodo inferior a un año. Suelen tener un patrón similar o casi igual durante un periodo de 12 meses. Estas variaciones pasan a formar parte de una serie temporal si los datos se registran con regularidad, es decir, cada hora, cada día, cada semana, cada mes o cada trimestre.

Las variaciones estacionales son provocadas por el hombre o se producen de forma natural. Las diferentes estaciones o condiciones climáticas desempeñan un papel fundamental en dichas variaciones. Por ejemplo, la producción de cultivos depende totalmente de las estaciones. Del mismo modo, el mercado de un paraguas o un impermeable depende de la estación lluviosa, mientras que la venta de neveras y unidades de A.C. alcanza su punto máximo durante el verano.

Las convenciones creadas por el hombre incluyen festivales, fiestas y ocasiones como los matrimonios. Estos acontecimientos a corto plazo se repiten año tras año.

Variaciones cíclicas

Las variaciones de las series temporales que tienden a operar durante un periodo superior a un año se denominan variaciones cíclicas. Para una empresa, un periodo completo se considera el «ciclo económico». El repunte o el declive de los resultados empresariales dependen de diversos factores como la estructura económica, la gestión empresarial y otras fuerzas que interactúan.

Estas variaciones cíclicas del negocio pueden ser regulares pero no periódicas. Por lo general, las empresas experimentan un proceso cíclico de cuatro fases que comprende la prosperidad, la recesión, la depresión y la reactivación.

Tales variaciones cíclicas son parte integrante de un patrón de series temporales, ya que el desarrollo empresarial depende en gran medida de los «puntos de datos secuenciales» generados.

Movimientos aleatorios o irregulares

Los componentes aleatorios provocan una variación significativa en la variable objeto de observación. Se trata de fluctuaciones puramente irregulares sin ningún patrón establecido. Se trata de fuerzas imprevistas, impredecibles y de naturaleza errática; por ejemplo, terremotos, inundaciones, hambrunas y otras catástrofes.

Los sucesos aleatorios descritos anteriormente se analizan utilizando los datos de series temporales de origen para abordar mejor estos escenarios de la vida real que pueden producirse en el futuro.

Tipos de datos de series temporales

Los datos de series temporales se dividen en cuatro tipos: deterministas, no deterministas, estacionarios y no estacionarios.

#1. Series temporales deterministas

Una serie temporal determinista puede describirse con una expresión analítica. No implica aspectos aleatorios o probabilísticos. Matemáticamente, puede expresarse exactamente para todos los intervalos de tiempo en términos de una expansión en serie de Taylor.

Esto es posible si se conocen todas sus derivadas en algún punto arbitrario. Estas derivadas especifican explícitamente el pasado y el futuro en ese momento. Si se cumplen todas las condiciones, es posible predecir con exactitud su comportamiento futuro y analizar cómo se comportó en el pasado.

#2. Series temporales no deterministas

Una serie temporal no determinista tiene asociado un aspecto aleatorio que impide su descripción explícita. Por lo tanto, las expresiones analíticas no son soluciones suficientemente factibles para expresar una serie temporal de este tipo. Una serie temporal puede ser no determinista por las siguientes razones:

  1. La información necesaria para describirla no está disponible en su totalidad. Aunque los datos puedan estar presentes en principio, no pueden tratarse como cuantificables explícitamente.
  2. El proceso de generación de datos es de naturaleza aleatoria.

Debido al factor aleatorio, la serie temporal no determinista obedece a leyes probabilísticas. Por lo tanto, los datos se abordan en términos estadísticos, lo que implica que los datos se definen mediante distribuciones de probabilidad y promedios de diversas formas. Esto incluye medias y medidas de dispersión, es decir, varianzas.

#3. Series temporales estacionarias

En una serie temporal estacionaria, las propiedades estadísticas como la media, la varianza y otras no dependen del aspecto temporal. Una serie temporal estacionaria es más fácil de predecir, ya que se puede afirmar con certeza que sus propiedades estadísticas permanecerán igual que se han observado en el pasado. De ahí que diversos métodos de previsión estadística se basen en el argumento de que la serie temporal es prácticamente estacionaria. Esto implica que las series temporales pueden considerarse estacionarias en aproximación aplicando sencillas transformaciones matemáticas.

#4. Series temporales no estacionarias

En una serie no estacionaria, las propiedades estadísticas varían con el tiempo. Por lo tanto, las series temporales con tendencias, o estacionalidad, entran en la categoría de no estacionarias, ya que la tendencia y la estacionalidad pueden afectar al valor de la serie temporal en diferentes intervalos de tiempo. Las series temporales no estacionarias describen datos impredecibles, lo que impide su modelización o previsión.

Fuente: Oreilly

Análisis y previsión de datos de series temporales

El análisis y la previsión de series temporales son herramientas muy útiles para observar, analizar y estudiar la evolución y la dinámica de procesos vitales y objetos de diversa índole.

Análisis de series temporales

El análisis de series temporales se define como un proceso de análisis de los datos recogidos a lo largo de un periodo de tiempo. En este caso, los analistas registran los datos en intervalos constantes a lo largo de un periodo de tiempo fijo. El ritmo de observación de los datos, es decir, el intervalo de tiempo, puede variar de segundos a años.

Los datos de series temporales describen variables sometidas a inspección, ya que proporcionan un análisis detallado del patrón fluctuante a lo largo de un periodo de tiempo específico. Los parámetros necesarios para el análisis pueden variar según los distintos ámbitos y disciplinas. Algunos ejemplos pueden ser

  • Instrumentos científicos – Datos registrados por día
  • Sitio web comercial – Visitas de clientes por día
  • Mercado bursátil – Valores de las acciones por semana
  • Estación – Días de lluvia al año

Para garantizar la coherencia y la fiabilidad, el análisis de series temporales opera con grandes cantidades de puntos de datos. Un buen tamaño de muestra es una representación sutil de la autenticidad de una tendencia o patrón descubierto.

Además, el análisis de series temporales también es adecuado para predecir acontecimientos futuros basándose en datos registrados en el pasado.

Predicción de series temporales

El análisis de series temporales permite a las organizaciones identificar la causa raíz de las fluctuaciones de las tendencias a lo largo del tiempo. Con los datos en la mano, las empresas pueden estudiar e investigar más a fondo para comprender mejor cómo abordar las tendencias desconocidas y prever los acontecimientos venideros. Las empresas suelen emplear software de visualización de datos para determinar tales anomalías en los datos.

La previsión de series temporales gira en torno a dos factores esenciales:

  1. Anticipar acontecimientos futuros basándose en el comportamiento pasado de los datos.
  2. Suponer que las tendencias venideras guardarán similitudes con el patrón de datos pasado.

En la previsión, el objetivo principal es esencialmente predecir cómo los puntos de datos seguirán siendo los mismos o variarán en el futuro. He aquí algunos ejemplos de diferentes sectores industriales para comprender mejor los matices del análisis de series temporales y la previsión.

  • Bolsa – Predecir el precio de cierre de las acciones cada día.
  • Ventas – Predecir las ventas de productos de una tienda cada día.
  • Precios – Predecir el precio medio del combustible cada día.

Algunas de las técnicas estadísticas habituales utilizadas para la previsión de series temporales son la media móvil simple (SMA), el suavizado exponencial (SES), la media móvil autorregresiva integrada (ARIMA) y la red neuronal (NN).

Datos de series temporales en la nube

Para desvelar el valor de los datos de series temporales, las empresas deben ser capaces de almacenar y consultar los datos con rapidez. Las empresas del mercado de capitales dependen de grandes volúmenes de datos históricos y de flujo continuo para emplear el análisis de datos en tiempo real y tomar decisiones empresariales impactantes. Puede tratarse de predecir la vulnerabilidad de los precios de las acciones, determinar las necesidades de capital neto o prever los tipos de cambio. Para proporcionar flexibilidad y procesar los datos sin problemas, muchas empresas están optando por la migración de sus bases de datos de series temporales a la nube.

Con la migración de las bases de datos de series temporales a la nube, las organizaciones pueden acceder a recursos ilimitados a la carta. Permite a las empresas utilizar cientos de núcleos para realizar su tarea, lo que maximiza el rendimiento de la red sin problemas de latencia.

Las bases de datos de series temporales en la infraestructura de la nube son adecuadas para cargas de trabajo de cálculo intensivo. Esto incluye la realización de cálculos de riesgo en respuesta a las tendencias del mercado en tiempo real. Las empresas financieras pueden prescindir de la sobrecarga del centro de datos y centrarse en la utilización de los recursos para mejorar la productividad de sus cargas de trabajo.

Los proveedores en la nube, como AWS, ofrecen Amazon Timestream, un servicio de base de datos de series temporales que permite cargar, almacenar y analizar fácilmente conjuntos de datos de series temporales. Ofrecen almacenamiento para gestionar cargas de trabajo con transacciones intensivas, herramientas de análisis en tiempo real y funcionalidad de flujo de datos para presentar los eventos en el momento en que se producen.

Por lo tanto, la infraestructura en nube amplifica y escala los beneficios de los datos de series temporales.

Aplicaciones de las series temporales

Los modelos de series temporales sirven para dos propósitos,

  1. Comprender los factores subyacentes que produjeron un determinado patrón de datos.
  2. Basándose en el análisis, ajustar un modelo para pronosticar y controlar.

Veamos algunos de los casos de aplicación de los datos de series temporales.

#1. Los datos de series temporales en la industria financiera

Todas las decisiones financieras, empresariales y de inversión se toman basándose en las tendencias actuales del mercado y en las previsiones de la demanda. Los datos de series temporales se utilizan para explicar, correlacionar y predecir el dinámico mercado financiero. Los expertos financieros pueden examinar los datos financieros para dar previsiones de aplicaciones que ayuden a mitigar los riesgos, estabilizar los precios y el comercio.

El análisis de series temporales desempeña un papel clave en el análisis financiero. Se utiliza en la predicción de los tipos de interés, la previsión de la volatilidad en los mercados bursátiles y muchos más. Las partes interesadas en los negocios y los responsables políticos pueden tomar decisiones informadas sobre la fabricación, las compras, la asignación de recursos y optimizar sus operaciones empresariales.

Este análisis se utiliza eficazmente en el sector de la inversión para supervisar las cotizaciones de los valores y sus fluctuaciones a lo largo del tiempo. La cotización de los valores también puede observarse a corto plazo (es decir, registrando datos por horas o días) o a largo plazo (es decir, con una observación que se extiende durante meses o años). El análisis de series temporales es una herramienta útil para seguir el comportamiento de un valor, un activo o una variable económica durante un largo periodo de tiempo.

#2. Datos de series temporales en la industria médica

La sanidad está emergiendo rápidamente como un campo impulsado por los datos. Además del análisis financiero y empresarial, el ámbito médico está aprovechando enormemente el análisis de series temporales.

Consideremos un escenario que requiera una sinergia de datos de series temporales, procedimientos médicamente alineados y técnicas de minería de datos durante el tratamiento de pacientes con cáncer. Un marco híbrido de este tipo puede emplearse para aprovechar las funcionalidades de extracción de características a partir de los datos de series temporales recopilados (es decir, las imágenes de rayos X del paciente) para realizar un seguimiento del progreso del paciente y su respuesta a los tratamientos proporcionados por la fraternidad médica.

En el sector sanitario, obtener inferencias a partir de los datos de series temporales en constante cambio tiene un valor crítico. Además, las prácticas médicas avanzadas exigen que los historiales de los pacientes estén conectados a lo largo del tiempo para una mejor visibilidad de la salud del paciente. Asimismo, los parámetros de salud del paciente deben registrarse con precisión a intervalos regulares para tener una imagen más clara de su estado de salud.

Con la aparición de instrumentos médicos avanzados, el análisis de series temporales se ha establecido en el ámbito sanitario. Considere los siguientes ejemplos,

  • Dispositivos de ECG: Dispositivos inventados para controlar las afecciones cardiacas mediante el registro de los impulsos eléctricos del corazón.
  • Dispositivos EEG: Dispositivos utilizados para cuantificar la actividad eléctrica del cerebro.

Estos dispositivos han permitido a los médicos ejercer el análisis de series temporales para un diagnóstico médico más rápido, eficaz y preciso.

Además, con la llegada de los dispositivos IoT, como los sensores vestibles y los dispositivos sanitarios portátiles, ahora las personas pueden realizar mediciones regulares de sus variables de salud a lo largo del tiempo con entradas mínimas. Esto conduce a una recopilación coherente de datos médicos dependientes del tiempo tanto para individuos enfermos como sanos.

#3. Datos de series temporales en astronomía

La astronomía y la astrofísica son las dos disciplinas modernas en las que los datos de series temporales se están aprovechando de forma significativa.

Fundamentalmente, la astronomía implica trazar trayectorias de objetos cósmicos y cuerpos celestes y realizar mediciones precisas para comprender mejor el universo más allá de la atmósfera terrestre. Debido a este requisito, los expertos en astronomía dominan el manejo de datos de series temporales mientras calibran y configuran instrumentos complejos y estudian objetos astronómicos de interés.

Los datos de series temporales llevan mucho tiempo asociados al campo de la astronomía. En el año 800 a.C. se recopilaban datos de series temporales de manchas solares a intervalos regulares. Desde entonces, el análisis de series temporales se utilizó para

  • Descubrir estrellas lejanas basándose en las distancias estelares,
  • Observar acontecimientos cósmicos como las supernovas para comprender mejor el origen de nuestro universo.

Los datos de series temporales, en este caso, se refieren a las longitudes de onda e intensidades de la luz emitida por estrellas, cuerpos celestes u objetos. Los astrónomos controlan constantemente estos datos de series temporales para detectar en tiempo real los acontecimientos cósmicos en el momento en que se producen.

En los últimos tiempos han surgido áreas de investigación como la astroinformática y la astroestadística, que mezclan diversas disciplinas como la minería de datos, el aprendizaje automático, la inteligencia computacional y la estadística. En estas novedosas áreas de investigación, el papel de los datos de series temporales es detectar y clasificar objetos astronómicos de forma rápida y eficaz.

#4. Los datos de series temporales en la previsión meteorológica

Aristóteles estudió ampliamente los patrones meteorológicos para comprender mejor las causas y los efectos observados en los cambios del tiempo en la antigüedad. Con el paso de los días, los científicos empezaron a registrar los datos meteorológicos en instrumentos como el «barómetro» para calcular las variables atmosféricas. Los datos se recogían a intervalos regulares y se guardaban en distintos lugares.

Con el tiempo, las previsiones meteorológicas empezaron a aparecer en los periódicos. Si avanzamos rápidamente hasta nuestros días, las omnipresentes estaciones de previsión meteorológica están instaladas en distintas geografías de todo el mundo para recopilar variables meteorológicas precisas.

Dichas estaciones cuentan con dispositivos funcionales avanzados que están interconectados para recopilar y correlacionar los datos meteorológicos de varios lugares. Los datos correlacionados se utilizan para pronosticar las condiciones meteorológicas en cada momento en función de las necesidades.

#5. Los datos de series temporales en el desarrollo empresarial

Los datos de series temporales permiten a las empresas tomar decisiones comerciales. Esto se consigue ya que el proceso analiza datos pasados para derivar acontecimientos futuros y arrojar luz sobre posibilidades probables. El patrón de datos pasados se utiliza para derivar los siguientes parámetros:

  • Crecimiento empresarial: Para evaluar el rendimiento financiero y empresarial general y medir el crecimiento, los datos de series temporales son el activo más adecuado y fiable.
  • Estimar la tendencia: Se pueden emplear diversos métodos de series temporales para estimar las tendencias emergentes. Consideremos, por ejemplo, que estos métodos analizan las observaciones de datos durante un periodo de tiempo para reflexionar sobre el aumento o la disminución de las ventas de un dispositivo electrónico concreto.
  • Desvelar patrones estacionales: Los puntos de datos registrados podrían revelar fluctuaciones y patrones estacionales que podrían ayudar en la previsión de datos. La información obtenida de los datos desempeña un papel clave para los mercados en los que los precios de los productos fluctúan estacionalmente. Estos datos pueden ayudar a las empresas a planificar y desarrollar mejor sus productos.

Conclusión 👨‍🏫

En resumen, los datos de series temporales pueden considerarse como las características de puntos de datos complejos recogidos durante un periodo de tiempo constante. El análisis, el modelado y la previsión de series temporales se han convertido en una parte integral de nuestra vida cotidiana con la aparición de los gadgets IoT, los electrodomésticos inteligentes y los dispositivos portátiles. Además, los datos de series temporales están encontrando su aplicación en diversos campos, como la sanidad, la astrofísica, la economía, la ingeniería, los negocios y muchos más.