Le « temps » est une variable cruciale lorsqu'il s'agit d'accumuler des données. Dans l'analyse des séries chronologiques, le temps est un élément important des données.
What is Time Series Data?
Les données de séries chronologiques font référence à une série de points de données classés dans le temps. Il introduit une dépendance d'ordre entre un ensemble d'observations. Les séries chronologiques sont omniprésentes dans le monde actuel axé sur les données. Comme chaque événement suit la flèche du temps, nous sommes en interaction constante avec une variété de données de séries chronologiques.
Les séries chronologiques sont généralement supposées être générées à intervalles de temps réguliers et sont appelées séries chronologiques régulières. Cependant, les données de cette série chronologique n'ont pas besoin d'être générées à intervalles réguliers. De tels cas englobent des séries temporelles irrégulières où les données suivent une séquence temporellement phasée. Cela implique que les mesures peuvent ne pas avoir lieu à intervalles réguliers. Cependant, les données peuvent être générées à des intervalles de temps discrets ou en rafale. Les retraits aux guichets automatiques ou les dépôts en compte sont des exemples de séries temporelles irrégulières.
Techniquement, dans une série chronologique, une ou plusieurs variables changent au cours d'une période donnée. Si une seule variable varie dans le temps, elle est appelée série chronologique univariée. Par exemple, considérons un capteur mesurant la température d'une pièce toutes les secondes. Ici, seule une valeur de température unidimensionnelle est générée à chaque instant (c'est-à-dire une seconde). Au contraire, lorsque plus d'une variable change au fil du temps, on parle de série chronologique multivariée. Par exemple, considérons l'économie bancaire. Dans de tels cas, des séries chronologiques multivariées sont utilisées pour comprendre comment les changements de politique apportés à une variable, comme le taux des prises en pension, peuvent affecter d'autres variables (c'est-à-dire les décaissements de prêts pour les banques commerciales).
Données de séries chronologiques trouve son application dans toutes les disciplines, de la finance, la géologie, la météorologie, la fabrication à l'informatique, l'IoT, les sciences physiques et sociales. Il est utilisé pour suivre les changements climatiques, le taux de natalité, le taux de mortalité, les fluctuations du marché, les performances du réseau et de nombreuses autres applications. Certains de ses principaux cas d'utilisation incluent la surveillance, la prévision et la détection d'anomalies. Par exemple, les prévisions de séries chronologiques jouent un rôle essentiel dans la détermination de la popularité des systèmes de gestion de bases de données. La figure ci-dessous montre la popularité croissante du SGBD au fil des ans (2019-2021) dans un graphique de série chronologique.

Key Components of Time Series
Les facteurs qui influencent les valeurs d'une observation dans une série chronologique sont traités comme leurs composants clés. Les trois catégories de composants comprennent :
- Tendance ou mouvements à long terme
- Mouvements à court terme
- Variations saisonnières
- Variations cycliques
- Mouvements aléatoires ou irréguliers
Trend
La tendance des données à augmenter ou à diminuer sur une longue période de temps est appelée tendance ou composante à long terme. Cependant, il est important de noter que le mouvement vers le haut ou vers le bas ne doit pas nécessairement être dans la même direction sur une période de temps donnée.
Les tendances peuvent augmenter, diminuer ou rester stables sur différentes périodes de temps. La tendance globale, cependant, doit toujours correspondre à une tendance à la hausse, à la baisse ou stable. De telles tendances de mouvement sont évidentes dans les exemples tels que la productivité agricole, le taux de mortalité, les appareils fabriqués, le nombre d'usines, etc.
Tendance linéaire et non linéaire
Le tracé des valeurs des séries chronologiques en fonction du temps sur un graphique révèle le type de tendance en fonction du modèle de regroupement des données. Si le cluster de données est plus ou moins autour d'une ligne droite, la tendance est alors qualifiée de tendance linéaire. Sinon, le modèle de cluster de données montre une tendance non linéaire car le rapport de changement entre deux variables n'est pas stable ou constant. Par conséquent, ces tendances sont également appelées corrélations curvilignes.
Mouvements à court terme
Dans une série chronologique, ces composants ont tendance à se répéter sur une période de temps. Ils ont de courtes rafales irrégulières et affectent les variables étudiées. Les deux types de catégories sous mouvement à court terme comprennent :
Variations saisonnières
Ces versions fonctionnent régulièrement et périodiquement sur une période inférieure à un an. Ils ont tendance à avoir un modèle similaire ou presque le même au cours d'une période de 12 mois. De telles variations font partie d'une série chronologique si les données sont enregistrées régulièrement, c'est-à-dire toutes les heures, tous les jours, toutes les semaines, tous les mois ou tous les trimestres.
Les variations saisonnières sont soit d'origine humaine, soit d'origine naturelle. Différentes saisons ou conditions climatiques jouent un rôle critique dans ces variations. Par exemple, la production agricole dépend entièrement des saisons. De même, le marché du parapluie ou de l'imperméable dépend de la saison des pluies, tandis que la vente de glacières et de climatiseurs culmine pendant la saison estivale.
Les conventions artificielles comprennent les festivals, les fêtes et les occasions comme les mariages. De tels événements à court terme se reproduisent année après année.
Variations cycliques
Les variations de séries chronologiques qui ont tendance à s'étendre sur une période de plus d'un an sont appelées variations cycliques. Pour une entreprise, une période complète est considérée comme le « Cycle économique ». Le pic ou la baisse des performances de l'entreprise dépend de divers facteurs tels que la structure économique, la gestion de l'entreprise et d'autres forces en interaction. Ces variations conjoncturelles de l'activité peuvent être régulières mais non périodiques. Généralement, les entreprises subissent un processus cyclique en quatre phases comprenant la prospérité, la récession, la dépression et la reprise.
De telles variations cycliques font partie intégrante d'un modèle de série chronologique, car le développement commercial repose fortement sur les « points de données séquentiels » générés.
Mouvements aléatoires ou irréguliers
Les composantes aléatoires provoquent une variation significative de la variable observée. Ce sont des fluctuations purement irrégulières sans aucun motif défini. Les forces sont imprévues, imprévisibles et de nature irrégulière, par exemple les tremblements de terre, les inondations, les famines et autres catastrophes.
Les événements aléatoires décrits ci-dessus sont analysés à l'aide des données de la série chronologique source pour mieux s'attaquer aux scénarios de la vie réelle qui pourraient se produire à l'avenir.
Types of Time Series
Les données de séries chronologiques peuvent être divisées en quatre types, déterministes, non déterministes, stationnaires et non stationnaires. Jetons un coup d'œil à chaque type en détail.
#1. Séries temporelles déterministes
Une série temporelle déterministe peut être décrite avec une expression analytique. Il n'implique pas d'aspects aléatoires ou probabilistes. Mathématiquement, il peut être exprimé exactement pour tous les intervalles de temps en termes de développement en série de Taylor. Cela est possible si toutes ses dérivées sont connues à un moment arbitraire. Ces dérivés spécifient explicitement le passé et le futur à ce moment-là. Si toutes les conditions sont remplies, il est possible de prédire avec précision son comportement futur et d'analyser comment il s'est comporté dans le passé.
#2. Séries temporelles non déterministes
Une série temporelle non déterministe a un aspect aléatoire qui lui est associé qui empêche sa description explicite. Par conséquent, les expressions analytiques ne sont pas des solutions suffisamment réalisables pour exprimer une telle série chronologique. Une série chronologique peut être non déterministe pour les raisons suivantes :
- Les informations nécessaires pour le décrire ne sont pas disponibles dans leur intégralité. Bien que des données puissent être présentes en principe, elles ne peuvent pas être traitées comme quantifiables explicitement.
- Le processus de génération de données est de nature aléatoire.
En raison du facteur aléatoire, la série temporelle non déterministe obéit à des lois probabilistes. Par conséquent, les données sont traitées en termes statistiques – ce qui implique que les données sont définies par des distributions de probabilité et des moyennes de diverses formes. Cela comprend les moyens et les mesures de dispersion, c'est-à-dire les variances.
#3. Séries temporelles stationnaires
Dans une série chronologique stationnaire, les propriétés statistiques telles que la moyenne, la variance et autres ne reposent pas sur l'aspect temporel. Une série temporelle stationnaire est plus facile à prédire car on peut affirmer avec certitude que ses propriétés statistiques resteront les mêmes que celles observées dans le passé. Par conséquent, diverses méthodes de prévision statistique sont basées sur l'argument selon lequel la série chronologique est à peu près stationnaire. Cela implique que les séries temporelles peuvent être considérées comme stationnaires dans l'approximation en appliquant des transformations mathématiques simples.
#4. Séries temporelles non stationnaires
Dans une série non stationnaire, les propriétés statistiques varient avec le temps. Par conséquent, les séries chronologiques avec des tendances, ou la saisonnalité, relèvent de la catégorie non stationnaire car la tendance et la saisonnalité peuvent affecter la valeur de la série chronologique à différents intervalles de temps. Les séries temporelles non stationnaires décrivent des données imprévisibles, les empêchant d'être modélisées ou prévues.

Time Series Analysis and Forecasting
L'analyse et la prévision de séries chronologiques sont des outils pratiques pour observer, analyser et étudier l'évolution et la dynamique des processus vitaux et des objets de différents types. Regardons chacun plus en profondeur.
Analyse des séries chronologiques
L'analyse des séries chronologiques est définie comme un processus d'analyse des données collectées sur une période de temps. Ici, les analystes de données enregistrent les données à intervalles constants sur une période de temps fixe. Le taux d'observation des données, c'est-à-dire l'intervalle de temps, peut varier de quelques secondes à plusieurs années.
Les données de séries chronologiques décrivent les variables à inspecter car elles fournissent une analyse détaillée du modèle fluctuant sur une période de temps spécifique. Les paramètres nécessaires à l'analyse peuvent varier selon les différents domaines et disciplines. Certains des exemples peuvent inclure :
- Instruments scientifiques – Données enregistrées par jour
- Site marchand – Visites clients par jour
- Bourse – Valeurs des actions par semaine
- Saison – Jours de pluie par an
Pour assurer la cohérence et la fiabilité, l'analyse des séries chronologiques fonctionne sur de grandes quantités de points de données. Une bonne taille d'échantillon est une représentation subtile de l'authenticité d'une tendance ou d'un modèle découvert.
De plus, l'analyse de séries chronologiques est également adaptée pour prédire des événements futurs sur la base de données enregistrées dans le passé.
Prévisions de séries chronologiques
L'analyse des séries chronologiques permet aux organisations d'identifier la cause première des fluctuations des tendances au fil du temps. Avec les données en main, les entreprises peuvent ensuite étudier et approfondir leurs recherches pour mieux comprendre comment faire face aux tendances inconnues et prévoir les événements à venir. Les entreprises emploient généralement visualisation de données techniques pour déterminer de telles anomalies dans les données.
La prévision des séries chronologiques s'articule autour de deux facteurs essentiels :
- Anticipez les événements futurs en fonction du comportement passé des données.
- Supposons que les tendances à venir présenteront des similitudes avec le modèle de données passé.
En prévision, l'objectif principal est de prédire essentiellement comment les points de données continueront de rester les mêmes ou de varier à l'avenir. Voici quelques exemples de différents secteurs industriels pour mieux comprendre les nuances de l'analyse et des prévisions de séries chronologiques.
- Marché boursier – Prévision du cours de clôture de l'action chaque jour.
- Ventes – Prédisez les ventes de produits pour un magasin chaque jour.
- Tarification – Prévision du prix moyen du carburant chaque jour.
Certaines des techniques statistiques courantes utilisées pour la prévision des séries chronologiques comprennent la moyenne mobile simple (SMA), le lissage exponentiel (SES), la moyenne mobile intégrée autorégressive (ARIMA) et le réseau de neurones (NN).
Time Series Data in the Cloud
Pour dévoiler la valeur des données de séries chronologiques, les entreprises doivent être en mesure de stocker et d'interroger des données rapidement. Les sociétés du marché des capitaux s'appuient sur de gros volumes de données historiques et en continu pour utiliser des analyses de données en temps réel et prendre des décisions commerciales percutantes. Cela peut impliquer de prévoir la vulnérabilité des cours des actions, de déterminer les besoins nets en capital ou de prévoir les taux de change. Pour offrir de la flexibilité et traiter les données de manière transparente, de nombreuses entreprises optent pour la migration de leurs bases de données de séries chronologiques vers le nuage.
Avec la migration des bases de données de séries temporelles vers les clouds, les organisations peuvent accéder à des ressources illimitées à la demande. Il permet aux entreprises d'utiliser des centaines de cœurs pour accomplir leur tâche qui maximise le débit du réseau sans problèmes de latence.
Les bases de données de séries temporelles dans l'infrastructure cloud sont adaptées aux charges de travail gourmandes en calcul. Cela comprend l'exécution de calculs de risque en réponse aux tendances du marché en temps réel. Les entreprises financières peuvent supprimer les frais généraux du centre de données et se concentrer sur l'utilisation des ressources pour améliorer la productivité de leurs charges de travail.
Les fournisseurs de cloud tels que AWS fournir Flux temporel d'Amazon, un service de base de données de séries chronologiques qui permet de charger, de stocker et d'analyser facilement des ensembles de données de séries chronologiques. Ils offrent un stockage pour gérer les charges de travail à forte intensité de transactions, des outils d'analyse en temps réel et une fonctionnalité de streaming de données pour présenter les événements au fur et à mesure qu'ils se produisent.
Par conséquent, l'infrastructure cloud amplifie et met à l'échelle les avantages des données de séries chronologiques.
Applications of Time Series
Les modèles de séries chronologiques ont deux objectifs,
- Comprendre les facteurs sous-jacents qui ont produit un certain modèle de données.
- Sur la base de l'analyse, ajustez un modèle à prévoir et à surveiller.
Examinons quelques-uns des cas d'utilisation d'applications de données de séries chronologiques.
#1. Séries temporelles dans le domaine financier et commercial
Toutes les décisions financières, commerciales et d'investissement sont prises sur la base des tendances actuelles du marché et des prévisions de la demande. Les données de séries chronologiques sont utilisées pour expliquer, corréler et prédire le marché financier dynamique. Les experts financiers peuvent examiner les données financières pour donner des prévisions pour les applications qui aident à atténuer les risques, à stabiliser les prix et à négocier.
L'analyse des séries chronologiques joue un rôle clé dans l'analyse financière. Il est utilisé dans la prévision des taux d'intérêt, prévoyant la volatilité des marchés boursiers, et beaucoup plus. Les parties prenantes commerciales et les décideurs politiques peuvent prendre des décisions éclairées concernant la fabrication, les achats, l'allocation des ressources et optimiser leurs opérations commerciales.
Cette analyse est effectivement utilisée dans le secteur de l'investissement pour surveiller les taux des titres et leurs fluctuations dans le temps. Le prix du titre peut également être observé à court terme (c.-à-d. données d'enregistrement par heure ou par jour) ou à long terme (c.-à-d. observation étalée sur des mois ou des années). L'analyse des séries chronologiques est un outil utile pour suivre les performances d'un titre, d'un actif ou d'une variable économique sur une période prolongée.
#2. Séries temporelles dans le domaine médical
La santé est en train de devenir rapidement un domaine axé sur les données. En plus de l'analyse financière et commerciale, le domaine médical tire grandement parti de l'analyse des séries chronologiques.
Considérez un scénario qui nécessite une synergie de données de séries chronologiques, de procédures médicalement alignées et de techniques d'exploration de données lors du traitement des patients atteints de cancer. Un tel cadre hybride peut être utilisé pour exploiter les fonctionnalités d'extraction de caractéristiques à partir des données de séries chronologiques collectées (c'est-à-dire les images radiographiques du patient) pour suivre les progrès et la réponse du patient aux traitements fournis par la fraternité médicale.
Dans le secteur de la santé, tirer des inférences à partir des données de séries chronologiques en constante évolution est d'une valeur critique. De plus, les pratiques médicales avancées exigent que les dossiers des patients soient connectés au fil du temps pour une meilleure visibilité de la santé des patients. De plus, les paramètres de santé du patient doivent être enregistrés avec précision à intervalles réguliers pour avoir une image plus claire de l'état de santé du patient.
Avec l'avènement des instruments médicaux de pointe, l'analyse des séries chronologiques s'est imposée dans le domaine de la santé. Considérez ci-dessous des exemples,
- Appareils ECG : appareils inventés pour surveiller les conditions cardiaques en enregistrant les impulsions électriques du cœur.
- Appareils EEG : Appareils utilisés pour quantifier l'activité électrique dans le cerveau.
De tels dispositifs ont permis aux médecins d'effectuer une analyse de séries chronologiques pour un diagnostic médical plus rapide, efficace et précis.
De plus, avec l'avènement des appareils IoT tels que les capteurs portables et les appareils de santé portables, les gens peuvent désormais prendre des mesures régulières de leurs variables de santé au fil du temps avec un minimum d'entrées. Cela conduit à une collecte de données cohérente de données médicales dépendantes du temps pour les individus malades et en bonne santé.
#3. Séries temporelles en astronomie
L'astronomie et l'astrophysique sont les deux disciplines modernes où les données de séries chronologiques sont exploitées de manière significative.
Fondamentalement, l'astronomie consiste à tracer les trajectoires des objets cosmiques et des corps célestes et à effectuer des mesures précises pour mieux comprendre l'univers au-delà de l'atmosphère terrestre. En raison de cette exigence, les experts en astronomie sont compétents dans le traitement des données de séries chronologiques tout en calibrant et en configurant des instruments complexes et en étudiant les objets astronomiques d'intérêt.
Les données de séries chronologiques ont longtemps été associées au domaine de l'astronomie. En 800 avant JC, des données de séries chronologiques sur les taches solaires ont été collectées à intervalles réguliers. Depuis lors, l'analyse des séries chronologiques a été utilisée pour
- Découvrez des étoiles lointaines basées sur stellar les distances,
- Observez les événements cosmiques tels que les supernovae pour mieux comprendre l'origine de notre univers.
Les données de séries chronologiques, dans ce cas, concernent les longueurs d'onde et les intensités de lumière émises par les étoiles, les corps célestes ou les objets. Les astronomes surveillent en permanence ces données de streaming en direct pour détecter les événements cosmiques en temps réel au fur et à mesure qu'ils se produisent.
Ces derniers temps, des domaines de recherche tels que l'astroinformatique et l'astrostatistique ont émergé, qui mélangent diverses disciplines telles que l'exploration de données, l'apprentissage automatique, l'intelligence informatique et les statistiques. Dans ces nouveaux domaines de recherche, le rôle des données de séries chronologiques est de détecter et de classer rapidement et efficacement les objets astronomiques.
#4. Séries temporelles dans les prévisions météorologiques
Aristote a étudié de manière approfondie les conditions météorologiques pour mieux comprendre les causes et les effets observés dans les changements climatiques dans les temps anciens. Au fil des jours, les scientifiques ont commencé à enregistrer des données météorologiques sur des instruments tels que le « baromètre » pour calculer les variables atmosphériques. Les données ont été collectées à intervalles réguliers et conservées à différents endroits.
Avec le temps, finalement, météo les prévisions ont commencé à figurer dans les journaux. Avance rapide jusqu'à l'époque d'aujourd'hui, des stations de prévisions météorologiques omniprésentes sont installées dans différentes zones géographiques à travers le monde pour collecter des variables météorologiques précises.
Ces stations ont des dispositifs fonctionnels avancés qui sont interconnectés pour collecter et corréler les données météorologiques de divers endroits. Les données corrélées sont utilisées pour prévoir les conditions météorologiques à chaque instant en fonction des besoins.
#5. Séries temporelles en développement des affaires
Les données de séries chronologiques permettent aux entreprises de prendre des décisions commerciales. Ceci est réalisé lorsque le processus analyse les données passées pour dériver les événements futurs et mettre en lumière les possibilités probables. Le modèle de données passées est utilisé pour dériver les paramètres suivants :
- Croissance des affaires: Pour évaluer la performance financière et commerciale globale et mesurer la croissance, les données de séries chronologiques sont l'actif le plus approprié et le plus fiable.
- Estimer la tendance: Diverses méthodes de séries chronologiques peuvent être utilisées pour estimer les tendances émergentes. Considérons, par exemple, que ces méthodes analysent les observations de données sur une période de temps pour réfléchir à une augmentation ou à une diminution des ventes d'un appareil électronique particulier.
- Dévoiler les modèles saisonniers: Les points de données enregistrés pourraient révéler des fluctuations et des modèles saisonniers qui pourraient aider à la prévision des données. Les informations de données obtenues jouent un rôle clé pour les marchés où les prix des produits fluctuent de façon saisonnière. Ces données peuvent aider les entreprises à mieux planifier et développer leurs produits.
Conclusion
En résumé, les données de séries chronologiques peuvent être considérées comme les caractéristiques de points de données complexes collectés sur une période de temps constante. L'analyse des séries chronologiques, la modélisation et la prévision sont devenues une partie intégrante de notre vie quotidienne avec l'émergence de Gadgets IoT, appareils ménagers intelligents et appareils portables. En outre, les données de séries chronologiques trouvent leur application dans divers domaines, notamment la santé, l'astrophysique, l'économie, l'ingénierie, les affaires et bien d'autres.