Matplotlib est une bibliothèque de traçage Python que les experts en apprentissage automatique utilisent principalement pour créer des visualisations statiques et interactives.
Qu’est-ce que Matplotlib ?
Mathplotlib est une création de John D. Hunter en 2003, publiée le 8 mai 2021 et dont la version actuelle est 3.4.2.
Cette bibliothèque est principalement écrite en Python, tandis que le reste est écrit en objectif C et en JavaScript, ce qui la rend compatible avec les plateformes.
Matplotlib utilise NumPy, qui est une extension numérique de Python. Son extension avec NumPy ajoute à sa viabilité en tant qu’alternative open-source et en fait une meilleure préférence que MATLAB.
Pour les applications Python GUI, Matplotlib permet de tracer des graphiques statiques en utilisant l’API orientée objet fournie.
Les utilisateurs peuvent utiliser seulement quelques lignes de code Python pour visualiser leurs données à l’aide de différents graphiques, notamment des diagrammes de dispersion, des histogrammes, des diagrammes à barres, des diagrammes circulaires, des diagrammes linéaires et des diagrammes en boîte.
Vous pouvez utiliser Matplotlib pour créer des graphiques dans des environnements tels que le shell Python, Jupyter notebook,
Jupyter lab, mais aussi en utilisant Pycharm ou Anaconda et sur des serveurs d’applications web comme Flask et Django sur différentes plateformes.
Comme dans MATLAB, vous pouvez contrôler les tracés en termes de polices, de lignes, de couleurs et de styles.
Après une brève présentation de la bibliothèque Matplotib en Python, voyons comment la configurer dans nos systèmes.
Configuration de l’environnement Matplotlib
Comme tout autre paquetage et bibliothèque Python, vous pouvez installer la bibliothèque précompilée Matplotlib et ses paquetages sur tous les systèmes d’exploitation à l’aide du gestionnaire de paquetages pip.
Bien sûr, cela nécessite que vous installiez d’abord Python et le paquetage pip sur votre système.
Les commandes suivantes affichent la version de Python et de pip pour confirmer si ces outils sont déjà installés.
Vérifiez si Python est installé
Python --version
Vérifiez si pip est installé
pip -V
Installer Mathplotlib
La commande ci-dessous installe le paquet Matplotlib depuis le Python Package Index(PyPI).
python -m pip install matplotlib
Cette commande télécharge et installe les paquets pertinents de Matplotlib. Vous devriez voir un message d’installation réussie une fois l’installation terminée.
Pour être sûr que Matplotlib a été installé avec succès, tapez la commande suivante, qui affichera la version de Matplotlib dans votre invite de commande.
import matplotlib
matplotlib.__version__
Les développeurs souhaitant installer le paquetage Matplotlib non compilé doivent avoir accès au compilateur adéquat dans leur système, en plus des dépendances, des scripts d’installation, des fichiers de configuration et des correctifs.
Cependant, cette installation particulière de Matplolib non compilé peut être compliquée, en particulier pour les utilisateurs novices de Matplotlib. Par conséquent, pourquoi ne pas utiliser une commande en une ligne pour installer la bibliothèque en quelques secondes ?
Après l’installation de Matplotlib, importez le paquet dans votre environnement pour accéder à ses utilitaires.
Options de traçage de Matplotlib
Matplotlib propose de nombreuses options de tracé pour visualiser les données. Elle permet également de personnaliser les tracés en fournissant différents thèmes, couleurs et options de palette que l’utilisateur peut utiliser pour manipuler les tracés.
Ces options de traçage comprennent :
#1. Graphiques à barres
Les diagrammes en bâtons, bien connus sous le nom de diagrammes en barres, sont une option appropriée pour visualiser une comparaison quantitative de valeurs au sein d’une même catégorie.

Matplotlib représente ce graphique à l’aide de barres rectangulaires dont les longueurs et les hauteurs représentent leurs valeurs proportionnelles. Les barres peuvent être horizontales ou verticales.
Matplotlib utilise sa fonction plt.bar()
pour créer le diagramme à barres.
En outre, vous pouvez utiliser d’autres fonctions pour manipuler ce graphique. Par exemple, les fonctions plt .xlabel()
et plt.ylabel()
étiquettent les axes x et y du graphique,
respectivement.
La fonction plt.title()
vous permet également de donner un titre à votre graphique, tandis que la fonction plt.savefig()
enregistre le graphique. La fonction plot.show()
, qui est la plus importante, affiche le graphique.
#2. Diagrammes circulaires
Vous pouvez visualiser la distribution proportionnelle des éléments au sein d’une même catégorie à l’aide d’un graphique statistique circulaire appelé camembert.
Les camemberts affichent les données sous forme de pourcentage. La surface totale du graphique correspond au pourcentage de l’ensemble des données, tandis que les parts de tarte individuelles représentent des sections du pourcentage des données.

Matplotlib utilise la fonction plt.pie()
qui dessine et ajuste les paramètres du graphique circulaire.
D’autres paramètres comme l’autopct
qui imprime la valeur du camembert jusqu’à la première décimale sont utiles pour tracer des camemberts.
Les entreprises trouvent les diagrammes circulaires utiles pour présenter des informations pertinentes telles que les opérations, les ventes ou les ressources.
#3. Histogramme
Un histogramme affiche la distribution des données numériques. Il utilise des intervalles continus pour diviser les données en sections distinctes.
La principale différence entre un histogramme et un diagramme en bâtons est le type de données qu’ils traitent. Alors que les histogrammes traitent les données continues, les diagrammes en bâtons traitent les données catégorielles.

Matplotlib utilise la fonction hist()
qui utilise un tableau de valeurs aléatoires ou définies pour créer l’histogramme.
#4. Graphiques linéaires
Ces tracés sont utiles pour montrer la relation entre deux valeurs de données que nous définissons comme numériques et catégorielles, sur une base X et Y.

Les tracés linéaires sont utiles pour suivre l’évolution des valeurs de données sur une certaine période.
#5. Diagrammes de dispersion
Les diagrammes de dispersion mettent en évidence la relation, y compris la corrélation entre les variables des données. Ils sont également utiles pour identifier les valeurs aberrantes.

Les diagrammes de dispersion utilisent des points pour représenter la relation entre les variables de données et la façon dont un changement dans une variable peut affecter une autre.
Comment créer des graphiques dans Matplotlib
Matplotlib utilise différentes fonctions pour créer différents tracés. Il utilise également très peu de lignes de code pour créer le graphique.
Ci-dessous, nous verrons comment créer les différentes options de tracé à l’aide de différentes fonctions de Matplotlib.
#1. Diagramme à barres dans Matplotlib
Les diagrammes à barres, comme expliqué ci-dessus, affichent des catégories de données à l’aide de barres et d’axes qui représentent une comparaison des catégories sur un axe et des valeurs correspondantes des catégories sur l’autre axe.
La fonction bar()
de Matplotlib prend différentes dispositions d’argument pour décrire la disposition des barres, comme indiqué ci-dessous.
plt.bar(x, y, height, width, bottom, align)
Les paramètres x et y représentent les valeurs des coordonnées x et y de la barre dans le graphique. Le paramètre width représente la largeur de la barre, tandis que le paramètre height représente la hauteur de la barre.
Par exemple, représentons le nombre de chiens et de chats dans un refuge pour animaux par x.
import matplotlib.pyplot as plt
import numpy as np
x = ["Chats", "Chiens"]
plt.xlabel("Chats et chiens dans le refuge")
plt.ylabel("No. d'animaux dans le refuge")
plt.title("Nombre de chats et de chiens dans le refuge x")
y = [300, 350]
plt.bar(x, y, color ='black', width = 0.5)
Résultat :

Comme dans notre exemple ci-dessus, vous pouvez spécifier la couleur des barres en utilisant l’attribut color. De plus, plt .xlabel et p.ylabel nomment
respectivement les axes x et y
, tandis que plt.title
nomme le graphe.
#2. Comment créer un graphique circulaire
Matplotlib utilise la fonction pie()
fournie avec le module pyplot
pour tracer un graphique circulaire.
La fonction représente les données à tracer sous forme de tableau.
Syntaxe :
matplotlib.pyplot.pie(data, explode=None, labels=None, colors=None, autopct=None, shadow=False)
Le paramètre colors définit la couleur des parts de tarte. Vous pouvez utiliser un tableau de valeurs pour spécifier une couleur pour chaque part.
Pour inclure les détails de chaque part de tarte, l’argument autopct
ajoute les pourcentages numériques que chaque part représente en utilisant la notation de formatage String de Python. L’argument explode accepte un tableau de valeurs commençant à 0,1 pour définir la distance de la tranche par rapport au centre du camembert.
Traçons un diagramme circulaire qui affiche les ressources en pourcentage allouées à un projet particulier.
import matplotlib.pyplot as plt
import numpy as np
y = np.array([25, 10, 45, 20])
mylabels = ["w", "x", "y", "z"]
explodevalues = [0.1, 0.2, 0, 0]
colors = ['tab:blue', 'tab:green', 'tab:orange', 'tab:red']
plt.title("Ressources allouées à un projet aléatoire")
plt.pie(y, labels = mylabels, colors=colors,explode = explodevalues, autopct='%1.1f%%', shadow = True)
plt.show()
Sortie :

Le graphique ci-dessus affiche un diagramme circulaire avec quatre tranches étiquetées w, x, y et z, respectivement. Les valeurs explode définissent la distance à laquelle les tranches seront placées par rapport au centre du camembert.
Dans le graphique ci-dessus, x est plus éloigné car sa valeur explode est plus grande que les autres. L’attribut shadow ajoute une ombre au camembert, comme dans l’image, tandis que autopct
définit le pourcentage relatif que chaque tranche représente par rapport à l’ensemble du camembert.
#3. Création d’un histogramme
Avec un histogramme, nous utiliserons une série d’intervalles pour représenter l’étendue des valeurs données sur l’axe des abscisses.
L’axe des ordonnées, quant à lui, représente les informations relatives à la fréquence.
Contrairement aux autres tracés, le tracé d’un histogramme dans Matplotlib nécessite certaines étapes prédéfinies que vous devez suivre pour créer le tracé.
Ces étapes sont les suivantes
- Créez un bin d’intervalles à partir de l’ensemble des valeurs de données dont vous disposez. Vous pouvez utiliser la fonction
np.random.normal()
qui peut générer des valeurs aléatoires pour vous. - À l’aide d’une série d’intervalles, répartissez les valeurs dans une plage de valeurs.
- Comptez les valeurs comprises dans chaque intervalle particulier.
- Utilisez maintenant la fonction
matplotlib.pyplot.hist()
pour créer l’histogramme.
La fonction hist()
prend en compte plusieurs paramètres,
notamment
x – Il représente la séquence du tableau
bins – Il s’agit d’un paramètre facultatif qui représente des intervalles de variables qui ne se chevauchent pas et qui peuvent contenir des nombres entiers ou une séquence de chaînes de caractères.
range – Ce paramètre définit les intervalles supérieur et inférieur des bins
align – Ce paramètre contrôle l’alignement de l’histogramme. Il peut être à gauche, à droite ou au milieu.
color – Définit la couleur des barres.
rwidth – Ce paramètre définit la largeur relative des barres de l’histogramme par rapport à celle de la case.
log – Le paramètre log définit une échelle logarithmique sur l’axe de l’histogramme.
L’exemple suivant trace un histogramme avec les valeurs définies.
from matplotlib import pyplot as plt
x = [22, 40, 87, 5, 43, 30, 56,73, 55, 54, 11, 20, 51, 5, 50, 60, 70, 80]
plt.hist(x)
plt.title(Histogram plot example')
plt.xlabel('x axis')
plt.ylabel('frequency')
plt.show()
Sortie :

#4. Graphique linéaire dans Matplotlib
Matplotlib utilise sa sous-bibliothèque appelée pyplot
, qui est livrée avec diverses fonctions qui aident à sa mise en œuvre.
Nous utilisons la fonction plot()
, qui est une fonction générique fournie avec pyplot
pour tracer les courbes et différents autres types de courbes, y compris les courbes courbes et les courbes multiples. La création de ces différents types de tracés dépend des valeurs que vous donnez à l’axe des y.
Lors du traçage, importez matplotlib.pyplot
et Numpy, qui dessinent les graphiques. La méthode plot(x,y)
crée un tracé linéaire en passant des valeurs aléatoires aux arguments x et y.
En outre, vous pouvez passer une variable label qui étiquette le tracé. La fonction title nomme le titre du graphique, tandis que les fonctions xlabel et ylabel nomment les axes. Enfin, la fonction show() affiche le graphique.
Par exemple, la fonction show() permet d’afficher le graphique :
import matplotlib.pyplot as plt
import numpy as np
x = np.linspace(0, 5, 10)
y = 3*x 2
plt.title('Line plot example')
plt.xlabel('x axis')
plt.ylabel('y axis')
plt.plot(x, y)
plt.show()
Résultat :

L’attribut np.linspace
renvoie sur le graphique un ensemble de nombres régulièrement espacés sur un intervalle particulier pour les valeurs x. Cela créera un tableau de 10 valeurs comprises entre 0 et 5
. Les valeurs y sont créées à partir de l’équation qui utilise les valeurs x correspondantes.
Création de diagrammes de dispersion
Matplotlib utilise la méthode scatter() pour créer ce graphique.
Cette méthode prend en compte les paramètres suivants.
matplotlib.pyplot.scatter(x_axis_data, y_axis_data, s=None, c=None, marker=None, cmap=None, vmin=None, vmax=None, alpha=None, linewidths=None, edgecolors=None)
Les paramètres x_axis_data et y_axis_data ne peuvent pas être laissés vides, contrairement aux autres paramètres qui peuvent être facultatifs et avoir pour valeur None. Alors que l’argument x_axis_data définit un tableau de données pour l’axe des x, l’argument y_axis_data définit un tableau de données pour l’axe des y.
Exemple de diagramme de dispersion dans matplotlib
import matplotlib.pyplot as plt
x =[15, 17, 18, 27, 22, 27, 32, 14, 11, 12, 29, 16]
y =[19, 16, 17, 18, 10, 26, 13, 27, 14, 18, 17, 35]
plt.title('Scatter plot example')
plt.xlabel('x variable')
plt.ylabel('y variable')
plt.scatter(x, y, c ="green")
# Pour afficher le graphique
plt.show()
Sa sortie ressemblera à :

Qu’est-ce que subplot() dans matplotlib ?
La fonction subplot ()
peut être utilisée pour dessiner plusieurs graphiques sur une seule figure Matplotlib. Cela permet de visualiser et de comparer les multiples tracés à l’intérieur de la figure.
Cette fonction renvoie un tuple avec trois arguments : les lignes et les colonnes en tant que premier et deuxième argument, respectivement, et l’index du tracé actuel en tant que troisième argument.
Les lignes et les colonnes définissent clairement la disposition de Matplotlib.
Par conséquent, plt.subplot(2, 1, 1)
par exemple, tracera une figure Matplotlib avec deux lignes et une colonne, et ce tracé sera le premier tracé.
D’autre part, plt.subplot(2, 1, 2)
affiche un second graphique avec deux lignes et une colonne.
Le traçage de ces deux tracés les superpose, comme dans l’exemple ci-dessous.
import matplotlib.pyplot as plt
import numpy as np
#plot 1 :
x = np.array([2, 4, 6, 8])
y = np.array([3, 6, 9, 12])
plt.subplot(2, 1, 1)
plt.plot(x,y)
#plot 2 :
x = np.array([3, 6, 9, 12])
y = np.array([1, 2, 3, 4])
plt.subplot(2, 1, 2)
plt.plot(x,y)
plt.show()
La sortie de l’exemple ci-dessus ressemblera à l’image ci-dessous.

Prenons un autre exemple : utilisons la fonction subplot pour tracer deux figures d’une ligne et de deux colonnes. Cela permettra d’afficher les tracés côte à côte.
import matplotlib.pyplot as plt
import numpy as np
#plot 1 :
x = np.array([2, 4, 6, 8])
y = np.array([3, 6, 9, 12])
plt.subplot(1, 2, 1)
plt.plot(x,y)
#plot 2 :
x = np.array([3, 6, 9, 12])
y = np.array([1, 2, 3, 4])
plt.subplot(1, 2, 2)
plt.plot(x,y)
plt.show()
L’exemple ci-dessus affichera le résultat suivant.

Eh bien, c’était une interactivité intéressante, n’est-ce pas ? 😃
Mot de la fin
Matplotlib est une bibliothèque de visualisation bien connue en Python. Son interactivité et sa facilité d’utilisation, même pour les débutants, en font un outil encore meilleur pour les tracés en Python.
Cet article a couvert des exemples des différents tracés que les fonctions fournies avec Matplotlib peuvent créer, y compris les diagrammes circulaires, les diagrammes à barres, les histogrammes et les diagrammes de dispersion.
Bien entendu, Python dispose de plusieurs autres bibliothèques que les experts en apprentissage automatique et les scientifiques des données peuvent utiliser pour créer des visualisations.
Vous pouvez explorer plus de tracés que vous pouvez créer avec Matplotlib et quelles fonctions vous utiliserez pour créer le tracé.
Bon tracé!📉📊📊