Comprendre le bogue de traversée de chemin dans le module tarfile de Python
Récemment, une équipe de chercheurs en sécurité a annoncé la découverte d'un bogue vieux de quinze ans dans la fonctionnalité d'extraction de fichiers tar de Python. La vulnérabilité a été divulguée pour la première fois en 2007 et répertoriée sous le nom de CVE-2007-4559. Une note a été ajoutée à la documentation officielle de Python, mais le bogue lui-même n'a pas été corrigé.
Cette vulnérabilité pourrait avoir un impact sur des milliers de projets logiciels, mais de nombreuses personnes ne sont pas familières avec la situation ou la façon de la gérer. C'est pourquoi, ici à Secure Code Warriornous vous donnons la possibilité de simuler vous-même l'exploitation de cette vulnérabilité afin d'en voir l'impact et d'acquérir une expérience pratique des mécanismes de ce bogue persistant, de sorte que vous puissiez mieux protéger votre application !
Essayez la mission simulée maintenant.
La vulnérabilité : traversée de chemin lors de l'extraction d'un fichier tar
La traversée d'un chemin ou d'un répertoire se produit lorsque des données utilisateur non analysées sont utilisées pour construire un chemin de fichier, ce qui permet à un pirate d'accéder à des fichiers et de les écraser, voire d'exécuter un code arbitraire.
La vulnérabilité se trouve dans le module tarfile de Python. Un fichier tar (archive sur bande) est un fichier unique, appelé archive. Il regroupe plusieurs fichiers avec leurs métadonnées et est généralement reconnu par l'extension .tar.gz ou .tgz. Chaque membre de l'archive peut être représenté par un objet TarInfo, qui contient des métadonnées, telles que le nom du fichier, l'heure de modification, la propriété, etc.
Le risque provient de la capacité des archives à être extraites à nouveau.
Lors de l'extraction, chaque membre a besoin d'un chemin d'accès pour être écrit. Cet emplacement est créé en joignant le chemin de base au nom du fichier :

Une fois ce chemin créé, il est transmis à la commande tarfile.extract ou tarfile.extractall pour effectuer l'extraction :

Le problème réside dans l'absence de vérification du nom de fichier. Un attaquant pourrait renommer des fichiers pour y inclure des caractères de traversée de chemin, tels que le point, la barre oblique (../), ce qui amènerait le fichier à sortir du répertoire dans lequel il est censé se trouver et à écraser des fichiers arbitraires. Cela pourrait éventuellement conduire à l'exécution de code à distance, ce qui est propice à l'exploitation.
La vulnérabilité apparaît dans d'autres scénarios, si vous savez comment l'identifier. Outre la gestion des fichiers tar par Python, la vulnérabilité existe dans l'extraction des fichiers zip. Vous la connaissez peut-être sous un autre nom, comme la vulnérabilité zip slip, qui s'est manifestée dans d'autres langages que Python !
Comment pouvez-vous réduire les risques ?
Bien que la vulnérabilité soit connue depuis des années, les responsables de Python considèrent que la fonctionnalité d'extraction fait ce qu'elle est censée faire. Dans ce cas, certains diront qu'il s'agit d'une fonctionnalité et non d'un bogue. Malheureusement, les développeurs ne peuvent pas toujours éviter d'extraire des fichiers tar ou zip d'une source inconnue. C'est à eux qu'il incombe d'assainir les entrées non fiables pour éviter les vulnérabilités de traversée de chemin dans le cadre de pratiques de développement sécurisées.
Vous souhaitez en savoir plus sur la manière d'écrire du code sécurisé et de réduire les risques avec Python ?
Essayez gratuitement notre défi Python.
Si vous souhaitez obtenir d'autres directives de codage gratuites, consultez Secure Code Coach pour vous aider à rester au fait des pratiques de codage sécurisées.


Récemment, une équipe de chercheurs en sécurité a annoncé la découverte d'un bogue vieux de quinze ans dans la fonctionnalité d'extraction de fichiers tar de Python. La vulnérabilité a été divulguée pour la première fois en 2007 et répertoriée sous le nom de CVE-2007-4559. Une note a été ajoutée à la documentation officielle de Python, mais le bogue lui-même n'a pas été corrigé.

Secure Code Warrior est là pour vous aider à sécuriser le code tout au long du cycle de vie du développement logiciel et à créer une culture dans laquelle la cybersécurité est une priorité. Que vous soyez responsable AppSec, développeur, CISO ou toute autre personne impliquée dans la sécurité, nous pouvons aider votre organisation à réduire les risques associés à un code non sécurisé.
Réservez une démonstrationLaura Verheyde est développeuse de logiciels à l'adresse Secure Code Warrior . Elle se consacre à la recherche de vulnérabilités et à la création de contenu pour Missions et Coding labs.


Récemment, une équipe de chercheurs en sécurité a annoncé la découverte d'un bogue vieux de quinze ans dans la fonctionnalité d'extraction de fichiers tar de Python. La vulnérabilité a été divulguée pour la première fois en 2007 et répertoriée sous le nom de CVE-2007-4559. Une note a été ajoutée à la documentation officielle de Python, mais le bogue lui-même n'a pas été corrigé.
Cette vulnérabilité pourrait avoir un impact sur des milliers de projets logiciels, mais de nombreuses personnes ne sont pas familières avec la situation ou la façon de la gérer. C'est pourquoi, ici à Secure Code Warriornous vous donnons la possibilité de simuler vous-même l'exploitation de cette vulnérabilité afin d'en voir l'impact et d'acquérir une expérience pratique des mécanismes de ce bogue persistant, de sorte que vous puissiez mieux protéger votre application !
Essayez la mission simulée maintenant.
La vulnérabilité : traversée de chemin lors de l'extraction d'un fichier tar
La traversée d'un chemin ou d'un répertoire se produit lorsque des données utilisateur non analysées sont utilisées pour construire un chemin de fichier, ce qui permet à un pirate d'accéder à des fichiers et de les écraser, voire d'exécuter un code arbitraire.
La vulnérabilité se trouve dans le module tarfile de Python. Un fichier tar (archive sur bande) est un fichier unique, appelé archive. Il regroupe plusieurs fichiers avec leurs métadonnées et est généralement reconnu par l'extension .tar.gz ou .tgz. Chaque membre de l'archive peut être représenté par un objet TarInfo, qui contient des métadonnées, telles que le nom du fichier, l'heure de modification, la propriété, etc.
Le risque provient de la capacité des archives à être extraites à nouveau.
Lors de l'extraction, chaque membre a besoin d'un chemin d'accès pour être écrit. Cet emplacement est créé en joignant le chemin de base au nom du fichier :

Une fois ce chemin créé, il est transmis à la commande tarfile.extract ou tarfile.extractall pour effectuer l'extraction :

Le problème réside dans l'absence de vérification du nom de fichier. Un attaquant pourrait renommer des fichiers pour y inclure des caractères de traversée de chemin, tels que le point, la barre oblique (../), ce qui amènerait le fichier à sortir du répertoire dans lequel il est censé se trouver et à écraser des fichiers arbitraires. Cela pourrait éventuellement conduire à l'exécution de code à distance, ce qui est propice à l'exploitation.
La vulnérabilité apparaît dans d'autres scénarios, si vous savez comment l'identifier. Outre la gestion des fichiers tar par Python, la vulnérabilité existe dans l'extraction des fichiers zip. Vous la connaissez peut-être sous un autre nom, comme la vulnérabilité zip slip, qui s'est manifestée dans d'autres langages que Python !
Comment pouvez-vous réduire les risques ?
Bien que la vulnérabilité soit connue depuis des années, les responsables de Python considèrent que la fonctionnalité d'extraction fait ce qu'elle est censée faire. Dans ce cas, certains diront qu'il s'agit d'une fonctionnalité et non d'un bogue. Malheureusement, les développeurs ne peuvent pas toujours éviter d'extraire des fichiers tar ou zip d'une source inconnue. C'est à eux qu'il incombe d'assainir les entrées non fiables pour éviter les vulnérabilités de traversée de chemin dans le cadre de pratiques de développement sécurisées.
Vous souhaitez en savoir plus sur la manière d'écrire du code sécurisé et de réduire les risques avec Python ?
Essayez gratuitement notre défi Python.
Si vous souhaitez obtenir d'autres directives de codage gratuites, consultez Secure Code Coach pour vous aider à rester au fait des pratiques de codage sécurisées.

Récemment, une équipe de chercheurs en sécurité a annoncé la découverte d'un bogue vieux de quinze ans dans la fonctionnalité d'extraction de fichiers tar de Python. La vulnérabilité a été divulguée pour la première fois en 2007 et répertoriée sous le nom de CVE-2007-4559. Une note a été ajoutée à la documentation officielle de Python, mais le bogue lui-même n'a pas été corrigé.
Cette vulnérabilité pourrait avoir un impact sur des milliers de projets logiciels, mais de nombreuses personnes ne sont pas familières avec la situation ou la façon de la gérer. C'est pourquoi, ici à Secure Code Warriornous vous donnons la possibilité de simuler vous-même l'exploitation de cette vulnérabilité afin d'en voir l'impact et d'acquérir une expérience pratique des mécanismes de ce bogue persistant, de sorte que vous puissiez mieux protéger votre application !
Essayez la mission simulée maintenant.
La vulnérabilité : traversée de chemin lors de l'extraction d'un fichier tar
La traversée d'un chemin ou d'un répertoire se produit lorsque des données utilisateur non analysées sont utilisées pour construire un chemin de fichier, ce qui permet à un pirate d'accéder à des fichiers et de les écraser, voire d'exécuter un code arbitraire.
La vulnérabilité se trouve dans le module tarfile de Python. Un fichier tar (archive sur bande) est un fichier unique, appelé archive. Il regroupe plusieurs fichiers avec leurs métadonnées et est généralement reconnu par l'extension .tar.gz ou .tgz. Chaque membre de l'archive peut être représenté par un objet TarInfo, qui contient des métadonnées, telles que le nom du fichier, l'heure de modification, la propriété, etc.
Le risque provient de la capacité des archives à être extraites à nouveau.
Lors de l'extraction, chaque membre a besoin d'un chemin d'accès pour être écrit. Cet emplacement est créé en joignant le chemin de base au nom du fichier :

Une fois ce chemin créé, il est transmis à la commande tarfile.extract ou tarfile.extractall pour effectuer l'extraction :

Le problème réside dans l'absence de vérification du nom de fichier. Un attaquant pourrait renommer des fichiers pour y inclure des caractères de traversée de chemin, tels que le point, la barre oblique (../), ce qui amènerait le fichier à sortir du répertoire dans lequel il est censé se trouver et à écraser des fichiers arbitraires. Cela pourrait éventuellement conduire à l'exécution de code à distance, ce qui est propice à l'exploitation.
La vulnérabilité apparaît dans d'autres scénarios, si vous savez comment l'identifier. Outre la gestion des fichiers tar par Python, la vulnérabilité existe dans l'extraction des fichiers zip. Vous la connaissez peut-être sous un autre nom, comme la vulnérabilité zip slip, qui s'est manifestée dans d'autres langages que Python !
Comment pouvez-vous réduire les risques ?
Bien que la vulnérabilité soit connue depuis des années, les responsables de Python considèrent que la fonctionnalité d'extraction fait ce qu'elle est censée faire. Dans ce cas, certains diront qu'il s'agit d'une fonctionnalité et non d'un bogue. Malheureusement, les développeurs ne peuvent pas toujours éviter d'extraire des fichiers tar ou zip d'une source inconnue. C'est à eux qu'il incombe d'assainir les entrées non fiables pour éviter les vulnérabilités de traversée de chemin dans le cadre de pratiques de développement sécurisées.
Vous souhaitez en savoir plus sur la manière d'écrire du code sécurisé et de réduire les risques avec Python ?
Essayez gratuitement notre défi Python.
Si vous souhaitez obtenir d'autres directives de codage gratuites, consultez Secure Code Coach pour vous aider à rester au fait des pratiques de codage sécurisées.

Cliquez sur le lien ci-dessous et téléchargez le PDF de cette ressource.
Secure Code Warrior est là pour vous aider à sécuriser le code tout au long du cycle de vie du développement logiciel et à créer une culture dans laquelle la cybersécurité est une priorité. Que vous soyez responsable AppSec, développeur, CISO ou toute autre personne impliquée dans la sécurité, nous pouvons aider votre organisation à réduire les risques associés à un code non sécurisé.
Voir le rapportRéservez une démonstrationLaura Verheyde est développeuse de logiciels à l'adresse Secure Code Warrior . Elle se consacre à la recherche de vulnérabilités et à la création de contenu pour Missions et Coding labs.
Récemment, une équipe de chercheurs en sécurité a annoncé la découverte d'un bogue vieux de quinze ans dans la fonctionnalité d'extraction de fichiers tar de Python. La vulnérabilité a été divulguée pour la première fois en 2007 et répertoriée sous le nom de CVE-2007-4559. Une note a été ajoutée à la documentation officielle de Python, mais le bogue lui-même n'a pas été corrigé.
Cette vulnérabilité pourrait avoir un impact sur des milliers de projets logiciels, mais de nombreuses personnes ne sont pas familières avec la situation ou la façon de la gérer. C'est pourquoi, ici à Secure Code Warriornous vous donnons la possibilité de simuler vous-même l'exploitation de cette vulnérabilité afin d'en voir l'impact et d'acquérir une expérience pratique des mécanismes de ce bogue persistant, de sorte que vous puissiez mieux protéger votre application !
Essayez la mission simulée maintenant.
La vulnérabilité : traversée de chemin lors de l'extraction d'un fichier tar
La traversée d'un chemin ou d'un répertoire se produit lorsque des données utilisateur non analysées sont utilisées pour construire un chemin de fichier, ce qui permet à un pirate d'accéder à des fichiers et de les écraser, voire d'exécuter un code arbitraire.
La vulnérabilité se trouve dans le module tarfile de Python. Un fichier tar (archive sur bande) est un fichier unique, appelé archive. Il regroupe plusieurs fichiers avec leurs métadonnées et est généralement reconnu par l'extension .tar.gz ou .tgz. Chaque membre de l'archive peut être représenté par un objet TarInfo, qui contient des métadonnées, telles que le nom du fichier, l'heure de modification, la propriété, etc.
Le risque provient de la capacité des archives à être extraites à nouveau.
Lors de l'extraction, chaque membre a besoin d'un chemin d'accès pour être écrit. Cet emplacement est créé en joignant le chemin de base au nom du fichier :

Une fois ce chemin créé, il est transmis à la commande tarfile.extract ou tarfile.extractall pour effectuer l'extraction :

Le problème réside dans l'absence de vérification du nom de fichier. Un attaquant pourrait renommer des fichiers pour y inclure des caractères de traversée de chemin, tels que le point, la barre oblique (../), ce qui amènerait le fichier à sortir du répertoire dans lequel il est censé se trouver et à écraser des fichiers arbitraires. Cela pourrait éventuellement conduire à l'exécution de code à distance, ce qui est propice à l'exploitation.
La vulnérabilité apparaît dans d'autres scénarios, si vous savez comment l'identifier. Outre la gestion des fichiers tar par Python, la vulnérabilité existe dans l'extraction des fichiers zip. Vous la connaissez peut-être sous un autre nom, comme la vulnérabilité zip slip, qui s'est manifestée dans d'autres langages que Python !
Comment pouvez-vous réduire les risques ?
Bien que la vulnérabilité soit connue depuis des années, les responsables de Python considèrent que la fonctionnalité d'extraction fait ce qu'elle est censée faire. Dans ce cas, certains diront qu'il s'agit d'une fonctionnalité et non d'un bogue. Malheureusement, les développeurs ne peuvent pas toujours éviter d'extraire des fichiers tar ou zip d'une source inconnue. C'est à eux qu'il incombe d'assainir les entrées non fiables pour éviter les vulnérabilités de traversée de chemin dans le cadre de pratiques de développement sécurisées.
Vous souhaitez en savoir plus sur la manière d'écrire du code sécurisé et de réduire les risques avec Python ?
Essayez gratuitement notre défi Python.
Si vous souhaitez obtenir d'autres directives de codage gratuites, consultez Secure Code Coach pour vous aider à rester au fait des pratiques de codage sécurisées.
Table des matières

Secure Code Warrior est là pour vous aider à sécuriser le code tout au long du cycle de vie du développement logiciel et à créer une culture dans laquelle la cybersécurité est une priorité. Que vous soyez responsable AppSec, développeur, CISO ou toute autre personne impliquée dans la sécurité, nous pouvons aider votre organisation à réduire les risques associés à un code non sécurisé.
Réservez une démonstrationTéléchargerRessources pour vous aider à démarrer
Sécurité dès la conception : Définir les meilleures pratiques, permettre aux développeurs et évaluer les résultats de la sécurité préventive
Dans ce document de recherche, les cofondateurs de Secure Code Warrior , Pieter Danhieux et Matias Madou, Ph.D., ainsi que des contributeurs experts, Chris Inglis, ancien directeur national américain de la cybernétique (aujourd'hui conseiller stratégique du Paladin Capital Group), et Devin Lynch, directeur principal du Paladin Global Institute, révèleront les principales conclusions de plus de vingt entretiens approfondis avec des responsables de la sécurité des entreprises, y compris des RSSI, un vice-président de la sécurité des applications et des professionnels de la sécurité des logiciels.
Évaluation comparative des compétences en matière de sécurité : Rationalisation de la conception sécurisée dans l'entreprise
Il est notoirement difficile de trouver des données significatives sur le succès des initiatives Secure-by-Design. Les RSSI sont souvent confrontés à des difficultés lorsqu'ils tentent de prouver le retour sur investissement (ROI) et la valeur commerciale des activités du programme de sécurité, tant au niveau des personnes que de l'entreprise. De plus, il est particulièrement difficile pour les entreprises d'obtenir des informations sur la façon dont leurs organisations sont comparées aux normes actuelles du secteur. La stratégie nationale de cybersécurité du président a mis les parties prenantes au défi d'"adopter la sécurité et la résilience dès la conception". Pour que les initiatives de conception sécurisée fonctionnent, il faut non seulement donner aux développeurs les compétences nécessaires pour assurer la sécurité du code, mais aussi garantir aux régulateurs que ces compétences sont en place. Dans cette présentation, nous partageons une myriade de données qualitatives et quantitatives, dérivées de sources primaires multiples, y compris des points de données internes collectés auprès de plus de 250 000 développeurs, des informations sur les clients basées sur des données, et des études publiques. En nous appuyant sur cette agrégation de points de données, nous visons à communiquer une vision de l'état actuel des initiatives Secure-by-Design dans de multiples secteurs verticaux. Le rapport explique en détail pourquoi cet espace est actuellement sous-utilisé, l'impact significatif qu'un programme de perfectionnement réussi peut avoir sur l'atténuation des risques de cybersécurité, et le potentiel d'élimination des catégories de vulnérabilités d'une base de code.
Services professionnels - Accélérer grâce à l'expertise
L'équipe des services de stratégie de programme (PSS) de Secure Code Warriorvous aide à construire, améliorer et optimiser votre programme de codage sécurisé. Que vous partiez de zéro ou que vous affiniez votre approche, nos experts vous fournissent des conseils sur mesure.
Thèmes et contenu de la formation sur le code sécurisé
Notre contenu, à la pointe de l'industrie, évolue constamment pour s'adapter au paysage du développement logiciel en constante évolution, tout en gardant votre rôle à l'esprit. Les sujets abordés vont de l'IA à l'injection XQuery, et sont proposés pour une variété de rôles, des architectes et ingénieurs aux gestionnaires de produits et à l'assurance qualité. Découvrez en avant-première ce que notre catalogue de contenu a à offrir par sujet et par rôle.
Ressources pour vous aider à démarrer
Révélation : Comment l'industrie du cyberespace définit la notion de "Secure by Design" (sécurité dès la conception)
Dans notre dernier livre blanc, nos cofondateurs, Pieter Danhieux et Matias Madou, Ph.D., ont rencontré plus de vingt responsables de la sécurité d'entreprise, notamment des RSSI, des responsables AppSec et des professionnels de la sécurité, afin d'identifier les principales pièces de ce puzzle et de découvrir la réalité qui se cache derrière le mouvement Secure by Design. Il s'agit d'une ambition partagée par les équipes de sécurité, mais il n'y a pas de manuel de jeu commun.
Vibe Coding va-t-il transformer votre base de code en une fête de fraternité ?
Le codage vibratoire est comme une fête de fraternité universitaire, et l'IA est la pièce maîtresse de toutes les festivités, le tonneau. C'est très amusant de se laisser aller, d'être créatif et de voir où votre imagination peut vous mener, mais après quelques barils, boire (ou utiliser l'IA) avec modération est sans aucun doute la solution la plus sûre à long terme.