Technique de codage sécurisé : Traitement des données XML, partie 1
Le langage de balisage extensible (XML) est un langage de balisage utilisé pour coder des documents dans un format qui est à la fois facile à manipuler par les machines et lisible par l'homme. Cependant, ce format couramment utilisé comporte de nombreuses failles de sécurité. Dans ce premier article de blog sur le XML, j'expliquerai les bases de la manipulation sécurisée des documents XML à l'aide d'un schéma.
L'OWASP divise les différentes vulnérabilités liées à XML et aux schémas XML en deux catégories.
Documents XML malformés
Les documents XML malformés sont des documents qui ne respectent pas les spécifications XML du W3C. Parmi les exemples de documents malformés, on peut citer la suppression d'une balise de fin, la modification de l'ordre de différents éléments ou l'utilisation de caractères interdits. Toutes ces erreurs doivent entraîner une erreur fatale et le document ne doit subir aucun traitement supplémentaire.
Afin d'éviter les vulnérabilités causées par des documents malformés, vous devez utiliser un analyseur XML bien testé qui respecte les spécifications du W3C et qui ne prend pas beaucoup plus de temps pour traiter les documents malformés.
Documents XML non valides
Les documents XML non valides sont bien formés mais contiennent des valeurs inattendues. Dans ce cas, un attaquant peut tirer parti d'applications qui ne définissent pas correctement un schéma XML pour déterminer si les documents sont valides. Vous trouverez ci-dessous un exemple simple de document qui, s'il n'est pas validé correctement, peut avoir des conséquences inattendues.
Un magasin en ligne qui stocke ses transactions dans des données XML :
<purchase></purchase>
<id>123</id>
<price>200</price>
And the user only has control over the <id> value. It is then possible, without the right counter measures, for an attacker to input something like this:</id>
<purchase></purchase>
<id>123</id>
<price>0</price>
<id></id>
<price>200</price>
If the parser that processes this document only reads the first instance of the <id> and <price> tags this will lead to unwanted results. </price></id>

Il est également possible que le schéma ne soit pas assez restrictif ou que d'autres validations d'entrée soient insuffisantes, de sorte que des nombres négatifs, des décimales spéciales (comme NaN ou Infinity) ou des valeurs excessivement grandes peuvent être saisis là où ils ne sont pas attendus, ce qui conduit à un comportement involontaire similaire.
Pour éviter les vulnérabilités liées à des documents XML non valides, il convient de définir un schéma XML précis et restrictif afin d'éviter les problèmes liés à une validation incorrecte des données.
Dans le prochain billet, nous aborderons des attaques plus avancées sur les documents XML, telles que les Jumbo Payloads et le redoutable numéro quatre du Top Ten de l'OWASP, XXE.
Entre-temps, vous pouvez perfectionner ou mettre à l'épreuve vos compétences en matière de validation d'entrées XML sur notre portail.
Les spécifications pour XML et les schémas XML comportent de nombreuses failles de sécurité. En même temps, ces spécifications fournissent les outils nécessaires pour protéger les applications XML. Même si nous utilisons les schémas XML pour définir la sécurité des documents XML, ils peuvent être utilisés pour effectuer une variété d'attaques : récupération de fichiers, falsification de requêtes côté serveur, balayage de ports ou force brute.


Les spécifications pour XML et les schémas XML comportent de nombreuses failles de sécurité. En même temps, ces spécifications fournissent les outils nécessaires pour protéger les applications XML. Même si nous utilisons les schémas XML pour définir la sécurité des documents XML, ils peuvent être utilisés pour effectuer une variété d'attaques.
Chercheur en sécurité applicative - Ingénieur R&D - Doctorant

Secure Code Warrior est là pour vous aider à sécuriser le code tout au long du cycle de vie du développement logiciel et à créer une culture dans laquelle la cybersécurité est une priorité. Que vous soyez responsable AppSec, développeur, CISO ou toute autre personne impliquée dans la sécurité, nous pouvons aider votre organisation à réduire les risques associés à un code non sécurisé.
Réservez une démonstrationChercheur en sécurité applicative - Ingénieur R&D - Doctorant


Le langage de balisage extensible (XML) est un langage de balisage utilisé pour coder des documents dans un format qui est à la fois facile à manipuler par les machines et lisible par l'homme. Cependant, ce format couramment utilisé comporte de nombreuses failles de sécurité. Dans ce premier article de blog sur le XML, j'expliquerai les bases de la manipulation sécurisée des documents XML à l'aide d'un schéma.
L'OWASP divise les différentes vulnérabilités liées à XML et aux schémas XML en deux catégories.
Documents XML malformés
Les documents XML malformés sont des documents qui ne respectent pas les spécifications XML du W3C. Parmi les exemples de documents malformés, on peut citer la suppression d'une balise de fin, la modification de l'ordre de différents éléments ou l'utilisation de caractères interdits. Toutes ces erreurs doivent entraîner une erreur fatale et le document ne doit subir aucun traitement supplémentaire.
Afin d'éviter les vulnérabilités causées par des documents malformés, vous devez utiliser un analyseur XML bien testé qui respecte les spécifications du W3C et qui ne prend pas beaucoup plus de temps pour traiter les documents malformés.
Documents XML non valides
Les documents XML non valides sont bien formés mais contiennent des valeurs inattendues. Dans ce cas, un attaquant peut tirer parti d'applications qui ne définissent pas correctement un schéma XML pour déterminer si les documents sont valides. Vous trouverez ci-dessous un exemple simple de document qui, s'il n'est pas validé correctement, peut avoir des conséquences inattendues.
Un magasin en ligne qui stocke ses transactions dans des données XML :
<purchase></purchase>
<id>123</id>
<price>200</price>
And the user only has control over the <id> value. It is then possible, without the right counter measures, for an attacker to input something like this:</id>
<purchase></purchase>
<id>123</id>
<price>0</price>
<id></id>
<price>200</price>
If the parser that processes this document only reads the first instance of the <id> and <price> tags this will lead to unwanted results. </price></id>

Il est également possible que le schéma ne soit pas assez restrictif ou que d'autres validations d'entrée soient insuffisantes, de sorte que des nombres négatifs, des décimales spéciales (comme NaN ou Infinity) ou des valeurs excessivement grandes peuvent être saisis là où ils ne sont pas attendus, ce qui conduit à un comportement involontaire similaire.
Pour éviter les vulnérabilités liées à des documents XML non valides, il convient de définir un schéma XML précis et restrictif afin d'éviter les problèmes liés à une validation incorrecte des données.
Dans le prochain billet, nous aborderons des attaques plus avancées sur les documents XML, telles que les Jumbo Payloads et le redoutable numéro quatre du Top Ten de l'OWASP, XXE.
Entre-temps, vous pouvez perfectionner ou mettre à l'épreuve vos compétences en matière de validation d'entrées XML sur notre portail.
Les spécifications pour XML et les schémas XML comportent de nombreuses failles de sécurité. En même temps, ces spécifications fournissent les outils nécessaires pour protéger les applications XML. Même si nous utilisons les schémas XML pour définir la sécurité des documents XML, ils peuvent être utilisés pour effectuer une variété d'attaques : récupération de fichiers, falsification de requêtes côté serveur, balayage de ports ou force brute.

Le langage de balisage extensible (XML) est un langage de balisage utilisé pour coder des documents dans un format qui est à la fois facile à manipuler par les machines et lisible par l'homme. Cependant, ce format couramment utilisé comporte de nombreuses failles de sécurité. Dans ce premier article de blog sur le XML, j'expliquerai les bases de la manipulation sécurisée des documents XML à l'aide d'un schéma.
L'OWASP divise les différentes vulnérabilités liées à XML et aux schémas XML en deux catégories.
Documents XML malformés
Les documents XML malformés sont des documents qui ne respectent pas les spécifications XML du W3C. Parmi les exemples de documents malformés, on peut citer la suppression d'une balise de fin, la modification de l'ordre de différents éléments ou l'utilisation de caractères interdits. Toutes ces erreurs doivent entraîner une erreur fatale et le document ne doit subir aucun traitement supplémentaire.
Afin d'éviter les vulnérabilités causées par des documents malformés, vous devez utiliser un analyseur XML bien testé qui respecte les spécifications du W3C et qui ne prend pas beaucoup plus de temps pour traiter les documents malformés.
Documents XML non valides
Les documents XML non valides sont bien formés mais contiennent des valeurs inattendues. Dans ce cas, un attaquant peut tirer parti d'applications qui ne définissent pas correctement un schéma XML pour déterminer si les documents sont valides. Vous trouverez ci-dessous un exemple simple de document qui, s'il n'est pas validé correctement, peut avoir des conséquences inattendues.
Un magasin en ligne qui stocke ses transactions dans des données XML :
<purchase></purchase>
<id>123</id>
<price>200</price>
And the user only has control over the <id> value. It is then possible, without the right counter measures, for an attacker to input something like this:</id>
<purchase></purchase>
<id>123</id>
<price>0</price>
<id></id>
<price>200</price>
If the parser that processes this document only reads the first instance of the <id> and <price> tags this will lead to unwanted results. </price></id>

Il est également possible que le schéma ne soit pas assez restrictif ou que d'autres validations d'entrée soient insuffisantes, de sorte que des nombres négatifs, des décimales spéciales (comme NaN ou Infinity) ou des valeurs excessivement grandes peuvent être saisis là où ils ne sont pas attendus, ce qui conduit à un comportement involontaire similaire.
Pour éviter les vulnérabilités liées à des documents XML non valides, il convient de définir un schéma XML précis et restrictif afin d'éviter les problèmes liés à une validation incorrecte des données.
Dans le prochain billet, nous aborderons des attaques plus avancées sur les documents XML, telles que les Jumbo Payloads et le redoutable numéro quatre du Top Ten de l'OWASP, XXE.
Entre-temps, vous pouvez perfectionner ou mettre à l'épreuve vos compétences en matière de validation d'entrées XML sur notre portail.
Les spécifications pour XML et les schémas XML comportent de nombreuses failles de sécurité. En même temps, ces spécifications fournissent les outils nécessaires pour protéger les applications XML. Même si nous utilisons les schémas XML pour définir la sécurité des documents XML, ils peuvent être utilisés pour effectuer une variété d'attaques : récupération de fichiers, falsification de requêtes côté serveur, balayage de ports ou force brute.

Cliquez sur le lien ci-dessous et téléchargez le PDF de cette ressource.
Secure Code Warrior est là pour vous aider à sécuriser le code tout au long du cycle de vie du développement logiciel et à créer une culture dans laquelle la cybersécurité est une priorité. Que vous soyez responsable AppSec, développeur, CISO ou toute autre personne impliquée dans la sécurité, nous pouvons aider votre organisation à réduire les risques associés à un code non sécurisé.
Voir le rapportRéservez une démonstrationChercheur en sécurité applicative - Ingénieur R&D - Doctorant
Le langage de balisage extensible (XML) est un langage de balisage utilisé pour coder des documents dans un format qui est à la fois facile à manipuler par les machines et lisible par l'homme. Cependant, ce format couramment utilisé comporte de nombreuses failles de sécurité. Dans ce premier article de blog sur le XML, j'expliquerai les bases de la manipulation sécurisée des documents XML à l'aide d'un schéma.
L'OWASP divise les différentes vulnérabilités liées à XML et aux schémas XML en deux catégories.
Documents XML malformés
Les documents XML malformés sont des documents qui ne respectent pas les spécifications XML du W3C. Parmi les exemples de documents malformés, on peut citer la suppression d'une balise de fin, la modification de l'ordre de différents éléments ou l'utilisation de caractères interdits. Toutes ces erreurs doivent entraîner une erreur fatale et le document ne doit subir aucun traitement supplémentaire.
Afin d'éviter les vulnérabilités causées par des documents malformés, vous devez utiliser un analyseur XML bien testé qui respecte les spécifications du W3C et qui ne prend pas beaucoup plus de temps pour traiter les documents malformés.
Documents XML non valides
Les documents XML non valides sont bien formés mais contiennent des valeurs inattendues. Dans ce cas, un attaquant peut tirer parti d'applications qui ne définissent pas correctement un schéma XML pour déterminer si les documents sont valides. Vous trouverez ci-dessous un exemple simple de document qui, s'il n'est pas validé correctement, peut avoir des conséquences inattendues.
Un magasin en ligne qui stocke ses transactions dans des données XML :
<purchase></purchase>
<id>123</id>
<price>200</price>
And the user only has control over the <id> value. It is then possible, without the right counter measures, for an attacker to input something like this:</id>
<purchase></purchase>
<id>123</id>
<price>0</price>
<id></id>
<price>200</price>
If the parser that processes this document only reads the first instance of the <id> and <price> tags this will lead to unwanted results. </price></id>

Il est également possible que le schéma ne soit pas assez restrictif ou que d'autres validations d'entrée soient insuffisantes, de sorte que des nombres négatifs, des décimales spéciales (comme NaN ou Infinity) ou des valeurs excessivement grandes peuvent être saisis là où ils ne sont pas attendus, ce qui conduit à un comportement involontaire similaire.
Pour éviter les vulnérabilités liées à des documents XML non valides, il convient de définir un schéma XML précis et restrictif afin d'éviter les problèmes liés à une validation incorrecte des données.
Dans le prochain billet, nous aborderons des attaques plus avancées sur les documents XML, telles que les Jumbo Payloads et le redoutable numéro quatre du Top Ten de l'OWASP, XXE.
Entre-temps, vous pouvez perfectionner ou mettre à l'épreuve vos compétences en matière de validation d'entrées XML sur notre portail.
Les spécifications pour XML et les schémas XML comportent de nombreuses failles de sécurité. En même temps, ces spécifications fournissent les outils nécessaires pour protéger les applications XML. Même si nous utilisons les schémas XML pour définir la sécurité des documents XML, ils peuvent être utilisés pour effectuer une variété d'attaques : récupération de fichiers, falsification de requêtes côté serveur, balayage de ports ou force brute.
Table des matières
Chercheur en sécurité applicative - Ingénieur R&D - Doctorant

Secure Code Warrior est là pour vous aider à sécuriser le code tout au long du cycle de vie du développement logiciel et à créer une culture dans laquelle la cybersécurité est une priorité. Que vous soyez responsable AppSec, développeur, CISO ou toute autre personne impliquée dans la sécurité, nous pouvons aider votre organisation à réduire les risques associés à un code non sécurisé.
Réservez une démonstrationTéléchargerRessources pour vous aider à démarrer
Modélisation des menaces avec l'IA : transformer chaque développeur en modélisateur de menaces
Vous repartirez mieux équipé pour aider les développeurs à combiner les idées et les techniques de modélisation des menaces avec les outils d'IA qu'ils utilisent déjà pour renforcer la sécurité, améliorer la collaboration et créer des logiciels plus résilients dès le départ.
Le pouvoir de la marque dans l'AppSec DevSec DevSecOps (Qu'est-ce qu'un acronyme ?)
Dans le domaine de l'AppSec, l'impact durable d'un programme exige plus que de la technologie : il faut une marque forte. Une identité forte garantit que vos initiatives trouvent un écho et suscitent un engagement durable au sein de votre communauté de développeurs.
Ressources pour vous aider à démarrer
Nouvelle catégorie de risque dans le Top 10 de l'OWASP : S'attendre à l'inattendu
Le Top 10 2025 de l'OWASP ajoute la mauvaise gestion des conditions exceptionnelles à la position 10. Atténuez les risques grâce à une logique "fail closed", à des gestionnaires d'erreurs globaux et à une validation stricte des entrées.
OWASP Top 10 2025 : Défaillances de la chaîne d'approvisionnement en logiciels
Le Top 10 2025 de l'OWASP place les défaillances de la chaîne d'approvisionnement des logiciels en troisième position. Atténuez ce risque à fort impact grâce à des SBOM stricts, au suivi des dépendances et au renforcement du pipeline CI/CD.
OWASP Top 10 : 2025 - Quoi de neuf et comment Secure Code Warrior vous aide à rester aligné
Découvrez ce qui a changé dans le Top 10 de l'OWASP : 2025 et comment Secure Code Warrior facilite la transition grâce à la mise à jour des quêtes, des Courses et des informations destinées aux développeurs.
Adoptez rapidement l'IA agentique dans le développement de logiciels ! (Spoiler : Vous ne devriez probablement pas.)
Le monde de la cybersécurité va-t-il trop vite en matière d'IA agentique ? L'avenir de la sécurité de l'IA est là, et il est temps pour les experts de passer de la réflexion à la réalité.



.png)

.avif)
.png)


