Un document HTML contient des informations. Un exemple de document minimal est donné ici.
Ces informations sont structurées en une hiérarchie, c'est à dire que chaque élément, à l'exception de l'élément html, est imbriqué dans un autre élément que l'on appelle son parent. On parle alors d'arbre du document html pour décrire cet imbrication entre les éléments html qui servent de parent et les éléments html qu'ils contiennent qu'on appelle enfants.
Le contenu du document est en général principalement décrit dans l'élément body qui inclut, le plus souvent de nombreux autres éléments (ses enfants).
Exemple simplifié de hiérarchie:
Source HTML | L'arbre correspondant |
<!doctype html> |
![]() |