Au fur et a mesure de la détection, sachant quelle expression régulière a rencontré le token désiré on est en mesure de savoir quel est son type. On peut alors le stocker. Pour ce faire il faut d’abord découper les tokens déjà récupérés (les balises html et les mots) suivant des séparateurs afin (...) >suite
Les expressions régulières sont des outils extrêmement puissants et précis qui permettent de reconnaître des formes (ou pattern) dans du texte. Elles vont donc être très utiles ici afin de supprimer le code dont on ne veut pas (commentaires, java scripts, feuilles de styles etc.), et afin de détecter les (...) >suite