Délimiteur invisible pour les chaînes en HTML

J’ai besoin d’un moyen d’identifier certaines chaînes dans le balisage HTML. Je sais ce que sont les chaînes, mais il est possible qu’elles soient des sous-chaînes d’autres chaînes du document. Pour les trouver, je produis un caractère de délimiteur spécial (utilisant actuellement \032 ). Sur le chargement de la page, nous parcourons le code HTML et enregistrons l’emplacement des chaînes, puis supprimons le délimiteur.

Malheureusement, la plupart des navigateurs affichent le caractère délimiteur jusqu’à ce que nous puissions les trouver et les supprimer tous. Je voudrais éviter cela si possible. Existe-t-il un caractère ou une chaîne qui sera conservé dans le contenu HTML (un commentaire ne fonctionnera pas) mais qui ne sera pas visible par l’utilisateur? Il doit également être quelque chose qui ne devrait pas apparaître à côté d’une chaîne, donc quelque chose comme   ne fonctionnerait pas non plus.

EDIT: Désolé, j’ai oublié de mentionner que les chaînes seront en atsortingbuts, donc toute sorte de tag ne fonctionnera pas.

– non-jointeur sans largeur (voir http://htmlhelp.org/reference/html40/entities/special.html )

‌‌mytext‌‌ cela apparaît déjà dans votre texte, doublez-le (par exemple: ‌‌mytext‌‌


Modifier en réponse à un commentaire: fonctionne dans Firefox 3. Notez que vous devez rechercher la valeur Unicode de l’entité.

   
This is a ‌test

Vous pouvez les insérer dans des éléments . Cela fonctionnera uniquement pour le texte dans la page (pas les atsortingbuts, ou similaires).

Sinon, vous pouvez insérer un caractère d’espacement que votre programme ne génère pas déjà dans le code HTML, comme un caractère de tabulation ( \x09 ), un onglet vertical ( \x0b ), un retour chariot ( \x0d ) – sans newline à côté, ala texte de Windows – ou simplement un octet nul ( \x00 ).

La meilleure chose que je voudrais insérer, qui n’est pas visible sur le navigateur, sera une paire de balises avec un identifiant spécial, comme . Cela n’apparaîtra pas sur le contenu, alors que cela peut être présent dans le document. Vous n’avez pas besoin de les supprimer.

Vous pouvez utiliser des marques de gauche à droite (LTR) . Est-ce pour une sorte de test XSS? Si tel est le cas, cela pourrait être intéressant: Support de Taint pour PHP