Articles of utf 8

UTF-8 et Unicode, qu’y a-t-il entre 0xC0 et 0x80?

J’ai lu des articles sur Unicode et UTF-8 ces derniers jours et je rencontre souvent une comparaison similaire à celle-ci: int strlen_utf8(char *s) { int i = 0, j = 0; while (s[i]) { if ((s[i] & 0xc0) != 0x80) j++; i++; } return j; } Quelqu’un peut-il clarifier la comparaison avec 0xc0 et vérifier […]

Convertir les caractères non-ASCII de ASCII-8BIT en UTF-8

Je tire du texte de sites distants et essaie de le charger dans une application Ruby 1.9 / Rails 3 qui utilise utf-8 par défaut. Voici un exemple de texte offensant: Cancer Res; 71(3); 1-11. ©2011 AACR.\n Ce code de copyright développé ressemble à ceci: Cancer Res; 71(3); 1-11. \xC2\xA92011 AACR.\n Ruby me dit que […]

Comment puis-je écrire un fichier texte en C # avec une page de code autre que UTF-8?

Je veux écrire un fichier texte. Au lieu de l’UTF-8 par défaut, je veux écrire le code ISO-8859-1 qui est la page de code 28591. Je n’ai aucune idée de la manière de procéder … J’écris mon fichier avec le code très simple suivant: using (StreamWriter sw = File.CreateText(myfilename)) { sw.WriteLine(“my text…”); sw.Close(); }

Enregistrer le fichier texte UTF-8 encodé avec VBA

Comment puis-je écrire des chaînes encodées en UTF-8 dans un fichier texte de vba, comme Dim fnum As Integer fnum = FreeFile Open “myfile.txt” For Output As fnum Print #fnum, “special characters: äöüß” ‘latin-1 or something by default Close fnum Y a-t-il une configuration au niveau de l’application?

Comment savoir si la chaîne a déjà été encodée en URL?

Comment pourrais-je vérifier si la chaîne a déjà été encodée? Par exemple, si j’encode TEST== , j’obtiens TEST%3D%3D . Si je code à nouveau la dernière chaîne, j’obtiens TEST%253D%253D , il faudrait que je sache avant de le faire si c’est déjà codé … J’ai enregistré des parameters et je dois les rechercher. Je ne […]

Comment lire UTF-8 avec un opérateur diamant ()?

Je veux lire l’entrée UTF-8 dans Perl, peu importe si elle provient de l’entrée standard ou d’un fichier, en utilisant l’opérateur diamant: while(){…} . Donc, mon script devrait pouvoir être appelé de ces deux manières, comme d’habitude, en donnant le même résultat: ./script.pl utf8.txt cat utf8.txt | ./script.pl Mais les résultats diffèrent! Seul le second […]

Problèmes OS X Terminal UTF-8

Bon, j’ai finalement obtenu un MacBook Air après 15 ans de linux. Et avant que je l’aie eu mon grand souci était le support UTF-8 parce que peu importe si je reçois des fichiers envoyés de Windows ou des mac-clients il y a toujours des problèmes avec l’encodage, alors que sur Ubuntu je peux être […]

Problème d’encodage UTF-8 dans Spring MVC

J’ai un bean Spring MVC et je voudrais retourner le caractère turc en définissant le codage UTF-8. mais bien que ma chaîne soit “şŞğĞİıçÇöÖüÜ”, elle revient sous la forme “?????? çÇöÖüÜ”. et aussi quand je regarde la page de réponse, qui est la page Internet Explorer, l’encodage est l’iso européen de l’ouest, pas UTF-8. Voici […]

Comment GetBytes () en C # avec encodage UTF8 avec BOM?

J’ai un problème avec l’encodage UTF8 dans mon application asp.net mvc 2 en C #. J’essaie de laisser l’utilisateur télécharger un simple fichier texte à partir d’une chaîne. J’essaie d’obtenir un tableau d’octets avec la ligne suivante: var x = Encoding.UTF8.GetBytes(csvSsortingng); mais quand je le retourne pour le téléchargement en utilisant: return File(x, …, …); […]

Pourquoi Eclipse utilise-t-il le codage Cp1252?

Excuses si c’est une question très amateur! Je sais que Eclipse utilise Cp1252 par défaut pour son encodage. J’ai récemment créé un programme utilisant des cartes de hachage pour convertir les lettres entrées en braille. Pour ce faire, j’ai dû changer la méthode d’encodage en UTF-8. Je ne connais pas grand-chose non plus, mais tout […]