Articles of unicode

Comment est-ce que je peux effectuer une opération «commence avec la culture» à partir du milieu d’une chaîne?

J’ai une exigence relativement obscure, mais je pense que cela devrait être possible avec la BCL. Pour le contexte, j’parsing une chaîne de date / heure dans Noda Time . Je maintiens un curseur logique pour ma position dans la chaîne d’entrée. Donc, même si la chaîne complète peut être “3 janvier 2013”, le curseur […]

Qu’est-ce qu’une “paire de substitution” en Java?

Je lisais la documentation de SsortingngBuffer , en particulier la méthode reverse () . Cette documentation mentionne quelque chose à propos des paires de substitution . Qu’est-ce qu’une paire de substitution dans ce contexte? Et quels sont les substituts bas et haut ?

Puis-je faire en sorte que git reconnaisse un fichier UTF-16 en tant que texte?

Je surveille un fichier de machine virtuelle Virtual PC (* .vmc) dans git, et après avoir effectué un changement, Git a identifié le fichier comme étant binary et ne l’a pas modifié pour moi. J’ai découvert que le fichier était encodé en UTF-16. Peut-on apprendre à git à reconnaître que ce fichier est du texte […]

Equivalents Unicode pour \ w et \ b dans les expressions régulières Java?

De nombreuses implémentations regex modernes interprètent le raccourci de classe de caractères \w comme “toute ponctuation de lettre, chiffre ou connexion” (généralement: trait de soulignement). De cette façon, une expression rationnelle comme \w+ correspond à des mots comme hello , élève , GOÄ_432 ou gefräßig . Malheureusement, Java ne le fait pas. En Java, \w […]

Problème de codage Java FileReader

J’ai essayé d’utiliser java.io.FileReader pour lire des fichiers texte et les convertir en chaîne, mais j’ai trouvé que le résultat était erroné et pas lisible du tout. Voici mon environnement: Windows 2003, encodage du système d’exploitation: CP1252 Java 5.0 Mes fichiers sont encodés en UTF-8 ou CP1252, et certains d’entre eux (fichiers encodés en UTF-8) […]

Représentation de la structure de répertoire et de fichier dans la syntaxe de démarque

Je veux décrire les structures de répertoires et de fichiers dans certains de mes articles de blog Jekyll. Par exemple, vous pouvez voir sur ce lien sur le site Web Jekyll que la structure des répertoires et des fichiers est bien affichée sur la page: . ├── _config.yml ├── _drafts | ├── begin-with-the-crazy-ideas.textile | └── […]

Conversion de symboles, lettres d’accent à l’alphabet anglais

Le problème est que, comme vous le savez, le graphique Unicode contient des milliers de caractères et je souhaite convertir tous les caractères similaires en lettres de l’alphabet anglais. Par exemple, voici quelques conversions: ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy –> the Family … et j’ai vu qu’il y a plus de 20 versions […]

Caractères Unicode dans les URL

En 2010, diffuseriez-vous des URL contenant des caractères UTF-8 dans un grand portail Web? Les caractères Unicode sont interdits conformément à la RFC sur les URL (voir ici ). Ils devraient être codés en pourcentage pour être conformes aux normes. Mon point principal, cependant, est de servir les caractères non encodés dans le seul but […]

Différence entre UTF-8 et UTF-16?

Différence entre UTF-8 et UTF-16? Pourquoi en avons-nous besoin? MessageDigest md = MessageDigest.getInstance(“SHA-256”); Ssortingng text = “This is some text”; md.update(text.getBytes(“UTF-8”)); // Change this to “UTF-16” if needed byte[] digest = md.digest();

Différence entre Char.IsDigit () et Char.IsNumber () en C #

Quelle est la différence entre Char.IsDigit() et Char.IsNumber() en C #?