Langues sockets en charge par les glyphes «latin» vs «latin-extended» dans les fonts des fonts Web Google?

Google Web Fonts Sélectionner des jeux de caractères

Certaines fonts de Google Web Fonts prennent en charge plusieurs “jeux de caractères”. Le fait est que si la police Web que j’utilise ne sert que les glyphes «latins», les utilisateurs qui traduisent la page dans un langage dont les glyphes ne sont pas pris en charge remarqueront clairement le texte corrompu.

J’aimerais que mes fonts Web prennent en charge les langues les plus populaires du monde, sauf l’anglais, par exemple l’espagnol, l’allemand, le français, etc.

Dans ce but, j’aimerais savoir quelles langues, exactement, le “latin” et le “latin-extended” correspondent, individuellement.

Je m’attends à ce que la réponse ressemble à:

Latin Character Set & Supported Languages: - .......... - .......... - .......... Latin-Extended Character Set & Supported Languages: - .......... - .......... - .......... 

Je n’ai pas pu trouver cette information dans la documentation Google Web Fonts, ni dans Google.

Latin

aka Unicode Latin1-Supplement (U + 0080 à U + 00FF) est destiné à soutenir les langues d’Europe occidentale (comme vous avez mentionné le français, l’allemand, l’espagnol et par coïncidence d’autres langues mentionnées dans la liste ci-dessous; L’anglais américain est pris en charge par la norme ASCII).

Latin étendu

Latin étendu signifie pratiquement bloquer Latin-Extended-A (U + 0100 à U + 017F) qui devrait supporter la plupart des textes écrits en latin.

Latin1-Extended-B contient principalement un support pour les langues écrites en latin, mais également 3 caractères pour le roumain et l’azerbaïdjanais mentionnés ci-dessous (peuvent être remplacés par des caractères de l’extension A).

Il existe des extensions C, D et E encore plus exotiques, mais ces caractères ne sont jamais utilisés dans les textes électroniques courants. Plus la police contient de caractères, plus sa taille est importante (les fonts couvrant la totalité du BMP peuvent dépasser 10 Mo). Par conséquent, tous les caractères du bloc Latin-Extended ne doivent pas être présents dans la catégorie Latin-Extended , en particulier dans les fonts très stylisées: cela dépend de l’object de la police ou des motifs de son auteur. Pour savoir si la police prend en charge une langue spécifique, essayez d’afficher les caractères de la liste ci-dessous.

Prise en charge des langues

Dans la liste ci-dessous, je ne compte pas:

  • les digraphes généralement remplacés par des caractères séparés ((, Œ sont supportés par le supplément Latin1)
  • alphabets non latins, car la question concerne le latin contre le latin étendu
  • langues minoritaires et mortes (elfdalien, féroïen, kachoube, monténégrin, livonien)
  • Alphabets ASCII (comme le néerlandais ou le gaélique) entièrement pris en charge par ASCII
  • symboles historiques de manuscrits

S’il vous plaît commenter si quelque chose d’important est manquant ou si une langue minoritaire est utilisée dans la communication électronique. Par défaut, toutes les langues ont besoin du bloc Latin-Extended-A, sauf indication contraire dans la liste)

  • Albanais Ç, Ë (Supplément Latin1)
  • Azerbaïdjanais , Ğ, I (minuscules sans point), ©, Ö,, Ü, Ə (le dernier de Extended-B est remplaçable par Ä, puis même alphabet que le turc)
  • Serbe , bosniaque et croate Ć, Č, Đ, Š, Ž
  • Catalan À, É, È, Í, Ó, Ò, Ú, Ü, Ç (Supplément Latin1)
  • Tchèque Á, Č, Ď, Ě, Í, Ň, Ó, Š, Ť, Ú, Ů, Ž, Ž
  • Danois , Norvégien Æ, Å, Ø (Supplément Latin1)
  • Anglais £, ¢
  • Estonien Ä, Ö, Õ, Ü, Š, Ž
  • Espéranto Ĉ, Ĝ, Ĥ, Ĵ, Ŝ, Ŭ
  • Finlandais Å, Ä, Ö, Š, Ž
  • Français Œ, Œ, Â, À, É, Ê, Ë, Ç, Î, Ï, Ô, Û, Û, Ü, Ÿ, »,« (Œ, Ÿ de Extended-A, le rest comprenant ÿ dans Supplément Latin1)
  • Allemand Ä, Ö, Ü, ß (Supplément Latin1)
  • Hongrois Á, É, Í, Ó, Ö, Ő, Ú, Ü, Ű
  • Irlandais Á, É, Í, Ó, Latin (Supplément Latin1)
  • Islandais Á, Á, É, Í, Ó, Ö, Ú, Ý, Þ, Ð (Supplément Latin1)
  • Letton , Č, Ē, Ģ, Ķ, Ļ, Ņ, Ō, Ŗ, Š, Ž
  • Lithuaian Ą, Č, Ę, Ė, Š, Ū, Ž
  • Polonais Ą, Ć, Ę, Ł, Ó, Ó, Ś, Ź, Ż
  • Portugais Á, À, À, À, À, À, À, À, À,
  • Roumain Ă, Â, Î, Ș, Ț (les deux derniers sont en latin étendu B, peuvent utiliser Ş, Ţ à partir de l’extension A)
  • Slovaque Ä, Á, Č, Ď, Í, Ĺ, Ľ, Ó, Ô, Ú, Š, Ť, Ý, Ž
  • Sardaigne Ç (Supplément Latin1)
  • Turc Ç, Ğ, I (minuscule sans point), İ, Ö, Ş, Ü
  • Espagnol et Galicien Ñ, ¿, ¡(Supplément Latin1)
  • Suédois Å, Ä, Ö (Supplément Latin1)
  • Vietnamien Ă, Â, Đ, Ê, Ô, Ơ, Ư (+ combiner les tonalités 0x300 et 0x301)
  • Gallois Â, Ê, Î, Ô, Û, Ŵ, Ŷ

Combinaison de signes diacritiques

Alternativement, la police peut prendre en charge le bloc Combination Diacritical Marks: U + 0300 à U + 036F. Par exemple, Ř peut être tapé comme U + 0158 (alias caractère précomposé ) ou comme R + U + 030C . Les programmes prenant en charge Unicode devraient tous les deux afficher la même chose, mais si le programme ou la police ne supporte pas le répertoire , la marque diacritique de combinaison pourrait se retrouver un peu mal placée, voir ce Q & R Unicode très détaillé sur ce sujet.

Autres personnages à considérer

Fraktur allemand utilisé il y a juste 50 ans contient des caractères (comme les “s” morphs mentionnés dans le lien) qui ne sont pas en Unicode, n’ont pas de contrepartie latine exacte et certaines fonts les mappent comme d’autres caractères. Il y a d’autres symboles exotiques qui pourraient être utiles dans les textes électroniques (quand j’étais enfant, on m’apprenait “ch” comme un caractère digraphique distinct dans l’alphabet tchèque après “h” et il était utilisé comme tel jusqu’au milieu des années 90). pas en Unicode, plus d’informations intéressantes ici ).

Autres fonts

Vous souhaiterez peut-être personnaliser certaines fonts (si leur licence le permet) par le service Font Squirrel . Il existe de nombreuses fonts de support gratuites pour commencer:

  • J’aime beaucoup la belle police ouverte de Quivira avec 11 + k caractères, 1,5 Mo
  • Arial Unicode est installé sur de nombreux ordinateurs (une partie de MS Office, 50 ko + caractères, 22 Mo)
  • Il existe un projet Noto de Google qui contient TOUS les caractères Unicode les plus récents dans les fonts serif, sans-serif et UI, bien classés par blocs (1.1 Go)
  • en tant que police de sauvegarde de dernier recours, vous pouvez envisager de regarder Unifont (50 + k mais seulement 11 Mo).