12 février 2007

Typographie française sur le web

En travaillant sur Unicode, je découvre la typographie sur le web.

Certes, je faisais jusqu’ici mon possible pour utiliser les guillemets chevrons [«…»] bien français au lieu des guillemets anglophones ["], j’usais de capitales accentuées, même dans le cas de majuscules (voir ici: Majuscule et capitale, minuscule et bas de casse), et je rajoutais au mieux de belles espaces insécables avant les signes de ponctuation double comme [:], [;], [?] et [!], mais… en restant dans le jeu de caractères ISO-8859-1 (ou « ISO-Latin-1 ») j’avais au final tout faux.

Les liens suivants m’ont ouvert les yeux :
Tout d’abord, les signes de ponctuation [;], [?] et [!] ne doivent pas être précédés d’une espace insécable, mais d’une… fine.

Ah.

Et comment fait-on une fine en HTML ? M’enfin, en changeant la taille de la police de l’espace insécable, c’est bien connu !
Tous à bord !
Doit s’écrire :
Tous à bord<span style="font-size: 30%;">&nbsp;</span>!
Autant dire que ça commence bien.

Ensuite, l’apostrophe. Moi qui croyais benoîtement que la courbure imposée lors de la frappe par Microsoft Word était de l’ordre du superflu, eh bien non, l’apostrophe française s’écrit bien [’] (Unicode &#8217;), et non ['] (ASCII &#39;).

Et le tiret cadratin, alors ? Oh, un simple &#8212; (—). Rappelons en effet que le &#151; du Windows CP-1252 n’est pas Unicode, et ne fonctionne comme l’indique sa table de codage, que sous Windows.

Le tiret demi-cadratin est lui donné par &#8211; (–).

Les points de suspension ? &#8230; (…).

Et heureusement que je suis sur Mac : tous ces caractères, en plus des majuscules accentuées, sont facilement accessibles au clavier. À part la fine insécable, bien sûr.

Me voilà donc à revoir toutes mes pages web francophones et à estimer le temps de recomposition de leurs textes.

Mais soudain j’échoue pour mon infortune sur une page de typographie, datée de 2004, qui s’intitule « Les ligatures ».

Page où l’on se remémore qu’on doit d’user du « œ » &#339; pour bien parler d’un œuf (Unicode) et non d’un oeuf (pour s’en tenir à ISO-8859-1) ; quant au «æ» de Lætitia, il se trouve, lui, dans ISO-8859-1.

Mais page, où l’on se fait également et aimablement rappeler, que « f i » doit être ligaturé. Ainsi que « f l ». « f f i ». « f f l ». Etc. !

« f f » : « ff », &#64256;
« f i » : « fi », &#64257;
« f l » : « fl », &#64258;
« f f i » : « ffi », &#64259;
« f f l » : « ffl », &#64260;
« c t » : « … », &#…; Introuvable ?
« s t » : « st », &#64262;

On parlera donc de « signification » et d’« efficacité », et non de "signification" ou d'"efficacité" (quelle horreur ! une apostrophe droite mariée avec d’angliches guillemets ; on ne sait plus qui est qui – sans parler de l’absence de ligature).

Comparez en sélectionnant des parties de mots : dans les premiers cas, les lettres ligaturées forment bien un unique caractère.

Et c’est là qu’on atteint la limite de l’exercice : ces mots aux lettres joliment ligaturées ne peuvent plus être trouvés dans la page par une bête recherche dans son navigateur ! On ne sait non plus ce qui advient de l’indexation du texte.

Faut-il patcher Firefox ? Google ? Aïe, aïe !

1 commentaire:

David Andrianavalontsalama a dit…

Je crois avoir trouvé pour l'espace fine : " ", aussi appelée   (c'est une entité du (X)HTML).