❌

Vue normale

Il y a de nouveaux articles disponibles, cliquez pour rafraĂźchir la page.
À partir d’avant-hierFlux principal

Nouvelle annĂ©e, vƓux 2025 et accomplissements passĂ©s et futurs

Traditionnelle pĂ©riode de vƓux lors du changement d’annĂ©e. Voyons ce qui devrait
 changera
 pourrait Ă©ventuellement changer ou non. Donc revenons cette annĂ©e encore sur nos accomplissements passĂ©s et futurs et de ce que nous aimerions voir plus sur notre site prĂ©fĂ©rĂ©.

Bonne année 2025

Cinq personnes se sont prĂȘtĂ©es au jeu de cette dĂ©pĂȘche pas vraiment de vƓux, mais un peu quand mĂȘme. En vrac dans les accomplissements : hurl, cadran solaire, programmes Ă©lectoraux, Amstrad CPC, financement europĂ©en, Haiku, CV, Transimpressux, visualisation scientifique, XMPP, commentaires de code, docker, menstruation, vĂ©lo, documentation, Ă©diteur pixel art, assembleur, OSXP, Smalltalk. L’annĂ©e qui vient, sur LinuxFr.org, promet d’ĂȘtre (fe)diverse, Ă©vĂ©nementielle, ferroviaire, bureautique, rĂ©parable, un peu rouillĂ©e, rĂ©solue et motivĂ©e.

Sommaire

BenoĂźt Oumph Sibaud

Accomplissements, rĂ©alisations, progrĂšs de l’annĂ©e 2024

Le retard cĂŽtĂ© adminsys pour LinuxFr.org se rĂ©duit, de mĂȘme pour celui sur le code (Ă©videmment ça ne va jamais assez vite, c’est le principe) (voir les dĂ©pĂȘches sur nos services img et epub). J’ai eu l’occasion de jouer un peu avec Hurl pour des tests HTTP (voir les dĂ©pĂȘches prĂ©cĂ©demment mentionnĂ©es et celle sur Hurl 6.0.0) et docker et docker compose, en plus de faire un peu de Go. J’ai pu de nouveau ĂȘtre prĂ©sent pour le stand et les animations sur place lors de la confĂ©rence Open Source eXPerience Paris et c’était bien de revoir d’autres personnes de l’équipe, de notre lectorat, des libristes connus de longue date et des nouvelles personnes (et de goĂ»ter la biĂšre de nos 25 ans aussi). Le 28 juin 2024, la politique de minimisation des donnĂ©es mise en place un an plus tĂŽt (pour les 25 ans du site) s’est appliquĂ©e pour les comptes dĂ©jĂ  fermĂ©s prĂ©alablement (prochaine Ă©tape en juin 2026).

Je suis aussi content de ma dĂ©pĂȘche sur le contenu programmatique lors des Ă©lections europĂ©ennes de juin. Je mentionnerais aussi dans les sujets importants la question du programme de financement europĂ©en Next Generation Internet (NGI) et la dĂ©pĂȘche sur le dĂ©cĂšs de lunar, un hacktiviste pĂ©dagogue.

Ce que je voudrais faire, apprendre ou approfondir en 2025

DĂ©jĂ  dans les reports de 2024, je voudrais m’intĂ©resser au Fediverse et Ă  ActivityPub peut-ĂȘtre, et peut-ĂȘtre Ă  Gemini (le protocole) ? Il y a des travaux en cours sur le service de partage sur les rĂ©seaux sociaux share. Par contre j’ai donnĂ© moins de confĂ©rences en 2024 pour LinuxFr.org et globalement assistĂ© Ă  moins d’évĂ©nements : donc je rĂ©itĂšre l’ambition 2025 de rencontrer plus rĂ©guliĂšrement le lectorat ou les personnes contribuant au site ou des publics nouveaux, car c’est apprĂ©ciable pour le moral et la motivation.

Des contenus que je voudrais voir plus sur LinuxFr.org (type de contenu, sujet, etc.)

Je peux reprendre in extenso mon propos de l’annĂ©e derniĂšre : je serais intĂ©ressĂ© d’avoir plus de contenus (idĂ©alement des dĂ©pĂȘches) sur la rĂ©paration et la rĂ©utilisation, sur de l’informatique sobre, sur des sujets qui ne me viendraient pas Ă  l’idĂ©e (sĂ©rendipitĂ©), sur les politiques autour du numĂ©rique et des donnĂ©es, sur des retours d’expĂ©rience et sur les sujets qui vous passionnent vous.

Ysabeau

Accomplissements, rĂ©alisations, progrĂšs de l’annĂ©e 2024

Quelque chose dont je suis plutĂŽt franchement fiĂšre c’est d’avoir parlĂ© d’un sujet typiquement fĂ©minin sur LinuxFr.org tout en restant parfaitement dans le thĂšme du site et celui de la JournĂ©e internationale des droits des femmes. Le dessin de l’illustration, qui met les points sur les « i Â» m’a beaucoup amusĂ©. La qualitĂ© de l’accueil de la dĂ©pĂȘche sur LinuxFr.org et ailleurs m’a ravie. Dans la sĂ©rie rĂ©alisations : les portraits que j’ai faits, quelque chose que j’entends continuer, ont Ă©tĂ© une grande source de connaissances en ce qui me concerne. Pour finir le modĂšle-tutoriel de CV – Fiche de candidature qui me trottait dans la tĂȘte depuis un certain temps.

Concernant les progrĂšs : je pense avoir atteint, en matiĂšre d’EPUB, le niveau pour mes besoins. Un jour il faudra que je fasse une dĂ©pĂȘche sur ce sujet et sur Sigil. Et j’ai bien progressĂ© avec Inkscape, et mĂȘme en XML hourra !

Ce que je voudrais faire, apprendre ou approfondir en 2025

Je n’ai pas fini la sĂ©rie Transimpressux, je vais continuer Ă  travailler dessus. En 2024, j’avais aussi pour objectif, dĂ©sir, de me pencher sur l’informatique et le handicap, l’exploration de l’espace, entre autres sujet, m’en a Ă©loignĂ©e. À voir si j’arrive cette annĂ©e Ă  mieux explorer le terrain. J’ai aussi dans l’idĂ©e de rĂ©diger quelque chose sur l’art la maniĂšre de faire des modĂšles pour LibreOffice et le site des extensions de LibreOffice. Parce que ce n’est pas si Ă©vident. Peut-ĂȘtre mĂȘme, si je trouve comment faire, transformer en extension certaines de mes sĂ©ries de modĂšles.

Quoi d’autre ? Ah oui et faire des modĂšles de jouets et miniatures (pour maisons de poupĂ©e par exemple) pour Draw et Inkscape qui pourraient ĂȘtre faits soit en imprimant le modĂšle sur papier et en utilisant des matĂ©riaux de rĂ©cupĂ©ration (cartons divers) pour la rĂ©alisation, soit en utilisant un graveur (dĂ©coupeur ?) laser. AmĂ©liorer peut-ĂȘtre ma connaissance du XML et finir de lire les spĂ©cifications de l’ODF peut-ĂȘtre.

Des contenus que je voudrais voir plus sur LinuxFr.org (type de contenu, sujet, etc.)

Comme pour l’annĂ©e derniĂšre, j’aimerais qu’on explore plus les questions de rĂ©parabilitĂ© trĂšs concrĂštement et sur les plans techniques et juridiques. Il y a aussi la question du handicap et de l’informatique qui mĂ©rite d’ĂȘtre plus mise en avant. Et plus de tutoriels.

vmagnin

Accomplissements, rĂ©alisations, progrĂšs de l’annĂ©e 2024

J’ai publiĂ© en mars 2024, avec mon coauteur Ali, une bibliothĂšque en Fortran orientĂ© objet nommĂ©e ForColormap qui propose des palettes de couleurs pour la visualisation scientifique. CĂŽtĂ© hobbys, j’ai bien progressĂ© dans mes projets musicaux ForMIDI et ForSynth (qui gĂ©nĂšre des WAV), avec Ă  nouveau l’introduction de l’orientĂ© objet. C’est une façon d’étudier la musique : programmer c’est comprendre. J’ai aussi avancĂ© sur mon projet de cadran solaire ForSundial, le seul que j’ai hĂ©bergĂ© pour l’instant sur Codeberg. J’espĂšre avoir le temps un jour d’aller au-delĂ  du prototype en peuplier (il paraĂźt que la dĂ©coupe laser peut graver du marbre). Ah oui, je me suis aussi achetĂ© une carte Greaseweazle 4.1 pour rĂ©cupĂ©rer le contenu de disquettes des annĂ©es 80 (en particulier au format Atari ST, non lisible sur PC), mais je n’ai toujours pas eu le temps de faire ce que je voulais. Chacun de ces points pourrait faire l’objet d’un journal, mais le temps, c’est ça le problĂšme


Sur LinuxFr.org, je n’ai publiĂ© que ma dĂ©pĂȘche pseudo-pĂ©riodique « Des nouvelles de Fortran n°6 Â» pour NoĂ«l, ainsi que deux journaux, dont un long qui est la suite de celui de novembre 2021 sur le pulsar iconique CP 1919 et qui parle de beaucoup de choses : histoire de l’informatique, musique Ă©lectronique, plongĂ©e dans les dĂ©cennies 70 et 80 et ce qu’elles ont Ă  nous dire sur le monde d’aujourd’hui (similaritĂ©s et diffĂ©rences), etc.

Mais j’ai en fait aussi participĂ© plus ou moins Ă  d’autres dĂ©pĂȘches qui m’intĂ©ressaient : relecture, discussion ou rĂ©daction. C’est sympa Ă  faire et c’est un peu comme y avoir accĂšs en avant-premiĂšre. N’hĂ©sitez pas Ă  franchir le pas (onglet RĂ©daction) si ce n’est dĂ©jĂ  fait.

Ce que je voudrais faire, apprendre ou approfondir en 2025

Je commence Ă  apprendre le Rust, non pas tellement parce que j’en aurais un quelconque besoin cĂŽtĂ© professionnel ou cĂŽtĂ© hobby, mais avant tout pour Ă©tudier de nouveaux (pour moi) concepts comme les gĂ©nĂ©riques, les traits, les motifs, la possession et la durĂ©e de vie, les fermetures, etc. J’ai empruntĂ© un bon livre : DĂ©veloppez avec Rust traduit rĂ©cemment chez Dunod. La derniĂšre fois que j’avais vraiment Ă©tĂ© excitĂ© d’apprendre un nouveau langage, c’était avec Python il y a quinze ans (et les expressions rĂ©guliĂšres en mĂȘme temps). AprĂšs le serpent, je prendrais bien un peu de crabe


Sinon, j’aimerais bien avoir le temps de faire en 2025 ce que je n’ai pas eu le temps de faire en 2024 :-) Mais j’ai peut-ĂȘtre tort, je devrais peut-ĂȘtre vouloir faire moins de choses pour avoir plus de temps
 Ă  ne rien faire (en plus c’est Ă©cologique). Être idle.

Des contenus que je voudrais voir plus sur LinuxFr.org (type de contenu, sujet, etc.)

Donc des journaux ou dĂ©pĂȘches sur Rust :-) J’aime bien aussi ce qui concerne l’histoire de l’informatique, et ce qui sort des clous comme l’histoire des sciences, les arts, en particulier la musique, etc. L’informatique Ă©tant quasiment partout, on trouve facilement un prĂ©texte pour parler de n’importe quoi
 On pourrait publier des critiques de livres autour de l’informatique ou de la science et la technologie, et pourquoi pas de films ou autres Ɠuvres. Enfin, des bricolages en FabLab peuvent ĂȘtre intĂ©ressants.

gUI

Une version trÚs raccourcie pour moi, je voudrais me concentrer particuliÚrement sur une chose cette année :

Ce que je voudrais faire, apprendre ou approfondir en 2025

De la documentation !

Plusieurs points dans ce sens :

  • AmĂ©liorer mes commentaires (j’y documente dĂ©jĂ  tous les piĂšges Ă  cons, mais je continue d’avoir du mal Ă  me comprendre quand je dĂ©terre des vieux bouts de code)
  • AmĂ©liorer mes notes perso : aujourd’hui j’utilise nb pour ça. C’est pas mal, mais c’est un peu le foutoir, c’est pas centralisĂ©, bref
 peut mieux faire
  • AmĂ©liorer la doc de mon infra domestique : oui en bon vieux gros Geek c’est pas simple chez moi. Alors dĂ©jĂ  quand je dois remettre les mains sur un truc qui tourne sans soucis depuis des annĂ©es j’ai des gouttes de sueurs, je n’ose imaginer s’il m’arrive quelque chose (eh oui, soyons prĂ©voyants) comment ma famille (pourtant pas des manches) va s’en sortir.
  • Quelques autres projets de doc un poil hors-sujet ici (livret d’accueil dans mon association sportive par exemple)

PulkoMandy

Accomplissements, rĂ©alisations, progrĂšs de l’annĂ©e 2024

J’ai continuĂ© Ă  travailler sur l’adaptation de vbcc et vasm pour la console de jeux VTech V. Smile. L’assembleur et le compilateur C sont fonctionnels et on peut compiler le systĂšme d’exploitation Contiki avec. Le code gĂ©nĂ©rĂ© n’est pas du tout optimisĂ© pour l’instant.

J’ai un peu avancĂ© sur mon interprĂ©teur pour les fictions interactives du jeu Lectures Enjeu mais il y a des fonctionnements que je n’arrive pas Ă  comprendre: si je fais fonctionner un jeu, j’en casse un autre :(

J’ai publiĂ© une nouvelle version de l’éditeur pixel art GrafX2, il n’y en avait pas eu depuis 2021. Je ne fais plus grand-chose pour ce projet, je pense que le logiciel est assez complet.

Je continue bien sĂ»r Ă  travailler pour Haiku: entre autres sur les dĂ©pĂȘches Linuxfr, le navigateur web WebPositive, et le client XMPP Renga. Je n’ai jamais le temps et la motivation de participer autant que je le voudrais.

Enfin, j’ai entrepris la rĂ©alisation d'un interprĂ©teur Smalltalk pour Amstrad CPC. Il fonctionne, mais il est beaucoup trop lent.

Et comme il n’y a pas que l’informatique dans la vie, j’ai traversĂ© la France en vĂ©lo pour me rendre de Toulouse Ă  Avranches, soit environ 900km en une douzaine de jours. J’ai eu plus de problĂšmes au retour en train qu’à l’aller en vĂ©lo.

Ce que je voudrais faire, apprendre ou approfondir en 2025

Du cĂŽtĂ© des problĂšmes techniques: le systĂšme de sauvegarde externe de mon serveur auto hĂ©bergĂ© est cassĂ©. Il faut que j’investigue les scripts perl fournis par le service de sauvegarde que j’ai choisi (qui a l’avantage d’ĂȘtre vraiment pas cher, et les inconvĂ©nients qui vont avec).

Je vais sĂ»rement continuer Ă  travailler sur les projets mentionnĂ©s ci-dessus (et quelques autres) et essayer de ne pas en commencer de nouveaux avant d’avoir fini quelque chose. J’ai beaucoup d’idĂ©es mais pas le temps pour tout faire.

Je vais essayer de lire les livres que j’ai gagnĂ©s grĂące Ă  mes contributions Ă  LinuxFr.org et que je n’ai pas tous eu le temps d’ouvrir :(

Je vais Ă©galement essayer de faire du vĂ©lo plus rĂ©guliĂšrement, ces derniers temps la motivation m’a beaucoup manquĂ© pour ça.

Des contenus que je voudrais voir plus sur LinuxFr.org (type de contenu, sujet, etc.)

J’aimerais lire des choses sur d’autres systĂšmes d’exploitation: Linux, BSD, mais aussi Serenity, ReactOS ou Redox OS et sĂ»rement plein d’autres dont je n’ai pas entendu parler.

(mais ce serait en plus des contenus existants sur plein de sujets, et des débats dans les commentaires, qui sont passionnants).

Pour finir

Nous vous souhaitons tout de mĂȘme la meilleure annĂ©e possible (on oscille entre ĂȘtre rebelles et conformistes). Et, bien Ă©videmment, n’hĂ©sitez pas Ă  « continuer Â» cette dĂ©pĂȘche dans les commentaires.

Et un merci à toutes celles et ceux qui font de LinuxFr.org un site enrichi en sérendipité et surprises.

Commentaires : voir le flux Atom ouvrir dans le navigateur

Aide pour créer une clé USB de démarrage avec iso de Kubuntu 24-04 LTS

14 janvier 2025 Ă  11:17

Je dĂ©sire installer Kubuntu 24-04 sur une installation Ubuntu 20-04. J’ai besoin d’aide pour installer Unetbootin sur l’ordinateur. Le Terminal ne trouve pas le fichier d’installation de Unebootin que j’ai copiĂ© dans un rĂ©pertoire d’utilisateur. C’est la premiĂšre fois que je me confronte avec Linux et je constate que l’orthographe varie beaucoup d’une source Ă  l’autre sur Internet. Je voudrais qu’une personne expĂ©rimentĂ©e en installation prenne le contrĂŽle de cet ordinateur pour me montrer concrĂštement les bonnes commandes.

7 messages - 3 participant(e)s

Lire le sujet en entier

Framasoft en chiffres, Ă©dition 2024

Par : Framasoft
28 décembre 2024 à 01:58

Quel est l’impact concret des actions de notre association ? C’est la question Ă  laquelle nous aimons rĂ©pondre en fin d’annĂ©e (cf. chiffres 2022, chiffres 2023) : prendre le temps de chiffrer nos actions est essentiel pour rĂ©aliser le service que l’on peut rendre aux autres. En route pour les Framastats 2024 !

🎈 Framasoft a 20 ans🎈 : Contribuez pour financer une 21iĂšme annĂ©e !

GrĂące Ă  vos dons (dĂ©fiscalisables Ă  66 %), l’association Framasoft agit depuis 20 ans pour faire avancer le Web Ă©thique et convivial. Retrouvez un focus sur certaines de nos actions en 2024 sur le site Soutenir Framasoft.

âžĄïž Lire la sĂ©rie d’articles de cette campagne (nov. – dĂ©c. 2024)

Du cÎté de nos services en ligne


Plus de 1,8 million de personnes naviguent sur nos sites internet chaque mois : c’est trois fois plus de visites que n’en reçoit la Tour Eiffel, chaque mois ! C’est assez fou (et trĂšs motivant) d’imaginer que ce que nous faisons est utile Ă  tant de monde.

Et service par service, ça donne quoi ?

Framadate

Framadate permet de crĂ©er des mini-sondages, notamment pour trouver le bon crĂ©neau de rendez-vous. Et en chiffres, Framadate c’est :

  • 37 403 780 visites en 2024, soit 5 millions de plus qu’en 2023
  • 1,246 million de sondages hĂ©bergĂ©s en 2024 (sensiblement Ă©quivalent Ă  2023)
Graphique présentant l'évolution des visites sur Framadate

Graphique prĂ©sentant l’évolution des visites sur Framadate

Framapad

Framapad permet de rĂ©diger Ă  plusieurs sur un mĂȘme document. Framapad est sans doute l’un des plus gros services Etherpad au monde avec :

  • 601 800 pads hĂ©bergĂ©s actuellement, soit 92 000 de plus qu’en 2023
  • Plusieurs millions de pads hĂ©bergĂ©s depuis le lancement du service
  • 337 650 comptes sur MyPads (+ 28 000 par rapport Ă  2023)
  • Plus de 5 millions de visites en 2024
Graphique présentant la répartition des pads selon nos instances Framapad (pads annuels, bimestriels, hebdomadaires, semestriels, mensuels et comptes Mypads)

Graphique présentant la répartition des pads selon nos instances Framapad (pads annuels, bimestriels, hebdomadaires, semestriels, mensuels et comptes Mypads)

 

Framalistes et Framagroupes

Framalistes et Framagroupes permettent de crĂ©er des listes de discussion par email. Le serveur de Framalistes Ă©tant arrivĂ© au maximum de ses capacitĂ©s, nous avons ouvert Framagroupes en juin 2023, pour continuer Ă  proposer ce service que nous trouvons indispensable. Framalistes et Framagroupes sont certainement les plus gros serveurs de listes de discussion (hors gĂ©ants du Web) qui existent, avec :

  • Plus d’1,3 million d’utilisateurs et utilisatrices, soit 200 000 de plus qu’en 2023
  • 69 180 listes ouvertes, soit 5 280 de plus qu’en 2023
  • Environ 300 000 mails envoyĂ©s en moyenne par jour ouvrĂ©

Framaforms

Framaforms permet de crĂ©er simplement des questionnaires en ligne. Framaforms en chiffres c’est :

  • 867 000 visites par mois
  • 597 859 formulaires actuellement hĂ©bergĂ©s
  • 194 216 formulaires crĂ©Ă©s cette annĂ©e (22 000 de plus qu’en 2023)
Graphique présentant l'évolution des visites sur Framaforms (ça grimpe !)

Graphique prĂ©sentant l’évolution des visites sur Framforms (ça grimpe !)

Framacalc

Framacalc permet de crĂ©er des tableurs collaboratifs. C’est peut-ĂȘtre lĂ  encore la plus grosse base Ethercalc au monde avec :

  • 4 632 215 visites en 2023
  • 212 000 calcs hĂ©bergĂ©s
Graphique présentant l'évolution des visites sur Framacalc

Graphique prĂ©sentant l’évolution des visites sur Framacalc

Framateam

Framateam est un service de tchat, et permet une organisation d’équipe par canaux. C’est probablement l’une des plus grosses instances Mattermost publique au monde avec :

  • 163 730 utilisateurs et utilisatrices sur le service (dont 6 197 se connectent tous les jours), soit 15 000 de plus qu’en 2023
  • 31 703 Ă©quipes qui s’organisent
  • 184 537 canaux de discussions (20 000 de plus que l’an passĂ©)
  • Plus de 6 millions de messages Ă©changĂ©s cette annĂ©e (et presque 50 millions depuis le lancement du service)
Statistiques de Framateam, notre instance Mattermost

Statistiques de Framateam, notre instance Mattermost

Framagit

Framagit est une forge logicielle, oĂč dĂ©veloppeurs et dĂ©veloppeuses peuvent publier leur code et contribuer Ă  celui des autres. Framagit est probablement un des plus gros serveurs Gitlab publics de France avec :

  • 76 945 projets hĂ©bergĂ©s
  • 53 072 utilisateurs et utilisatrices
  • 10 615 forks
  • 161 156 issues
  • 103 153 Merge requests
  • 1,9 million de notes
Capture Ă©cran du tableau d'accueil de Framagit

Capture Ă©cran du tableau d’accueil de Framagit

Capture Ă©cran du tableau d'accueil de Framagit

Capture Ă©cran du tableau d’accueil de Framagit

Framacarte

Framacarte permet de crĂ©er des cartes gĂ©ographiques en ligne. Et en chiffres, c’est :

  • 3 161 967 visites en 2023
  • 8 764 utilisateurs et utilisatrices (+ 2 074 en un an)
  • 196 978 cartes hĂ©bergĂ©es (+ 16 476 en un an)
Graphique présentant l'évolution des visites sur Framacarte

Graphique prĂ©sentant l’évolution des visites sur Framacarte

Framatalk

Framatalk permet de crĂ©er ou rejoindre un salon de vidĂ©oconfĂ©rence. Et en chiffres, c’est :

  • 121 765 visites en 2024
  • 27 200 visioconfĂ©rences hĂ©bergĂ©es en 2024, soit en moyenne 75 confĂ©rences actives pour 200 participant⋅es par jour ouvrĂ©
Graphique présentant l'évolution des visites sur Framatalk (remarquez cet énorme pic pendant l'année des confinements !)

Graphique prĂ©sentant l’évolution des visites sur Framatalk (remarquez cet Ă©norme pic pendant l’annĂ©e des confinements !)

Framindmap

Framindmap permet de crĂ©er des cartes mentales. En chiffres, Framindmap c’est :

  • 282 379 visites en 2024
  • 1,36 1,13 million de cartes mentales hĂ©bergĂ©es, soit 223 000 cartes crĂ©Ă©es en 2024
  • 588 584 utilisateurs et utilisatrices, soit 100 000 de plus qu’en 2023
Graphique présentant l'évolution des visites sur Framindmap

Graphique prĂ©sentant l’évolution des visites sur Framindmap

 

Framavox

Framavox permet Ă  un collectif de se rĂ©unir, dĂ©battre et prendre des dĂ©cisions, dans un seul endroit. Framavox est probablement une des plus grosses instances existantes de l’excellent logiciel Loomio, avec :

  • 128 938 utilisateurs et utilisatrices, soit 9 000 de plus qu’en 2023
  • 136 067 visites en 2024
  • 13 388 communautĂ©s, ce qui fait plus de 1 000 nouvelles communautĂ©s accueillies

Framavox – Illustration de David Revoy

Framagenda

Framagenda permet de crĂ©er des calendriers en ligne. Et en chiffres, c’est :

  • prĂšs de 300 000 calendriers
  • plus de 130 000 utilisateurices

Framaspace

Framaspace est un environnement de travail collaboratif pour les petites associations et collectifs. En chiffres, c’est :

  • 1 627 associations et petits collectifs qui ne s’organisent pas chez Google
  • 777 nouveaux espaces ouverts en 2024
  • 16 serveurs (dĂ©diĂ©s et machines virtuelles) pour 640 To d’espace disque provisionnĂ©
  • Plus de 800 000 fichiers hĂ©bergĂ©s
Une licorne dĂ©guisĂ©e en cosmonaute (avec une passoire sur la tĂȘte) marche sur les nuages et souffle des bulles. Dans ces bulles, on retrouve des cubes symbolisant le travail en commun (dossiers, boite Ă  outils, livres, machine Ă  Ă©crire, boulier, etc.).

Framaspace – Illustration de David Revoy

PeerTube

PeerTube est une alternative aux plateformes vidĂ©o. Et en chiffres c’est :

  • 422 000 utilisateurs et utilisatrices, soit 122 000 de plus qu’en 2023
  • 922 000 vidĂ©os
  • 1 062 instances publiques
  • 509 000 commentaires sur les vidĂ©os, contre 200 000 l’an passĂ©, soit une multiplication par 2,5 !
  • 443 millions de vues, soit 2 fois plus que l’an passĂ© (on compte une vue Ă  partir de 10 secondes sur la vidĂ©o)
  • 503 To de fichiers
  • 411 issues rĂ©solues en 2024 (sur 4 842 issues traitĂ©es au total)
  • 441 591 visites sur JoinPeerTube.org
  • 1 nouvelle application smartphone !

Statistiques PeerTube des 3 derniers mois de 2023 : instances, utilisateurices, commentaires, vidĂ©os, vues et poids des vidĂ©os

Mobilizon

Mobilizon est l’alternative que nous proposons aux groupes et Ă©vĂ©nements Facebook. En chiffres, c’est :

Mobilizon – Illustration de David Revoy

Framadrive

Framadrive, service de stockage de documents, n’est plus ouvert aux inscriptions, mais fonctionne toujours ! Et en chiffres, c’est :

  • Plus de 10 millions de fichiers
  • PrĂšs de 5 000 utilisateurs et utilisatrices
  • 2,6 To d’espace disque utilisĂ©

Framapiaf

Framapiaf, installation du logiciel de micro-bloging Mastodon, n’est plus ouvert aux nouvelles inscriptions mais reste bien actif. En chiffres, c’est :

  • 1 400 utilisateurs et utilisatrices s’étant connecté·es dans les 30 derniers jours
  • 2 597 813 messages postĂ©s depuis la mise en place de l’instance.

Dorlotons DĂ©googlisons – Illustration de David Revoy

Infrastructure technique

Framasoft est, Ă  notre connaissance, le plus gros hĂ©bergeur associatif de services en ligne au monde. Et a priori, ce modĂšle de fonctionnement associatif n’existe nulle part ailleurs ! En chiffres :

  • 63 serveurs et 63 machines virtuelles qui hĂ©bergent nos services en ligne (soit 5 serveurs physiques de plus qu’en 2024)
  • 0,7 tonne Ă©quivalent CO2 pour la consommation Ă©lectrique annuelle de notre infrastructure technique (notre hĂ©bergeur Hetzner utilisant des Ă©nergies renouvelables hydroĂ©lectriques et Ă©oliennes)
  • 1 admin sys Ă  temps plein et 2 personnes tech en soutien
  • 1 personne au support Ă  temps plein

Je participe au financement des Framaservices

 

L’association et les communs culturels

Les services en ligne que nous mettons Ă  disposition du public ne sont pas les seuls Ă  occuper nos journĂ©es. VoilĂ  quelques chiffres concernant d’autres actions que nous avons menĂ©es Ă  bien cette annĂ©e.

Dessin dans le style d'un jeu vidĂ©o de combat, oĂč s'affronte l'Ă©lĂ©phant et le piaf de DĂ©googlisonse et le monstre de Google Suite.

C’est grĂące Ă  vos dons que EspĂ©hef et AhĂšmvĂ© font face Ă  Hydrooffice ! Illustration de David Revoy

En interne

  • Framasoft c’est 25 membres bĂ©nĂ©voles et 9 salariĂ©â‹…es
  • 45 interventions en 2024, en prĂ©sentiel et/ou en ligne sur le numĂ©rique, les communs culturels et leurs enjeux
  • Plus de 102 articles publiĂ©s sur le Framablog en 2024
  • La parution de notre premier ouvrage de notre maison d’édition Des Livres en Communs : L’amour en Commun

Les projets partagés

  • 1 128 notices sur l’annuaire Framalibre, soit 31 de plus que l’an passĂ©
  • 51 prestataires (30 de plus qu’en 2023) en capacitĂ© d’accompagner des associations dans leur Ă©mancipation numĂ©rique recensĂ©s sur le site emancipasso.org
  • La participation Ă  la rĂ©union de clĂŽture du projet ECHO Network
  • La transmission de la coordination aprĂšs 8 annĂ©es d’animation du collectif CHATONS regroupant actuellement 96 hĂ©bergeurs alternatifs

Je soutiens les actions de Framasoft

Le dĂ©fi : 20 000 fois 20 € de dons pour les 20 ans de Framasoft !

Framasoft est financĂ©e par vos dons ! Chaque tranche de 20 euros de dons sera un nouveau ballon pour cĂ©lĂ©brer 20 annĂ©es d’aventures et nous aider Ă  continuer et dĂ©coller une 21e annĂ©e.

illustration oĂč des animaux mascottes de projets framasoft rassemblent des ballons sur deux piquets au sol. Les ballons prennent la forme d'un 20 gĂ©ant.

Illustration de David Revoy – Licence : CC-By 4.0

À ce jour, nous avons dĂ©passĂ© le pallier des 200 000 €, qui nous assure de pouvoir maintenir l’existant (en Ă©quipe rĂ©duite) en 2025.

Tout ce qui nous rapprochera du pallier idĂ©al des 400 000 € nous permettra de pouvoir accueillir de nouvelles forces, amĂ©liorer des services web, s’attaquer Ă  de nouveaux enjeux
 bref de dĂ©coller en 2025.

Il nous reste 4 jours pour convaincre les copaines et récolter de quoi faire décoller Framasoft.

Alors : dĂ©fi relevĂ© ?

🎈 Je soutiens la 21e annĂ©e de Framasoft 🎈

Sortie de LDAP Tool Box Service Desk en version O.6

20 décembre 2024 à 12:56

LDAP Tool Box Service Desk est une interface Web pour gĂ©rer les mots de passe et les statuts des comptes d’un annuaire LDAP standard ou d'un annuaire Active Directory. Il est publiĂ© sous licence GPL v3.

Ce logiciel sorti en 2020 a bien évolué depuis : systÚme de hook, audit, notifications par courriel, 


La version 0.6 parue début décembre 2024 apporte une innovation majeure : la compatibilité native avec Active Directory.

Service Desk 0.6

Active Directory

C'est peut-ĂȘtre un dĂ©tail pour vous, mais pour les administrateurs Active Directory cela veut dire beaucoup : plus besoin de passer par les outils d'administration Microsoft pour dĂ©bloquer un compte, les dĂ©activer ou rĂ©initialiser son mot de passe !

Service Desk se connecte désormais directement à Active Directory, autorisant ainsi la délégation d'un certain nombre de tùches de support utilisateur au service helpdesk, sans que celui-ci n'accÚde directement à l'AD.

OpenLDAP

Nous n'oublions pas bien entendu OpenLDAP, dont la gestion de la politique des mots de passe a bien évolué entre la version 2.4 et la version 2.5.

Service Desk intÚgre les derniÚres fonctionnalités de l'overlay policy, en particulier la gestion des dates de début et de fin de validité.

Audit et commentaires

Chaque action effectuĂ©e au travers de l'interface peut ĂȘtre tracĂ©e dans un fichier d'audit. Afin d'enrichir ces donnĂ©es, il est possible de forcer la saisie d'un commentaire (pour indiquer par exemple le numĂ©ro de ticket concernĂ©). Ce commentaire sera visible dans le fichier d'audit.

Hooks

Des scripts peuvent ĂȘtre appelĂ©s avant (prehook) ou aprĂšs (posthook) une action. Ainsi le changement de mot de passe, le dĂ©blocage d'un compte, la dĂ©sactivation d'un compte ou encore la modification des dates de validitĂ© peuvent ĂȘtre propagĂ©s Ă  d'autres systĂšmes.

Politique des mots de passe

Le composant visuel utilisé dans Self Service Password qui indiquer dynamiquement si les critÚres de complexité du mot de passe sont respectés ou non est désormais disponible dans Service Desk, facilitant ainsi la réinitialisation du mot de passe.

Commentaires : voir le flux Atom ouvrir dans le navigateur

Tuxemon Tower 0 : sortie de la premiĂšre version !

19 décembre 2024 à 03:30

Tuxemon Tower 0 est un petit jeu vidĂ©o trĂšs sobre. Il est inspirĂ© des jeux PokĂ©mon classiques et consorts, mais il est 100% libre et ne cherche aucunement Ă  ĂȘtre un clone.

Sommaire

En bref

Qu'est-ce que Tuxemon Tower 0 ?

Tuxemon Tower 0 est un jeu vidéo de combats en tour par tour. Les combattants peuvent avoir un ou des types, ont des statistiques, et une ou plusieurs capacités. En gagnant assez d'expérience, ils montent de niveau et ainsi deviennent plus forts. Un genre simple et classique, mais efficace.

Et dans le cas de Tuxemon Tower 0, la rĂ©alisation est trĂšs basique. Cela est vrai autant du point de vue graphique que de celui du moteur. De plus, on accorde qu'on peut parfois juger que l'expĂ©rience des joueurs est mĂ©diocre (notamment car, hormis ĂȘtre meilleur que nous, vous allez devoir vous fader des combats juste pour avoir un niveau suffisant et on reconnaĂźt qu'il n'y a pas trop d'intĂ©rĂȘt ludique Ă  regagner le mĂȘme combat contre une dresseuse ou commettre un crime contre la biodiversitĂ© en enchaĂźnant Ă  gogo les crĂ©atures sauvages de la mĂȘme zone, mais augmenter la vitesse de dĂ©filement du texte et garder enfoncĂ© sur le bouton A permet d'Ă©courter le temps de mise Ă  niveau). Mais le jeu est court, donc il est escomptĂ© que la dĂ©couverte et la curiositĂ© qui l'accompagne permettent d'avoir une expĂ©rience agrĂ©able de ce mini-jeu.

Télécharger Tuxemon Tower 0

Le téléchargement des sources (code, images, etc.), de la documentation générée et des constructions pour certaines plateformes (distributions GNU/Linux et Windows) se fait via BitTorrent à travers un lien magnet. On promeut en effet la décentralisation et le fédéralisme, mais aussi la non-disponibilité permanente. De plus, ça oblige tout le monde à partager le coût (hormis les trackers, certes) et à avoir une copie des sources, tout en étant résilient.

Ce serait sympa de partager pendant l'obtention et aussi aprĂšs que ce soit fait. Et on prĂ©vient : on n'est que rarement Ă  la fois connectĂ© Ă  Internet (on n'a volontairement pas d'accĂšs chez nous) et en mesure de partager via BitTorrent (on ne veut pas faire ça au boulot et il faut que ce soit permis par le rĂ©seau), donc ayez de la patience (ou ne vous plaignez pas inutilement). C'est Ă©galement pour ça qu'on encourage fortement que vous continuez de partager le torrent aprĂšs l'avoir entiĂšrement obtenu et de prĂ©fĂ©rence sans ratio (puisqu'il n'est pas bien lourd Ă  la vue de la normalitĂ© actuelle, et est tout Ă  fait lĂ©gal, ça ne devrait pas vous ĂȘtre bien problĂ©matique).

Quelques clients BitTorrent libres

Au cas oĂč vous n'auriez pas de client BitTorrent (ou un qui soit propriĂ©taire), en voici quelques-uns qui sont libres :

Images du jeu

Images de cartes

Images de cartes

Images de combats

Images de combats

Images de menus

Images de menus

Comment contribuer ?

Avant d'éventuellement contribuer, n'oubliez pas plutÎt en priorité de faire des choses plus importantes. En effet selon nous, mieux vaut s'activer pour l'émancipation sociale universelle et tendre vers une société écologique que de contribuer à un jeu.

  1. Pour nous, la meilleure maniĂšre de contribuer est de mettre Ă  disposition des sprites pour des crĂ©atures et des dresseurs. En effet, nous sommes trĂšs mauvais pour produire ça et cela ajouterait de la diversitĂ© bienvenue (pendant que celle sur Terre s'effondre
). Si ça vous branche, faites-le en respectant le style des actuels, avec une taille adĂ©quate (64×64 et/ou 56×56 et/ou 48×48), et de prĂ©fĂ©rence en faisant l'avant et l'arriĂšre (car avec juste l'avant on ne peut pas jouer la crĂ©ature ou la personne dresseuse mais juste l'affronter), voire en vous restreignant Ă  4 couleurs (c'est lĂ  la contrainte ultime, mais qui serait utile pour Ă©conomiser de l'espace et deviendra nĂ©cessaire si un jour un port sur GameBoy Color est fait) et alternativement c'est dĂ©jĂ  ça si ça ne dĂ©passe pas la barre des 8 (qui va nous servir de transition entre 16 et 4, tout en permettant de rĂ©duire l'usage mĂ©moire avec une petite astuce ou de la compression plus poussĂ©e que nous ne ferons probablement pas).
  2. Nous n'avons pas l'intention de gĂ©rer une communautĂ© autour de ce jeu. C'est pourquoi nous n'avons pas mis le code source sur une forge et nous ne comptons pas le faire. Rien ne vous empĂȘche toutefois de faire une version dĂ©rivĂ©e et de la publier, peut-ĂȘtre que nous irons y piocher des trucs en vous crĂ©ditant si nous en avons connaissance.
  3. Bien sĂ»r, si vous voulez que nous intĂ©grions peut-ĂȘtre un jour une contribution, veillez Ă  la mettre sous une licence compatible quand vous n'y ĂȘtes pas de toute façon obligĂ© par le gauche d'auteur. Utilisez donc une licence libre, avec de prĂ©fĂ©rence la GNU AGPLv3+ pour le code source et la Creative Commmons BY-SA v4.0 pour le reste.
  4. Mais oĂč mettre ce que vous produisez ? Ça vous regarde. Mais, pour que ce soit visible, le wiki du projet Tuxemon est un bon endroit ou vous pouvez faire un commentaire ci-dessous (pointant par exemple vers votre dĂ©pĂŽt sur OpenGameArt).
  5. Si vous vous y connaissez en portage ou en packaging pour votre systĂšme favori, n'hĂ©sitez pas Ă  faire un joli paquet pour le jeu et Ă  tenter honnĂȘtement de le faire officiellement intĂ©grer. Toutefois, cela ne vaut pas pour Apple iOS, Google Play, Microsoft Store, Steam de Valve, Origin d'Electronic Arts, et consorts.
  6. Évidemment une autre forme de contribution est tout simplement de faire la promotion du jeu. Parlez-en !
  7. Enfin, il existe un moyen rudimentaire : partager le contenu du torrent, pour qu'il soit disponible le plus de temps possible. En effet, nous sommes trĂšs loin d'ĂȘtre en permanence avec un accĂšs Ă  Internet et nous n'ouvrons pas systĂ©matiquement notre client BitTorrent favori quand nous le sommes.

Le droit d'auteur

Les licences utilisées

Les conséquences

Remerciements

En plus long ?

Le comité éditorial de LinuxFr.org a jugé inappropriée la version longue qui était prévue et qui lui a été soumise. De plus, il a suggéré de feuilletonner l'annonce d'origine. Mais cela ne correspond pas à notre vision éditoriale et plus généralement notre vision anthropologique (le brouhaha communicationnel nous apparaßt comme néfaste et donc à ne surtout pas alimenter), et nous n'avons de toute façon pas envie d'y passer du temps (il y a pour nous bien plus important que ce petit jeu vidéo, dont la réalisation est plus pour nous un plaisir coupable qu'autre chose, à fortiori dans une phase trÚs nette de fascisation et d'écocide).

NĂ©anmoins l'annonce d'origine, qui contient bien plus d'explications, reste disponible. Dans le torrent, il y a les sources (sources.tar.xz) et dans celle-ci il y a l'annonce prĂ©vue Ă  la base (news/fr/version-1-0-0_annonce.md). Et si vous voulez la publier ailleurs (en mentionnant que nous en sommes Ă  l'origine et en diffĂ©renciant bien toute modification), en entier ou sous forme partielle, elle est sous licences libres (vous pouvez choisir celle qui vous convient le mieux) avec gauche d'auteur : Creative Commons BY-SA 3.0, Creative Commons BY-SA 4.0 et GNU GPL 3.0.

Données du jeu

Consultation en jeu

Dans le menu de lancement, proposant de dĂ©marrer une nouvelle partie ou d'en charger une existante, appuyez sur Start (ou plutĂŽt l'un des boutons qui y correspond si vous n'utilisez pas une manette ou qu'elle n'est pas reconnue ou pas bien). Cela vous fera changer de menu. Vous aurez alors une entrĂ©e « Explorer les donnĂ©es Â». Ce n'est pas parce que ça existe que c'est exhaustif.

Documentation HTML

Dans le torrent, avec les sources et les constructions, il y a de la documentation sous forme de fichiers HTML, que vous pouvez consulter avec un navigateur web. Vous pouvez aussi la regénérer depuis les sources. Comme pour la consultation en jeu, ce n'est pas nécessairement exhaustif, mais c'est déjà ça.

Images

Liste des créatures

Liste des créatures

Liste des dresseurs et dresseuses

Liste des dresseurs et dresseuses

Annexe : temps et motivation

Au début d'un projet personnel, la motivation est souvent grande. Mais tant qu'il n'y a pas quelque chose de finalisée, il est à priori courant que la motivation tende à décroitre. En tout cas, c'est notre cas.

C'est en partie pour cela que le jeu est trĂšs simple (systĂšme ultra-basique pour les cartes, pas de possibilitĂ© d'esclavagir, pas de statut, pas de possibilitĂ© de manipulation par le joueur/joueuse d'objets non-visuels, pseudo-alĂ©atoire en guise de non-intelligence artificielle, etc.). L'autre grosse partie de l'explication est la volontĂ© de faire de la basse technologie (d'oĂč entre autres que ce soit graphiquement en niveaux de gris, malgrĂ© des sprites avec des couleurs au-delĂ  de ce spectre) et la restante est l'ajout de complexitĂ© qui nuise Ă  l'expĂ©rience de la mĂ©canique du jeu en ajoutant du « bruit Â», mais ce n'est lĂ  pas le sujet.

Venir reprocher ou se plaindre de la trop grande simplicitĂ© du jeu (qu'il aurait fallu qu'il y ait ceci et cela, etc.) peut ĂȘtre en soi une critique pertinente. NĂ©anmoins, ça ferait totalement fi de l'aspect humain en ce qui concerne la production. En effet, si le jeu n'Ă©tait pas aussi basique, il ne serait probablement jamais sorti de par la baisse de motivation.

C'est pourquoi le jeu est volontairement trÚs simple. Mais c'est une fin en soi et une base. Tout ce qui a été fait pour la version 1.0.0 de ce jeu ne sera plus à faire pour une ou des éventuelles versions améliorées et un ou des éventuels autres jeux exploitant tout ou partie de ce qui a été réalisé pour celui-là.

Approximation de l'Ă©volution de la motivation

Dans le cadre du dĂ©veloppement de ce jeu, on utilise git, un logiciel de gestion de version. Tous les changements y sont consignĂ©s et datĂ©s. À partir des informations qu'il a enregistrĂ©es, il est donc possible d'avoir une idĂ©e de l'Ă©volution de la motivation.

Toutefois, on ne va pas vous livrer le dépÎt git (et on a expliqué pourquoi). Vous n'en aurez donc ci-aprÚs qu'une vue fort approximative, dont la génération a été faite par git-bars.

Il fournit une vue par mois du nombre de commits. C'est donc trĂšs approximatif. En effet, un commit peut avoir une taille trĂšs variable et ĂȘtre pour des changements importants ou mineurs. NĂ©anmoins, ça donne tout de mĂȘme une image plutĂŽt rĂ©aliste de l'Ă©volution de notre motivation.

On peut notamment bien voir que les dĂ©buts sont des pĂ©riodes fastes. Pour dĂ©but 2023, on peut constater que c'est assez peu garni, ce qui s'explique par la contre-rĂ©forme des retraites. Mais ça montre aussi un biais : en mars et en avril 2023, on n'a fait que des petits trucs pas bien importants, mais ça a engendrĂ© pas mal de commits.

Statistiques de commits par nous pour ce nouveau jeu

2024-11  61   ▀▀▀▀▀▀▀▀▀▀▀▀▀
2024-10  52   ▀▀▀▀▀▀▀▀▀▀▀
2024-09  45   ▀▀▀▀▀▀▀▀▀▀
2024-08  77   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2024-07  19   ▀▀▀▀
2024-06  34   ▀▀▀▀▀▀▀
2024-05  62   ▀▀▀▀▀▀▀▀▀▀▀▀▀
2024-04  126  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2024-03  59   ▀▀▀▀▀▀▀▀▀▀▀▀▀
2024-02  96   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2024-01  89   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2023-12  52   ▀▀▀▀▀▀▀▀▀▀▀
2023-11  78   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2023-10  117  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2023-09  224  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2023-08  106  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2023-07  87   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2023-06  56   ▀▀▀▀▀▀▀▀▀▀▀▀
2023-05  106  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2023-04  92   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2023-03  60   ▀▀▀▀▀▀▀▀▀▀▀▀▀
2023-02  10   ▀▀
2023-01  19   ▀▀▀▀
2022-12  34   ▀▀▀▀▀▀▀
2022-11  80   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2022-10  87   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2022-09  106  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2022-08  88   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2022-07  138  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2022-06  85   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2022-05  50   ▀▀▀▀▀▀▀▀▀▀▀
2022-04  28   ▀▀▀▀▀▀
2022-03  121  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2022-02  131  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2022-01  144  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-12  133  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-11  81   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-10  26   ▀▀▀▀▀
2021-09  35   ▀▀▀▀▀▀▀
2021-08  45   ▀▀▀▀▀▀▀▀▀▀
2021-07  85   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-06  5    ▀
2021-05  18   ▀▀▀▀
2021-04  55   ▀▀▀▀▀▀▀▀▀▀▀▀
2021-03  79   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-02  112  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-01  60   ▀▀▀▀▀▀▀▀▀▀▀▀▀

Statistiques de commits par nous pour Greycess Knight RPG

Greycess Knight RPG est la base de ce nouveau jeu. Il part donc du mĂȘme dĂ©pĂŽt git. Puisque des changements sont valables pour les 2 jeux, on les fait dans Greycess Knight RPG, ce qui occasionne des commits de fusion dans le nouveau jeu. De plus, en soustrayant les nombres de commits par mois de Greycess Knight RPG Ă  ceux du nouveau jeu, on peut avoir le nombre de commits qui touchent aux changements nĂ©cessaires au nouveau, ou du moins en partie puisqu'on fait parfois le changement dans le nouveau jeu avant de le mettre aussi dans l'ancien ou le (quasi-)mĂȘme changement dans les 2 pour faciliter la fusion. C'est pour ça qu'on met ci-aprĂšs les statistiques pour Greycess Knight RPG.

2024-11  17   ▀▀▀▀▀▀▀
2024-10  9    ▀▀▀▀
2024-09  4    ▀
2024-08  20   ▀▀▀▀▀▀▀▀
2024-07  1    
2024-06  8    ▀▀▀
2024-05  15   ▀▀▀▀▀▀
2024-04  34   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2024-03  3    ▀
2024-02  10   ▀▀▀▀
2024-01  12   ▀▀▀▀▀
2023-12  16   ▀▀▀▀▀▀▀
2023-11  15   ▀▀▀▀▀▀
2023-10  13   ▀▀▀▀▀
2023-09  29   ▀▀▀▀▀▀▀▀▀▀▀▀
2023-08  26   ▀▀▀▀▀▀▀▀▀▀▀
2023-07  25   ▀▀▀▀▀▀▀▀▀▀▀
2023-06  26   ▀▀▀▀▀▀▀▀▀▀▀
2023-05  25   ▀▀▀▀▀▀▀▀▀▀▀
2023-04  35   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2023-03  27   ▀▀▀▀▀▀▀▀▀▀▀▀
2023-02  4    ▀
2023-01  3    ▀
2022-12  9    ▀▀▀▀
2022-11  22   ▀▀▀▀▀▀▀▀▀
2022-10  15   ▀▀▀▀▀▀
2022-09  14   ▀▀▀▀▀▀
2022-08  27   ▀▀▀▀▀▀▀▀▀▀▀▀
2022-07  44   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2022-06  14   ▀▀▀▀▀▀
2022-05  16   ▀▀▀▀▀▀▀
2022-04  6    ▀▀
2022-03  22   ▀▀▀▀▀▀▀▀▀
2022-02  33   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2022-01  54   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-12  92   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-11  81   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-10  26   ▀▀▀▀▀▀▀▀▀▀▀
2021-09  35   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-08  45   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-07  85   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-06  5    ▀▀
2021-05  18   ▀▀▀▀▀▀▀▀
2021-04  55   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-03  79   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-02  112  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀
2021-01  60   ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀

Par ailleurs, comme vous pouvez le voir, ça a bougĂ© du cĂŽtĂ© de Greycess Knight RPG. Une version 1.0.2 est en cours. Mais du point de vue de l'expĂ©rience de jeu, elle n'apporte rien ou presque. Ce sera une mise Ă  jour technique : elle consistera essentiellement en une amĂ©lioration du code source (de diverses maniĂšres et Ă  divers endroits) et en une rĂ©duction par 3 de la taille du binaire sans la bibliothĂšque SDL2 statiquement liĂ©e (ce qui l'amĂšnera Ă  environ 250 ko grĂące Ă  la correction d'une erreur stupide).

Commentaires : voir le flux Atom ouvrir dans le navigateur

epub, le convertisseur EPUB3 à la volée de LinuxFr.org

4 novembre 2024 Ă  03:57

Le site LinuxFr.org utilise divers logiciels libres pour son fonctionnement et ses services : une large majoritĂ© provient de projets tiers (Debian, MariaDB, Redis - version d’avant le changement de licence, nginx, Postfix, conteneurs LXC et Docker, Ruby On Rails, Sympa, etc.) et d’autres composants sont dĂ©veloppĂ©s pour nos propres besoins. Cette derniĂšre catĂ©gorie comprend le code principal du site web en Ruby On Rails, et principalement 5 services autour : le cache d’images img, la tribune board, le convertisseur EPUB 3 epub, le partageur sur les rĂ©seaux sociaux share et le convertisseur LaTeX vers SVG svg. Cette dĂ©pĂȘche va s’intĂ©resser Ă  epub, un code sous AGPLv3.

Elle est nĂ©e d’une envie personnelle d’expliquer, documenter et montrer ce qui a Ă©tĂ© fait sur le convertisseur EPUB3 Ă  la volĂ©e de LinuxFr.org, et elle vient accompagner la prĂ©cĂ©dente sur img, le cache d’images sur LinuxFr.org.

    Sommaire

    Des EPUB de vos contenus et commentaires

    LinuxFr.org vous permet de lire les contenus et commentaires du site, au format EPUB3, par exemple dans votre liseuse préférée. Il y a une exception à cela, les liens, parce que certes ça ferait des EPUB tout mignons, mais surtout petits voire un poil inutiles. Le lien EPUB est présent automatiquement sur chaque contenu (hormis les liens donc).

    Le principe est simple : on donne un lien vers un contenu HTML Ă  epub, il le demande Ă  la partie Ruby on Rails du site, ainsi que les images associĂ©es, convertit le tout au format EPUB3 et le renvoie Ă  la personne qui l’a demandĂ©. Techniquement epub n'est pas exposĂ© frontalement mais se trouve derriĂšre un nginx.

    CÎté code Ruby on Rails

    C’est assez basique : on ajoute juste sur chaque contenu un lien pour tĂ©lĂ©charger au format EPUB. Ainsi, y compris sur cette dĂ©pĂȘche, vous allez trouver un lien Ă  la fin pour rĂ©cupĂ©rer le tout au format EPUB (et un autre pour rĂ©cupĂ©rer le source en Markdown mais c’est un autre sujet).

    app/views/news/_news.atom.builder:    epub = content_tag(:div, link_to("Télécharger ce contenu au format EPUB", "#{url}.epub"))
    app/views/polls/_poll.atom.builder:  epub = content_tag(:div, link_to("Télécharger ce contenu au format EPUB", "#{url}.epub"))
    app/views/posts/_post.atom.builder:  epub = content_tag(:div, link_to("Télécharger ce contenu au format EPUB", "#{url}.epub"))
    app/views/nodes/_actions.html.haml:    = link_to "EPUB", "#{path_for_content node.content}.epub", title: "Télécharger ce contenu au format EPUB", class: "action download"
    app/views/diaries/_diary.atom.builder:  epub = content_tag(:div, link_to("Télécharger ce contenu au format EPUB", "#{url}.epub"))
    app/views/wiki_pages/_wiki_page.atom.builder:  epub = content_tag(:div, link_to("Télécharger ce contenu au format EPUB", "#{url}.epub"))

    CÎté epub

    Le service est plutĂŽt simple, par rapport Ă  img, car il n’a pas de dĂ©pendance sur redis par exemple, et qu’il a, au final, peu de paramĂ©trage (un couple adresse+port d’écoute, un fichier de trace et un hĂŽte pour aller chercher les contenus).

    Il est possible de faire un GET /status et on obtient une rĂ©ponse HTTP 200 avec un contenu OK. C’est utile pour tester que le service est lancĂ© (depuis l’intĂ©rieur de la plateforme).

    Sinon on lui demande une dĂ©pĂȘche, un journal, une entrĂ©e de forum, un sondage, une entrĂ©e de suivi ou une page wiki en prenant le chemin sur LinuxFr.org et ajoutant un petit .epub Ă  la fin, et il va renvoyer un fichier EPUB. Ou bien il va rĂ©pondre un contenu non trouvĂ© HTTP 404 s’il y a un souci. Et vu son fonctionnement, si on a un souci de HTML non valide ou si img a un problĂšme avec une image, alors derriĂšre epub pourrait avoir le mĂȘme souci.

    epub est un binaire dynamique en Go. Il impose le https pour l’hĂŽte (du coup on aura tous les liens en HTTPS en interne normalement). Il ne peut pas vraiment ĂȘtre compilĂ© statiquement (on a besoin de libxml2, libonig2 et de la mĂȘme version de la libc au dĂ©ploiement). Il ne gĂšre pas les images in-line.

    Dans les logs on va trouver des infos comme :

    2024/11/03 16:34:02 Status code of http:/example.invalid/exemple.png is: 404
    (
)
    2024/11/03 16:38:23 Fetch https://linuxfr.org/news/capitole-du-libre-2024-au-programme-du-16-et-17-novembre
    2024/11/03 16:38:24 Fetch https://linuxfr.org/users/liberf0rce/journaux/libreast-2006-is-out-of-order
    

    Historique

    epub a Ă©tĂ© crĂ©Ă© par Bruno Michel en 2013 et Bruno est le seul Ă  travailler dessus (48 commits) jusqu’en 2018. Comme img, on peut considĂ©rer que epub a fait le job pendant ce temps-lĂ , sans besoin de retouche.

    Mon premier commit de 2021 concerne la gestion d’un cas de collision de nommages des images.

    En 2022, Bruno quitte l’équipe du site, et par ailleurs il y a des montĂ©es de versions et des migrations Ă  faire sur les serveurs de LinuxFr.org, et epub fait partie des services Ă  reprendre en main. Ce qui veut dire le comprendre, le documenter et au besoin l’amĂ©liorer.

    Bref je dĂ©cide de me plonger dans epub (2022-2024), dans la foulĂ©e de img, car a priori ce n’est pas un composant compliquĂ© du site (il vit dans son coin, il offre une interface, c’est du Go, donc on a un binaire seulement Ă  gĂ©rer - divulgĂąchage en fait non pas seulement).

    Le choix est le mĂȘme que pour img (cf la dĂ©pĂȘche prĂ©cĂ©dente) : ajouter un Dockerfile permettant de recompiler epub dans un conteneur, en contrĂŽlant la version de Go utilisĂ©e, en effectuant une dĂ©tection d’éventuelles vulnĂ©rabilitĂ©s au passage avec govulncheck. Cela me permet de valider que l’on sait produire le binaire d’une part, et que l’on offre Ă  tout le monde la possibilitĂ© de contribuer facilement sur ce composant. Et de dĂ©couvrir qu’une version statique n’est pas facilement envisageable.

    Puis je vais tester le composant pour vĂ©rifier qu’il fonctionne comme je le pense et qu’il fait ce qu’on attend de lui. Je vais ajouter une suite des tests qui couvrent les diffĂ©rentes fonctionnalitĂ©s et les vĂ©rifient en IPv4 et en IPv6, en HTTP 1.1 et en HTTP 2.0. Les tests utilisent Hurl et docker-compose, et encore une fois l’idĂ©e de donner la possibilitĂ© de contribuer facilement. Ils comprennent des tests de types de contenus non pris en charge, le test de la limite Ă  5 MiB, diffĂ©rents types de contenus, le test de vie, des appels erronĂ©s (mauvais chemin, mauvaise mĂ©thode, etc). Et surtout de vĂ©rifier avec epubcheck que le fichier epub produit est correct. Le choix des cas de tests est basĂ© sur le trafic rĂ©ellement constatĂ© sur le serveur de production, sur les diffĂ©rents cas dans le code et un peu sur l’expĂ©rience du testeur.

    Les différents travaux effectués vont permettre de détecter et corriger quelques soucis :

    Et Ă  la fin, j’écris une dĂ©pĂȘche pour parler de tout cela.

    Évolutions rĂ©centes

    Dockerfile

    Le fichier Dockerfile du projet permet :

    • de partir d’une image officielle Go d’une version donnĂ©e, basĂ©e sur une distribution Debian (en raison des dĂ©pendances)
    • de l’utiliser pendant la construction en prenant la liste des dĂ©pendances de compilation, en les tĂ©lĂ©chargeant, en prenant l’unique fichier source epub.go et en le compilant dynamiquement avec l’option pour retirer les chemins de compilation
    • de rechercher les Ă©ventuelles vulnĂ©rabilitĂ©s avec govulncheck
    • de tester avec golangci/golangci-lint le code (fait Ă  la construction de l’image, car on dispose de toutes les dĂ©pendances Ă  ce moment-lĂ )
    • de repartir d’une base Debian en y mettant les autoritĂ©s de certification, les dĂ©pendances de fonctionnement et le binaire issus de la partie construction, de dĂ©clarer le port d’écoute et de lancer le binaire avec des variables disposant de valeurs par dĂ©faut.

    La suite de tests

    Pour l’utiliser, c’est assez simple, il faut aller dans le rĂ©pertoire tests et lancer un docker-compose up --build, qui va produire le conteneur contenant epub, et dĂ©marrer le nginx-cert qui fournit les certificats et le nginx prĂ©configurĂ© pour les tests. Si tout va bien, on attend, et au bout d’un moment il s’affiche :

    linuxfr.org-epub-test_1  | All tests look good!
    tests_linuxfr.org-epub-test_1 exited with code 0
    

    Rentrons un peu dans les détails.

    D’abord un fichier docker-compose.yaml qui dĂ©crit le rĂ©seau IPv4/IPv6 utilisĂ© pour les tests, l’image nginx-cert qui sera utilisĂ©e pour crĂ©er une autoritĂ© de certification et un certificat serveur de test, l’image nginx qui sera utilisĂ©e avec sa configuration et ses fichiers Ă  servir pour les tests, l’image epub et son paramĂ©trage (dont l’accĂšs au nginx) ainsi que le rĂ©pertoire de l’autoritĂ© de certification de tests et enfin l’image de la suite de tests qui est construit avec son Dockerfile et son rĂ©pertoire de dĂ©pĂŽt des fichiers EPUB.

    Le Dockerfile de tests est basĂ© sur une image Hurl (un outil pour faire des tests HTTP). On ajoute les fichiers de tests en .hurl, le script shell qui pilote le tout, on prĂ©voit d’avoir les paquets dont on aura besoin : bash (pas par dĂ©faut dans les Alpine), curl, openjdk17 (pour epubcheck), openssl, unzip (transitoirement), bind-tools et shellcheck. On installe epubcheck. Et on lance les tests par dĂ©faut.

    La configuration nginx de test Ă©coute en HTTP sur le port 80 en IPV4 et IPv6 et permet de dĂ©finir des chemins avec des rĂ©ponses en HTTP 301, 302, 308, 400, 401, 403, etc. jusqu’à 530 et mĂȘme 666 pour les codes invalides, ainsi qu’une redirection infinie.

    Dans les données de tests servies par nginx, on trouve des contenus du mauvais type, des contenus dans divers formats, une image trÚs grande et des images qui ne seront pas accessibles.

    Sont aussi présents deux fichiers de tests avec une extension en .hurl :

    • le test de vie et les chemins hors des contenus autorisĂ©s
    • les tests sur les contenus

    Vient enfin le script shell qui pilote le tout :

    • on dĂ©finit les variables pour les cibles IPv4/IPv6 que l’on veut utiliser dans les autres conteneurs Docker
    • on purge le stockage des EPUB sur disque
    • on lance les premiers tests (en IPv4 et IPv6, en HTTP 1.1 et en HTTP 2.0)
    • sur chaque EPUB produit, on lance epubcheck et on regarde si la validation donne le rĂ©sultat attendu (succĂšs ou Ă©chec)
    • si on est arrivĂ© jusque-lĂ  on Ă©crit que tout va bien et on dĂ©clenche un sourire de satisfaction.

    Les problématiques restantes

    Il y a quelques entrées encore ouvertes dans le suivi :

    • les images trop grandes (en octet), non rĂ©cupĂ©rables, de format inconnu, etc. : la suite de tests actuelle « couvre Â» le cas des images de plus de 5 MiB ou non rĂ©cupĂ©rables, avec des tests qui Ă©chouent, comme prĂ©vu, vu que c’est img qui est censĂ© faire le job de les Ă©viter. Cependant il pourrait ĂȘtre sympa de remplacer toute image non disponible/invalide par une image de remplacement « Image indisponible Â» du bon Content-Type et du bon nom (vu qu’elle est dĂ©clarĂ©e dans le MANIFEST).
    • les images trop grandes (en pixel) : globalement on revient Ă  la question des images que laisse passer img
    • les epub non fonctionnels en rĂ©daction et modĂ©ration : pour des questions de droits, la gĂ©nĂ©ration EPUB ne marche pas dans les espaces de rĂ©daction et de modĂ©ration, Ă  voir si on trouve un contournement ou si on Ă©vite de proposer le lien.

    Il y a la question habituelle de la montĂ©e de versions des dĂ©pendances (pour nous actuellement contraintes celles du code Ruby on Rails). Et des questions Ă  se poser sur l’avenir de nginx ?. Les dĂ©pendances pendant le fonctionnement amĂšnent aussi leur lot de contraintes.

    Conclusion ?

    Encore une fois, sans surprise et me rĂ©pĂ©tant, il reste des problĂ©matiques et du code Ă  faire pour les gĂ©rer (c’est rare un composant sans demandes d’évolution ou de correction). Yapuka (mais probablement plus tard, il faut aussi partager le temps avec les autres composants, ou avoir plus de contributions).

    epub rend la fonction que l’on attend de lui, mĂȘme si on pourrait faire un peu mieux. Plonger dans ce composant s’est avĂ©rĂ© assez intĂ©ressant et formateur (et nĂ©cessaire) : techniquement cela a Ă©tĂ© l’occasion de faire du Go, du docker et du docker-compose, du nginx, du hurl, de l’HTTP et de gĂ©rer des problĂ©matiques statique/dynamique et des dĂ©pendances. Il s’agissait encore de comprendre ce que faisait un code Ă©crit par une autre personne, de se poser des questions pour choisir les tests et le contenu de la documentation, de se demander pour quelles raisons tel ou tel choix a Ă©tĂ© fait, de rendre ce composant plus « contribuable Â», et de complĂ©ter le tout de façon dĂ©taillĂ©e avec une dĂ©pĂȘche.

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    img, le cache d’images sur LinuxFr.org

    Le site LinuxFr.org utilise divers logiciels libres pour son fonctionnement et ses services : une large majoritĂ© provient de projets tiers (Debian, MariaDB, Redis - version d’avant le changement de licence, nginx, Postfix, conteneurs LXC et Docker, Ruby On Rails, Sympa, etc.) et d’autres composants sont dĂ©veloppĂ©s pour nos propres besoins. Cette derniĂšre catĂ©gorie comprend le code principal du site web en Ruby On Rails, et principalement 5 services autour : le cache d’images img, la tribune board, le convertisseur EPUB 3 epub, le partageur sur les rĂ©seaux sociaux share et le convertisseur LaTeX vers SVG svg. Cette dĂ©pĂȘche va s’intĂ©resser Ă  img, un code sous AGPLv3.

    Elle est nĂ©e d’une envie personnelle d’expliquer, documenter et montrer ce qui a Ă©tĂ© fait sur le cache d’images de LinuxFr.org, complĂ©tĂ©e d’une demande d’un « article technique sur le fonctionnement de ce cache, les choix techniques qui ont Ă©tĂ© faits, les erreurs commises donc Ă  Ă©viter
 Â».

      Sommaire

      Des images sur le site

      LinuxFr.org vous permet d’utiliser des images externes dans les contenus et commentaires du site. Ces images sont incluses en syntaxe markdown avec ![description textuelle](adresse "titre optionnel") (soit en saisissant directement du Markdown, soit en cliquant sur l’icĂŽne d’ajout d’image dans l’éditeur). Profitons-en pour rappeler que pour utiliser une image sur LinuxFr.org, vous devez vous assurer de respecter sa licence.

      Nous vous encourageons donc Ă  utiliser des images sous licence libre et Ă  citer les auteurs (c’est mĂȘme obligatoire pour les licences CC-by et CC-by-sa). Cette citation est tirĂ©e de la dĂ©pĂȘche d’annonce Un nouveau reverse-proxy cache pour les images externes sur LinuxFr.org de 2012.

      Il est aussi recommandĂ© de mettre une vraie description textuelle, qui finira dans l’attribut alt de la balise img utilisĂ©e pour l’accessibilitĂ© ou si l’image ne peut ĂȘtre chargĂ©e. Il peut ĂȘtre utile de lui donner un titre qui apparaĂźtra l’autre du survol de l’image Ă  la souris par exemple.

      Exemple :

      ![Logo LinuxFr.org](https://linuxfr.org/images/logos/linuxfr2_classic_back.png "L’actualitĂ© du logiciel libre et des sujets voisins (DIY, Open Hardware, Open Data, les Communs, etc.), sur un site francophone contributif gĂ©rĂ© par une Ă©quipe bĂ©nĂ©vole par et pour des libristes enthousiastes.")

      Logo LinuxFr.org

      Buts du cache d’images

      Les raisons évoquées à la mise en place de img (sans ordre particulier) :

      • la sĂ©curitĂ© : si une image externe n’est servie qu’en HTTP (en clair donc) et est appelĂ©e au milieu d’une page LinuxFr.org elle-mĂȘme servie en HTTPS, alors le navigateur va rĂąler sur le mĂ©lange des genres. img permet de servir toutes les images identiquement (par exemple en HTTPS, et avec le certificat de LinuxFr.org, via le serveur frontal devant img). À noter que ces images ne sont pas servies directement depuis le domaine principal linuxfr.org mais depuis un sous-domaine img.linuxfr.org pour Ă©viter que le JavaScript embarquĂ© dans les images en SVG puisse servir de vecteur d’attaque contre le site.
      • la protection de la vie privĂ©e des personnes visitant LinuxFr.org : seul LinuxFr.org voit les informations en provenance de leur navigateur (dont l’adresse IP). Les Ă©quipes d’administration des diffĂ©rents sites ne les voient plus (elles voient l’adresse IP du serveur LinuxFr.org).
      • une meilleure gestion du trafic : au lieu d’envoyer tout notre public chercher individuellement chaque image, LinuxFr.org la rĂ©cupĂšre une fois et la rend disponible. Si le site externe fournissant l’image est un serveur Ă  faibles ressources (liaison ADSL avec faible dĂ©bit montant par exemple), la mise en cache permet de garantir qu’il ne recevra qu’un faible volume de requĂȘtes (la rĂ©cupĂ©ration se faisant initialement toutes les 10 min tant que des demandes arrivent, le cache expirant aprĂšs 10 min).
      • la conservation des images : les images incluses depuis des sites externes peuvent ne plus ĂȘtre disponibles (l’entitĂ© a disparu, le serveur a Ă©tĂ© arrĂȘtĂ©, le domaine a Ă©tĂ© perdu, l’adresse a changĂ©, etc.). Nous avons donc un mĂ©canisme de cache pour que nous puissions continuer Ă  servir une image mĂȘme si elle devient indisponible.

      Parmi les conséquences de cette implémentation initiale, on peut citer :

      • si le fichier est changĂ© sur le serveur distant (modifiĂ©, converti dans un autre format), l’ancien fichier est servi jusqu’à la prochaine rĂ©cupĂ©ration et le nouveau fichier ne sera servi qu’à la prochaine rĂ©cupĂ©ration ;
      • si le fichier est supprimĂ© sur le serveur distant, l’image ne sera plus servie aprĂšs la prochaine rĂ©cupĂ©ration (car le serveur a rĂ©pondu que l’image n’existe plus) ;
      • il est possible de modifier l’image au passage : les images d’avatar sont retaillĂ©es pour une hauteur de 64 pixels par exemple ;
      • il est possible de bloquer des images : les images problĂ©matiques (pub/spam, contenus pour adultes, images injurieuses, etc.) peuvent ĂȘtre bloquĂ©es et ne plus ĂȘtre servies ;
      • par ailleurs img n’accepte de servir que les images connues de LinuxFr.org dont le poids fait moins de 5 MiB.

      À l’utilisation

      Lors de l’écriture d’un commentaire ou d’un contenu sur LinuxFr.org, une personne va ajouter une image externe via la syntaxe Markdown, par exemple ![Logo LinuxFr.org](https://linuxfr.org/images/logos/linuxfr2_classic_back.png)

      Ce qui donne à l’affichage :

      Logo LinuxFr.org

      Et cÎté code HTML :

      <img src="https://linuxfr.org/images/logos/linuxfr2_classic_back.png" alt="Logo LinuxFr.org">

      OK, mauvais exemple ce n’est pas une image externe, puisqu’elle est hĂ©bergĂ©e sur LinuxFr.org justement. Prenons un autre exemple ![April - Campagne d’adhĂ©sion](https://april.org/campagne-2024/relais/banniereCampagneApril.svg).

      Ce qui donne à l’affichage :

      April - Campagne d’adhĂ©sion

      Et cÎté code :

      <img src="//img.linuxfr.org/img/68747470733a2f2f617072696c2e6f72672f63616d7061676e652d323032342f72656c6169732f62616e6e6965726543616d7061676e65417072696c2e737667/banniereCampagneApril.svg" alt="April - Campagne d’adhĂ©sion" title="Source : https://april.org/campagne-2024/relais/banniereCampagneApril.svg">

      Donc on sert l’image via le sous-domaine img.linuxfr.org. On peut aussi noter le titre rempli automatiquement avec la source. Expliquons la nouvelle adresse :

      • // on sert en https si la page est en https et en http si la page est en http (c’est plutĂŽt un oubli qu’autre chose, vu que le site est uniquement en https)
      • img.linuxfr.org on sert depuis un sous-domaine du site
      • 68747470733a2f2f617072696c2e6f72672f63616d7061676e652d323032342f72656c6169732f62616e6e6965726543616d7061676e65417072696c2e737667 est la version en texte-vers-hexadĂ©cimal de l’adresse d’origine (68 pour h, 74 pour t (deux fois), 70 pour p, etc.). Il existe des sites et des outils en local pour faire cette conversion, mais cela ne concerne pas la simple utilisation du site.
      • banniereCampagneApril.svg on met Ă  la fin le nom du fichier pour ĂȘtre sympa si vous voulez sauver l’image en local avec un nom plus explicite

      Ceci Ă©tait le cas oĂč tout se passe bien, comme prĂ©vu, comme le voulait la personne qui voulait utiliser une image externe.

      Voyons maintenant ce qui se passe dans le cas pas si rare oĂč la personne a donnĂ© une adresse d’image invalide, une adresse ne pointant pas vers une image vers autre chose (cas extrĂȘmement frĂ©quent), une image trop grosse (plus de 5 MiB), etc. Il se passe la mĂȘme chose cĂŽtĂ© code, mais cĂŽtĂ© affichage, pas d’image, et on voit seulement le texte alternatif dans son navigateur. Dans les coulisses, img a rĂ©pondu 404, cette adresse n’est pas disponible.

      On note donc qu’une mĂȘme image servie en http:// ou en https:// aura une adresse convertie en hexadĂ©cimal diffĂ©rente, donc sera vue comme une autre image par img. MĂȘme chose si le serveur externe accepte des adresses sans tenir compte de la casse, ou si on rajoute des paramĂštres dans l’adresse comme « ?mot_magique=merci Â».

      CÎté code Ruby on Rails

      Un contenu ou commentaire est en cours de crĂ©ation et une image externe a Ă©tĂ© mentionnĂ©e. Le code de gestion des images va vĂ©rifier que l’image est dĂ©clarĂ©e dans redis (crĂ©er l’entrĂ©e img/<adresse> avec adresse l’adresse de l’image en clair, ajouter un champ created_at avec l’horodatage, ajouter l’adresse dans la liste des derniĂšres images img/latest) et renvoyer l’adresse via img.

      Le code peut aussi modifier le champ status d’une image dans redis pour mettre ou enlever un blocage (valeur Blocked) par l’équipe du site, et l’ajouter/enlever de la liste des images bloquĂ©es img/blocked.

      CÎté img

      Les schémas dans la documentation du service img explicitent les possibilités et les comportements.

      Il est possible de faire un GET /status et on obtient une rĂ©ponse HTTP 200 avec un contenu OK. C’est utile pour tester que le service est lancĂ© (depuis l’intĂ©rieur de la plateforme).

      Sinon, on peut envoyer des requĂȘtes GET /img/<adresse_en_hexa> or GET /img/<adresse_en_hexa>/<nom_de_fichier> pour les images, et GET /avatars/<adresse_en_hexa> ou GET /avatars/<adresse_en_hexa>/<nom_de_fichier> pour les avatars.

      En se limitant aux requĂȘtes lĂ©gitimes, le comportement de img est le suivant :

      • l’adresse demandĂ©e a Ă©tĂ© prĂ©cĂ©demment dĂ©clarĂ©e (dans redis par la partie code Ruby On Rails) sinon il rĂ©pond 404 ;
      • l’adresse demandĂ©e n’est pas bloquĂ©e par l’équipe du site sinon il rĂ©pond 404 ;
      • l’adresse est dĂ©jĂ  dans le cache disque, alors il renvoie l’image ;
      • l’adresse n’est pas dans le cache disque et la rĂ©cupĂ©ration Ă©choue, il renvoie 404 (et va noter temporairement l’échec dans img/err/<uri>) ;
      • l’adresse n’est pas dans le cache disque et la rĂ©cupĂ©ration a lieu (notĂ© temporairement dans img/update/<uri>): si le serveur rĂ©pond positivement Ă  la demande, avec une image comme attendue, pas trop volumineuse, alors on la met en cache disque. Si c’est un avatar, on peut retailler l’image. On aura des champs supplĂ©mentaires stockĂ©s type avec la nature de l’image (en-tĂȘte Content-Type), checksum avec un hachage SHA1 et etag avec la valeur ETag (entĂȘte ETag).

      Le cache est rafraßchi réguliÚrement.

      img est un binaire statique en Go. Il offre des options pour dĂ©finir le couple adresse:port d’écoute, pour dĂ©finir oĂč envoyer les logs, pour se connecter Ă  une base redis, pour dĂ©finir le rĂ©pertoire du cache disque, pour choisir le User-Agent qui sera utilisĂ© pour les requĂȘtes externes, pour dĂ©finir l’avatar qui sera renvoyĂ© par dĂ©faut, et la possibilitĂ© de le lancer uniquement en mode audit interne pour vĂ©rifier la cohĂ©rence et l’état des donnĂ©es et des fichiers.

      Dans les logs on va trouver des infos comme :

      2024/10/20 20:39:24 Status code of http://example.invalid/exemple1.png is: 404
      2024/10/20 20:39:24 Fail to fetch http://example.invalid/exemple1.png (serve from disk cache anyway)
      2024/10/20 20:44:12 Fetch http://example.invalid/exemple2.png (image/png) (ETag: "be5e-4dba836030980")
      2024/10/20 20:44:12 http://example.invalid/exemple3.png has an invalid content-type: text/html;charset=UTF-8
      2024/10/20 20:44:12 Fail to fetch http://example.invalid/exemple3.png (serve from disk cache anyway)
      

      Ici l’exemple 1 est dĂ©jĂ  en cache et peut ĂȘtre servi mĂȘme si on Ă©choue Ă  le rĂ©cupĂ©rer Ă  ce moment-lĂ . L’exemple 2 vient d’ĂȘtre rĂ©cupĂ©rĂ©. L’exemple 3 a dĂ©sormais une adresse invalide (qui renvoie une page HTML au lieu d’une image) mais il existe en cache une image prĂ©cĂ©demment rĂ©cupĂ©rĂ©e.

      Historique

      img a Ă©tĂ© crĂ©Ă© par Bruno Michel en 2012. Adrien Kunysz amĂšne 5 commits en novembre 2013, mais globalement Bruno est le seul Ă  travailler dessus (43 commits) jusqu’en 2018. img fait le job et il n’est pas besoin d’y retoucher trop souvent.

      En 2022, Bruno quitte l’équipe du site, et par ailleurs il y a des montĂ©es de versions et des migrations Ă  faire sur les serveurs de LinuxFr.org, et img fait partie des services Ă  reprendre en main. Ce qui veut dire le comprendre, le documenter et au besoin l’amĂ©liorer.

      Bref je dĂ©cide de me plonger dans img (2022-2024), car a priori ce n’est pas le composant le plus compliquĂ© du site (il vit dans son coin, il offre une interface, c’est du Go, donc on a un binaire seulement Ă  gĂ©rer).

      Étape 1 : je vais commencer par ajouter un Dockerfile permettant de recompiler img dans un conteneur, en contrĂŽlant la version de Go utilisĂ©e, en effectuant une dĂ©tection d’éventuelles vulnĂ©rabilitĂ©s au passage avec govulncheck. Cela me permet de valider que l’on sait produire le binaire d’une part, et que l’on offre Ă  tout le monde la possibilitĂ© de contribuer facilement sur ce composant.

      Étape 2 : je vais tester le composant pour vĂ©rifier qu’il fonctionne comme je le pense et qu’il fait ce qu’on attend de lui. Je vais ajouter une suite des tests qui couvrent les diffĂ©rentes fonctionnalitĂ©s et les vĂ©rifient en IPv4 et en IPv6, en HTTP 1.1 et en HTTP 2.0. Les tests utilisent Hurl et docker-compose (avec des images redis et nginx), et encore une fois l’idĂ©e de donner la possibilitĂ© de contribuer facilement. Ils comprennent des tests de types de contenus non pris en charge, le test de la limite Ă  5 MiB, diffĂ©rents types d’images, le test de vie, des appels erronĂ©s (mauvais chemin, mauvaise mĂ©thode, etc). Le choix des cas de tests est basĂ© sur le trafic rĂ©ellement constatĂ© sur le serveur de production, sur les diffĂ©rents cas dans le code et un peu sur l’expĂ©rience du testeur.

      Étape 2,5 : l’avatar par dĂ©faut renvoie sur le site de production, y compris sur les tests en dĂ©veloppement en local et sur le serveur de test du site. J’en profite pour ajouter un paramĂštre pour cela (et cela permettra de passer du PNG au SVG par dĂ©faut).

      Étape 3 : encore une fois essayons de simplifier la vie d’hypothĂ©tiques personnes contributrices. Une petite modification pour que hurl et redis soient fournis via docker-compose et ne soient plus nĂ©cessaires sur le poste de dĂ©veloppement.

      Étape 4 : il est temps de documenter plus le fonctionnement. J’avais dĂ©jĂ  dĂ©crit les infos stockĂ©es dans redis, mais pour comprendre le systĂšme de cache, autant fournir des diagrammes pour illustrer ce qui se passe lors d’une requĂȘte et comment on passe d’un Ă©tat Ă  un autre. C’est aussi l’occasion de complĂ©ter la suite de tests en ajoutant des tests avant et aprĂšs expiration du cache, histoire de pouvoir documenter ces cas prĂ©cis.

      Étape 5 : en cas d’échec de rĂ©cupĂ©ration, une image Ă©tait indisponible jusqu’à la prochaine rĂ©cupĂ©ration (donc potentiellement pendant 10 min). Autant servir l’ancienne version en cache lorsque cela se produit : je modifie le code et les tests en consĂ©quence.

      Étape 6 : je sais que certaines images ont Ă©tĂ© perdues, que des adresses d’images ont toujours Ă©tĂ© erronĂ©es, que des contenus et commentaires ont Ă©tĂ© supprimĂ©s et qu’il n’y a donc plus lieu de garder les images associĂ©es. Je dĂ©cide d’implĂ©menter dans img un audit interne qui indiquera si des anomalies sont prĂ©sentes dans redis, si des images sont indisponibles ou si des entrĂ©es dans le cache disque ne correspondent plus Ă  aucune image. Et j’ajoute cet audit dans la suite de tests.

      Étape 7 : j’écris une dĂ©pĂȘche pour parler de tout cela.

      Évolutions rĂ©centes

      Dockerfile

      Le fichier Dockerfile du projet permet :

      • de partir d’une image officielle Go d’une version donnĂ©e, basĂ©e sur une distribution minimale Alpine
      • de l’utiliser pendant la construction en prenant la liste des dĂ©pendances, en les tĂ©lĂ©chargeant, en prenant l’unique fichier source img.go et en le compilant statiquement avec l’option pour retirer les chemins de compilation
      • de rechercher les Ă©ventuelles vulnĂ©rabilitĂ©s avec govulncheck
      • d’ajouter le paquet tzdata pour avoir les dĂ©finitions fuseaux horaires (nĂ©cessaire pour les conversions de/vers GMT pour les entĂȘtes type Last-Modified).
      • de repartir d’une base Alpine en y mettant les dĂ©finitions de fuseaux horaires et le binaire issus de la partie construction, de dĂ©clarer le port d’écoute et de lancer le binaire avec des variables disposant de valeurs par dĂ©faut.

      La suite de tests

      Pour l’utiliser, c’est assez simple, il faut aller dans le rĂ©pertoire tests et lancer un docker-compose up --build, qui va produire le conteneur contenant img, et dĂ©marrer le redis et le nginx prĂ©configurĂ©s pour les tests. Si tout va bien, on attend, et au bout d’un moment il s’affiche :

      linuxfr.org-img-test_1  | All tests look good!
      tests_linuxfr.org-img-test_1 exited with code 0
      

      Rentrons un peu dans les détails.

      D’abord un fichier docker-compose.yaml qui dĂ©crit le rĂ©seau IPv4/IPv6 utilisĂ© pour les tests, l’image redis qui sera utilisĂ©e (stockage gĂ©rĂ© par docker), l’image nginx qui sera utilisĂ©e avec sa configuration et ses fichiers Ă  servir pour les tests, l’image img et son paramĂ©trage (dont l’accĂšs au redis et au nginx) ainsi que le rĂ©pertoire du cache et enfin l’image de la suite de tests qui est construit avec son Dockerfile, prĂ©vue pour faire du Docker-in-Docker et avoir accĂšs au cache img et aux fichiers nginx.

      Le Dockerfile de tests est basĂ© sur une image Hurl (un outil pour faire des tests HTTP). On ajoute les fichiers de tests en .hurl, le script shell qui pilote le tout, on prĂ©voit d’avoir les paquets dont on aura besoin : bash (pas par dĂ©faut dans les Alpine), coreutils, docker et xxd (pour les conversions texte vers hexadĂ©cimal). Et on lance les tests par dĂ©faut.

      La configuration nginx de test Ă©coute en HTTP sur le port 80 en IPV4 et IPv6 et permet de dĂ©finir des chemins avec des rĂ©ponses en HTTP 301, 302, 308, 400, 401, 403, etc. jusqu’à 530 et mĂȘme 666 pour les codes invalides, ainsi qu’une redirection infinie.

      Dans les donnĂ©es de tests servies par nginx, on trouve des contenus du mauvais type, une image destinĂ©e Ă  ĂȘtre bloquĂ©e, des images dans divers formats, une image trĂšs grande en pixels mais pas trop en octets, une image trop grande en octets, et un avatar Ă  servir par dĂ©faut.

      Sont aussi présents cinq fichiers de tests avec une extension en .hurl :

      • le test de vie et les chemins hors img/ et avatars/
      • les tests sur les avatars : adresse valide ou invalide, image inexistante, bon et mauvais types, comportements sur les diffĂ©rents codes HTTP et sur une boucle de redirection infinie
      • les tests sur les images (dĂ©coupĂ©s en trois parties, la partie initiale, la partie entre la rĂ©cupĂ©ration initiale et l’expiration du cache et enfin la partie aprĂšs la rĂ©cupĂ©ration et l’expiration du cache.

      Vient enfin le script shell qui pilote le tout :

      • on dĂ©finit les variables pour les cibles IPv4/IPv6 et les binaires redis et img que l’on veut utiliser dans les autres conteneurs Docker
      • on liste les images dans diffĂ©rentes catĂ©gories :
        • celles qui vont Ă©chouer et ne comporteront donc qu’une entrĂ©e dans redis sans rien dans le cache disque (avec sous-catĂ©gories possibles bloquĂ©es/non-bloquĂ©es)
        • les images devant ĂȘtre en erreur
        • les images qui iront normalement dans le cache
      • on prĂ©pare des images qui seront altĂ©rĂ©es plus tard
      • on purge le cache sur disque, on nettoie redis et on dĂ©clare toutes nos images comme le faire le code Ruby on Rails. Certaines sont dĂ©clarĂ©es bloquĂ©es pour les tests.
      • on lance les premiers tests (en IPv4 et IPv6, en HTTP 1.1 et en HTTP 2.0)
      • on modifie certaines images pour simuler un changement sur le serveur externe, une suppression sur le serveur externe ou un blocage par l’équipe de site
      • on lance les tests post-rĂ©cupĂ©ration initiale mais avant l’expiration du cache (toujours avec toutes les variantes)
      • on force l’expiration du cache
      • on lance les tests post-expiration du cache (toujours avec toutes les variantes)
      • si on est arrivĂ© jusqu’ici, c’est qu’on a passĂ© tous les tests Hurl, alors maintenant on recompte ce que l’on a dans redis et sur disque et on vĂ©rifie si ça correspond Ă  nos attentes
      • on nettoie les images mises volontairement en Ă©chec
      • on lance le test d’audit interne qui doit nous dire que tout va bien
      • si on est arrivĂ© jusque-lĂ  on Ă©crit que tout va bien et on dĂ©clenche un sourire de satisfaction.

      L’audit interne

      L’objectif est de vĂ©rifier la cohĂ©rence des donnĂ©es dans redis, si des images sont indisponibles ou si des entrĂ©es dans le cache disque ne correspondent plus Ă  aucune image.

      Le binaire d’img peut donc ĂȘtre appelĂ© en mode audit et lancer des contrĂŽles internes.

      D’abord il collecte la liste des fichiers dans le cache disque.

      Ensuite il vérifie que toutes les images listées dans les derniÚres images (img/latest) existent comme entrées individuelles.

      Puis il vĂ©rifie s’il existe des images bloquĂ©es (il rĂąlera s’il y en a) et si chacune existe comme entrĂ©e individuelle le cas Ă©chĂ©ant.

      Ensuite on parcourt tous les entrĂ©es individuelles d’images :

      • on rĂąle si on tombe sur une entrĂ©e img/updated/ ou img/err/ sans date d’expiration
      • on rĂąle si on tombe sur une entrĂ©e img/ sans champ created_at, sans type ou d’un type inconnu, sans checksum, avec un statut inconnu, une image bloquĂ©e non prĂ©sente dans les images bloquĂ©es, un champ inconnu, une prĂ©sence inattendue dans le cache disque, etc. Et on marque les images que l’on a vu passer comme attendu dans le cache.
      • on rĂąle sur tous les fichiers du cache restants (ne correspondant Ă  aucune image)
      • si on a rĂąlĂ©, on renvoie 1, sinon 0

      Le grand nettoyage

      img a fonctionnĂ© pendant 12 ans en production : il a rencontrĂ© des bugs, des comportements inattendus, des contenus et commentaires ont Ă©tĂ© supprimĂ©s ou rĂ©Ă©ditĂ©s, etc. Il est donc probable qu’il y ait besoin d’aller dĂ©poussiĂ©rer un peu tout cela et de retirer ce qui est inutile.

      Les traces du grand nettoyage sont d’abord visibles dans la rĂ©trospective de la premiĂšre quinzaine de septembre 2024 :

      • une « image Â» sur sept prĂ©sente un souci (n’est pas une image, adresse invalide, trop grosse, etc.) et n’est donc pas dans le cache sur disque (ce qui a conduit Ă  pas mal de taf sur la partie gestion des images)
      • les types de contenu (Content-Type) en provenance de sites variĂ©s et divers, c’est quelque chose
 entre les « image/JPEG » ou « image/PNG » en majuscules parce que, les charset=utf-8 ou UTF-8 ou
 sur du binaire, les name= qui ne sont pas dans la norme
 Wikimedia renvoie aussi du profile="https://www.mediawiki.org/wiki/Specs/SVG/1.0.0" (pareil ça semble en dehors de tout standard).

      D’abord j’attaque le sujet la fleur au fusil en me disant que ça va passer crĂšme, je fais un joli tableau qui rĂ©sume l’état initial :

                                    img/<uri>   img/updated/<uri>   img/err/<uri>   blocked
      total                           25565 -21       634               160            5
      
      no created_at                      23 -23         0                 0            0
      created_at                       2857 -3          0                 5            1
      created_at+type                   222             0                 0            0
      total not in cache               3104 -26         0                 0            0
      
      created_at+type+checksum(+etag) 22463 +5        634               155            4
      
      files in cache                  22778 +5
      

      Donc on a officiellement 25 565 images, mais 23 sont mal crĂ©Ă©es (Ă©tat thĂ©oriquement impossible hors race condition), 222 sont incomplĂštes (Ă©tat thĂ©oriquement impossible race condition), 22 463 sont attendues en cache et on a 22 778 fichiers dans le cache. Ça part mal. Je nettoie en premier le plus facile (on voit le delta +/- de mes corrections). Et on arrive Ă  une situation oĂč une image sur sept prĂ©sente alors un souci et il faut gĂ©rer un grand volume de corrections Ă  faire.

      Parmi les soucis on trouve des types de contenus inattendus (image/PNG ou image/JPEG avec majuscules, image, des images binaires annoncĂ©es avec un charset, des types invalides comme image/jpg au lieu de image/jpeg, etc), des erreurs de notre lectorat (mauvais lien, mauvais copier-coller, lien vers une page web au lieu d’une image), mais aussi des espaces insĂ©cables et autres blancs inopportuns, des guillemets convertis, des doubles scheme (http://https:// ou http://file://).

      AprĂšs cela se cache une autre catĂ©gorie encore plus pĂ©nible : les images que l’on a en cache, mais qui ne sont plus utiles au site : par exemple celles qui Ă©taient dans des contenus ou commentaires supprimĂ©s (notamment le spam), celles qui Ă©taient dans des commentaires ou contenus rĂ©Ă©ditĂ©s depuis, etc.

      Un problĂšme connu est devenu vite pĂ©nible : on n’a pas d’association entre les images externes et les contenus/commentaires concernĂ©s. Donc il faut d’abord extraire la liste de toutes les dĂ©clarations d’images externes des 12 tables SQL oĂč l’on peut trouver des images et des avatars, sous forme HTML ou Markdown.

      Ensuite il faut sortir toutes les entrĂ©es dans redis et regarder si on les retrouve en clair ou converties en hexadĂ©cimal dans l’extraction SQL.

      Et par sécurité on fera une double vérification pour celles détectées en erreur, en relançant une recherche en base (attention à la casse dans la recherche texte).

      Au final, on peut supprimer des milliers d’entrĂ©es redis et de fichiers dans le cache.

      Et un jour l’audit dit :

      Connection 127.0.0.1:6379 0
      2024/10/19 12:11:21 Sanity check mode only
      2024/10/19 12:11:37 Files in cache: 17926
      2024/10/19 12:11:39 Total img keys in redis: 18374
      OK
      

      Ça aura pris un mois et demi (l’audit a Ă©tĂ© fusionnĂ© le 8 septembre 2024), certes pas en continu, mais ça a Ă©tĂ© long et guĂšre palpitant de faire ce grand mĂ©nage. Et j’ai refait une seconde passe du traitement complet la semaine d’aprĂšs pour vĂ©rifier que tout se passait correctement et que les soucis rĂ©siduels aprĂšs tout ça Ă©taient minimes ou nuls.

      Parmi les anecdotes, Web Archive / archive.org a eu sa fuite de comptes utilisateurs et a Ă©tĂ© indisponible sur la fin (ce qui rendait compliquĂ© la rĂ©cupĂ©ration d’images perdues ou leur remplacement par un lien valide par exemple). Et, mentionnĂ© dans la rĂ©trospective de la seconde quinzaine de septembre 2024, un compte de spammeur de 2015 supprimé  mieux vaut tard que jamais : dĂ©tectĂ© parce que comme beaucoup de visiteurs, le spammeur ne fait pas la diffĂ©rence entre un lien vers un document et l’ajout d’une image.

      Les problématiques restantes

      Il y a la question habituelle de la montĂ©e de versions des dĂ©pendances (pour nous actuellement contraintes celles du code Ruby on Rails) et du remplacement des composants devenus non-libres (migrer vers valkey plutĂŽt que redis ? Questions Ă  se poser sur l’avenir de nginx ?).

      On pourrait aussi ajouter la prise en charge du TLS et d’un certificat X.509 directement dans img plutĂŽt que dans un frontal. Mais ce n’est utile que si on les sĂ©pare sur deux serveurs distants, ce qui n’est pas le cas actuellement. Donc mĂȘme si ça ne paraĂźt pas compliquĂ© Ă  faire, ce n’est pas urgent.

      Ensuite une entrĂ©e de suivi existe pour sĂ©parer le cache des avatars du cache des autres images : les contraintes pour le cache des avatars Ă©tant diffĂ©rentes de celui des autres images, le stockage en cache devrait ĂȘtre diffĂ©rent. Cela reste un problĂšme mineur. Le changement doit d’abord ĂȘtre fait cĂŽtĂ© Ruby on Rails pour dĂ©finir les avatars avec des clĂ©s redis diffĂ©rentes (genre avatars/ au lieu de img/). Ensuite on peut modifier img pour sĂ©parer le traitement des requĂȘtes HTTP /img/<adresse_hexa> vers les clĂ©s redis img/<adresse> et le cache disque des images par rapport aux requĂȘtes /avatars/<adresse_hexa> vers les clĂ©s avatars/<adresse> et le cache des avatars. Il faudra aussi dĂ©placer les avatars stockĂ©s dans l’actuel cache des images dans leur propre cache. Et lĂ  on devrait pouvoir avoir la mĂȘme adresse dans les deux caches mais avec un rendu Ă©ventuellement diffĂ©rent.

      Un autre problĂšme concerne la non-association des contenus ou commentaires avec les images externes qu’ils contiennent, ce qui rend l’administration des anciennes images un peu pĂ©nible. Le fait que les contenus et commentaires peuvent ĂȘtre rĂ©Ă©ditĂ©s ou simplement prĂ©visualisĂ©s (donc que des images peuvent ĂȘtre supprimĂ©es et d’autres ajoutĂ©es) vient compliquer un peu la tĂąche. Actuellement un ensemble de scripts permettent d’obtenir ces infos et fournissent un contournement, mais ça reste un peu laborieux.

      Un cache rafraĂźchi pĂ©riodiquement conserve les images pour Ă©viter de surcharger le site d’origine, pas si le site a changĂ©, dĂ©placĂ© ou perdu l’image. La modification pour servir depuis le cache disque en cas d’échec de rĂ©cupĂ©ration couvre le cas de la disparition d’une image avec une erreur sur l’adresse, pas celui oĂč le serveur rĂ©pond une mauvaise image. Il y a donc une autre entrĂ©e de suivi images et disparition du web Ă©voquant l’augmentation des soucis sur les images externes avec un cache rafraĂźchi, en raison des domaines rĂ©cupĂ©rĂ©s par des spammeurs et autres pĂ©nibles, ou perdus ou utilisĂ©s pour du phishing (imageshack.us, aprĂšs framapic, pix.toilelibre, etc.). Diverses problĂ©matiques sont mentionnĂ©es comme la perte d’information et donc la diminution de l’intĂ©rĂȘt des contenus anciens, la prime aux pĂ©nibles du rĂ©fĂ©rencement SEO qui pourrissent le net en rĂ©cupĂ©rant les vieux domaines, la modification possible des images publiĂ©es. Pour rĂ©soudre cela techniquement, ça nĂ©cessite de suivre les images et les domaines perdus, et d’intervenir de façon rĂ©guliĂšre. Ou bien de ne plus rafraĂźchir le cache (que cela soit jamais, aprĂšs la publication ou au bout d’un certain temps aprĂšs la publication). Pour juste Ă©viter la perte d’info, il est possible de remplacer par une image locale rĂ©cupĂ©rĂ©e d’une archive du net type archive.org, avec le cĂŽtĂ© « pĂ©nible Ă  faire Â» et sans garantie que ça soit toujours possible (merci waybackpy).

      Enfin une troisiĂšme entrĂ©e de suivi suggĂšre l'hĂ©bergement des images des dĂ©pĂȘches (et Ă©ventuellement des journaux), idĂ©alement en permettant d’avoir une version modifiĂ©e d’une image en changeant sa taille. On peut citer en vrac comme problĂ©matiques la responsabilitĂ© lĂ©gale, l’éventuelle volumĂ©trie, l’impossibilitĂ© de corriger une image publiĂ©e facilement par la personne qui l’a soumise, la centralisation et la perte de rĂ©fĂ©rencement pour des tiers, l’éventuelle rĂ©troactivitĂ© et le traitement de l’historique, le fait qu’il faut traiter tous les autres contenus/commentaires pouvant accueillir des images, etc. Autre question, faut-il diffĂ©rencier les images passĂ©es en modĂ©ration a priori de celles en modĂ©ration a posteriori ?

      Conclusion ?

      Bref sans surprise, il reste des problĂ©matiques et du code Ă  faire pour les gĂ©rer (c’est rare un composant sans demandes d’évolution ou de correction). Yapuka (mais probablement plus tard, il faut aussi partager le temps avec les autres composants, ou avoir plus de contributions).

      img apporte les fonctionnalitĂ©s que l’on attendait de lui mĂȘme si on pourrait faire mieux. Plonger dans ce composant s’est avĂ©rĂ© assez intĂ©ressant et formateur (et nĂ©cessaire) : techniquement cela a Ă©tĂ© l’occasion de faire du Go, du docker et du docker-compose, du redis et du nginx, du hurl et de l’HTTP. Et de comprendre ce que faisait un code Ă©crit par une autre personne, de se poser des questions pour choisir les tests et le contenu de la documentation, de se demander pour quelles raisons tel ou tel choix a Ă©tĂ© fait, de rendre ce composant plus « contribuable Â», et de complĂ©ter le tout de façon dĂ©taillĂ©e avec une dĂ©pĂȘche. Reste Ă  savoir si j’ai rĂ©pondu Ă  l’attente d’un article technique sur le fonctionnement de ce cache, les choix techniques qui ont Ă©tĂ© faits, les erreurs commises donc Ă  Ă©viter
 et la rĂ©ponse est Ă  trouver dans les commentaires.

      Commentaires : voir le flux Atom ouvrir dans le navigateur

      Sortie de LyX 2.4

      15 octobre 2024 Ă  05:34

      Revenons sur les nouveautĂ©s de LyX 2.4 Ă  l’occasion de la sortie de la 2.4.2, qui apporte son lot de correctifs.

      LyX est un Ă©diteur de documents WYSIWYM (what you see is what you mean) prĂ©vu pour l’environnement TeX et disponible sous licence GPL. Contrairement Ă  Word ou LibreOffice, par exemple, l’utilisateur ne voit pas directement Ă  l’écran le mĂȘme rĂ©sultat que s’il imprimait le document (WYSIWYG). Ce mĂ©canisme est voulu, car TeX impose de « compiler Â» les documents avant de les visualiser : LyX permet donc de visualiser la sĂ©mantique du document avant d’en gĂ©nĂ©rer un PDF.

      La version 2.4 est sortie le 1er juin 2024 et apporte un grand lot de nouveautés, aprÚs six ans de développement. Cette version est constituée de 8700 commits par 40 personnes et a permis de fermer 800 problÚmes connus.

      Logo Lyx

      FenĂȘtre principale de LyX

      Parmi les changements principaux, LyX utilise dĂ©sormais UTF-8 en interne pour la reprĂ©sentation des documents, une Ă©volution qui suit de prĂšs LaTeX, qui a fait le mĂȘme mouvement en 2018 (bien aprĂšs les moteurs modernes comme XeTeX ou LuaTeX).

      Au niveau de l’interface graphique, les thĂšmes sombres fonctionnent bien mieux qu’avant, notamment au niveau de l’éditeur de formules. Pour Windows, le thĂšme Fusion de Qt est nĂ©cessaire pour obtenir une interface sombre.

      Au niveau des exports vers d’autres formats que des dĂ©rivĂ©s de TeX, LyX 2.4 gĂ©nĂšre dĂ©sormais du XHTML 5 (c’est-Ă -dire du HTML5 mais lisible comme du XML). La sortie DocBook a Ă©tĂ© entiĂšrement rĂ©Ă©crite, de telle sorte qu’elle s’utilise dĂ©sormais sur la majoritĂ© des types de documents LyX (Ă  l’exception notable des prĂ©sentations Beamer). PrĂ©cĂ©demment, seuls des documents suivant un modĂšle spĂ©cifique Ă  DocBook pouvaient ĂȘtre exportĂ©s en DocBook, mais pas en LaTeX : maintenant, un mĂȘme document pourra ĂȘtre exportĂ© en DocBook et LaTeX. Cette sortie DocBook a aussi Ă©tĂ© l’occasion d’implĂ©menter une sortie en ePub 3 (utilisant DocBook et les outils standard de DocBook pour convertir un document en ePub 3).

      Le développement de LyX se poursuit activement, avec la branche 2.5 en préparation parallÚlement aux mises à jour de la branche 2.4. Les améliorations et corrections en cours sont détaillées dans le systÚme de suivi du projet, accessible au public.

      Il est remarquable de noter que LyX, lancé initialement en 1995, approche bientÎt de ses 30 ans d'existence. Cette longévité témoigne de la qualité et de l'utilité durable de ce logiciel. Il n'a jamais cessé d'évoluer pour répondre aux exigences de ses utilisateurs, en particulier dans le domaine de l'édition scientifique et académique.

      Commentaires : voir le flux Atom ouvrir dans le navigateur

      Revue de presse de l’April pour la semaine 38 de l’annĂ©e 2024

      Par : echarp
      25 septembre 2024 Ă  02:55

      Cette revue de presse sur Internet fait partie du travail de veille menĂ© par l’April dans le cadre de son action de dĂ©fense et de promotion du logiciel libre. Les positions exposĂ©es dans les articles sont celles de leurs auteurs et ne rejoignent pas forcĂ©ment celles de l’April.

      [clubic.com] La secrĂ©taire d'État Ă  l'IA et au NumĂ©rique est Ă  la derniĂšre place du gouvernement, un nouvel affront Ă  la Tech

      ✍ Alexandre Boero, le dimanche 22 septembre 2024.

      Pour la premiĂšre fois en France, l’intelligence artificielle est reprĂ©sentĂ©e au sein du gouvernement, avec le NumĂ©rique. Sauf qu’une fois de plus, les disciplines de la Tech n’ont pas droit Ă  leur ministĂšre.

      Et aussi:

      [LeMagIT] Open Source Summit: Proxmox se dĂ©voile aux clients de VMware (€)

      ✍ Yann Serra, le jeudi 19 septembre 2024.

      Le petit Ă©diteur autrichien a vu le nombre d’entreprises intĂ©ressĂ©es par sa solution de virtualisation exploser depuis que Broadcom a changĂ© les conditions tarifaires de VMware, le leader du domaine.

      [Le Monde Informatique] Linus Torvalds incite les codeurs à miser sur les projets open source utiles (€)

      ✍ Sean Michael Kerner, le mercredi 18 septembre 2024.

      Lors de l’évĂ©nement Open Source Summit Europe de la Fondation Linux, le crĂ©ateur de Linux a fait le point sur les derniĂšres mises Ă  jour de Linux et sur l’open source.

      [L'Informaticien] Une initiative pour soutenir les meilleures pratiques open source

      Le mercredi 18 septembre 2024.

      BaptisĂ©e Developer Relations Foundation (DRF), cette initiative, annoncĂ©e le lundi 16 septembre lors de l’OSSummit de Vienne, vise Ă  soutenir et Ă  unifier les meilleures pratiques au sein de la communautĂ© des dĂ©veloppeurs open source.

      [L'usine Nouvelle] Comment l'Inria veut faire avancer l'open source dans l'IA
 tout en monĂ©tisant ses recherches (€)

      ✍ LĂ©na Corot, le mardi 17 septembre 2024.

      En prĂ©sentant le 12 septembre le programme de recherche P16 et la start-up Probabl, l’Inria s’attaque Ă  l’intĂ©gralitĂ© du cycle de la donnĂ©e. L’objectif est de dĂ©velopper et maintenir Ă  l’état de l’art des bibliothĂšques de logiciels open source tout en parvenant Ă  commercialiser ces ressources avec de nouveaux produits et services.

      [ZDNET] La documentation sur Linux et les logiciels libres est un vĂ©ritable capharnaĂŒm: voici la solution

      ✍ Steven Vaughan-Nichols, le mardi 17 septembre 2024.

      Il ne suffit pas de dire Ă  quelqu’un de se dĂ©brouiller tout seul lorsque le manuel est obsolĂšte, illisible ou inexistant. Nous devons amĂ©liorer la qualitĂ© de la documentation du code, et le moyen d’y parvenir est simple.

      [Le Monde Informatique] AWS place Opensearch sous les auspices de la Fondation Linux

      ✍ Jacques Cheminat, le lundi 16 septembre 2024.

      AprĂšs avoir forkĂ© le moteur de recherche et d’analyse d’Elasticsearch, AWS a dĂ©cidĂ© de transfĂ©rer ce projet Ă  la Fondation Linux avec la crĂ©ation d’une entitĂ© dĂ©diĂ©e la Fondation Opensearch.

      Commentaires : voir le flux Atom ouvrir dans le navigateur

      Célébrons les 21 ans des Linux-Meetup au Québec

      🎉 Il y a plus de deux dĂ©cennies, j’ai lancĂ© mon tout premier Linux-Meetup Ă  MontrĂ©al en mai 2003. Depuis, chaque premier mardi du mois, nous avons tenu 252 rencontres sans interruption, rassemblant des passionnĂ©s du monde Linux.

      🚀 Le samedi 21 septembre 2024, nous fĂȘterons 21 ans de partage autour de Linux et des logiciels libres au QuĂ©bec ! Cet Ă©vĂ©nement coĂŻncide avec la JournĂ©e internationale des logiciels libres (SoftwareFreedomDay), offrant une visibilitĂ© mondiale inĂ©galĂ©e. Ce sera l’occasion de cĂ©lĂ©brer cette communautĂ© qui s’est agrandie au fil des annĂ©es et de marquer cette Ă©tape importante dans l’histoire du logiciel libre.

      📈 Chaque annĂ©e, notre Ă©vĂ©nement annuel devient de plus en plus grand grĂące Ă  l’appui de nos commanditaires. Avec une participation record de 150 passionnĂ©s l’an dernier et le soutien de 23 commanditaires visionnaires.

      🌐 L’évĂ©nement se tiendra en prĂ©sentiel Ă  l’école de technologie supĂ©rieure (ÉTS), Ă  l’universitĂ© et en virtuelle sur BigBlueButton, permettant Ă  la communautĂ© Linux francophone de participer d’oĂč qu’elle soit.

      đŸ’Œ Si votre entreprise utilise Linux ou soutient les logiciels libres, c’est une occasion unique de promouvoir vos solutions et vos services auprĂšs d’une audience ciblĂ©e et engagĂ©e. Rejoignez-nous comme commanditaire et bĂ©nĂ©ficiez d’une visibilitĂ© accrue au sein de la communautĂ©. Contactez-moi rapidement pour discuter de votre participation !

      đŸš© Pour les plus aventureux, la cinquiĂšme Ă©dition de notre chasse au trĂ©sor informatique (CTF : CaptureTheFlag) sera de retour avec des dĂ©fis inĂ©dits, conçus par Dominique Derrier et Pascal Gad. Cet Ă©vĂ©nement interactif mettra vos compĂ©tences Linux Ă  l’épreuve et promet des moments captivants pour les participants.

      đŸ—Łïž Au programme : des prĂ©sentations passionnantes des experts Linux, le CTF et des opportunitĂ©s d’échanges avec la communautĂ©, et bien plus encore.

      đŸŽŸïž Ne manquez pas cette opportunitĂ© unique de vous inscrire et de dĂ©couvrir l’agenda complet Ă  https://www.rencontres-linux.quebec/event/21-ans-de-linux-meetup-au-quebec-1/

      Commentaires : voir le flux Atom ouvrir dans le navigateur

      Revue de presse de l’April pour la semaine 30 de l’annĂ©e 2024

      Par : echarp
      29 juillet 2024 Ă  12:22

      Cette revue de presse sur Internet fait partie du travail de veille menĂ© par l’April dans le cadre de son action de dĂ©fense et de promotion du logiciel libre. Les positions exposĂ©es dans les articles sont celles de leurs auteurs et ne rejoignent pas forcĂ©ment celles de l’April.

      [Le Monde Informatique] Nantes Métropole mise sur l'open source pour son archivage numérique

      ✍ Dominique Filippone, le vendredi 26 juillet 2024.

      Externalisation: Regroupant 24 communes dans le dĂ©partement de Loire Atlantique, Nantes MĂ©tropole a confiĂ© Ă  Atos le dĂ©ploiement de son systĂšme d’archivage Ă©lectronique reposant sur la solution open source Vitam conçue et dĂ©veloppĂ©e par l’Etat.

      [ZDNET] La Suisse exige désormais des logiciels open source

      ✍ Steven Vaughan-Nichols, le mercredi 24 juillet 2024.

      La Suisse vient de faire un grand pas en avant avec une loi rĂ©volutionnaire qui impose l’utilisation de logiciels libres dans le secteur public du pays. Explications.

      [Next] PPA: le compromis de Mozilla sur la publicité ne plait pas à tout le monde

      ✍ Vincent Hermann, le mardi 23 juillet 2024.

      Avec Firefox 128, Mozilla a introduit une fonction baptisĂ©e PPA, pour Privacy-Preserving Attribution. Mais entre cette arrivĂ©e sans crier gare et le fonctionnement – pas toujours bien compris – du mĂ©canisme, les critiques ont fusĂ©.

      [ZDNET] Comment (et pourquoi) l'open source attire les plus grands innovateurs du monde

      ✍ Steven Vaughan-Nichols, le lundi 22 juillet 2024.

      Certains des meilleurs profils IT travaillent dans le domaine de l’open source. Qui sont ces personnes? Comment sont-elles arrivĂ©es lĂ ? Quelle est leur vision de l’avenir de l’open source?

      [01net.] Peu utilisĂ©s, instables
 les logiciels made in France de l'État coĂ»tent un pognon de dingue

      ✍ StĂ©phanie Bascou, le dimanche 21 juillet 2024.

      La Cour des comptes, qui Ă©value les actions faites en matiĂšre de numĂ©rique de l’administration, livre un bilan plus que mitigĂ© de «la suite numĂ©rique de l’agent public», un ensemble de services dĂ©veloppĂ©s en interne par et pour l’administration qui vise Ă  concurrencer Google doc ou Slack.

      [Campus Matin] Vers la fin de l'outil de visioconférence Zoom dans les établissements publics de l'ESR?

      ✍ Isabelle Cormaty, le jeudi 18 juillet 2024.

      En mars 2023, le ministĂšre de l’enseignement supĂ©rieur a mis Ă  disposition des Ă©tablissements publics la solution de classe virtuelle BigBlueButton (BBB). Si l’offre a suscitĂ© de nombreuses critiques Ă  son dĂ©marrage, elle est davantage apprĂ©ciĂ©e aujourd’hui aprĂšs l’augmentation des tarifs de Zoom.

      Commentaires : voir le flux Atom ouvrir dans le navigateur

      Une histoire de formats : il n’y a pas que la taille qui compte

      Dans cette nouvelle excursion dans le temps et dans l’espace du Transimpressux, nous allons rendre une rapide visite Ă  ThĂ©otiste Lefevbvre (1798 - 1887) prote d’imprimerie et Ă  quelques-uns de ses confrĂšres ainsi que dans les magasins de quelques bibliothĂšques. Nous passerons aussi, un grand moment du cĂŽtĂ© de la Silicon Valley et de Redmond dans l’État de Washington, bien obligĂ© puisqu’on parlera beaucoup de formats numĂ©riques, sans oublier d’aller dire bonjour Ă  Donald Knuth, Tim Berners-Lee et John Gruber. On terminera notre exploration quelque part dans les archives numĂ©riques de la BibliothĂšque nationale de France (BnF).

      La climatisation du Transimpressux a été entiÚrement révisée et le bar rechargé en boissons fraßches et glaces en tous genres. On vous souhaite un bon voyage.

      Le transimpressux

      Sommaire

      Préambule

      Cette dĂ©pĂȘche ne se veut pas exhaustive sur les formats en tous genres ni trĂšs technique sur les formats informatiques. Pour les formats d’image, qui ne sont pas traitĂ©s ici, je vous renvoie Ă  l’excellente dĂ©pĂȘche de Tanguy Ortolo qui a fait le tour de la question et au journal de Glandos sur l’intĂ©gration du JPEG XL dans les navigateurs.

      Les formats matériels, entre coût et rangement

      Encore aujourd’hui, le format matĂ©riel d’un document, spĂ©cialement, s’il s’agit d’un livre, est important pas uniquement pour des questions de coĂ»t. Mais aussi Ă  cause d’eux. C’est parce que le papier coĂ»tait cher qu’Alde Manuce a crĂ©Ă© l’italique au dĂ©but du 16e siĂšcle. L’italique prenant moins de place que les autres styles de caractĂšres, il devenait possible d’imprimer des livres en petit format qui pouvaient ainsi ĂȘtre achetĂ©s par une clientĂšle impĂ©cunieuse.

      Une pile de livres
      Des diffĂ©rences de taille et de tailles. Image retravaillĂ©e avec le filtre « Pencil Portrait Â» de Q’mic-Qt (et un peu Inkscape).

      Les rouleaux, volumen ou rotulus

      La taille de ces rouleaux varie beaucoup. Ils peuvent atteindre plusieurs mĂštres de long (ou de large, selon le sens de lecture). TĂ©moin cette remarque d’Auguste Molinier, chartiste et bibliothĂ©caire, en 1892 :

      On a Ă©tudiĂ© rĂ©cemment la longueur des volumina antiques. En Égypte, elle paraĂźt avoir Ă©tĂ© illimitĂ©e ; un rouleau trouvĂ© Ă  ThĂšbes a 43 m. 50, ce qui est excessif ; il est vrai que le moyen Ăąge a eu des rouleaux de parchemin, plus solides, mais encore plus lourds et infiniment plus longs. Pour les Ɠuvres littĂ©raires grecques et latines, un Ă©rudit moderne, M. Birt, a Ă©valuĂ© Ă  12 mĂštres la longueur extrĂȘme des volumina.1

      Ces longueurs dĂ©mesurĂ©es ne sont pas propres aux Égyptiens. Les Archives nationales de Paris possĂšdent un parchemin d’une longueur d’une vingtaine de mĂštres. DatĂ© de 1307, ce rouleau consigne les aveux, obtenus sous la torture, de cent-trente-huit Templiers. Il va sans dire que leur longueur et leur anciennetĂ© rend les rouleaux trĂšs difficiles Ă  manipuler, une difficultĂ© que la numĂ©risation Ă©limine.

      Des formats des livres

      Les noms des formats des livres en imprimerie traditionnelle sont liĂ©s au nombre de pages que l’on imprimait sur une feuille. Le mot « format Â» lui-mĂȘme pourrait venir des chĂąssis, ou « formes Â» dans lesquels on plaçait les pages Ă  imprimer. Ce procĂ©dĂ© s’appelait l’imposition.

      Les formats les plus usuels, du plus grand au plus petit :

      • in-folio : soit quatre pages par feuille, la taille la plus grande de livre,
      • in-quarto, huit pages,
      • in-octavo, seize pages,
      • in-douze, vingt-quatre pages,
      • in-dix-huit, trente-six pages.

      La rĂ©partition des pages sur la feuille Ă©tait Ă  la fois importante et dĂ©licate puisqu’une fois imprimĂ©e, la feuille Ă©tait pliĂ©e. Il fallait donc veiller non seulement Ă  la bonne rĂ©partition des pages sur la feuille, mais aussi Ă  leur sens. Dans son Guide pratique du compositeur d’imprimerie, ThĂ©otiste Lefebvre consacre plus d’un quart de son livre (119 pages sur 440) Ă  cette dĂ©licate question. Dans son petit guide sur la Typographie, Charles-FĂ©licien Huart y consacre aussi plusieurs pages.

      Un exemple de rĂ©partition des pages2 pour un volume in-douze, « cĂŽtĂ© de premiĂšre Â» indique le recto, « cĂŽtĂ© de seconde Â», le verso. La feuille est pliĂ©e en trois dans le sens de la hauteur et deux dans la largeur.

      répartition
      Recto : deux sĂ©ries de pages tĂȘte en bas, pages 12, 13, 16 et 9 (1re sĂ©rie) et 8, 17, 20 et 5 (2e sĂ©rie) et, en dessous pages 1, 24, 21 et 4. Verso : deux sĂ©ries de pages tĂȘte en bas, pages 10, 15, 14 et 11 (1re sĂ©rie) et 6, 19,18 et 7 (2e sĂ©rie) et 3, 22, 23 et 2 en dessous.

      Cette diffĂ©rence de tailles peut amener les bibliothĂšques dont le fond n’est pas directement accessible au public Ă  opter pour un classement matĂ©riel des livres basĂ©s sur le format. On aura ainsi des cĂŽtes du genre « in12-numĂ©ro d’inventaire Â». C’est un systĂšme trĂšs efficace et qui Ă©vite d’avoir un petit livre (littĂ©ralement) perdu au milieu de livres nettement plus grands.

      Les formats actuels, livre et papier

      L’indication de format Ă  partir du nombre de pages imprimĂ©es sur une feuille ne donne pas d’information prĂ©cise sur la taille effective des livres. Il faut signaler que les dimensions changent en fonction de celles de la feuille d’origine. Les appellations actuelles, cĂŽtĂ© Ă©dition, du style Livre de poche (environ 10,5 cm x 17,5 cm), livre brochĂ© ou encore grand format, utilisĂ©es en lieu et place d’in-folio, in-octavo, etc. rĂ©servĂ©s plutĂŽt au livre ancien ne sont pas plus prĂ©cises.

      En, revanche, la taille des feuilles de papier les plus utilisĂ©es a fait l’objet d’une norme, la norme ISO 216. Elle concerne les formats A, dont le fameux A4 qui est celui des feuilles standard des imprimantes de bureau et le format B. Le principe : plus le numĂ©ro est Ă©levĂ©, plus la feuille est petite. La numĂ©rotation commence Ă  0 qui fait un mĂštre carrĂ© (84,1 cm x 118,9 cm) pour le format A. La taille de la feuille du numĂ©ro supĂ©rieur devant ĂȘtre Ă©gale Ă  la moitiĂ© de celle du numĂ©ro infĂ©rieur qui la prĂ©cĂšde. En d’autres termes : le format A3 Ă©gal deux fois le format A4 qui, lui-mĂȘme, est deux fois plus grand que le format A5. Il en va de mĂȘme avec le format B. Cela explique au passage pourquoi le format A4 mesure 21 x 29,7 cm et pas 21 x 30 cm.

      Les formats de texte

      Jusque dans les annĂ©es 1990, il y avait un nombre trĂšs important d’outils et de formats de textes. Writer de LibreOffice, d’aprĂšs mes comptes, peut ouvrir jusqu’à quarante-quatre formats de fichier diffĂ©rents, hors modĂšles et hors web, mais n’enregistre que dans des formats qui sont ceux encore utilisĂ©s Ă  l’heure actuelle. Ce qui rĂ©duit la liste Ă  treize formats incluant les modĂšles et l’HTML.

      Sur cette frise chronologique, on a, en haut, des formats de texte avec leur date de naissance plus ou moins approximative et, en dessous, des langages de balisage avec leur date de naissance Ă©galement.

      Formats de texte et langages de balisage
      Les formats de texte : 1977 Texte brut, 1987-2007 RTF, 1990-2007 DOC, 2005 ODT, 2007 DOCX. Ils ont Ă©tĂ© choisis parce qu’ils sont les plus connus, voire, les plus utilisĂ©s. Dans cette liste deux formats ne sont plus maintenus, les formats RTF et DOC. Mais il existe encore des amas de fichiers dans ces deux formats.

      Le texte brut, .txt

      Le texte brut, nait Ă  une date imprĂ©cise. Probablement vers la fin des annĂ©es 1950 ou au dĂ©but des annĂ©es 1960. Le premier RFC3 qui dĂ©finit un standard de protocole pour des messages en texte brut (Standard for the Format of Arpa Network Text Messages) date de 1977, il porte le numĂ©ro 733 et a Ă©tĂ© rĂ©digĂ© par l’agence amĂ©ricaine pour les projets de recherche avancĂ©e de dĂ©fense (DARPA pour Defense Advanced Research Projects Agency).

      Au dĂ©but, le format n’acceptait que l’Ascii, Ă  savoir les vingt-six lettres de l’alphabet, les chiffres, les ponctuations de base et les caractĂšres de commande Ascii. Ce qui en fait un format simple, mais trĂšs pauvre. L’Ascii est codĂ© sur 7 bits, ce qui ne permet d’avoir que cent-vingt-huit caractĂšres, en fait quatre-vingt-dix imprimables et trente-huit pour les codes de commande4. Il accepte, depuis, l’Unicode. Depuis quand ? Difficile Ă  prĂ©ciser, mais la premiĂšre mention d’Unicode qui figure sur le site rfc-editor remonte Ă  juillet 1994 (en), RFC 1641, Ă  titre expĂ©rimental. On peut supposer, en tout cas, que le consortium Unicode qui rĂ©unit la fine fleur de l’informatique a dĂ» trĂšs tĂŽt faire en sorte que son standard puisse ĂȘtre acceptĂ© dans le format texte brut.

      Ce format se rĂ©vĂšle assez vite insuffisant de part sa simplicitĂ© mĂȘme, confinant Ă  la pauvretĂ© : pas d’enrichissement typographique, pas de notion de style ni de hiĂ©rarchie des paragraphes, pas de possibilitĂ© d’avoir des images. Il est, de fait, plutĂŽt infĂ©rieur Ă  ce que l’on peut avoir sur du papier. Il reste nĂ©anmoins trĂšs utilisĂ© et par toutes les applications qui traitent du texte : Ă©diteurs de texte, bureautique, etc. Il a pour lui l’avantage d’ĂȘtre simple, lĂ©ger et interopĂ©rable. C’est le format, par exemple, avec lequel la BnF Gallica dĂ©livre les documents « bruts de numĂ©risation Â» (il faut copier-coller le texte ailleurs pour le garder et le retravailler), et c’est, bien Ă©videmment, celui des RFC.

      Il y a des personnes qui recommandent de conserver le texte en texte brut, compte tenu des limitations du format, ce n’est pas franchement conseillĂ© pour des documents un peu complexes Ă©tant donnĂ© qu’il y aura Ă©normĂ©ment de pertes d’information.

      Le RTF

      En 1987, Microsoft lance le Rich Text Format (RTF) qui permettait d’avoir du texte « enrichi Â» avec des attributs : gras, italique, soulignĂ© et de dĂ©passer le cadre du texte brut. C’est un format qui a Ă©tĂ© pendant un certain temps, un standard d’échange de fait pour ce type de fichiers. Il Ă©tait au moins lu par beaucoup de logiciels sur nombre de systĂšmes d’exploitation. C’était un format pratique d’échange, notamment Ă  une Ă©poque oĂč le PDF n’était pas encore un format ouvert et ne pouvait ĂȘtre gĂ©nĂ©rĂ© que via le (cher) logiciel d’Adobe. Et aussi parce que c’était l’époque de la « grande dĂ©mocratisation Â» de l’informatique, et, qu’à vrai dire, les utilisateurices finaux ne savaient pas trop comment, surtout sous quelle forme et ce qui se passait quand on Ă©changeait des fichiers.

      Aussi pratique que soit le format RTF, outre son absence de lĂ©gĂšretĂ©, il Ă©tait nĂ©anmoins trĂšs limitĂ© : pas de texte structurĂ© autrement que sur un plan purement visuel, par exemple. Microsoft arrĂȘtera de le maintenir en 2008 (il aura tenu vingt ans tout de mĂȘme !). C’est donc un format mort.

      Le .doc, un format propriétaire incontournable

      Quand Microsoft lance sa suite bureautique dans les annĂ©es 1990 (la date sur la chronologie n’est pas tout Ă  fait exacte), il adopte pour le traitement de texte, Word, l’extension .doc qui avait Ă©tĂ© aussi celle de WordPerfect. Word avait pour lui de montrer le rendu du texte immĂ©diatement : le fameux WYSIWYG pour « What you see is what you get Â» (ce que vous voyez est ce que vous obtenez).

      La suite finit par devenir quasiment incontournable et le format DOC de Word devenir un « standard de fait Â». Microsoft abandonnera le DOC en 2007 pour le DOCX basĂ© sur l’Office Open XML. On produira encore longtemps aprĂšs des fichiers en .doc en vertu du « tout le monde n’a pas la version de MsOffice 2007 Â». On trouve encore sur internet des modĂšles de fichiers Ă  ce format Ă  tĂ©lĂ©charger.

      Il Ă©tait reprochĂ© au format son poids, lourd, des problĂšmes de confidentialitĂ© (on pouvait, par exemple, retrouver du texte effacĂ© avant l’enregistrement ou le modĂšle de l’imprimante5) et sa faiblesse devant les virus. Et, bien entendu, c’était un format propriĂ©taire et pas interopĂ©rable. Un autre dĂ©faut majeur du format Ă©tait qu’il Ă©tait modifiĂ© Ă  chaque nouvelle version de Word ce qui impliquait de devoir acheter la nouvelle version du logiciel pour pouvoir travailler sur les nouveaux fichiers en .doc.

      Microsoft dĂ©livrera les sources du format en 2006, mais les spĂ©cifications semblent ne plus figurer sur le site de la firme. Le code source de la version d’origine de Word, quant Ă  lui, a Ă©tĂ© rendu public et versĂ© au musĂ©e amĂ©ricain de l’histoire de l’ordinateur (en).

      Le .doc peut encore ĂȘtre ouvert et travaillĂ© d’un grand nombre de logiciels. Abiword par exemple ouvre les .doc mais pas les .docx. En revanche, il est de moins en moins possible de gĂ©nĂ©rer des fichiers Ă  ce format, et c’est une bonne chose. On ne saurait que trop vous suggĂ©rer de transformer tous les fichiers en .doc qui traĂźneraient encore dans vos ordinateurs en ODT (ou de faire le mĂ©nage). Il en va de mĂȘme pour le format de modĂšle .dot.

      L’ODT : un format ouvert

      En 2005 apparaĂźt un format bien intĂ©ressant : le format ODT, qui est une des composantes du plus gĂ©nĂ©ral OpenDocument Format (ODF) avec le O d’Open, le D de Document et le T de Texte, l’extension OTT Ă©tant pour les modĂšles avec le premier T pour Template (modĂšle en anglais). L’ODF est gĂ©rĂ© par le consortium OASIS, pour Organization for the Advancement of Structured Information Standards (Organisation pour l’avancement des normes d’informations structurĂ©es).

      OASIS est une structure Ă  but non-lucratif autorisĂ©e par l’ISO (International Standard Organization, l’organisation dont l’objectif social est l’élaboration et la publication de normes mondiales de produits et services), Ă  publier des standards dont les spĂ©cifications sont publiquement disponibles sans passer par les fourches caudines de l’ISO. Le consortium a Ă©tĂ© crĂ©Ă© en 1993, il s’appelait Ă  l’époque SGML Open. Il Ă©tait constituĂ© de fournisseurs et d’utilisateurs d’outils informatique, son but Ă©tait le dĂ©veloppement de lignes directrices pour l’interopĂ©rabilitĂ© de logiciels utilisant le langage de balisage SGML. Il change de nom en 1998 pour devenir OASIS qui reflĂšte mieux les travaux du consortium. Parmi les cent-seize membres (l’adhĂ©sion est payante) : Ă  peu prĂšs toutes les grandes entreprises de l’informatique amĂ©ricaine et quelques chinoises ou japonaises (Alibaba, Hitachi, Huawei, Fujitsu
) mais aussi des organismes tels que le Parlement europĂ©en, l’Office des publications europĂ©ennes, le MinistĂšre français de l’IntĂ©rieur, le FBI, des universitĂ©s (Brno, Milan, Luxembourg, Oslo, Westminster, MIT, etc.), la Biblioteca del Congreso Nacional du Chili, TheDocumentFoundation, etc. Il existe en outre une fondation europĂ©enne Ă  but non lucratif OASIS Open Europe (en) affiliĂ©e au consortium et dont l’objectif est de soutenir le rĂŽle de l’Europe dans le dĂ©veloppement de l’open source et des normes ouvertes.

      La version 1.0 du format OpenDocument (ODF) pour les applications bureautiques a Ă©tĂ© approuvĂ©e le 1er mai 2005 Ă  l’unanimitĂ© des soixante-dix-huit membres ayant votĂ©. La version 1.0 des directives pour l’accessibilitĂ© du format ODF, quant Ă  elle a Ă©tĂ© approuvĂ©e Ă  l’unanimitĂ© des onze membres ayant votĂ© le 1á”‰Êł mai 2008. La derniĂšre version du format ODF est la 1.3 (en), approuvĂ©e le 27 avril 2021. LibreOffice l’a intĂ©grĂ© Ă  partir des versions 7, pratiquement Ă  la sortie de la norme, c’est le format d’enregistrement par dĂ©faut. La norme ODF 1.3 a mis notamment l’accent sur la signature et le chiffrage des documents.

      Le format ODF est basĂ© sur le XML. C’est un fichier « compressĂ© Â» qui en contient plusieurs6 :

      • le fichier meta.xml contient des informations au sujet du document (l’auteur, la date de la derniĂšre sauvegarde),
      • le fichier styles.xml contient les styles utilisĂ©s dans le document,
      • le fichier content.xml contient le contenu principal du document (texte, tableaux, Ă©lĂ©ments graphiques
),
      • le fichier settings.xml, en gĂ©nĂ©ral spĂ©cifique Ă  une application, contient certains paramĂštres tels que l’imprimante sĂ©lectionnĂ©e
,
      • les fichiers META-INF/manifest.xml contiennent des informations supplĂ©mentaires sur les autres fichiers (comme le type MIME ou le chiffrement).

      Plus des dossiers : Pictures, Thumbnails, etc.

      Ce format est le format natif notamment de LibreOffice, OpenOffice7, Calligra, Collabora Online, GoogleDocs, Zoho, il est aussi ouvert, travaillé et enregistré par des logiciels tels que MsOffice depuis 2007 (2016 pour la version pour MacOS), Office365, OnlyOffice ou AbiWord (listes non limitatives).

      L’une de ses trĂšs grandes forces est, qu’à l’instar du format HTML, toute la mise en forme repose sur des styles. Ce qui rend trĂšs Ă©volutifs et adaptables les documents au format ODT (pour peu qu’ils le soient avec un logiciel qui le gĂšre bien).

      En France, le format ODF est le seul format bureautique recommandĂ© par le rĂ©fĂ©rentiel gĂ©nĂ©ral d’interopĂ©rabilitĂ©. Le format ODT Ă©tant mentionnĂ© comme format Ă  privilĂ©gier par nombre d’administrations de par le monde.

      Le format DOCX et son OOXML

      L’annĂ©e 2007 est celle qui « rĂ©volutionne Â» la suite bureautique de Microsoft. En effet, la firme abandonne les vieux formats pour en adopter des nouveaux basĂ©s sur le XML d’oĂč le X de l’extension. Mais pas n’importe quel XML, le XML maison appelĂ© Office Open XML (OOXML pour faire court). Il est fort probable que, ce faisant, l’idĂ©e Ă©tait de court-circuiter le standard ODF. Microsoft a d’ailleurs livrĂ© une guerre fĂ©roce pour que son OOXML soit acceptĂ© par l’ISO en s’y reprenant Ă  deux fois. La norme, adoptĂ©e le 17 aout 2008, porte le numĂ©ro ISO/IEC DIS 29500. Il est possible (probable ?) Ă©galement que, Word Ă©tant ce qu’il est, se baser sur le XML de l’ODT aurait vraisemblablement nĂ©cessitĂ© un grand travail de refonte du logiciel. Il existe deux « variantes Â» de DOCX, le premier, celui de la version 2007 et celui de 2010. En effet, la norme ISO/IEC DIS 29500 n’est pas compatible avec Office 2007.

      Sur le plan technique, il est reprochĂ© Ă  l’OOXML sa complexitĂ© qui en rend difficile la mise en Ɠuvre. À tel point qu’il se dit que Microsoft lui-mĂȘme ne l’implĂ©mente pas correctement. La derniĂšre version d’OOXML est actuellement la rĂ©fĂ©rence ISO/IEC 29500-1:2016 (en) de novembre 2016 (elle fait 5024 pages).

      Sur le plan juridique, le caractĂšre libre de la norme est flou, il en ressort une certaine instabilitĂ© sur ce plan. Avec les spĂ©cifications, Microsoft a distribuĂ© :

      un document promettant de ne pas poursuivre les auteurs de l’utilisation d’Office Open XML dans un autre logiciel que ceux de Microsoft. Cette promesse de non-poursuite elle-mĂȘme laisse certains flous, notamment :
      ‱ s’appliquant Ă  la norme ECMA en l’état, s’applique-t-elle Ă  une Ă©ventuelle version finale de l’ISO ?
      ‱ s’applique-t-elle Ă  tous les brevets logiciels nĂ©cessaires Ă  la mise en Ɠuvre de la norme ?
      ‱ s’applique-t-elle Ă©galement aux extensions du format OOXML ?
      La licence d’utilisation de OpenXML est incompatible avec les programmes sous la licence GPL.8

      À l’instar des fichiers ODF, le DOCX est un fichier compressĂ© qui en contient plusieurs. On en trouvera l’anatomie (en) par exemple sur le site Office Open XML (en).9

      Il est actuellement ouvert, voire travaillé et enregistré, de la plupart des suites bureautiques.

      Des langages de balisages

      Parler des formats de texte sans évoquer les langages de balisage serait assez inepte puisque les formats modernes sont basés dessus. Pour rappel, un langage de balisage est un langage servant à définir et à structurer les informations dans un document.

      Il en existe de nombreux, mais on n’évoquera que ceux qui semblent les plus connus ou les plus utilisĂ©s.

      TeX le grand ancien

      TeX fait figure de grand ancien, puisque la premiĂšre version du langage de balisage date de 1978. Cela dit, on devrait peut-ĂȘtre plutĂŽt parler « d’écosystĂšme Â» car c’est Ă  la fois un format, le langage de balisage utilisĂ© par LaTeX et un logiciel libre de composition. TeX a Ă©tĂ© crĂ©Ă© par Donald E. Knuth, professeur Ă©mĂ©rite Ă  l’UniversitĂ© de Stanford et considĂ©rĂ© comme l’un des pionniers de l’algorithmique. L’objectif de Donald E. Knuth en crĂ©ant TeX Ă©tait d’avoir des documents scientifiques et techniques de bonne qualitĂ© typographique, ce qu’il n’était pas possible d’obtenir avec les logiciels d’édition de l’époque. Le principe du langage TeX est la sĂ©paration du contenu de et la forme, ce qui Ă©tait innovant.

      TeX est complĂ©tĂ© par LaTeX qui est « un ensemble de macros permettant de faire beaucoup de choses Â»10, et, bien sĂ»r, par le langage de composition de polices vectorielles Metafont. LaTeX a Ă©tĂ© dĂ©veloppĂ© par Leslie Lamport. La premiĂšre version est sortie en 1983.

      Ce n’est pas un traitement de texte, l’idĂ©e Ă©tant que l’auteur ou l’autrice :

      puisse mettre son Ă©nergie Ă  rĂ©diger le contenu sans ĂȘtre distrait par l’apparence de son document. En Ă©crivant en langage LaTeX, l’utilisateur doit donc dĂ©finir sĂ©mantiquement le contenu de son document plutĂŽt que visuellement. DMS, UniversitĂ© de MontrĂ©al.

      On peut générer des fichiers TeX soit directement avec un éditeur de texte, soit avec des logiciels comme Lyx ou encore Overleaf qui est un éditeur LaTeX en ligne et collaboratif. Mais, pour en voir le rendu, il faudra soit faire un PDF, si on utilise un éditeur de texte, soit passer par le visualiseur, quand il existe, dans un logiciel tel que Lyx.

      À ma connaissance la plupart des suites bureautiques ne l’acceptent pas, pas plus que Calibre d’ailleurs.

      La derniÚre version de TeX, 3,143.141592653 date de janvier 2021. Le format est géré par le groupe des utilisateurs de TeX ou TUG (en). LaTeX quant à lui est géré par le projet LaTeX (en). La derniÚre version date de juin 2024.

      Le SGML et ses petits

      Le SGML, S pour Standard, G pour Generalized, M pour Markup et L pour Langage (langage de balisage gĂ©nĂ©ralisĂ© normalisĂ©) possĂšde le numĂ©ro de norme ISO 8879:1986. 1986 Ă©tant l’annĂ©e d’obtention du numĂ©ro ISO, la premiĂšre version du SGML Ă©tant sortie en 1978. Produit de l’industrie de l’édition, il a adoptĂ©, comme TeX, le principe de la sĂ©paration complĂšte du fond et de la forme. C’est, en fait, une norme permettant de dĂ©finir des langages de balisage gĂ©nĂ©riques pour des documents. SGML sera, dĂšs 1984, le format standard des publications officielles des CommunautĂ©s europĂ©ennes.

      Ce qui caractĂ©rise un document SGML : il doit possĂ©der une « dĂ©finition du type de document Â» (DTD ou doctype en anglais). Cette DTD sert Ă  indiquer la structure du document. Et, Ă©videmment le systĂšme de balises que l’on va retrouver chez les membres de la famille.

      HTML, sans lequel, possiblement, LinuxFr.org ne serait pas

      Le langage HTML, pour HyperText Markup Language, est un langage de balisage pour l’hypertexte, cette fonctionnalitĂ© qui permet de naviguer sur internet. Il a Ă©tĂ© crĂ©Ă©, ou plutĂŽt lancĂ© au dĂ©but des annĂ©es 1990 par Tim Berners-Lee qui en a profitĂ© pour concevoir au passage la forme des adresses Web que nous connaissons (les URL) et le protocole de communication HTTP.

      Le format HTML est gĂ©rĂ© par le World Wide Web Consortium (W3C) fondĂ© en 1994 par Tim Berners-Lee. L’objectif du W3C : Ă©mettre des normes et des recommandations pour le web.

      La premiĂšre version de HTML Ă©tait trĂšs limitĂ©e : cela n’allait pas plus loin que la structure du texte avec les balises de titres et de listes, et les liens hypertextes.

      En 1999, sort la version 4 (en) qui deviendra une norme ISO en 2000. La norme HTML 4 supporte pleinement le langage de mise en forme CSS (Cascading Style Sheet ou feuilles de style en cascade). Le HTML 4 existe en trois variantes, si on peut dire :

      • le HTML strict qui exclut les Ă©lĂ©ments de « prĂ©sentation Â» puisque qu’il revient au CSS de faire le travail de mise en forme,
      • le HTML transitionnel accepte quelques balises de prĂ©sentation obsolĂštes hĂ©ritĂ©es du HTML 3,
      • frameset qui normalise les jeux de cadre, les «frames Â».

      La derniĂšre version de HTML est le HTML 5 publiĂ© en 2012. Il ne remplace pas le HTML 4.1 : les deux standards coexistent. HTML 5 apporte en plus des fonctionnalitĂ©s d’animations complexes, multimĂ©dia avec de l’audio et de la vidĂ©o, etc. jusque-lĂ  assurĂ©es notamment par le logiciel privateur Flash. HTML 5 s’est aussi Ă©loignĂ© du SGML.

      XML le futur du HTML

      C’est, en tout cas, ainsi que s’intitulait en 1998 un article (en) de Todd Freter (en) directeur de programme chez Sun Microsystem. DĂ©fini comme un sous-ensemble de SGML, « le XML a Ă©tĂ© conçu pour ĂȘtre facile Ă  mettre en Ɠuvre et interopĂ©rable avec SGML et HTML Â»11. De fait les syntaxes HTML et XML sont les mĂȘmes. L’une des diffĂ©rences fondamentales entre les deux Ă©tait, au dĂ©part, qu’il Ă©tait possible de dĂ©finir ses propres balises avec XML, mais pas avec HTML. Un comportement qui a Ă©tĂ© modifiĂ© en 2014 pour HTML avec les Web Components (en).

      XML (eXtensible Markup Language) a Ă©tĂ© dĂ©veloppĂ© par un groupe de travail pilotĂ© par le W3C Ă  partir de 1996, avec, comme prĂ©sident, Jon Bosak (en) de Sun Microsystems. Les objectifs, Ă  sa sortie en 1998, Ă©taient les suivants selon la Recommandation du W3C du 10 fĂ©vrier 1998 :

      1. XML devrait pouvoir ĂȘtre utilisĂ© sans difficultĂ© sur Internet ;
      2. XML devrait soutenir une grande variĂ©tĂ© d’applications ;
      3. XML devra ĂȘtre compatible avec SGML ;
      4. Il devrait ĂȘtre facile d’écrire des programmes traitant les documents XML ;
      5. Le nombre d’options dans XML doit ĂȘtre rĂ©duit au minimum, idĂ©alement Ă  aucune ;
      6. Les documents XML devraient ĂȘtre lisibles par l’homme et raisonnablement clairs ;
      7. La conception de XML devrait ĂȘtre prĂ©parĂ©e rapidement ;
      8. La conception de XML sera formelle et concise ;
      9. Il devrait ĂȘtre facile de crĂ©er des documents XML ;
      10. La concision dans le balisage de XML est de peu d’importance.

      Qu’en est-il aujourd’hui de ces principes ?

      En fonction de la syntaxe XML du document, s’il est transmis avec le type MIME text/html, il est vu par les navigateurs comme un fichier HTML. En revanche, s’il est transmis avec un type XML MIME, il sera traitĂ© comme un document XML. Dans le deuxiĂšme cas de figure, des erreurs de syntaxe mĂȘme mineures empĂȘcheront un document Ă©tiquetĂ© XML d’ĂȘtre correctement restituĂ© alors qu’elles seraient ignorĂ©es dans la syntaxe HTML. L’objectif 1, n’est donc pas atteint et XML ne remplace dĂ©finitivement pas HTML. En revanche, XML est effectivement trĂšs utilisĂ© : outre les formats ODF et OOXML, c’est le langage sur lequel est basĂ© le format SVG (Scalable Vector Graphics, ou, en français graphique vectoriel adaptable) et c’est le format de rĂ©fĂ©rence pour l’échange de donnĂ©es. Mais, pour ce qui est de la lisibilitĂ© du format par des yeux humains, elle n’est pas toujours au rendez-vous.

      XML est maintenu par le W3C. La derniÚre version (en) porte le numéro 1.1, elle est sortie le 29 septembre 2006.

      Langages de balisage léger

      Les langages de balisage lĂ©ger sont conçus pour ĂȘtre facile Ă  utiliser avec un Ă©diteur de texte. La syntaxe en est simple.

      Le MarkDown, peut-ĂȘtre le plus connu d’entre eux, a Ă©tĂ© crĂ©Ă© en 2004 par le programmeur amĂ©ricain John Gruber; aidĂ© d’Aaron Swartz. Il n’a pas subi d’évolution importante depuis. En revanche, il en existe des variantes. John Gruber le dĂ©finit comme :

      un outil de conversion de texte en HTML destinĂ© Ă  la rĂ©daction Web. Markdown vous permet d’écrire en utilisant un format de texte brut facile Ă  lire et Ă  Ă©crire, puis de le convertir en XHTML (ou HTML) structurellement valide. Daring Fireball (en).

      Pour en savoir plus sur la syntaxe MarkDown, on peut, trÚs profitablement, se référer au wiki de LinuxFr.org.

      Il en existe d’autres comme txt2tags crĂ©Ă© en 2001 ou encore AsciiDoc (en) dont la premiĂšre version date de 2002. Txt2tags (en) est un logiciel gĂ©nĂ©rateur de documents Ă©crit en Python et qui utilise un langage de balisage lĂ©ger comme source. Quant Ă  AsciiDoc, il se veut un langage particuliĂšrement adaptĂ© Ă  la rĂ©daction de documentations techniques. Il existe aussi le langage de balisage du CMS (gestion de contenu web) SPIP, nĂ© en 2001.

      L’archivage et la conservation des textes

      Il est ici, Ă©videmment question des formats d’archivage des textes, avec ou sans images, tableaux, formules de mathĂ©matiques, etc. Avant d’aborder cette question : une dĂ©finition s’impose. Il ne s’agit pas des formats dits d’archives de type .zip, .rar, .tar etc. Archiver les textes c’est, dans ce contexte, pouvoir les conserver et y accĂ©der sans avoir besoin de l’application qui a servi Ă  les gĂ©nĂ©rer. Et ce soit en conservant la mise en page d’origine, comme pour le PDF, soit en laissant Ă  l’outil de lecture la main pour la mise en page. Chaque format a ses spĂ©cificitĂ©s. Mais de toute façon :

      un bon format de prĂ©servation, c’est un bon format tout court. Outils open source nombreux, mĂ©tadonnĂ©es internes bien foutues, dĂ©marche collective de normalisation
 Bertrand Caron, archiviste numĂ©rique Ă  la BnF, janvier 2024.

      EPUB

      L’EPUB, pour Electronic PUBlication, est un format de document numĂ©rique qui n’est pas destinĂ© Ă  l’impression. L’une de ses spĂ©cificitĂ©s est, notamment, de laisser Ă  l’utilisatrice ou l’utilisateur le choix du rendu du fichier. Il existe, toutefois, un mode « fixed-layout Â» qui fige la mise en forme de l’EPUB. Ce mode a Ă©tĂ© conçu pour les publications qui nĂ©cessitent que la mise en page soit respectĂ©e, comme certaines publications scolaires. Mais cela rĂ©clame une mise en page adaptĂ©e aux tailles des Ă©crans des appareils de lecture.

      EPUB a succĂ©dĂ© au format OeB (Open eBook). Au dĂ©part, gĂ©rĂ© par l’International Digital Publishing Forum (IDPF) qui sera intĂ©grĂ© au W3C en 2017. La premiĂšre version sort en 2007, suivie, en 2010 par l’EPUB2 et, en 2011, par l’EPUB3. Il a Ă©tĂ© trĂšs vite adoptĂ©. Aujourd’hui les deux versions coexistent, l’EPUB2 prĂ©dominant encore sur l’EPUB3. Le format est basĂ© sur XML et sur HTML. Un fichier EPUB est un fichier zip qui contient plusieurs fichiers et rĂ©pertoires dont un dossier META-INF qui contient un fichier container.xml, ce dossier n’apparait pas quand on gĂ©nĂšre un fichier Ă  partir de Sigil d’ailleurs. Les fichiers de texte sont au format XHTML.

      Qu’apporte l’EPUB3 par rapport Ă  l’EPUB2 ? Les Ă©volutions concernent principalement l’accessibilitĂ© et l’intĂ©gration de contenus audio ou vidĂ©o. Ainsi les formules de mathĂ©matiques qui, en EPUB2 sont converties en images, donc illisibles sans yeux, sont gardĂ©es en tant que telles avec EPUB3. Les liseuses ne supportent pas forcĂ©ment toutes les fonctions, notamment multimĂ©dias.

      Il est possible d’y ajouter diffĂ©rents types de marquage ou de verrous : les DRM Adobe, chĂšres et complexes, les DRM LCP, trĂšs pratiques pour le prĂȘt des livres en bibliothĂšque ou encore des filigranes qui n’imposent aucune limitation aux EPUB. L’apposition d’une DRM a un EPUB est, en principe, une dĂ©cision Ă©ditoriale. Il semble nĂ©anmoins que certaines librairies Ă©prouvent le besoin d’en rajouter. Il convient donc d’ĂȘtre vigilant quand on achĂšte un EPUB si on veut Ă©viter d’avoir un livre avec une DRM. Le livre numĂ©rique reprĂ©sente 10,1 % du chiffre d’affaires de l’édition française en 2023, ce qui inclut les EPUB et les PDF.

      La version la plus rĂ©cente du format EPUB et l’EPUB3.3 sortie en mai 2023. Elle est devenue une Recommandation W3C (en).

      PDF

      L’objectif du format PDF a contrario de celui de l’EPUB est le respect de la mise en page du fichier qui a servi Ă  le gĂ©nĂ©rer. De ce fait, il n’est pas trĂšs lisible sur une liseuse ou sur un tĂ©lĂ©phone.

      La naissance du PDF remonte Ă  1991 et elle est due Ă  John Warnock cofondateur d’Adobe. La premiĂšre version de ce format est sortie en 1992. À l’époque c’était assez fou de pouvoir accĂ©der Ă  un fichier avec sa mise en page d’origine sans qu’il soit nĂ©cessaire d’avoir l’application qui avait servi Ă  le gĂ©nĂ©rer. Il deviendra un standard ouvert gĂ©rĂ© par l’ISO en 2008, numĂ©ro ISO 32000.

      En fait il n’existe pas un, mais plusieurs formats PDF dont :

      • PDF/A pour l’archivage,
      • PDF/E pour les documents techniques,
      • PDF/X pour l’impression,
      • PDF/UA pour l’accessibilitĂ© universelle,
      • ou encore des formulaires FDF.

      La version PDF/A-3 permet d’incorporer le fichier d’origine au PDF : dans l’export PDF de LibreOffice, cela s’appelle un PDF hybride. Cela donne un fichier qui pĂšse deux fois plus lourd, grosso modo, minus le poids des polices embarquĂ©es, que le PDF « simple ». Et, si on ouvre le PDF Ă  partir de l’application qui a servi Ă  le crĂ©er, ou si on clique sur « Cliquer pour les afficher » (ou Ă©quivalent) dans un lecteur de PDF qui le permet, ici Okular, on ouvre le fichier d’origine. Mais, Ă©videmment, quand on le modifie ça ne modifie pas le PDF. Il faut soit gĂ©nĂ©rer un nouveau PDF soit l’écraser.

      À savoir, il n’y a que quatorze polices standard PDF, en fait seulement cinq fontes diffĂ©rentes avec leurs variantes, gras, italiques : Courrier, Helvetica, Times Roman, Symbol et Zapf Dingbats. Il est donc trĂšs important, quand on gĂ©nĂšre un PDF d’incorporer les polices au fichier Ă  condition que cela soit permis par la licence des polices. Pour ne pas alourdir le fichier, il est suggĂ©rĂ© de n’incorporer que les polices utilisĂ©es dans le document. Avec LibreOffice, vous pouvez configurer cela soit en gĂ©nĂ©rant le PDF, soit, de prĂ©fĂ©rence, la premiĂšre fois que vous enregistrez le fichier, c’est dans l’onglet « Police Â» des propriĂ©tĂ©s dudit fichier. Si vous utilisez un modĂšle, la case peut avoir Ă©tĂ© cochĂ©e dans le modĂšle et il ne sera pas nĂ©cessaire de le faire.

      Kurinto une histoire de chasses

      La chasse, en typographie, est l’encombrement d’un caractĂšre : largeur plus approche (espace autour). Pour un mĂȘme corps de caractĂšre (sa hauteur), elle peut varier selon les polices, ce qui, Ă©videmment, peut changer, voire, chambouler, complĂštement un document crĂ©Ă© avec une police et pour lequel on a changĂ© la typographie. La collection de polices Kurinto (en) a Ă©tĂ© dessinĂ©e Ă  la fois pour couvrir un large Ă©ventail de langues et de systĂšmes d’écriture et dans l’optique de pouvoir remplapcer les polices Microsoft avec des glyphes qui ont la mĂȘme chasse.

      Si vous cherchez des polices au dessin Ă©lĂ©gant pour remplacer des fontes comme le couple Arial/Times New Roman, avoir aussi des typographies Ă  chasse fixe ou lĂ©gĂšrement fantaisie, l’ensemble de polices Kurinto est un bon choix qui offre en prime une bonne cohĂ©rence entre les diverses polices. Elles sont sous licence SIL.

      DĂ©clinaison des noms des polices Kurinto permettant de voir leurs chasses respectives

      Les textes et documents qui ont servi Ă  alimenter cette dĂ©pĂȘche

      Les rĂ©fĂ©rences sont donnĂ©es Ă  peu prĂšs dans leur ordre d’apparition dans le texte. Ils sont tous accessibles en ligne et, de prĂ©fĂ©rence, en français. Volontairement, il y a un minimum de rĂ©fĂ©rences Ă  WikipĂ©dia. Ce n’est pas tout Ă  fait exhaustif, mais ça vous fera dĂ©jĂ  pas mal de lecture. Par exemple, je n’ai pas citĂ© le blog de StĂ©phane Bortzmeyer qui m’a bien servi Ă  dĂ©fricher le terrain.

      Les formats matériels

      • Sur les rouleaux notamment leur rangement. Le site Rotulus est consacrĂ© aux rouleaux mĂ©diĂ©vaux.
      • Guide pratique du compositeur d’imprimerie, ThĂ©otiste LefĂšvre, un guide considĂ©rĂ© longtemps comme une, si pas LA, rĂ©fĂ©rence en matiĂšre de typographie et d’imprimerie. Paru en 1855, il fera l’objet de multiples Ă©ditions, les derniĂšres en 2000. Aujourd’hui encore, ses pages sur la typographie peuvent servir de rĂ©fĂ©rences. ThĂ©otiste LefĂšvre Ă©tait le fils d’un apprenti compositeur. Il commencera comme ouvrier en imprimerie pour devenir une figure clĂ© du secteur. Sa fille deviendra correctrice. La version du guide donnĂ©e en tĂ©lĂ©chargement sur le site archive.org est d’assez mauvaise qualitĂ©. De toute façon, avec le texte brut ou la piĂštre qualitĂ© de la reconnaissance des caractĂšres on perd absolument tout ce qui fait l’intĂ©rĂȘt du livre qui donne beaucoup d’exemples.
      • Sur les formats A. Le site donne les dimensions des feuilles de papier en centimĂštres et en pixels.

      Les formats numériques (texte et archivage)

      La police

      Postambule

      La prochaine dĂ©pĂȘche de la sĂ©rie devrait ĂȘtre moins longue (pas difficile) et portera sur le code avant Unicode. Elle parlera donc aussi de football. Comme toujours, vos suggestions sont apprĂ©ciĂ©es.


      1. MOLINIER A. « Les manuscrits et les miniatures Â», BnF Gallica: Librairie Hachette, 1892. Disponible sur : BnF Gallica en PDF ou en texte brut. â†©

      2. L’exemple est reproduit Ă  partir du petit guide de Charles-Lucien Huard La Typographie↩

      3. Pour rappel, un RFC (Request For Comments) est un document qui dĂ©finit les normes techniques sur les lesquelles s’appuient le rĂ©seau Internet↩

      4. ANDRÉ Jacques, « CaractĂšres, codage et normalization. De Chappe Ă  Unicode Â», Document numĂ©rique, 2002/3-4 (Vol. 6), p. 13-49. DOI : 10.3166/dn.6.3-4.13-49.↩

      5. Les formats de texte, archives. â†©

      6. Wiki de LibreOffice↩

      7. À noter qu’OpenOffice, compte tenu de son absence d’évolution ne supporte pas la norme ODF 1.3↩

      8. Office Open XML – DĂ©finition↩

      9. Pour tout dire, mon gestionnaire d’archives Engrampa est incapable d’ouvrir un fichier .docx et l’explication du site, qui n’est pas un site officiel, me semble trĂšs touffue. â†©

      10. LittĂ©ralement : « set of macros to let you do many things Â».What is the difference between TeX and LaTeX? (en)↩

      11. Langage de balisage extensible (XML) 1.0, Recommandation du W3C, 10 fĂ©vrier 1998. â†©

      Commentaires : voir le flux Atom ouvrir dans le navigateur

      Kernel Recipes 2024 : il reste des places !

      20 juin 2024 Ă  07:48

      La 11ᔉ Ă©dition de Kernel Recipes aura lieu du 23 au 25 septembre 2024, Ă  la Fondation Biermans LapĂŽtre, Ă  Paris.

      Nous entamons la deuxiĂšme dĂ©cennie de la confĂ©rence, avec toujours autant de plaisir Ă  organiser et rĂ©unir orateurs et participants pour trois jours de convivialitĂ© et d’échanges.

      Kernel Recipes 2024

      Notre parrain cette annĂ©e est Arnaldo CARVALHO DE MELO (acme), contributeur au noyau. Il nous a accompagnĂ© d’une main de chef sur la prĂ©paration de l’agenda 2024.

      Encore une trĂšs belle affiche qui nous l’espĂ©rons vous plaira, dans la salle, lors du live stream ou des vidĂ©os en ligne plus tard : Maira CANAL, Himadri SPANDYA, Jose MARCHESI, Anel ORAZGALIYEVA, David VERNET, Steven ROSTEDT, Andrea RIGHI, Greg KH, Neeraj UPADHYAY, Paul MCKENNEY, Andrii NAKRYIKO, Pavel BEGUNKOV, Jens AXBOE, Breno LEITAO, Vlastimil BABKA, Arnaldo CARVALHO DE MELO, Sebastian ANDRZEJ, Derek BARBOSA, Guilherme AMADIO


      Également prĂ©sents, Frank TIZZONI pour saisir au vol de maniĂšre impitoyable les participants et les orateurs et Anisse ASTIER qui proposera Ă  nouveau son excellent live blog.

      Enfin un immense merci aux sponsors qui nous supportent à nouveau cette année et rendent possible cette conférence : la fondation eBPF, ARM, AMD, Collabora, Meta, Haproxy, Jumptrading, Criteo engineering, Igalia, Cyberzen

      La gestion du son et des images sera proposée par Uweti.

      Commentaires : voir le flux Atom ouvrir dans le navigateur

      Revue de presse de l’April pour la semaine 22 de l’annĂ©e 2024

      3 juin 2024 Ă  23:58

      Cette revue de presse sur Internet fait partie du travail de veille menĂ© par l’April dans le cadre de son action de dĂ©fense et de promotion du logiciel libre. Les positions exposĂ©es dans les articles sont celles de leurs auteurs et ne rejoignent pas forcĂ©ment celles de l’April.

      [ZDNET] Libre et open source express: OpenStreetMap, Panoramax, Signal, Murena, mentorat

      ✍ Thierry Noisette, le vendredi 31 mai 2024.

      Journées OpenStreetMap. La FAQ de Panoramax. Meredith Whittaker (Signal) et la concentration des IA. Gaël Duval et les smartphones Murena. Plaidoyer pour le mentorat des contributeurs occasionnels.

      [SiĂšcle Digital] Comment Mistral AI part Ă  la conquĂȘte de l'AmĂ©rique

      ✍ Benjamin Terrasson, le jeudi 30 mai 2024.

      Mistral AI commence a Ă©toffĂ© ses Ă©quipes aux États-Unis pour s’imposer sur place en alternative aux IA des gĂ©ants du web.

      [Les Echos] Comment créer une communauté puissante et développer son business

      ✍ NoĂ©mie Kempf, le mardi 28 mai 2024.

      A partir de l’exemple de Linux, NoĂ©mie Kempf, autrice du «Pouvoir des communautĂ©s»*, explique comment l’approche communautaire peut favoriser le dĂ©veloppement de votre entreprise.

      [ZDNET] Bureautique et collaboration: la Dinum déroule La Suite Numérique

      ✍ Louis Adam, le lundi 27 mai 2024.

      DerriĂšre ce terme, la direction interministĂ©rielle du numĂ©rique regroupe une suite d’outils bureautique et de collaboration Ă  destination des agents publics. Voici ce qu’il contient.

      Commentaires : voir le flux Atom ouvrir dans le navigateur

      Les prochaines fonctionnalités de Firefox dévoilées

      Mozilla, par l’intermĂ©diaire de son Community Manager, vient de lever le voile sur les prochaines fonctionnalitĂ©s du Navigateur Firefox et des prioritĂ©s de l’équipe de dĂ©veloppement. Les maĂźtres-mots des amĂ©liorations Ă  venir sont la productivitĂ©, la personnalisation, la simplicitĂ© et la performance. La feuille de route met aussi l’accent sur la compatibilitĂ© inter-navigateurs et l’utilisation de l’IA locale pour amĂ©liorer l’accessibilitĂ© et prĂ©server la confidentialitĂ© des utilisateurs.

      Illustration d’un navigateur Firefox ouvert sur une page d’accueil. La fenĂȘtre du navigateur est stylisĂ©e en 3D, avec le logo Firefox visible en haut au centre. La page montre une barre de recherche et plusieurs icĂŽnes de raccourcis en bleu et en vert. En arriĂšre-plan, des formes gĂ©omĂ©triques 3D comme des cubes et des sphĂšres flottent dans un espace violet.

      Rentrons un peu plus dans le détail.

      Petit zoom sur les nouvelles fonctionnalités

      • CĂŽtĂ© productivitĂ©, notons du neuf du cĂŽtĂ© des onglets
        • Le regroupement d’onglets,
        • Les onglets verticaux
        • mais aussi un nouveau systĂšme de gestion des profils pour mieux sĂ©parer les contextes de navigations (par exemple scolaire, professionnel ou encore personnel) tout en les rendant facilement accessibles.
      • Pour la personnalisation, les fonds d’écran personnalisables Ă  l’ouverture d’un nouvel onglet dĂ©barquent, comme ce qui se fait Ă  la concurrence. Ceux qui comme moi utilisent des extensions de type Tabliss ne verront pas la diffĂ©rence.
      • Des paramĂštres de confidentialitĂ© qui se voudront plus intuitifs afin de mieux comprendre et utiliser les technologies anti-pistage du navigateur.
      • Une rationalisation des menus pour rĂ©duire l’encombrement visuel et donner la prioritĂ© aux principales actions de l’utilisateur.

      L’Intelligence Artificielle (IA) est aussi de la partie, mais de maniĂšre prudente et mesurĂ©e. Dans les tuyaux, l’IA locale sera mise Ă  l’épreuve pour amĂ©liorer l’accessibilitĂ© (gĂ©nĂ©ration de texte alternatif) tout en prĂ©servant la confidentialitĂ© des utilisateurs (au mĂȘme titre que la fonctionnalitĂ© de traduction de site rĂ©alisĂ©e localement par exemple).

      Sous le capot, l’équipe de dĂ©veloppement veut encore accĂ©lĂ©rer le dĂ©marrage et le chargement des pages et Ă©conomiser la batterie de nos prĂ©cieux. Ils se targuent d’une amĂ©lioration des temps de rĂ©ponse de 20% sur Speedometer 3. Ils travaillent aussi avec le projet Interop pour amĂ©liorer la compatibilitĂ© inter-navigateurs et faciliter la vie des dĂ©veloppeurs web. C’est dans ce contexte qu’a Ă©tĂ© ajoutĂ© la fonctionnalitĂ© pour leur remonter facilement des sites qui dysfonctionnent.

      Hic et nunc

      Pour les plus impatients d’entre vous, certaines de ces nouvelles fonctionnalitĂ©s sont dĂ©jĂ  en cours de dĂ©veloppement et peuvent ĂȘtre accĂ©dĂ©es via les canaux beta et nightly, en jouant Ă©ventuellement avec les entrĂ©es du about:config, avec tous les risques d’instabilitĂ© et de perte de donnĂ©es que cela comporte, vous ĂȘtes prĂ©venus.

      Commentaires : voir le flux Atom ouvrir dans le navigateur

      L’écriture et l’image, des Ăąges farouches au texte Ă©lectronique

      Dans cette nouvelle excursion du Transimpressux, nous voyagerons chez les Mayas de l’époque prĂ©-colombienne ainsi que dans la Rome antique. Nous ferons un rapide tour des monastĂšres mĂ©diĂ©vaux, nous irons rendre une courte visite Ă  Aloys Senefelder Ă  Munich. Nous en profiterons pour aller voir Isaac Newton, Tintin et AstĂ©rix et on terminera notre voyage Ă  Kreutzal, en Allemagne. On n’y parlera pas de Rahan, quoique. On aura compris qu’il sera question d’image, d’écriture et de texte.

      Le bar du Transimpressux vous propose un vaste Ă©chantillon issu du pas si grand livre des recettes de LinuxFr.org. En espĂ©rant qu’à la lecture de cette dĂ©pĂȘche vous aurez fait un beau voyage.

      Train jaune

      Sommaire

      Préambule

      Au dĂ©part, j’avais prĂ©vu de parler aussi de formats, mais, Ă  l’arrivĂ©e, c’est dĂ©jĂ  bien long. La question des formats fera donc l’objet d’une autre dĂ©pĂȘche de la sĂ©rie.

      J’utilise indiffĂ©remment les termes de fonte, police, police de caractĂšre ou typographie. Et, comme il sera question de pĂ©riodes trĂšs Ă©loignĂ©es dans le temps, celles antĂ©rieures Ă  notre Ăšre seront indiquĂ©es sous la forme AEC (avant l’ùre commune).

      Quelques définitions avant de commencer

      Il est possible que certaines notions ne vous soient pas claires, ces quelques dĂ©finitions vous seront peut-ĂȘtre utiles.

      L’écriture et l’image, des concepts diffĂ©rents vraiment ?

      L’écriture n’est pas de l’image, l’image n’est pas de l’écriture. Oui et non.

      L’exemple des hiĂ©roglyphes mayas

      Le systĂšme d’écriture maya n’est pas purement logographique. D’ailleurs est-ce qu’un systĂšme d’écriture uniquement logographique ou pictographique existe vraiment ? On a vu prĂ©cĂ©demment sur LinuxFr.org concernant les systĂšmes d'Ă©criture que les hiĂ©roglyphes Ă©gyptiens et les sinogrammes n’étaient pas composĂ©s que de pictogrammes, mais qu’ils allaient de pair avec d’autres signes, notamment phonographiques. Il en va de mĂȘme avec l’écriture maya qui

      est un systĂšme graphique normalisĂ© qui, au moyen de quelques centaines de « signes-mots Â» (ou logogrammes) et environ 150 phonogrammes marquant des syllabes de type Consonne-Voyelle1.

      L’écriture maya est apparue, Ă  notre connaissance vers 400 AEC et a Ă©tĂ© utilisĂ©e jusqu’au XVIIe siĂšcle oĂč l’envahisseur espagnol a tout fait pour l’éradiquer, y compris en brĂ»lant des codex. Entre les Espagnols et le climat chaud et humide de la sphĂšre d’influence maya, on ne connaĂźt plus que trois codex mayas prĂ©colombiens2 : le codex de Dresde, celui de Paris et celui de Madrid. Un quatriĂšme codex, le codex Grolier, conservĂ© Ă  Mexico est sujet Ă  controverses, sa datation et son authenticitĂ© ne sont pas certaines. Mais on retrouve aussi l’écriture maya sur des monuments et du mobilier. On trouve Ă©galement des graffitis, signe, sans doute, d’un certain niveau d’alphabĂ©tisation de la population maya. L’écriture maya devait transcrire plusieurs langues amĂ©rindiennes, lesquelles langues ont toujours des locuteurs.

      codex de Paris
      Deux pages du codex de Paris

      Pour autant qu’on sache, pour les Mayas, leur Ă©criture tout au moins, l’image Ă©tait importante. Selon Jean-Michel Hoppan :

      Cette Ă©criture est rigoureuse et, tout Ă  la fois, trĂšs souple. Elle n’est pas normalisĂ©e, au contraire de l’idĂ©e qu’on se fait habituellement d’une Ă©criture. Le scribe peut privilĂ©gier l’esthĂ©tisme au dĂ©triment de la comprĂ©hension immĂ©diate (en tout cas pour nous). C’est encore plus Ă©vident sur les cĂ©ramiques, oĂč le texte est parfois complĂštement inintelligible. Le glyphe est lĂ , toujours chargĂ© du pouvoir de l’écrit, mais le contenu de la parole n’est plus. Il devient image. Il y a une grande partie de la cĂ©ramique oĂč l’on voit de l’écriture, mais qui, de fait, est constituĂ©e de pseudoglyphes.3

      Les hiĂ©roglyphes mayas n’ont pas de bloc Unicode, mĂȘme si les chiffres y figurent depuis la version 11.0 (juin 2018). Un billet du blog du consortium (en) du 23 janvier 2020 annonçait l’existence d’une subvention « pour restituer numĂ©riquement des Ă©critures historiques et modernes supplĂ©mentaires, y compris des hiĂ©roglyphes mayas. Â». L’idĂ©e Ă©tant aussi de faire progresser la recherche de la connaissance de l’écriture et de la culture maya sur les sites de la pĂ©riode 250 – 900, une Ă©tape importante pour dĂ©terminer les signes Ă  intĂ©grer Ă  Unicode, et d’aboutir Ă  la crĂ©ation de polices OpenType. La derniĂšre version de la norme Unicode, 15.1.0, date du 12 septembre 2023, un peu juste pour incorporer les hiĂ©roglyphes mayas quand on sait que la crĂ©ation d’une police peut prendre de quatorze Ă  seize mois.

      Le contre exemple romain

      L’alphabet latin puise ses origines dans l’alphabet Ă©trusque, qui, lui-mĂȘme, provient du systĂšme d’écriture grecque et c’est, bien entendu, celui que nous utilisons sur LinuxFr.org (le latin, pas le grec, suivez un peu). C’est celui de l’ASCII. Il figure dans l’Unicode, Ă©videmment, oĂč il dispose de plusieurs blocs. Le bloc latin de base contient en fait tous les caractĂšres et commandes de l’ASCII. Il n’a pas Ă©tĂ© modifiĂ© depuis la version 1.0.0 d’Unicode.

      D’aprĂšs les Ă©crits qui nous sont arrivĂ©s, les Romains avaient une vision trĂšs « utilitariste Â» de l’écriture. Pour eux (les Ă©crits qui nous sont parvenus sur le sujet proviennent essentiellement d’hommes) :

      l’écriture est essentiellement destinĂ©e Ă  (
) reprĂ©senter [le langage]. De plus, dans sa version alphabĂ©tique, qui est Ă  peu prĂšs la seule Ă  laquelle pensent les Latins, l’écriture est une notation des sons, les lettres renvoient Ă  des sons Ă©lĂ©mentaires et l’alphabet correspond terme Ă  terme (en principe) Ă  un inventaire fini de ces sons.4

      Il s’agissait donc pour les anciens Romains non pas de

      faire une science de la langue Ă  travers sa reprĂ©sentation graphique, mais bien une science de l’écrit en tant qu’il renvoie Ă  la langue. (Françoise Desbordes).

      Un support du langage bien imparfait d’ailleurs puisqu’il ne rend pas les effets du discours oral. Et ce facteur explique aussi que la graphie ait mis du temps Ă  se normaliser. L’écrit Ă©tant l’image de l’oral : la langue pouvait ĂȘtre prononcĂ©e par des locuteurs avec des accents diffĂ©rents et s’écrire ainsi en fonction de la prononciation.

      Les Ă©crits des Romains Ă©taient variĂ©s, indĂ©pendamment des discours, naturellement et sous diverses formes : monumentales, tablettes de cire, papyrus, mais aussi graffitis que l’on pouvait retrouver sur les murs des Ă©difices privĂ©s. Des graffitis qui Ă©taient destinĂ©s Ă  ĂȘtre lus et Ă©taient trĂšs liĂ©s Ă  l’oral :

      les messages interpellant parfois nommĂ©ment, au vocatif, une personne – homme ou femme. Ainsi s’explique aussi l’abondance des exclamations (feliciter ! salutem !), des salutations (salve vale !) et des vƓux (votum aux Lares pour la salus du maĂźtre de maison). Leur caractĂšre performatif ne fait pas de doute.5

      graffiti
      Graffiti de Pompéi vantant les exploits sexuels du miles Floronius (CIL, IV, 8767). Wolff 2012, 19, fig. 7.

      La sĂ©paration du texte et de l’image

      Des compétences, des métiers et des techniques différentes.

      Les manuscrits mĂ©diĂ©vaux, une sĂ©paration parfois extrĂȘme

      Le travail de copie des monastĂšres mĂ©diĂ©vaux, notamment (la profession se sĂ©cularisera Ă  partir du XIIIe siĂšcle), diffĂ©rait en fonction des lieux et des Ă©poques. Au dĂ©but, le, ou les copistes, suivant en cela, semble-t-il, les traditions grecques et romaines, Ă©taient Ă©galement chargĂ©s de l’ornementation. Les copistes, parce que la copie d’un manuscrit pouvait ĂȘtre distribuĂ©e en plusieurs cahiers Ă  diffĂ©rents copistes pour accĂ©lĂ©rer le travail de copie. La ponctuation, quant Ă  elle, Ă©tait gĂ©nĂ©ralement du ressort des correcteurs, quand il y en avait, pas des copistes.

      Il arrivait aussi qu’il y ait un copiste pour le texte et un pour les enluminures, surtout pour les manuscrits les plus riches. Dans ce cas, le ou la copiste Ă©crivait la lettre Ă  enluminer et laissait la place nĂ©cessaire, Ă  charge pour l’enlumineur ou l’enlumineuse d’orner le parchemin. Les copies n’étant pas du ressort unique des monastĂšres, les enlumineurs et les enlumineuses Ă©taient souvent des peintres.

      Et parce que le travail Ă©tait ainsi le fait de corps de mĂ©tier diffĂ©rents, il subsiste des manuscrits mĂ©diĂ©vaux pas finis, avec des « blancs Â» pour des enluminures qui ne verront jamais le jour.

      L’imprimerie : des typographies ornementales

      Jusqu’à la fin du XVIIIe siĂšcle, les techniques d’impression ont assez peu Ă©voluĂ©. Il y avait des perfectionnements et des amĂ©liorations, certes, mais, les techniques restaient grosso modo celles de Gutenberg. Les illustrations Ă©taient gravĂ©es Ă  part, puis, aprĂšs la dĂ©couverte fortuite de la lithographie par Aloys Senefelder en 1796 dessinĂ©es sur la pierre, ce qui permettait aux artistes de travailler directement sur la pierre sans avoir Ă  passer par l’intermĂ©diaire d’un graveur. La lithographie permet en effet de dessiner le motif sur la pierre, Ă  l’origine. Senefelder travaillera aussi sur plaque de zinc. La lithographie repose sur le principe de l’antagonisme de l’eau et de la graisse : les zones Ă  imprimer sont traitĂ©s Ă  la graisse, les autres sont mouillĂ©es. L’encre grasse se dĂ©pose ainsi seulement sur les zones grasses.

      Si l’impression en noir et blanc pouvait se faire d’une traite, celle en couleurs, selon les exigences et les techniques utilisĂ©es, pouvait requĂ©rir jusqu’à quatorze opĂ©rations diffĂ©rentes, et presque autant de passages couleurs. L’offset actuel, un procĂ©dĂ© qui dĂ©rive de la lithographie, fonctionne en quadrichromie : cyan, magenta, jaune et noir (CMJN) et autant de passages couleur.

      Les ornements plus susceptibles d’ĂȘtre rĂ©utilisĂ©s : lettrines, culs-de-lampe et autres fleurons, lignes et arabesques faisaient l’objet, quant Ă  eux, de fontes ornementales spĂ©cifiques. Il y avait mĂȘme des graveurs typographes spĂ©cialistes de typographie ornementale comme Joseph-Gaspard GillĂ© (pdf) (1766-1826). Aujourd’hui, ce genre de fonte peut se trouver, dans les blocs Unicode de systĂšmes d’écriture, notamment, latin. On y retrouve d’ailleurs bon nombre de ces polices ornementales purement figuratives mĂȘme si leur dessin ne correspond pas Ă  une lettre. Mais elles pourraient aussi bien figurer dans les flĂšches, les filets, les pavĂ©s, le bloc casseau ou encore les deux zones supplĂ©mentaires.

      Les symboles du zodiaque
      Les symboles du zodiaque de la collection de fontes de Gillé. Les symboles du zodiaque figurent dans les points de code Unicode U+2648 à 2653 (avec des dessins moins figuratifs).

      Toutes les techniques d’imprimerie continuent Ă  exister, de façon plus ou moins anedoctique. Les deux plus rĂ©pandues Ă©tant l’offset, pour les gros volumes, et l’impression numĂ©rique (laser ou jet d’encre). Cette derniĂšre Ă©tant la seule Ă  imprimer les couleurs d’une seule traite.

      La bande dessinĂ©e : des mĂ©tiers diffĂ©rents

      La bande dessinĂ©e ce n’est pas un mĂ©tier mais quatre mĂ©tiers diffĂ©rents qui peuvent ou non, ĂȘtre assurĂ©s par la mĂȘme personne :

      • le scĂ©nario,
      • le dessin,
      • la couleur,
      • et le lettrage qui nous intĂ©resse ici.

      Le lettrage, dans la bande dessinĂ©e ce sont en fait plusieurs types d’écriture :

      le paratexte (titres, signatures, numĂ©rotation), les interventions du narrateur (rĂ©citatifs, didascalies, commentaires), toute la notation des sons (dialogues, onomatopĂ©es, bruits) – le lettrage assume ainsi une part trĂšs importante du « rĂ©gime sonore Â» de la bande dessinĂ©e, au point que l’on appelle « muettes Â» les bandes dessinĂ©es qui n’en comportent pas du tout (puisque le lettrage n’est pas indispensable Ă  la rĂ©alisation d’une bande dessinĂ©e).6

      Gotlib (les Dingodossiers, la Rubrique à brac, Super Dupont, Gai-Luron) est entré en bande dessinée par la voie du lettrage.

      L’élĂšve Chaprot roi
      Un extrait des Dingodossiers de Gotlib, scĂ©nario de Goscinny. L’image comporte des didascalies Ă  gauche et en haut Ă  droite, une bulle de texte, en-dessous, du texte « sonore. Â»

      D’autres auront leur lettreur attitrĂ©, comme HergĂ©. ArsĂšne Lemey a assurĂ© le lettrage de ses Tintin Ă  partir de la version allemande du Secret de la licorne, le onziĂšme album de la sĂ©rie. La police de caractĂšre crĂ©Ă©e par ArsĂšne Lemey pour Tintin est l’Arleson, elle sera intĂ©grĂ©e Ă  la photocomposeuse de Casterman dans les annĂ©es 1970. Pour la sĂ©rie AstĂ©rix ce sont les lettrages de Michel Janvier, en charge de cette tĂąche pour un certain nombre d’album depuis 1989, qui ont Ă©tĂ© numĂ©risĂ©s. Trois famille principale de typographies ont ainsi Ă©tĂ© crĂ©Ă©es par Le Typophage : Regularus pour les bulles, Boldus pour l’écriture trĂšs grasse et Graphix pour les onomatopĂ©es et les symboles graphiques.

      Avoir sa propre police est actuellement assez facile en passant par des sites comme le Calligraphe qui permettent de gĂ©nĂ©rer une typographie Ă  partir de son Ă©criture manuscrite. C’est ce qu’a fait notamment heyheymomo (en) qui offre sa police en tĂ©lĂ©chargement (en).

      Qu’est-ce que le texte ?

      Au dĂ©but de l’informatique, chez IBM l’unitĂ© de mesure Ă©tait le mot (word). La capacitĂ© d’une machine s’évaluait donc en nombre de mots. Un mot Ă©tant, selon le manuel de l’IBM 605 constituĂ© de « dix chiffres et d’un signe algĂ©brique Â». Ainsi l’IBM 605 avait une capacitĂ© de 1 000 Ă  2 000 mots. Le texte n’était pas bien loin.

      Mais, qu’est-ce que le texte ? Selon les points de vue, la notion de texte peut ĂȘtre trĂšs vaste. En musique par exemple, il est question de sous-texte et ça n’a rien Ă  voir avec les paroles de chanson ou de mĂ©lodies ou le livret des opĂ©ras. Dans le cadre de cette sĂ©rie qui, globalement, traite de l’informatique dans le contexte historique de l’écriture, j’opte pour une dĂ©finition restrictive et axĂ©e sur l’écriture et la lecture.

      Le texte est ainsi de l’écriture qui peut se lire avec les yeux, les oreilles ou les doigts et qui peut aussi ĂȘtre lue par des robots. C’est du texte fait pour ĂȘtre lu pas pour ĂȘtre exĂ©cutĂ© dans le cadre d’un logiciel par exemple. Ce qui exclut le code informatique de la dĂ©finition, mĂȘme si c’est Ă©crit avec des Ă©diteurs de texte7. On doit pouvoir faire des recherches dans le texte, naviguer dedans, en extraire une partie pour la rĂ©utiliser ailleurs, etc.

      Il s’ensuit qu’une image avec de l’écriture dessus, ce n’est pas du texte. Un fichier PDF, fac-similĂ© d’un livre imprimĂ© n’est pas du texte. Et les versions PDF des livres numĂ©risĂ©s que propose la BnF Gallica par exemple ne sont pas du texte. Un formulaire en PDF qui est en fait une image que l’on aura modifiĂ©e avec un outil de dessin (ou imprimĂ© et modifiĂ© Ă  la main puis numĂ©risĂ©) n’est pas du texte.

      En revanche, si, de mon point de vue, la structure d’une base de donnĂ©es n’est pas du texte, son contenu par contre, oui. Ainsi, au hasard, celle de LinuxFr.org, est du texte, la partie publique tout au moins. Et ce n’est pas Claude qui me contredira.

      Manchot Ă  tables
      Un genre d’allĂ©gorie des tables de la base de donnĂ©es de LinuxFr.org.

      Il est d’autant plus important d’insister lĂ -dessus qu’il se trouve encore des personnes qui ne font pas la diffĂ©rence entre les deux. Et ce, tout simplement parce que c’est Ă©crit et qu’elles, elles, peuvent lire ce qui est Ă©crit.

      Nouveau Drop Caps : une police de lettrines

      Puisque qu’il a Ă©tĂ© question plus haut de typographies purement dĂ©coratives, c’est l’occasion de vous prĂ©senter une police qui ne peut servir qu’à des lettrines ou des titres.

      La police Nouveau Drops Caps

      Nouveau Drop Caps est une fonte gĂ©nĂ©rĂ©e par Dieter Steffmann (en) un typographe de formation qui a crĂ©Ă© plus de trois-cent-cinquante polices. La plupart sont plutĂŽt plus Ă  des fins dĂ©coratives que des polices de texte. Dans l’ensemble, ses polices peuvent ĂȘtre utilisĂ©es pour la langue française, elles ont les caractĂšres qu’il faut. La position de Dieter Steffmann sur son travail est la suivante :

      je considĂšre les polices de caractĂšres comme un patrimoine culturel, je ne suis pas d’accord avec leur commercialisation. Les polices autrefois fabriquĂ©es Ă  partir de caractĂšres mĂ©talliques avaient Ă©videmment un prix en fonction de la valeur du mĂ©tal, et le coĂ»t de conception, de dĂ©coupe et de moulage est convaincant, d’autant plus que l’acheteur devenait Ă©galement propriĂ©taire des polices achetĂ©es !

      Le site sur lesquelles il les dĂ©pose, 1001 fonts a, d’ailleurs, une licence (en), avec une disposition assez originale. La police

      peut ĂȘtre tĂ©lĂ©chargĂ©e et utilisĂ©e gratuitement pour un usage personnel et commercial, Ă  condition que son utilisation ne soit pas raciste ou illĂ©gale. (
)

      Les fontes peuvent ĂȘtre librement copiĂ©es et transmises Ă  d'autres personnes pour un usage privĂ© mais pas ĂȘtre vendues ou publiĂ©es sans l’autorisation Ă©crite des auteurs et autrices.

      Les textes et documents qui ont servi Ă  alimenter cette dĂ©pĂȘche

      Les rĂ©fĂ©rences sont donnĂ©es Ă  peu prĂšs dans leur ordre d’apparition dans le texte. La plupart sont accessibles en ligne, et, volontairement, il y a un minimum de rĂ©fĂ©rences Ă  WikipĂ©dia. Il y a, Ă©galement, le minimum possible de sources en anglais.

      L’écriture maya

      Jean-Michel Hoppan est l’un des seuls (le seul ?) spĂ©cialiste français d’un domaine de recherche (l’écriture maya) qui ne compte qu’une centaine de personnes dans le monde.

      La vision romaine de l’écriture

      • IdĂ©es romaines sur l’écriture, Françoise Desbordes, 1990, EPUB : ISBN 9782402324168, PDF : ISBN 9782402657495, marquage filigrane. La maison d’édition FeniXX qui Ă©dite ce livre est spĂ©cialisĂ©e dans la rĂ©Ă©dition des livres indisponibles du XXe siĂšcle.
      • L’écriture en libertĂ© : les graffitis dans la culture romaine, Michelle Corbier, extrait de Langages et communication : Ă©crits, images, sons, Corbier Mireille et Sauron Gilles (dir.), Ă©d. Ă©lectronique, Paris, Éd. du ComitĂ© des travaux historiques et scientifiques (Actes des congrĂšs nationaux des sociĂ©tĂ©s historiques et scientifiques), 2017.

      Les manuscrits médiévaux

      On peut se procurer ces livres au format PDF (fac-similĂ©), en texte brut (je travaille sur une version que je compte mettre en ligne pour chacun de ces livres), les emprunter en version EPUB Ă  la BnF si l'on a un compte, ou acheter l’EPUB. À noter que, selon les librairies, le fichier EPUB a ou non une protection numĂ©rique : ainsi, Le Furet du Nord indique qu’ils n’en ont pas, Cultura annonce une DRM LCP, et la FNAC une DRM Adobe.

      Bonus ! Si vous voulez vous rincer l’Ɠil, l’IRTH (Institut de recherche et d’histoire des textes) a dressĂ© une liste de sites pour accĂ©der au manuscrit mĂ©diĂ©val numĂ©risĂ©.

      L’imprimerie

      La bande dessinée

      • Lettrage, Laurent Gerbier, CitĂ© internationale de la bande dessinĂ©e et de l’image, septembre 2017.

      Postambule

      La question des formats sera abordĂ©e dans le prochain chapitre qui est dĂ©jĂ  bien avancĂ©. Et ce n’est pas plus mal, finalement.

      Dans le cadre de cette sĂ©rie, il va me falloir traiter aussi de la question des codes (sur laquelle j’ai quelques lacunes, vos suggestions sont bienvenues). Unicode, bien que dĂ©jĂ  pas mal abordĂ©, mĂ©rite un chapitre Ă  lui tout seul : histoire, composition du consortium, comment on ajoute un systĂšme d’écriture Ă  Unicode, et quelques paragraphes sur le code lui-mĂȘme (et là
). Je pense que je pourrais peut-ĂȘtre caser la norme ISO des Ă©critures dans ce chapitre. Si j’ai parlĂ© de conservation, il va falloir parler de l’archivage : protocoles, accĂšs, ce qui me permettra d’évoquer aussi de la science ouverte, je pense.


      1. L’écriture maya](https://www.inalco.fr/lecriture-maya), Jean-Michel Hoppan, INALCO. â†©

      2. Les codex Ă©taient Ă©crits sur un papier, l’amate, fait Ă  partir de l’écorce d’un figuier local. â†©

      3. Les glyphes mayas et leur dĂ©chiffrement, Jean-Michel Hoppan, 2009. â†©

      4. IdĂ©es romaines sur l’écriture, Françoise Desbordes & Centre national de la recherche scientifique & Anne Nicolas, 1990. â†©

      5. L’écriture en libertĂ© : les graffitis dans la culture romaine, Mireille Corbier, 2014. â†©

      6. Lettrage, Laurent Gerbier, septembre 2017. â†©

      7. Je reconnais qu’il peut y avoir matiĂšre Ă  pinaillage sur ce sujet. â†©

      Commentaires : voir le flux Atom ouvrir dans le navigateur

      Petites brĂšves : UUID, FSF, opendata, JO, linux, grafana, RoR, Docker et d'autres en vrac

      DĂ©versons un peu ici la veille du moment pour libĂ©rer des onglets ailleurs et partager des liens mais aussi des sources : il s’agit bien Ă©videmment de liens en rapport avec les thĂ©matiques du site (en l’occurrence dans cette fournĂ©e on trouvera logiciel libre, opendata, dĂ©veloppement et vie privĂ©e par exemple), et ils sont plutĂŽt variĂ©s ; les sources sont des sites web, des lettres d’actus et des rĂ©seaux sociaux (dans le cas prĂ©sent, tous arrivĂ©s jusqu’à moi via des flux RSS/Atom), et c’est aussi une maniĂšre de les partager et de vous inviter Ă  les suivre aussi. Dans la suite de la dĂ©pĂȘche, on parlera donc en vrac UUID, FSF, opendata, JO, linux, grafana, RoR, Docker et bien d’autres choses encore.

        Commentaires : voir le flux Atom ouvrir dans le navigateur

        Les langues peu documentées et le libre : quelques enjeux scientifiques

        Comme beaucoup de domaines scientifiques, la documentation de la diversitĂ© linguistique entretient une relation forte avec les mondes du Libre. Dans cette dĂ©pĂȘche, je vous propose de dĂ©couvrir ce domaine Ă  travers la prĂ©sentation de plusieurs logiciels et ressources libres ou en accĂšs ouvert. La documentation des langues Ă©tant un thĂšme peu courant sur LinuxFr.org, on commencera par une prĂ©sentation de cette problĂ©matique. Nous continuerons par une description des deux ressources principales existantes pour cataloguer et se repĂ©rer au sein de cette diversitĂ© linguistique. Je parlerai ensuite d’ELAN et de FLEX, deux logiciels utilisĂ©s pour annoter des enregistrements audio-visuels, une Ă©tape clef dans l’analyse linguistique, et qui permet le partage et la rĂ©utilisation de ces enregistrements. Enfin, aprĂšs un court passage sur la question de l’archivage, je prĂ©senterai deux compilations de corpus de documentation en accĂšs libre, une pratique rĂ©cente qui permet de nouveaux questionnements quantitatifs sur les langues orales peu documentĂ©es, et qui contribue Ă©galement Ă  la transparence et la traçabilitĂ© des analyses linguistiques.

          Sommaire

          L’étude des langues Ă  travers le monde

          Actuellement, environ 7000 langues ont Ă©tĂ© recensĂ©es Ă  travers le monde. Ce chiffre ne peut ĂȘtre qu’une approximation car, il n’y a pas de consensus sur la dĂ©finition de ce qu’est une langue. Une difficultĂ© par exemple est de dĂ©finir Ă  quel moment une langue est distincte d’une autre. Lorsqu’il y a variation, mais intercomprĂ©hension, de nombreux linguistes s’accordent Ă  dire qu’il s’agit alors de dialectes d’une mĂȘme langue, et donc, lorsqu’il n’y a pas intercomprĂ©hension, alors il s’agit diffĂ©rentes langues. Cette perspective considĂšre que tout le monde parle un dialecte (que ce soit celui de rĂ©fĂ©rence, ou un plus rĂ©gional comme celui de Paris, de Marseille, du QuĂ©bec), la langue n’étant qu’une abstraction permettant de regrouper les diverses pratiques langagiĂšres. En ce qui concerne l’intercomprĂ©hension, ce critĂšre n’est malheureusement pas absolu car elle peut varier selon les personnes et leur parcours personnel. Et lorsqu’on considĂšre l’évolution d’une langue Ă  travers le temps, sa diachronie, dĂ©finir ce qu’est une mĂȘme langue Ă  travers ses Ă©volutions temporelles se complexifie d’autant plus.

          Si certaines langues ont Ă©mergĂ© rĂ©cemment, on pense assez souvent aux langues dites crĂ©oles (le Bichelamar, les crĂ©oles malais, Ă  Madagascar ou au Cap Vert), ou Ă©galement lorsque certains dialectes se distinguent suffisamment pour ne plus ĂȘtre intercomprĂ©hensibles, la tendance actuelle est surtout Ă  la disparition massive des langues. Cette disparition est souvent rapportĂ©e Ă  travers la mort des derniers locuteurs et locutrices, on peut aussi considĂ©rer qu’une langue meurt lorsqu’elle n’est plus parlĂ©e d’une part, et qu’elle disparait si elle n’est pas documentĂ©e. Si certains aujourd’hui se questionnent sur la corrĂ©lation entre la diversitĂ© culturelle et la diversitĂ© Ă©cologique, il est Ă©vident que la disparition des langues correspond Ă©galement Ă  des inĂ©galitĂ©s et des tensions socio-politiques.

          Bref, la documentation des langues, c’est un sujet actuel, et d’un point de vue scientifique, la perte de cette diversitĂ© aura de tristes consĂ©quences sur la connaissance des langues et de l’univers des possibles languagiers, encore souvent sous-estimĂ© :

          • l’article The myth of language universals : Language diversity and its importance for cognitive science d’Evans donne un bel aperçu du dĂ©bat qui existe entre les linguistes fonctionnalistes, notamment les approches gĂ©nĂ©rativistes telles que proposĂ©es par Noam Chomsky. Pourtant, rĂ©guliĂšrement Ă  travers la documentation des langues, des catĂ©gories cognitives jusque-lĂ  non-soupçonnĂ©s, voire rejetĂ©es car non-observĂ©es, sont identifiĂ©s. Nous nous sommes rendu compte rĂ©cemment qu’un quart des langues grammaticalisaient l’emploi d’évidentiels, ces morphĂšmes qui indiquent la source d’une information. Au niveau de l’odorat, des neurologistes pensaient que si nous n’avions pas de termes abstraits pour catĂ©goriser les odeurs, c’était liĂ© au fait que notre cerveau ne le permettait pas. La description des termes liĂ©s Ă  l’odorat en Jahai (par ici si vous souhaitez Ă©couter du Jahai), qui possĂšde donc des termes spĂ©cifiques pour catĂ©goriser les odeurs, a montrĂ© le contraire.
          • accĂ©der Ă  des facettes non-matĂ©rielles de la prĂ©histoire, non-accessibles Ă  travers l’archĂ©ologie. La documentation des langues nous permet d’accĂ©der, dans une certaine mesure, aux termes et aux concepts utilisĂ©s durant les diffĂ©rentes prĂ©histoires Ă  travers la comparaison des langues et de leurs structures. Les travaux sont nombreux et anciens en ce qui concerne les langues europĂ©ennes, mais les recherches en linguistique historique (ou comparĂ©e) portent Ă©galement sur toutes les langues connues Ă  travers le monde. Les chercheurs et chercheuses de ce domaine collaborent assez rĂ©guliĂšrement avec les archĂ©ologues pour retracer les mouvements de population.
          • mettre au point des systĂšmes d’écriture pour les langues orales, ou simplement des traitements de texte adaptĂ© aux Ă©critures existantes. Parfois, certaines personnes savent Ă©crire dans la ou les langues officielles du pays, mais ne connaissent pas d’écriture pour une de leurs langues rĂ©gionales. C’est ainsi souvent le cas pour les personnes au Vanuatu. Le pays reconnait mĂȘme le droit d’enseigner les langues locales Ă  l’école, mais il n’existe que trĂšs rarement des ressources (que ce soit les personnes ou les manuels) pour cela. Parfois, les gens ne connaissent tout simplement pas de systĂšme d’écriture.

          Quelques concepts et termes liés à la documentation des langues

          Comme tout domaine de recherche, la terminologie et les concepts linguistiques Ă©voluent au grĂ© des discussions et peut se distinguer de l’usage attendu des termes. Une Ă©tape importante dans la documentation d’une langue est la production d’une grammaire dĂ©crivant les structures linguistiques de cette langue. De nombreux linguistes estiment alors qu’on peut dire que cette langue est dĂ©crite. Il ne faut pas se tromper cependant, aucun linguiste ne considĂšre qu’une langue est alors complĂštement dĂ©crite. Une grammaire ne contient que quelques aspects estimĂ©s actuellement essentielles par les linguistes de terrain. Ces points sont, le plus souvent, une description du systĂšme phonologique d’une langue (c’est-Ă -dire comment les sons d’une langue sont organisĂ©s les uns vis-Ă -vis des autres), des morphĂšmes et des processus morphologiques associĂ©s (la conjugaison, l’expression de la possession, les dĂ©clinaisons, les genres, les classifications, etc.) d’une langue et souvent un dĂ©but de description des processus syntaxiques. Il existe de nombreuses approches pour dĂ©crire les faits linguistiques, et la description d’une langue se fait souvent en dialogue avec les pratiques et terminologies qui ont Ă©tĂ© employĂ©es dans l'aire linguistique concernĂ©e.

          Depuis l’article Documentary and descriptive linguistics de Nicholaus Himmelman, qui a promu la distinction entre la documentation linguistique et la description linguistique, on accorde beaucoup plus d’importance Ă  la production d’un corpus d’enregistrements annotĂ©s. On dit alors d’une langue qu’elle est documentĂ©e si des enregistrements annotĂ©s, de prĂ©fĂ©rences audio-visuels, de cette langue existe. Enfin, il existe la problĂ©matique de l’outillage d’une langue, c’est-Ă -dire si ses locuteurs et locutrices ont accĂšs ou non aux outils informatisĂ©s, du traitement texte aux dictionnaires informatisĂ©s en passant par la reconnaissance vocale, la transcription automatique, voire aujourd’hui aux modĂšles de langues et autres ressources nĂ©cessitant des corpus beaucoup plus grands.

          Les catalogues et base de donnĂ©es pour l’identification des langues

          Une problĂ©matique rĂ©currente dans le domaine des langues est de clairement identifier la langue sur laquelle on travaille. Cependant, identifier une langue, ce qui relĂšve ou non de cette langue, oĂč elle est parlĂ©e, est l’enjeu de nombreux dĂ©bats, souvent politique, et n’est pas une tĂąche simple. Quoi qu’il en soit, il existe des ressources, bases de donnĂ©es, qui proposent d’associer Ă  des noms de langues, endonymes ou exonymes, des codes pour rendre leur identification univoque.

          L’Ethnologue et l’ISO 639 : une norme gĂ©rĂ©e par le Summer Institute of Linguistics (SIL)

          Ethnologue, Languages of the World, ou plus simplement l’Ethnologue, est une base de donnĂ©es dĂ©veloppĂ©e et maintenu par l’organisme Ă©vangĂ©lique SIL, Summer Institute of Linguistic depuis 1951. Elle vise Ă  recenser toutes les langues du monde. L’ISO 639 est une norme issue de ce catalogue, Ă©galement maintenue par le SIL. Cet organisme est trĂšs actif au niveau de la documentation des langues et de la crĂ©ation d’écritures, car un de ses objectifs est de traduire la Bible dans toutes les langues du monde. Historiquement, l’Ethnologue est un des premiers catalogues dont l’objet a Ă©tĂ© de recenser les langues. Si cette norme semble le plus souvent suffisamment exhaustive pour les besoins liĂ©s Ă  l’informatique, aprĂšs tout, les internautes consultent Internet en trĂšs peu de langue, d’un point de vue linguistique, il possĂšde de nombreuses lacunes.

          La liste SIL des langues

          Un premier souci est la nĂ©cessitĂ© d’avoir une granularitĂ© plus importante que simplement la langue. Les linguistes travaillent sur des dialectes et des variĂ©tĂ©s, sur des familles de langues, et parfois ont travaillĂ© sur des distinctions qui n’ont parfois plus cours. Afin de pouvoir associer ces ressources Ă  des langues, ou des entitĂ©s linguistiques particuliĂšres, l’approche du SIL ne suffit pas.

          Enfin, la gestion du catalogue par un organisme religieux, donc avec parfois d’autres enjeux qu’uniquement scientifiques, le fait qu’il s’agisse d’une norme, donc la nĂ©cessitĂ© de collaborer avec l’ISO, et le fait que seule une partie du catalogue est accessible (il faut un abonnement pour accĂ©der Ă  la totalitĂ© de la ressource) rend la ressource moins pertinente pour de nombreux linguistes. Ces limites ont poussĂ© des linguistes Ă  proposer une ressource alternative.

          Glottocode : par le Max Planck Institute for Evolutionary Anthropology.

          Le projet Glottolog, initialement dĂ©veloppĂ© par Sebastian Nordhoff et Harald Hammarström, catalogue non seulement les langues du monde actuelles et passĂ©s, les familles de langues et leurs diffĂ©rentes branches, mais Ă©galement « les restes Â» des hypothĂšses de langues ou de regroupements historiques. Cette granularitĂ© permet de retrouver les documents associĂ©s Ă  chacun de ces objets. Si le catalogue est dĂ©diĂ© aux langues moins connues, les langues les plus centrales sont elles aussi rĂ©pertoriĂ©es. Il s’agit actuellement du catalogue mis en avant par les linguistes documentant les langues Ă  travers le monde. L’application Glottolog est disponible via la licence MIT.

          Aperçu du Glottolog à travers la liste des langues

          Si aux premiers abords, la liste des langues du Glottolog ne se distingue pas franchement de celle de l’ISO 639, c’est parce qu’il faut regarder plus en dĂ©tail pour comprendre les diffĂ©rences essentielles entre les deux ressources. Notons tout de mĂȘme la colonne « Child dialects » : « Dialectes enfants », et les champs vides au niveau des colonnes Top-level-family et pour la langue Abai Tubu-Abai Sembuak dans la colonne « ISO-639-3 Â». La colonne « Child dialects » reprĂ©sente une information qui n’est pas documentĂ© dans l’ISO 639, ce n’est pas son objet aprĂšs tout, mais qui est intĂ©ressant pour les linguistes travaillant sur cette langue, indiquant qu’un minimum de donnĂ©es sociolinguistiques sont disponibles. Les champs vides dans la colonne « Top-level family » sont dus au fait que ces langues sont des isolats, c’est-Ă -dire que la linguistique comparĂ©e ne trouve pas de correspondances significatives entre cette langue et d’autres langues qui permettraient de les regrouper en une famille. Enfin, le vide dans la colonne ISO-963-3 rĂ©vĂšle que la langue Abai Tubu-Abai Sembuak ne possĂšde pas d’entrĂ©e dĂ©diĂ©e dans la norme.

          Ainsi, lorsque l’on consulte une langue en particuliĂšre, ici le Nisvai, on voit apparaitre tous les embranchements existants associĂ©s Ă  cette langue :

          La langue Nisvai dans le Glottolog

          Cette vue de l’arborescence associĂ©e Ă  une langue particuliĂšre rĂ©vĂšle tous les embranchements auxquels peut⁻ĂȘtre associĂ©e une langue. Et Ă  chacun de ces embranchements, si des ressources linguistiques ont Ă©tĂ© identifiĂ©es par les mainteneurs du Glottolog, celles peuvent ĂȘtre proposĂ©es. Cette fonction permet aux linguistes de trouver des ressources sur les langues proches, non pas gĂ©ographiquement (mĂȘme si en pratique c’est le plus souvent le cas), mais d’un point de vue gĂ©nĂ©alogique.

          Les autres

          Il existe d’autres initiatives pour cataloguer les langues du monde, que ce soit la liste proposĂ©e par Wikipedia, la liste de la CIA ou encore The Linguasphere Register, mais ces initiatives ne sont pas aussi pertinentes du point de vue de la documentation des langues.

          Documenter les langues

          ELAN : des schĂ©mas d’annotation flexibles

          ELAN est un des logiciels libres (GPL3) les plus utilisĂ©s par les linguistes pour annoter des enregistrements audio et vidĂ©o. Il permet d’élaborer des structures d’annotation complexes permettant ainsi de rendre compte des analyses que les linguistes souhaitent associer Ă  un enregistrement. Ces couches d’annotation sont reliĂ©es les unes aux autres par des relations logiques, avec le plus souvent une couche de rĂ©fĂ©rence indexĂ©e temporellement Ă  l’enregistrement. Les annotations les plus courantes sont une transcription, une traduction et une annotation morphologique. Mais des nombreuses autres analyses peuvent ĂȘtre incluses, que ce soit les parties du discours, les rĂ©fĂ©rences et anaphores, l'animĂ©itĂ©, mais aussi les gestes, la structuration du discours, les signes pour les sourds et malentendants.

          Extrait d’une narration prĂ©sente dans DoReCo, et vue sur les diffĂ©rentes couches d’annotation pouvant ĂȘtre associĂ©s Ă  un enregistrement.

          Dans cette capture d’écran issu d’un texte de DoReCo retravaillĂ© par l’auteur, on aperçoit un extrait de quelques secondes d’une narration nisvaie. Il s’agit d’un des modes de visualisation des annotations proposĂ©es par ELAN pour reprĂ©senter les diffĂ©rentes couches d’annotation. Certaines de ces annotations ont Ă©tĂ© rĂ©alisĂ©es Ă  la main par l’auteur, d’autres ont Ă©tĂ© retravaillĂ©es par les algorithmes mis en place par DoReCo, puis manuellement corrigĂ©s. Enfin, il y a Ă©galement des couches d’annotation de la prosodie par le biais de SLAM+.

          FLEX : gĂ©rer un projet de documentation

          FLEX est un logiciel dĂ©veloppĂ© par le SIL et dont le code source est rĂ©gie par la licence LGPL 2.1. Il est conçu davantage pour coordonner l’ensemble d’une documentation linguistique, de la gestion des textes Ă  l’élaboration d’un dictionnaire, en passant par les analyses linguistiques. En revanche, il ne gĂšre pas rĂ©ellement l’annotation d’enregistrements. De nombreux linguistes l’utilisent en complĂ©ment d’ELAN.

          Si le logiciel est prometteur sur le papier, Ă  chaque fois que je l’ai essayĂ©, j’ai Ă©tĂ© rebutĂ© par son cĂŽtĂ© usine Ă  gaz, et surtout ses nombreux plantages notamment lorsqu’on essaie de gĂ©rer des fichiers multimĂ©dia avec. Et il en est de mĂȘme pour les autres logiciels dĂ©veloppĂ© par le SIL, tel que SayMore pour gĂ©rer les mĂ©tadonnĂ©es des enregistrements, WeSay pour faire des dictionnaires en collaboration avec les locuteurs et locutrices, Ă  chaque fois que je les ai essayĂ©s, enthousiasmĂ© par leurs fonctionnalitĂ©s, j’ai Ă©tĂ© déçu par le fait qu’ils ne fonctionnaient pas correctement sur mon ordinateur.

          Aperçu de Flex

          Cette capture d’écran illustre un des modes de saisie de FLEX, ici la vue tabulaire du lexique, qui permet de rentrer et gĂ©rer les dĂ©finitions des lexĂšmes (les entrĂ©es du dictionnaire) de maniĂšre assez rapide. On aperçoit dans la partie en haut Ă  gauche les autres modes d’édition du lexique, et en dessous les autres catĂ©gories liĂ©es Ă  la gestion d’un projet de documentation : Texts & Words, Grammar, Notebook et Lists. C’est Ă  travers la catĂ©gorie Texts & Words que l’on peut par exemple importer des textes transcrits, voire des fichiers ELAN pour peupler la base de donnĂ©es lexicales. Grammar permet de dĂ©crire les paradigmes grammaticaux, FLEX propose d’ailleurs quelques algorithmes qui aident Ă  la construction des paradigmes grammaticaux. Notebook et Lists servent Ă  la gestion du projet, le premier pour prendre des notes diverses, et le second pour crĂ©er des listes, en particulier des tĂąches encore Ă  rĂ©aliser.

          Et il y en a bien d’autres encore

          Il existe de nombreux autres logiciels similaires, tels qu’EXmaralda pour l’annotation des enregistrements (surtout utilisĂ© en Allemagne Ă  ma connaissance), Sonal (non libre, et dont le dĂ©veloppement semble arrĂȘtĂ©) qui est utilisĂ© par les sociologues et les anthropologues pour une annotation thĂ©matique de leurs entretiens, Anvil, qui semble intĂ©ressant mais que je n’ai jamais rĂ©ellement vu utilisĂ©, ou enfin le vieux Transcriber qui lui Ă©tait encore employĂ© par certains projets il y a quelques annĂ©es. Rentrer dans le dĂ©tail de tous ces logiciels dĂ©passerait le cadre d’une dĂ©pĂȘche comme celle-ci, mais Ă©numĂ©rer la diversitĂ© logicielle montre qu’il s’agit d’un secteur un minimum dynamique, d’ailleurs la question de la transcription et de l’annotation des enregistrements ne se limite pas du tout qu’au domaine de la documentation des langues du monde.

          L’archivage et la compilation de corpus

          Afin de conserver et partager les corpus et donnée enregistrées par les linguistes, chercheurs voire simplement les personnes ayant documenté une langue, il existe des archives, le plus souvent en ligne. Il y a en France par exemple Pangloss, géré par le LACITO, dédié aux langues orales, ou ORTOLANG, plus générique, pour les corpus de langue. En Océanie, il y a Paradisec. Il y a aussi ELAR, autrefois à Londres, et qui a déménagé récemment à Berlin récemment.

          Ces archives proposent diverses interfaces pour dĂ©poser, gĂ©rer et parfois mĂȘme consulter les enregistrements et les annotations rĂ©alisĂ©s par les linguistes et leurs collaborateurs·e·s. À noter que pour ces archives, Ortolang dĂ©crit son architecture logicielle qui repose sur des briques ouvertes, en revanche concernant Paradisec et Pangloss, bien que leur statuts soient sĂ»rement similaires du fait de la dĂ©marche gĂ©nĂ©rale de ses ingĂ©nieurs, je n’ai pas trouvĂ© de liens vers les logiciels employĂ©s. Quant Ă  ELAR, le logiciel utilisĂ© est Preservica, une solution propriĂ©taire qui, quand on a le malheur de devoir l’utiliser, fonctionne bien lentement.

          La compilation de corpus, si elle se rapproche de l’archivage en ce qu’il s’agit Ă©galement de recueillir, conserver et publier les corpus des linguistes, correspond Ă©galement Ă  une Ă©dition particuliĂšre de ces corpus. La compilation de corpus est rĂ©alisĂ© Ă  travers la mise en place de processus de qualitĂ©, d’annotations et de conventions particuliĂšres. Les deux compilations de corpus prĂ©sentĂ©es ici sont des compilations de corpus de documentation de langues orales. Les enregistrements ont Ă©tĂ© systĂ©matiquement annotĂ©s en utilisant une convention nommĂ©e les gloses interlinaires (le nom fait en fait rĂ©fĂ©rence Ă  la pratique ancienne d’insĂ©rer des explications entre les lignes d’un texte. En pratique aujourd’hui, ce n’est plus vraiment ce que font les linguistes, puisque le travail est informatisĂ© et les annotations ne sont plus entre les lignes, mais, le terme a cependant Ă©tĂ© conservĂ©).

          DoReCo

          DoReCo est une compilation de 52 corpus en accĂšs ouvert (NdR : auquelle l’auteur a contribuĂ©). La compilation a nĂ©cessitĂ© la mise en place de processus de qualitĂ© afin d’assurer la cohĂ©rence de l’ensemble et de fournir un certain nombre de garanties quant aux qualitĂ©s du corpus.

          Les langues dans DoReCo

          Une premiĂšre qualitĂ©, et l’une des originalitĂ©s de DoReCo, est de proposer un alignement temporel est trĂšs fin. La durĂ©e de chaque phonĂšme, de chaque morphĂšmes, de chaque mot (ici suivant la dĂ©finition de la personne Ă  l’origine du corpus, car la dĂ©finition d’un mot n’a rien d’une Ă©vidence) et enfin de chaque groupe de souffle est fournie. Une deuxiĂšme qualitĂ© a Ă©tĂ© de s’assurer que pour l’ensemble des retranscriptions, chacun des termes et des morphĂšmes possĂšde une glose, c’est-Ă -dire qu’ils possĂšdent une explication linguistique.

          La compilation totalise une centaine d’heures d’enregistrements audio, en grande majoritĂ© des narrations monologiques. À noter que les corpus de la compilation sont accĂšs ouvert, via une licence Creative Commons, mais que les droits d’utilisation varient d’un corpus Ă  l’autre. Les donnĂ©es sont accessibles aux formats d’ELAN : .eaf, de Praat : . TextGrid, TEI.xml, et.csv.

          Multi-CAST

          Multi-CAST est Ă©galement une compilation de 18 corpus de documentation de langues diffĂ©rentes. Les textes annotĂ©s via le logiciel ELAN. Contrairement Ă  DoReCo, l’alignement temporel des annotations n’est pas rĂ©alisĂ© de maniĂšre prĂ©cise, mais manuellement, par les personnes Ă  l’origine du corpus, Ă  l’échelle de l’énoncĂ©. Les textes sont Ă©galement en grande majoritĂ© des narrations monologiques. L’originalitĂ© de cette compilation de corpus vient du fait que les textes contiennent trois couches d’annotation particuliĂšres : GRAID, Grammatical Relations and Animacy in Discourse, (voir), puis RefIND et ISNRef (Referent Indexing in Natural Language Discourse, voir Schiborr et al. 2018).

          La page d’accueil de Multi-Cast

          Cette compilation de corpus est aussi disponible dans plusieurs formats. XML Ă©videmment, puisque c’est le format natif d’ELAN, mais aussi TSV et il existe Ă©galement un paquet pour R. Tout cela est disponible via la licence CC-BY 4.0.

          Conclusion

          J’espĂšre que vous avez apprĂ©ciĂ© cette introduction Ă  la documentation des langues Ă  travers les logiciels libres. L’idĂ©e est surtout d’attiser la curiositĂ©, car il reste Ă©videmment encore de nombreux aspects ou points Ă  discuter et Ă  approfondir. La prochaine fois que j’aborderai le thĂšme de la documentation linguistique ici, j’espĂšre que ça sera pour prĂ©senter mon application basĂ©e sur Django pour faire de la lexicographie.

          Il y a Ă©galement un autre sujet sur lequel j’aimerais bien Ă©changer ici prochainement : la question des licences des donnĂ©es collectĂ©s et la nĂ©gociation lorsque l’on travaille avec des personnes Ă  tradition orale. Si ouvrir l’accĂšs aux donnĂ©es de recherche et aux corpus peut sembler ĂȘtre une Ă©vidence pour certains, il ne faut pas oublier que souvent, les chercheurs et chercheuses de terrain collectent des informations personnelles, que la connaissance n’est pas forcĂ©ment considĂ©rĂ©e comme un bien public et les enregistrements, notamment les narrations, qui ne sont pas forcĂ©ment perçues comme des fictions, sont souvent couverts par des droits locaux. Enfin, ouvrir ses donnĂ©es de recherche, si c’est permettre Ă  d’autres de rĂ©utiliser ses donnĂ©es, requiert beaucoup de travail de la part des linguistes, c’est une tĂąche longue, ingrate et surtout peu valorisĂ©e. Alors qu’il est de plus en plus prĂ©caire d’ĂȘtre chercheur en sciences humaines, il est aussi difficile de demander Ă  ces chercheurs et chercheuses de consacrer une grande partie de leur temps Ă  des tĂąches qui ne leur permettront pas de se constituer un CV, nĂ©cessaire si l’on souhaite avoir un poste stable (c’est-Ă -dire plus de deux ans).

          Label sans IA : ce texte a Ă©tĂ© rĂ©digĂ© sans aucun aide de la part d’une LLM.

          Commentaires : voir le flux Atom ouvrir dans le navigateur

          Comptabilité en texte brut

          Par : millette
          26 avril 2024 Ă  16:45

          Bonjour,

          J’ai surtout travaillĂ© Ă  mon compte mais ce n’est que depuis l’annĂ©e derniĂšre que je prends ça plus au sĂ©rieux, incluant les aspects comptables.

          Est-ce qu’il y en a parmi nous (au QuĂ©bec) qui utilisent le Plain Text Accounting (PTA) et qui voudrait m’accompagner dans ce long voyage? Alternativement, avez-vous un bon comptable Ă  me suggĂ©rer?

          J’aurais besoin d’un bon guide pour tout le tralala: taxes, impĂŽts, comptabilitĂ©s, conseils, etc.

          9 messages - 4 participant(e)s

          Lire le sujet en entier

          Proxmox Virtual Environment 8.2 avec assistant d'import VMware disponible

          26 avril 2024 Ă  01:55

          Proxmox Server Solutions GmbH a publié la version 8.2 de sa plate-forme de virtualisation libre Proxmox Virtual Environment (VE).
          La solution Proxmox VE est sous licence GNU Affero GPLv3. Proxmox Server Solutions propose un support d’entreprise à partir de 110 € par an et par processeur.

          Principales nouveautés de la version 8.2

          • La plate-forme Proxmox VE 8.2 est basĂ©e sur Debian 12.5 (“Bookworm”), et un noyau Linux 6.8. Les developpeurs ont mis Ă  jour QEMU 8.1, LXC 6.0, Ceph 18.2, et ZFS 2.2.
          • Assistant d’import pour les machines virtuelles VMware ESXi : Il facilite aux utilisateurs la possibilitĂ© d’importer des machines virtuelles directement Ă  partir d’autres hyperviseurs. Actuellement, il permet d’importer des VM basĂ©es sur VMware (ESXi et vCenter). Vous pouvez l’utiliser pour importer la VM entiĂšre, avec la plupart des paramĂštres de configuration d’origine mappĂ©s sur le modĂšle de configuration de Proxmox VE.
          • Installation automatisĂ©e : un nouvel outil « proxmox-auto-install-assistant Â» automatise entiĂšrement le processus d’installation sur le mĂ©tal nu. Le dĂ©ploiement rapide des hĂŽtes Proxmox VE peut ĂȘtre rĂ©alisĂ© grĂące Ă  une installation automatisĂ©e, Ă©liminant le besoin d’un accĂšs manuel au systĂšme. Pour utiliser cette approche, un fichier de rĂ©ponses contenant les paramĂštres de configuration requis pour le processus d’installation doit ĂȘtre prĂ©parĂ©. Ce fichier peut ĂȘtre facilement inclus dans l’ISO, stockĂ© sur un disque supplĂ©mentaire comme une clĂ© USB ou transmis via le rĂ©seau.
          • Backup fleecing : Lors du processus de sauvegarde d’une machine virtuelle (VM) en cours d’exĂ©cution, il est important de prendre en compte l’impact nĂ©gatif potentiel d’une cible de sauvegarde lente sur les performances des E/S invitĂ©es. Pour attĂ©nuer cet impact, l’utilisation de toison peut s’avĂ©rer trĂšs positive. Le «fleecing» implique la mise en cache de blocs de donnĂ©es dans une image de «fleecing» au lieu de les envoyer directement Ă  la cible de sauvegarde. Cette technique est particuliĂšrement utile lors de la sauvegarde d’invitĂ©s gourmands en E/S sur un serveur de sauvegarde Proxmox distant ou tout autre stockage de sauvegarde avec une connexion rĂ©seau lente.
          • Modernisation du pare-feu avec nftables (aperçu technologique) : Proxmox VE propose dĂ©sormais une nouvelle implĂ©mentation de pare-feu qui remplace iptables par nftables. La nouvelle implĂ©mentation est dĂ©veloppĂ©e dans le langage de programmation Rust. Bien que la nouvelle implĂ©mentation soit presque identique en termes de fonctionnalitĂ©s, il est important de noter que le pare-feu nftables doit ĂȘtre activĂ© manuellement et reste en mode aperçu, permettant Ă  la communautĂ© de fournir de prĂ©cieux commentaires.

          Commentaires : voir le flux Atom ouvrir dans le navigateur

          ❌
          ❌