Vue lecture

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.

Entrevue avec Christophe Grenier, développeur de testdisk et photorec

testdisk et photorec sont deux outils libres (GPLv2+) formidables… que l’on souhaite pourtant ne jamais avoir à utiliser ! En effet, les deux sont dédiés à la récupération de données après une panne matérielle, ou une bévue.

TestDisk

Le premier est axé supports de stockage et leurs partitions, le second orienté récupérations de fichiers (mais il est loin de se limiter aux images).

Cocorico : le développeur de ces outils est français, et il a bien voulu répondre à notre sollicitation d’entrevue :).

Bonjour Christophe ! Pouvez-vous présenter votre parcours ?

Quand j’ai commencé à développer testdisk, mon premier outil de récupération de données, j’étais encore étudiant en école d’ingénieur.
Maintenant, cela fait plus de 20 ans que je suis diplômé de l’ESIEA, j’interviens d’ailleurs dans son Mastère Spécialisé Sécurité et Information des systèmes depuis 2004.
Après avoir travaillé dans la sécurité informatique, j’ai travaillé autours des systèmes Linux, du réseau et de la sécurité.
Depuis un peu plus de 10 ans, je suis directeur d’exploitation pour un hébergeur parisien.
Dans le cadre de mon auto-entreprise, je fais de la récupération de données.

Comment avez-vous démarré ce projet ?

Un ami développeur professionnel sous Windows venait d’acheter un nouveau disque dur et pour éviter d’avoir trop de lettres de lecteurs (C:, D:, E:, …) avait décidé de réduire le nombre de partitions de son disque de données ; ce disque contenait 3 partitions.
Il a sauvegardé les données, supprimé les 3 partitions, en a créé 2 et — au moment de restaurer les données — il s’est rendu compte qu’il avait été trop vite et qu’il lui manquait la sauvegarde d’une des partitions.
Sachant que j’avais des connaissances sur le partitionnement des PC (je m’étais intéressé au fonctionnement des virus de boot qui se logeaient dans le premier secteur des disques durs), il m’a contacté.

Armé d’un éditeur hexadécimal, il nous avait fallu la journée pour reconstruire manuellement la table des partitions et récupérer ces données. Un peu plus tard ayant appris les rudiments de la programmation en C, je me suis dit qu’il devait être possible d’automatiser la récupération des partitions et c’est ainsi qu’est né testdisk en 1998.

Pour photorec, il a fallu attendre mon premier appareil photo numérique en 2002. Ayant peur de perdre des photos (effacement par mégarde de photos non sauvegardées, reformatage de la mauvaise carte mémoire…), avant même de partir en voyage, j’ai bricolé un programme en C sous Linux capable de récupérer les photos et vidéos prises par mon appareil photo. C’est ainsi que photorec est né pour récupérer des photos. Il a gardé son nom même s’il récupère des centaines de formats de fichier différents.

Quels sont les points marquants qui ont, selon vous, marqué l’évolution de ces logiciels ?

Les points principaux ayant permis le succès de ces logiciels sont :

  • de rendre ces logiciels multiplateformes pour PC : MS-Dos et Linux, puis Windows. La prise en charge de macOS est venu bien plus tard et a eu peu d’impact.
  • de distribuer ces logiciels gratuitement. L’utilisation d’une licence opensource (GPL v2+) m’a aussi permis d’avoir quelques contributions.
  • d’être plutôt à l’écoute des utilisateurs et d’enrichir les formats de fichiers gérés par photorec. Certains sont vraiment exotiques.
  • de la documentation en plusieurs langues à une époque où les traductions automatiques étaient quasi-inexploitables. Mais aujourd’hui, la documentation principale de plus de 60 pages est en anglais.

Un point marquant a été la reconnaissance officielle de l’utilisation de ces logiciels par des organismes étatiques.

testdisk a été conçu pour un public technique, j’ai eu des retours de différents sociétés de récupération de données de part le monde l’utilisant mais en général, elles ne souhaitent pas communiquer sur leur utilisation de logiciels (libres ou du commerce).

Un tournant a eu lieu en 2014 quand le NIST, dans le cadre du Computer Forensics Tool Testing Program (CFTT), a testé et publié ses résultats sur les capacités de photorec. En comparant les résultats de chaque outil, on découvre que photorec a les meilleurs résultats (1ère place ex aequo).
Ainsi, photorec figure dans le catalogue de logiciels que les agences d’États américains peuvent utiliser.

photorec apparaît dans les diapositives de la formation SecNum Academie de l’ANSSI.

Pourquoi un seul paquet pour deux logiciels, ou pourquoi pas un seul logiciel ?

Quand on parle de testdisk et photorec, il y a aussi fidentify, un outil en ligne de commande qui permet de tester rapidement l’identification de fichiers en utilisant les mêmes parsers que photorec, sans oublier qphotorec, une version graphique de photorec.

Selon les distributions, vous pouvez avoir un package testdisk comprenant testdisk, photorec et fidentify et un package qphotorec pour qphotorec.

testdisk utilise un accès en écriture au disque, photorec n’utilise qu’un accès en lecture. photorec est plus facile d’utilisation que testdisk, c’est presque du next/next/next, il ne fait que du « file carving » (récupération de fichiers par identification des entêtes).

Quelles sont les fonctionnalités les plus attendues que vous pensez implémenter ?

La vérification formelle du code des parsers de photorec est ce qui m’a le plus occupé ces dernières années, je continue de travailler dessus.
Je n’ai pas prévu d’implémenter de nouvelles fonctionnalités dans l’immédiat.

Avez-vous des retours d’utilisateurs, des remerciements de personnes qui ont pu grâce à ces outils retrouver une partie de leur vie numérique, ou de grincheux ?

Perdre une partie de sa vie numérique est très stressant.
De fait, j’ai été confronté à des grincheux très agressifs dont un cas extrême de menaces répétées de mort de la part d’un individu qui n’avait pas pu récupérer ses données. Les hébergeurs de ses messageries successives ont agi rapidement lorsque j’ai signalé ses messages, mais je me suis posé la question à ce moment-là si cela valait bien la peine de m’investir autant pour risquer cette violence numérique.

Les retours positifs des utilisateurs et leurs remerciements sont ce qui a permis de me motiver à continuer de développer sur toutes ces années ce projet.
À une époque, je recevais quotidiennement des mails de remerciements et/ou des donations. C’est moins fréquent désormais, mais c’est peut-être parce que les sauvegardes vers le cloud sont beaucoup plus courantes et qu’ainsi les gens ont moins recours à la récupération de données.

Effectivement, perdre une partie de sa vie numérique est très stressant, avez-vous des conseils à donner sur la sauvegarde ?

Ce sont des conseils très généraux :

  • que cela soit au niveau personnel ou au niveau professionnel, il est important de vérifier le périmètre de la sauvegarde. Si vous n’aviez plus que votre dernière sauvegarde, que vous manquerait-il ?
  • testez une restauration de données
  • si possible, multipliez les sauvegardes (sauvegarde avec historique ou versionning, pas une simple synchronisation)
  • dans l’idéal, plusieurs lieux de sauvegarde.

Sur ces projets, y a-t-il d’autres contributeurs ?

testdisk et photorec reçoivent principalement des contributions ponctuelles. J’en profite pour remercier toutes les personnes qui m’ont aidé pour les traductions, pour avoir partagé des fichiers dans des formats exotiques, ou pour avoir contribué au code.
Merci aussi aux personnes ayant participé à la modération du forum et au modérateur actuel !

Y a-t-il des fonctionnalités importantes qui ne seront pas développées, et pourquoi ?

À moins de recevoir des contributions, je ne pense pas pousser davantage le support mac.
Le chiffrement des disques sous Windows va devenir la norme, comme c’est le cas sous macOS. Je pense que cela va freiner le développement de testdisk et photorec. La récupération va devenir bien plus complexe en exigeant un déchiffrement préalable.

Des souvenirs marquants de cette expérience ?

Je crois que l’une des anecdotes qui m’a le plus amusé est celle que j’ai reçue en janvier 2007 : dans un premier mail, l’utilisateur explique qu’un appareil photo a été volé dans sa voiture, mais qu’une semaine plus tard, la police a trouvé le coupable et a pu restituer l’appareil photo. Le contenu avait été effacé, mais grâce à photorec, l’utilisateur avait récupéré plus de 300 photos.

Currently I am recovering over 300 photos using PhotoRec that my sister in law took over the holidays. Our car was broken into and the camera was stolen. A week later the police found the guy! They found the camera, but it had been wiped.
I had read about recovering photo's from flash cards via a story on slashdot, and now here I am.

Quelques heures plus tard, j’ai reçu la suite de l’histoire :

I have recovered some pictures that look to be taken by the thief […]
I am submitting a CD of the data I have recovered to the Detective involved in the case. My little camera was involved in a much larger theft, so hopefully the pictures they took will help nail them all!

Le voleur avait utilisé l’appareil photo, photorec a permis de récupérer des photos ayant beaucoup intéressé le détective en charge du dossier : celui-ci espère découvrir les autres personnes impliquées dans un vol de plus grande envergure.

Avez-vous eu des échanges avec des éditeurs de logiciels similaires (opensource ou propriétaires) ?

photorec a été victime de plusieurs contrefaçons.

Dans un cas, un fabricant de carte mémoire a distribué un logiciel de récupération de données, ce fabricant avait sous-traité le développement qui avait « optimisé » son temps de développement en récupérant le code source de photorec, remplaçant tous les entêtes de copyright et ajoutant une interface graphique.
Après avoir contacté le fabricant, celui-ci a fait rétablir les copyrights manquants et le code a été distribué en GPLv3.

Dans d’autres cas, des développeurs ont volontairement publié des contrefaçons qu’ils revendaient. Après avoir fait fermer leur hébergement plusieurs fois, ils ont fini par trouver un hébergeur bullet-proof, un hébergeur qui ne répondait plus aux plaintes…

Concernant le forum, avez-vous déjà rencontré des difficultés avec le respect du code de conduite ?

La modération sur le forum est obligatoire, les spammeurs sont très nombreux et inventifs en réutilisant par exemple du contenu d’autres sujets. Aucun code de conduite n’a été formalisé.
Le forum ne tient plus que grâce à la présence d’un modérateur, je ne sais pas si cette partie du projet va perdurer.

Quel est votre modèle économique ?

Le projet est né comme un projet personnel et reste géré comme tel.
Je travaille chez Global Service Provider, une société de services et hébergement informatique, qui me permet de disposer gracieusement (Merci à eux) de machines virtuelles (VM), sauvegarde, monitoring pour le projet.
Diverses donations ponctuelles couvrent les frais des différents noms de domaine, mon équipement informatique personnel…

Au niveau personnel, quels logiciels libres utilisez-vous, sur quel système d’exploitation ?

À l’exception des raspberry pi sous Raspbian, les différents ordinateurs de la maison sont sous Fedora Linux.
J’utilise gnome comme environnement graphique, alpine et roundcube pour la messagerie, vim comme éditeur de texte, du docker avec moby, gcc, python…

Et au niveau professionnel ?

Mon ordi portable est aussi Fedora Linux.
Les serveurs Linux que mon équipe et moi gérons sont principalement sous AlmaLinux et Debian.

J’utilise tous les jours ansible (automatisation des configurations), git (versionning), netbox (gestion de datacenters), oxidized (sauvegarde réseau), mediawiki (documentation)…

Merci pour votre disponibilité, et pour ces merveilleux outils !

Commentaires : voir le flux Atom ouvrir dans le navigateur

Argos Panoptès, l’interview

Pour Framaspace, Framasoft a fait développer un outil de supervision de sites web nommé Argos Panoptès (ou juste Argos pour aller plus vite).

Développé par Alexis Métaireau, développeur entre autres du générateur de site statique Pelican, et de l’outil de gestion de dépenses à plusieurs « I Hate money » (repris dans l’app cospend sur Nextcloud), le besoin a été défini par Luc Didry, l’administrateur système de Framasoft.

Luc et Alexis répondent à nos questions dans cet interview, pour plus d’information concernant Argos vous pouvez consulter l’article dédié.

Bonjour à tous les deux :) Ici on connaît déjà Luc puisque c’est notre admin sys préféré, mais Alexis, peux-tu nous dire qui tu es pour le framablog ?

Alexis : Bonjour, Framasoft, et merci pour la discussion ! Et bien, c’est parti pour l’exercice de la présentation alors.

Je suis un développeur de bientôt 40 ans, intéressé par les dynamiques collectives, le logiciel libre et la protection des données personnelles, depuis quelques années maintenant. Par le passé j’ai pu publier et maintenir quelques outils comme Pelican, un générateur de sites statiques et I hate money, pour gérer les dépenses partagées. J’ai travaillé quelques années pour Mozilla sur la partie synchronisation et chiffrement des données (Firefox Sync, Kinto) et sur quelques autres outils.

J’ai quitté le développement « pro » entre 2018 et 2023. Durant ces années j’ai eu la chance / le privilège de pouvoir monter une brasserie sur Rennes avec un ami. Nous avons essayé de faire vivre les valeurs de la collaboration (plutôt que celles de la compétition). Cela est resté très proche des valeurs du logiciel libre, nos recettes et les plans de nos machines étant par exemple publiés sur notre site web.

À l’été 2023 j’ai décidé de quitter la brasserie pour à la fois refaire du développement et travailler sur les outils de la prise de décision collective, et la gestion des conflits dans les collectifs. C’est à ce moment que nous sommes rentrés en contact avec Luc pour travailler sur Argos.

Pouvez-vous nous présenter l’outil Argos sur lequel vous avez travaillé ? À quel besoin répond-il pour Framaspace ?

Alexis : Argos est un outil de supervision de sites web. L’idée est assez simple : surveiller que les sites vont bien, et générer des alertes quand c’est utile, en envoyant des notifications par email ou autre.

La spécificité d’Argos est de pouvoir gérer un nombre de sites important. Framaspace, en grossissant, expose pas loin de 900 domaines au public, qui parfois tombent en panne. Je crois que le réel besoin derrière Argos était de simplifier la vie de Luc (vous saviez qu’il n’y avait qu’un seul adminsys chez Framasoft ? ! !) et de lui permettre d’avoir une meilleure vision globale de l’état du service.

Les vérifications concernent les statuts du site web, mais aussi l’état des certificats SSL, par exemple, et quelques vérifications spécifiques.

Luc : On surveillait déjà plus de 200 sites via notre outil de supervision (Shinken), mais celui-ci, avec toutes les autres sondes de supervision de notre infrastructure, avait bien de la peine à repasser toutes les 5 minutes sur les sites. Ce qui faisait qu’on pouvait se rendre compte qu’un site était tombé au bout de trop de temps.

Avec Framaspace, je savais que j’aurai des centaines (et à terme des milliers) de sites à surveiller en plus, sachant qu’un site est la cible de plusieurs vérifications, comme dit par Alexis. Il fallait donc un outil dédié.

Les outils existants comme statping-ng ou Uptime Kuma présentent un défaut rédhibitoire : vouloir afficher l’état de chaque site en même temps sur l’interface web. Ça va bien quand on a quelques sites, pas quand on en a des centaines (l’outil peine à envoyer les données de centaines de sites).

C’est de là qu’est née l’idée d’Argos, qui a le bon goût de n’afficher qu’un résumé de l’état des sites par défaut.

 

4 blocs avec des statuts (inconnu, ok, avertissement, erreur) et pour chacun, un nombre correspondant.

Capture d’écran de la page de statut d’Argos

 

Si on regarde de plus près les coutures, on voit que c’est développé en langage Python avec une base de données en PostgreSQL. Laissez-moi deviner : Alexis a choisi Python et Luc a choisi PostgreSQL ?

Alexis : Ah, je vois que tu nous connais un peu, mais figure toi que même pas ! J’aurais aimé plaider coupable pour le coup, mais Luc cherchait spécifiquement quelqu’un qui savait faire du Python, et c’est comme ça qu’on s’est rencontré. J’ai proposé d’utiliser le framework FastAPI à la place de Flask parce que ça nous permettait de faire de l’asynchrone de manière plus simple, et d’utiliser les fonctionnalités de typage de Python.

Luc : Pour Framaspace, j’ai été plus ou moins obligé de faire du Python car Salt, l’orchestrateur utilisé pour déployer les espaces est en Python : je pouvais, en utilisant ce langage, l’utiliser comme une bibliothèque, sans utiliser de bidouilles sales.

Comme Argos a été créé dans le cadre de Framaspace, j’ai voulu garder le même langage de programmation, pour avoir un tout cohérent.

Python n’est pas un langage si pire que ça. Il n’est pas amusant, mais ça fait le job. Peut-être aussi que je vieillis : j’utilise de plus en plus Python pour des scripts. Peut-être qu’écrire des scripts ne m’amuse plus, et que je veux les écrire vite pour passer à autre chose.

Mème the Rock qui conduit - Et ton machin va être en Perl, comme d'hab - Non j'ai choisi Python cette fois The rock se retourne, interloqué

La question habituelle de libriste : pourquoi avez-vous choisi de développer un outil dédié, il n’existait pas d’outils libres pour de la supervision ? Quelles sont ses spécificités ?

Alexis : Je te laisse répondre Luc, c’est toi qui a affiné le besoin :-)

Luc : Ah bah zut, j’ai déjà répondu au-dessus 😅

L’avantage d’avoir notre propre outil nous permet aussi de le tordre pour nos besoins spécifiques. Ainsi Argos envoie-t-il des notifications à notre serveur Gotify. Intégrer un tel canal de communication dans un outil existant aurait pu prendre du temps (comprendre le code, faire une PR, attendre une release…).

En lisant la doc, ça a l’air tout simple à utiliser par rapport à d’autres outils ! ! Comme administrateur⋅ice système du dimanche après-midi, si je veux surveiller l’état de mes sites, est-ce qu’il y a des pièges ou des choses à savoir ?

Alexis : Je pense que ça pourrait tout à fait permettre de surveiller l’état de quelques sites, bien que peut-être surdimensionné. Argos a besoin de lancer un serveur, une base de données et des agents. Est-ce bien utile pour un⋅e adminSys du dimanche ? Peut-être !

Luc : Franchement, je pense qu’il peut être utilisé aussi bien par une grosse organisation que par un·e adminSys du dimanche. La configuration est simple, l’installation pas très compliquée, et il n’a pas l’air de consommer beaucoup de ressources.

Alexis tu étais en mode prestation pour développer, comment s’est passée la relation avec Framasoft ?

Alexis : Franchement, c’était une surprise totale, et un plaisir du début à la fin. On a d’abord pu se faire quelques appels avec Luc pour clarifier les besoins, je me suis retrouvé avec une liste de fonctionnalités de base, et j’ai avancé comme ça.

Quand j’avais besoin j’ai pu échanger avec Luc qui était toujours assez réactif, et j’ai pu lever quelques blocages. J’ai beaucoup apprécié répondre à un besoin concret, en ayant l’utilisateur final au bout du fil pour clarifier les choses.

Par la suite, on a pu se faire quelques sessions ensemble, à la fois de présentation de l’outil, puis de pair-programming pour accompagner Luc sur certains aspects quand c’était utile, l’idée étant que ce soit lui qui prenne la main sur le projet.

C’était en fait ma première mission en tant que « prestataire », je crois que je suis très bien tombé !

Luc : Pareil de mon côté, c’était très agréable de bosser avec toi !

Est-ce que vous pensez que ça peut être utilisé dans d’autres contextes que Framaspace ?

Alexis : je pense que ça peut être utilisé dans d’autres contextes bien sûr. Je pense aux « fermes de sites », comme par exemple ce que peut faire NoBlogs en Allemagne, mais de manière générale c’est utile d’avoir un outil simple d’accès pour faire de la supervision. Bosser là-dessus m’a donné envie de permettre de faire de la supervision « en tant que service », pour des collectifs pour qui ce serait utile, mais… j’imagine que c’est une autre histoire.

Luc : Carrément ! Pas seulement pour des fermes de sites mais partout où on a besoin d’une supervision qui passe très régulièrement. On peut avoir des vérifications effectuées toutes les minutes, ce qui peut être utile sur des sites qui ne doivent pas tomber. Et un grand nombre de sites ne devrait pas faire peur à Argos : on peut multiplier le nombre d’agents (le logiciel qui s’occupe d’effectuer les vérifications et d’en remonter le résultat au serveur), et le choix de PostgreSQL comme base de données a (aussi) été fait parce que c’est un SGBD robuste qui peut encaisser de la charge de travail.

Et est-ce que vous imaginez une suite, avec une feuille de route ou des invitations à contribuer ?

Luc : Il y a déjà des idées de développements futurs pour améliorer Argos, mais ça n’est pas urgent : la première version est déjà tout à fait fonctionnelle.

Alexis : J’aime bien l’idée de ne pas avoir de feuille de route trop précise pour le futur, ce qui nous permet de se concentrer sur des besoins réels et de ne pas en faire une usine à gaz. Si vous l’utilisez et que vous avez des retours à faire, ou bien si vous souhaitez contribuer, n’hésitez pas. C’est pensé pour être simple à étendre, donc n’hésitez pas à jeter un œil et à proposer des changements.

Si vous avez encore des choses à dire :)

Alexis : Coucou Numahell, chouette de te recroiser par ici après ces quelques années :-)

Luc : Merci à toi, Alexis, pour le temps bénévole que tu as consacré à Argos après ta prestation !

Pour aller plus loin

Podcast Projets Libres ! Des humain⋅es derrière les projets !

Le podcast est un média particulièrement consommé en France, comme le rappelait l’interview de Benjamin Bellamy de Castopod en mai 2022 sur ce même blog (aussi disponible en… podcast !). Il permet d’écouter une interview en faisant la vaisselle, des crêpes, ou du roller (mais pas en milieu urbain – ceci est un message de la sécurité routière). Cela veut dire, par exemple, que vous pouvez écouter cette interview de Pouhiou et Booteille sur le projet PeerTube par… Walid de Podcast Projets Libres ! tout en changeant le joint de culasse de votre ordinateur ! C’est dingue cette coïncidence, non ? !

Un petit micro interview un grand micro. CC-BY-SA JJJJOOOOOOOOOOEEEEEEEEEEEPINO

Peux-tu te présenter ? Qui es-tu ? D’où viens-tu ? Quelle est ta couleur préférée ?

Je m’appelle Walid Nouh, mon surnom est wawa (ou wawax).

J’ai découvert l’informatique (et le roller) à l’âge de huit ans. Depuis, je n’ai jamais arrêté :)

J’habite actuellement en région parisienne et je travaille dans une entreprise de l’économie sociale et solidaire dans la réparation et le reconditionnement de gros électroménager.

Ma couleur préférée est le noir.

À quel moment, dans ton parcours, as-tu croisé le logiciel libre ?

Durant mes années d’IUT. En cours, nous avions des ordinateurs sous Red Hat Linux.

Mon premier ordinateur personnel sous Linux c’était en 2000, il tournait sur une MandrakeLinux.

C’est à la sortie de mes études que j’ai vraiment découvert le libre et compris que c’était ce que j’allais faire dans les années à venir.

C’est lors de ma première expérience professionnelle, dans une ESN nommée Atos, que j’ai eu l’occasion de rejoindre le Centre Open Source de la compagnie, et de rencontrer d’autres personnes passionnées et qui avaient l’habitude de contribuer sur des projets libres.

Pourquoi le format podcast ?

Le podcast est ma manière préférée de consommer de l’information. J’écoute entre 10 et 20 heures de podcasts par semaine…

J’aime le fait que le format est libre, qu’on peut trouver des podcasts de niche, et que l’on peut aller très en profondeur dans les sujets.

Je suis un très grand fan des podcasts longs (entre 45 minutes et deux heures), j’ai d’ailleurs du mal à écouter des épisodes de 15 minutes.

On peut vraiment faire ce qu’on veut en écoutant un podcast – ici, un astronaute jouant avec l’apesanteur en écoutant un podcast

D’ailleurs, tes podcasts font très pros (format, montage) : des astuces ou bons logiciels à conseiller ?

Chaque épisode me prend 6 à 10 heures de travail  !

Pour arriver à ce résultat je passe énormément de temps à me documenter, écouter des podcasts ou vidéos, afin de réaliser une trame.

Je soumets ensuite cette trame au(x) invité(s), afin qu’ils puissent se préparer ou ajuster celle-ci.

Cette phase préparatoire peut prendre des semaines, car elle est nourrie par mes rencontres, réflexions ou lectures. Chaque épisode commence, pour moi, par la découverte du sujet et un questionnement sur l’angle que je veux donner à l’interview, et comment celle-ci s’inscrit dans la suite des précédentes.

Pour le montage j’utilise Audacity, c’est très classique (il faut que j’essaye Ardour…).

Pour la mise en ligne je passe par la plateforme libre Castopod, qui est très bien et nativement connectée au Fediverse.

Si je devais donner des conseils :

  1. bien réfléchir à sa ligne éditoriale, ce que l’on veut faire, et en quoi ses épisodes vont se distinguer de ce qui existe déjà dans l’univers du podcast.
  2. être clair sur l’objectif de son podcast : est-ce que l’on veut un podcast plutôt “live” ? (donc sans montage par la suite). Est-ce qu’on se fixe des limites en temps à passer par épisode ?
  3. est-ce que tu veux vivre ou te rémunérer avec ton podcast ? (Auquel cas renseigne-toi bien, regarde ce que font les autres pour trouver un modèle qui te convient).

De mon côté, je me suis fixé plusieurs règles :

  1. la durée de l’épisode n’est pas un problème
  2. je ne m’interdis aucun sujet : le podcast reflète mes intérêts. Je suis conscient que certains épisodes ne vont pas intéresser la majorité des gens, mais du moment que j’ai envie de le faire, alors il n’y a pas de raison de s’en priver :)
  3. je ne m’astreint à aucun calendrier de sortie fixe (même si j’aime bien le format de 2 par mois, mais ça risque de glisser plutôt vers 1 toute les trois semaines)
  4. je fais le minimum en termes de communication sur les réseaux sociaux et je laisse faire le bouche-à-oreille
  5. des épisodes peuvent être super techniques et d’autres grand public, à mon appréciation

Pourquoi le sujet du libre et non celui du roller ?

J’ai commencé les podcasts il y a deux ans par collaborer sur un podcast de roller, nommé Balado Roller. Dans ce podcast nous interviewons des personnes qui ont contribué à l’essor du roller. J’ai commencé par y être invité, puis co-animateur et aujourd’hui je réalise une partie des montages des épisodes auxquels je participe. Son audience est bien supérieure à celle de Projets Libres ! et nous savons qu’il est écouté par les professionnels de ce sport.

Le podcast Projets libres !, reprend le même concept mais appliqué à ma seconde passion, qui est le logiciel libre. La différence c’est que pour celui de roller nous sommes deux, et nous nous appuyons sur un site qui existe depuis 20 ans.

Pour Projets Libres !, je suis tout seul, c’est moi qui fait tout de A à Z, suivant mes propres désirs (je suis assez perfectionniste).

Une autre différence est que sur nos interviews roller, le travail de préparation a soit été déjà fait en amont sur le site rollerenligne.com au fil des années, soit il est minimal car nous connaissons personnellement la plupart de nos invités. Sur Projets Libres ! je dois faire beaucoup plus de recherche pour éviter de dire des bêtises, et aussi pour être sûr de la qualité de l’échange de l’on va avoir.

Comment choisis-tu qui tu vas interviewer ? En fonction des affinités ? Parce que tu utilises le logiciel ou projet ? Du buzz ?

C’est une combinaison de plusieurs facteurs :

  1. mes propres passions, sujets de fond. Principalement : la cartographie des projets francophones, les financements des projets, les transports, le Fediverse, les forks et les ERPs
  2. les personnes qui me contactent pour me proposer un sujet ou une mise en relation
  3. les rencontres que je fais sur les salons ou conférences, et qui alimentent mes réflexions
  4. les outils que j’utilise et dont je suis fan
  5. mon travail, dans le métier du reconditionnement, qui m’amène à vouloir creuser certains sujets qui m’intéressent

J’essaye de n’interviewer que des personnes qui sont au coeur des projets. Ma stratégie est de proposer un contenu original, que j’espère de qualité, et que les personnes concernées feront tourner dans leur communauté. Je ne souhaite pas faire de publicité. Ma communication est plutôt du type LinuxFR que du type LinkedIn.

Je fais des podcasts en français car c’est ma langue natale et aussi parce qu’il y  a déjà de très bons podcasts en anglais.

J’en profite d’ailleurs pour indiquer que des statistiques publiques du podcast sont disponibles ici : https://statistics.projets-libres.org/

Dans tes podcasts, tu te concentres sur l’histoire humaine derrière les projets : c’est important pour toi ?

Pas de logiciel libre sans femmes et hommes !

J’ai eu la chance d’être un professionnel du logiciel libre, actif dans l’univers francophone pendant plus de 10 ans, d’être core developer sur un logiciel, d’avoir participé au fork d’un autre, d’avoir travaillé en ESN spécialisées dans le libre. Partout où je suis passé j’ai rencontré des femmes et des hommes passionnés par le libre et ses valeurs.

C’est en partie ce que je cherche à mettre en valeur, en m’appuyant sur ma propre expérience.

Pour faire simple, je cherche à produire le contenu que j’aimerais entendre. Je suis souvent frustré à la fin d’une interview car personnellement j’aurais posé d’autres questions, ou creusé d’autres sujets !

Mes podcasts ont pour but d’être complémentaires avec ceux qui existent déjà, que j’écoute régulièrement et que j’aprécie.

Qui aimerais-tu interviewer pour un prochain épisode ?

J’ai comme projet d’essayer interviewer toutes les associations historiques du libre.

L’idée serait de pouvoir faire une cartographie ou une frise temporelle de l’apparition des unes par rapport aux autres.

Je vais aussi me concentrer sur la notion de fork, et ce que cela veut dire au niveau humain (pour les personnes qui forkent, et pour les mainteneurs qui se font forker).

Bref, j’ai déjà une feuille de route pour les 6 mois à venir ^^

Page Castopod de Projets Podcasts Libres !

Quels sont les défis à venir pour le podcast ?

  1. Durer. Je me suis fixé 1 an sous cette forme et seul. Le podcast est un travail journalier, qui me prend presque tout mon temps libre.
    En 2024, il va falloir que je constitue une équipe, pour aider à monter en qualité et garder un rythme raisonnable.
  2. La parité femme/homme dans les interviews. Ce n’est pas si simple, mais j’y travaille et c’est très important pour moi.
  3. Se renouveler, d’avoir toujours des bonnes personnes avec du contenu intéressant.
  4. Il va falloir que je me finance mes besoins en me basant sur le don : je ne suis pas intéressé par mettre la publication ou du sponsoring dans le podcast. Comment donc faire en sorte que les gens acceptent de me financer, sans que cela ne me demande plus de travail supplémentaire (par exemple faire du contenu exclusif pour ses donateurs). Dans une démarche bénévole, tout contenu que je produis est du temps que je ne passe pas pour d’autres projets ou dans ma vie personnelle
  5. Réaliser un épisode avec sa transcription : c’est un défi permanent, car cela ajoute plusieurs heures de travail par épisode :)

La transcription des épisodes doit effectivement prendre un temps fou. C’est important pour toi ?

C’est une des premières choses qui m’a été demandé, et j’avais mis le sujet de côté car je ne pouvais pas tout faire. C’est en lisant le manifeste de Julie Moynat, relayé par Frédéric Couchet que j’ai remis le sujet au goût du jour.

La transcription a plusieurs fonctions :

  1. permettre aux gens qui ne veulent pas ou ne peuvent pas écouter le podcast de suivre notre conversation. Je dois avouer que, dans le cadre de mon travail, je déteste les tutoriels vidéos car tu ne peux pas rechercher dedans pour trouver exactement ce que tu veux…
  2. elle améliore le référencement du texte
  3. elle participe à la démarche “de ne pas juste avoir un podcast” mais d’avoir un media

Techniquement je passe par un service (non libre) de transcription. Je dois ensuite retravailler les phrases pour en faire un texte lisible. Cela pose des questions sur le niveau de retravail, entre avoir un texte en bon français et garder le sens et l’atmosphère de l’interview. J’ai bien essayé de demander une IA de me corriger les phrases sans les modifier, mais je n’ai pas encore atteint le bon résultat. J’ai des échanges avec Benjamin Bellamy de Castopod, car c’est un de leurs axes de travail actuel.

N’étant pas un professionnel, la correction transcription d’un épisode d’un heure me prend 2 à 3 heures de travail (avec la mise en forme sur le site). C’est une des raisons pour lesquelles je pense changer le rythme de sortie des épisodes.

Je voudrais faire quelques remerciements :

  • ma femme qui supporte tous mes enregistrements et mes conversations autour du podcast !
  • mes amis et collègues pour les idées, écoutes et commentaires
  • mon ami Emilien Martinoty pour son aide et pour création et maintenance du site
  • l’équipe de Castopod pour la migration sur leur plate-forme et les discussions régulières
  • tous les invités qui m’ont fait confiance
  • pour finir toute l’équipe framasoft pour leur accueil et la promotion de mon podcast

Quelques liens :

Piwigo, la photo en liberté

Nous avons profité de la sortie d’une nouvelle version de l’application mobile pour interroger l’équipe de Piwigo, et plus particulièrement Pierrick, le créateur de ce logiciel libre qui a fêté ses vingt ans et qui est, c’est incroyable, rentable.

 

 

 

Salut l’équipe de Piwigo ! Nous avons lu avec intérêt la page https://fr.piwigo.com/qui-sommes-nous

Moi je note que « Piwigo » c’est plus sympa que « PhpWebGallery », comme nom de logiciel. Enfin, un logiciel libre qui n’a pas un nom trop tordu. Qu’est-ce que vous pouvez nous apprendre sur Piwigo, le logiciel ?

Piwigo est un logiciel libre de gestion de photothèque. Il s’agit d’une application web, donc accessible depuis un navigateur web, que l’on peut également consulter et administrer avec des applications mobiles. Au-delà des photos, Piwigo permet d’organiser et indexer tout type de média : images, vidéos, documents PDF et autres fichiers de travail des graphistes. Originellement conçu pour les particuliers, il s’est au fil des ans trouvé un public auprès des organisations de toutes tailles.

 

Le logo de Piwigo, le logiciel

 

La gestation du projet PhpWebGallery démarre fin 2001 et la première version sortira aux vacances de Pâques 2002. Pendant les vacances, car j’étais étudiant en école d’ingénieur à Lyon et j’ai eu besoin de temps libre pour finaliser la première version. Le logiciel a tout de suite rencontré un public et des contributeurs ont rejoint l’aventure. En 2009, « PhpWebGallery » est renommé « Piwigo » mais seul le nom a changé, il s’agit du même projet.

Les huit premières années, le projet était entièrement bénévole, avec des contributeurs (de qualité) qui donnaient de leur temps libre et de leurs compétences. Le passage d’étudiant à salarié m’a donné du temps libre, vraiment beaucoup. Je faisais pas mal d’heures pour mon employeur mais en comparaison avec le rythme prépa/école, c’était très tranquille : pas de devoirs à faire le soir ! Donc Piwigo a beaucoup avancé durant cette période. Devenu parent puis propriétaire d’un appartement, avec les travaux à faire… mon temps libre a fondu et il a fallu faire des choix. Soit j’arrêtais le projet et il aurait été repris par la communauté, soit je trouvais un modèle économique viable et compatible avec le projet pour en faire mon métier. Si je suis ici pour en parler douze ans plus tard, c’est que cette deuxième option a été retenue.

En 2010 vous lancez le service piwigo.com ; un logiciel libre dont les auteurs ne crèvent pas de faim, c’est plutôt bien. Est-ce que c’est vrai ? Avez-vous trouvé votre modèle économique ?

 

Le logo de Piwigo, le service

 

Pour ce qui me concerne, je ne crève pas du tout de faim. J’ai pu rapidement retrouver des revenus équivalents à mon ancien salaire. Et davantage aujourd’hui. J’estime vivre très confortablement et ne manquer de rien. Ceci est très subjectif et mon mode de vie pourrait paraître « austère » pour certains et « extravagant » pour d’autres. En tout cas moi cela me convient :-)

Notre modèle économique a un peu évolué en 12 ans. Si l’objectif est depuis le départ de se concentrer sur la vente d’abonnements, il a fallu quelques années pour que cela couvre mon salaire. J’ai eu l’opportunité de réaliser des prestations de dev en parallèle de Piwigo les premières années pour compenser la croissance lente des ventes d’abonnements.

Ce qui a beaucoup changé c’est notre cible : on est passé d’une cible B2C (à destination des individus) à une cible B2B (à destination des organisations). Et cela a tout changé en terme de chiffre d’affaires. Malheureusement ou plutôt « factuellement » nous plafonnons depuis longtemps sur les particuliers. Nos offres Entreprise quant à elles sont en croissance continue, sans que l’on atteigne encore de plafond. Nous avons donc décidé de communiquer vers cette cible. Piwigo reste utilisable pour des particuliers bien sûr, mais ce sont prioritairement les organisations qui vont orienter notre feuille de route.

Grâce à la réorientation de notre modèle économique, il a été possible de faire grossir l’équipe.

Donc on a Piwigo.org qui fournit le logiciel libre que chacun⋅e peut installer à condition d’en avoir les compétences, et Piwigo.com, service commercial géré par ton équipe et toi. Vous vous chargez de la maintenance, des mises à jour, des sauvegardes.

Qui est vraiment derrière Piwigo.com aujourd’hui ? Et combien de gens est-ce que ça fait vivre ?

Une petite équipe mêlant des salariés, dont plusieurs alternants, des freelances dans les domaines du support, de la communication, du design ou encore de la gestion administrative. Cela représente 8 personnes, certaines à temps plein, d’autres à temps partiel. J’exclus le cabinet comptable, même s’il y passe du temps compte tenu du nombre de transactions que les abonnements représentent…

Qu’est-ce qui est lourd ?

Certains aspects purement comptables de l’activité. La gestion de la TVA par exemple. Non pas le principe de la TVA mais les règles autour de la TVA. Nous vendons en France, dans la zone Euro et hors zone Euro : à chaque situation sa règle d’application des taxes. Les PCA (produits constatés d’avance) sont aussi une petite source de tracas qu’il a fallu gérer proprement. Jamais je n’aurais imaginé passer autant de temps sur ce genre de sujets en lançant le projet commercial.

Qu’est-ce qui est cool ?
Constater que Piwigo est leur principal outil de travail de nombreux clients. On comprend alors que certains choix de design, certaines optimisations de performances font pour eux une grande différence au quotidien.

 

Création d’un⋅e utilisateur⋅ice

 

Nous avons lancé depuis quelques semaines une série d’entretiens utilisateurs durant lesquels des clients nous montrent comment ils utilisent Piwigo et c’est assez génial de les voir utiliser voire détourner les fonctionnalités que l’on a développées.

D’un point de vue vraiment personnel, ce que je trouve cool c’est qu’un projet démarré sur mon temps libre pendant mes études soit devenu créateur d’emplois. Et j’espère un emploi « intéressant » pour les personnes concernées. Qu’elles soient participantes à l’aventure ou utilisatrices dans leur métier. Je crois vraiment au rôle social de l’entreprise et je suis particulièrement fier que Piwigo figure dans le parcours professionnel de nombreuses personnes.

Votre liste de clients https://fr.piwigo.com/clients est impressionnante…

Oui, je suis d’accord : ça claque ! et bien sûr tout est absolument authentique. Évidemment on n’affiche qu’une portion microscopique de notre liste de clients.

Recevez-vous des commandes spécifiques des gros clients pour développer certaines fonctionnalités ?

Pourquoi des « gros » ? Certaines entreprises « pas très grosses » ont des demandes spécifiques aussi. Bon, en pratique c’est vrai que certains « gros » ont l’habitude que l’outil s’adapte à leur besoin et pas le contraire. Donc parfois on adapte : en personnalisant l’interface quasiment toujours, en développant des plugins parfois. C’est moins de 5 % de nos clients qui vont payer une prestation de développement. Vendre ce type de prestation n’est pas au cœur de notre modèle économique mais ne pas le proposer pourrait nuire à la vente d’abonnements, donc on est ouverts aux demandes.

Est-ce que vous refusez de faire certaines choses ?

D’un point de vue du développement ? Pas souvent. Je n’ai pas souvenir de demandes suffisamment farfelues… pardon « spécifiques » pour qu’on les refuse a priori. En revanche il y a des choses qu’on refuse systématiquement : répondre à des appels d’offre et autre « marchés publics ». Quand une administration nous contacte et nous envoie des « dossiers » avec des listes de questions à rallonge, on s’assure qu’il n’y a pas d’appel d’offre derrière car on ne rentrera pas dans le processus. Nous ne vendons pas assez cher pour nous permettre de répondre à des appels d’offre. Je comprends que les entreprises qui vendent des tickets à 50k€+ se permettent ce genre de démarche administrative, mais avec notre ticket entre 500€ et 4 000€, on serait perdant à tous les coups. Le « coût administratif » d’un appel d’offre est plus élevé que le coût opérationnel de la solution proposée. C’est aberrant et on refuse de rentrer là-dedans.

Bien que nous refusions de répondre à cette complexité administrative (très française), nous avons de nombreuses administrations comme clients : ministère, mairies, conseils départementaux, offices de tourisme… Comme quoi c’est possible (et légal) de ne pas gaspiller de l’énergie et du temps à remplir des dossiers.

Y a-t-il beaucoup de particuliers qui, comme moi, vous confient leurs photos ? Faites péter les chiffres qui décoiffent !

Environ 2000 particuliers sont clients de notre offre hébergée. Ils sont bien plus nombreux à confier leurs photos à Piwigo, mais ils ne sont pas hébergés sur nos serveurs. Notre dernière enquête en 2020 indiquait qu’environ un utilisateur sur dix était client de Piwigo.com [donc 90% des gens qui utilisent le logiciel Piwigo s’auto-hébergent ou s’hébergent ailleurs, NDLR] .

Si on élargit un peu le champ de vision, on estime qu’il y a entre 50 000 et 500 000 installations de Piwigo dans le monde. Avec une énorme majorité d’installations hors Piwigo.com donc. Difficile à chiffrer précisément car Piwigo ne traque pas les installations.

 

La page d’administration de Piwigo

 

Pour des chiffres qui « décoiffent », je dirais qu’on a fait 30 % de croissance en 2020. Puis encore 30 % de croissance en 2021 (merci les confinements…) et qu’on revient à notre rythme de croisière de +15 % par an en 2022. Dans le contexte actuel de difficulté des entreprises, je trouve qu’on s’en sort bien !

Autre chiffre qui décoiffe : on n’a pas levé un seul euro. Aucun business angel, aucune levée de fonds auprès d’investisseurs. Notre croissance est douce mais sereine. Attention pour autant : je ne dénigre pas le principe de lever des fonds. Cela permet d’aller beaucoup plus vite. Vers le succès ou l’échec, mais beaucoup plus vite ! Rien ne dit que si c’était à refaire, je n’essaierais pas de lever des fonds.

Encore un chiffre respectable : Piwigo a soufflé sa vingtième bougie en 2022. Le projet a connu plusieurs phases et nous vivons actuellement celle de la professionnalisation. Beaucoup de projets libres s’arrêtent avant et disparaissent car ils ne franchissent pas cette étape. Si certains voient dans l’arrivée de l’argent une « trahison » de la communauté, je trouve au contraire que c’est sain et gage de pérennité. Lorsque les fondateurs d’un projet ont besoin d’un modèle économique viable pour payer leurs propres factures, vous pouvez être sûrs que le projet ne va pas être abandonné sur un coup de tête.

Est-ce que les réseaux sociaux axés sur la photographie concurrencent Piwigo ? On pense à Instagram mais aussi à Pixelfed, évidemment.

J’ai regardé rapidement ce qu’était Pixelfed. Ma conclusion au bout de quelques minutes : c’est un clone opensource à Instagram, en mode décentralisé.

Piwigo n’est pas un réseau social. Pour certains utilisateurs, Piwigo a perdu de son intérêt dès lors que Facebook et ses albums photos sont arrivés. Pour d’autres, Piwigo constitue au contraire une solution pour ceux qui refusent la centralisation/uniformisation telle que proposée par Facebook ou Google. Enfin pour de nombreux clients pro (photographes ou entreprises) Piwigo est un outil à usage interne de l’équipe communication pour organiser les ressources média qui seront ensuite utilisées sur les réseaux sociaux. Il faut comprendre que pour les chargés de communication d’un office de tourisme, mettre sa photothèque sur Facebook n’a aucun sens. Ils ou elles publient quelques photos sur Facebook, sur Instagram ou autres, mais leur photothèque est organisée sur leur Piwigo.

Bref, même si les premières années je me suis demandé si Piwigo était encore pertinent face à l’émergence de ces nouvelles formes de communication, je sais aujourd’hui que Piwigo n’est pas en concurrence frontale avec ces derniers mais qu’au contraire, l’existence de ces réseaux nécessite pour les marques/entreprises qu’elles organisent leurs photothèques. Piwigo est là pour les y aider.

Quelles sont les différences ?

La toute première des choses, c’est la temporalité. Les réseaux sociaux sont excellents pour obtenir une exposition forte et éphémère de votre « actualité ». À l’inverse, Piwigo va exceller pour vous permettre de retrouver un lot de photos parmi des centaines de milliers, organisées au fil des années. Piwigo permet de gérer son patrimoine photo (et autres médias) sur le temps long.

L’autre aspect important c’est le travail en équipe. Un réseau social est généralement conçu autour d’une seule personne qui administre le compte. Dans Piwigo, plusieurs administrateurs collaborent (à un instant T ou dans la durée) pour construire la photothèque : classification, indexation (tags, titre, descriptions…)

Enfin, certaines fonctionnalités n’ont tout simplement rien à voir. Par exemple, dans un réseau social le cœur de métier va être d’obtenir des likes. Dans un Piwigo, vous allez pouvoir mettre en place un moteur de recherche multicritères avec vos propres critères. Par exemple on a un client qui fabrique des matériaux acoustiques. Ses critères de recherche sont collection, coloris, lieu d’implantation… Cela n’aurait aucun sens sur l’interface uniformisée d’un Instagram.

Qui apporte des contributions à Piwigo ? Est-ce que c’est surtout la core team ?

Cela a beaucoup changé avec le temps. Et même ce qu’on appelle aujourd’hui « équipe » n’est plus la même chose que ce qu’on appelait « équipe » il y a 10 ans. Aujourd’hui, l’équipe c’est essentiellement celle du projet commercial. Pas uniquement mais quand même pas mal.

On a donc beaucoup de contributions « internes » mais ce serait trop simplificateur d’ignorer l’énorme apport de la communauté de contributeurs au sens large. Déjà parce que l’état actuel de Piwigo repose sur les fondations créées par une communauté de développeurs bénévoles. Ensuite parce qu’on reçoit bien sûr des contributions sous forme de rapports de bugs, des pull-requests mais aussi grâce à des bénévoles qui aident des utilisateurs sur les forums communautaires, les bêta-testeurs… sans oublier les centaines de traducteurs.

Petite anecdote dont je suis fier : Rasmus Lerdorf, créateur de PHP (le langage de programmation principalement utilisé dans Piwigo) nous a plusieurs fois envoyé des patches pour que Piwigo soit compatibles avec les dernières versions de PHP.

 

Quel est votre lien avec le monde du Libre ? (<troll>y a-t-il un monde du Libre ?</troll>)

Je ne sais pas s’il y a un « monde du libre ». Historiquement Les contributeurs sont d’abord des utilisateurs du logiciel qui ont voulu le faire évoluer. Je ne suis pas certain qu’il s’agisse de fervents défenseurs du logiciel libre.

Franchement je ne sais pas trop comment répondre à cette question. Je sais que Piwigo est une brique de ce monde du libre mais je ne suis pas sûr que l’on conscientise le fait de faire partie d’un mouvement global. Je pense qu’on est pragmatique plutôt qu’idéologique.

 

En tant que client, je viens de recevoir le mail qui annonce le changement de tarif. Pouvez-vous nous expliquer l’origine de cette décision ?

Là on est vraiment sur l’actualité « à chaud ». Le changement de tarif pour les nouveaux/futurs clients a fait l’objet d’une longue réflexion et préparation. Je dirais qu’on le prépare depuis 18 mois.

 

Si j’ai bien compris la clientèle particulière est un tout petit pourcentage de la clientèle de Piwigo.com ?

Les clients de l’ancienne offre « individuelle » représentent 30 % du chiffre d’affaires des abonnements pour 91 % des clients. J’exclus les prestations de dev, qui sont exclusivement ordonnées par des entreprises. Donc « tout petit pourcentage », ça dépend du point de vue :-)

Est-ce que l’offre de stockage illimité devient trop chère ?

En moyenne sur l’ensemble des clients individuels, on est à ~30 Go de stockage utilisé. La médiane est quant à elle de 5Go. Si la marge financière dégagée n’est pas folle, on ne perd pas d’argent pour autant, car nous avons réussi à ne pas payer le stockage trop cher. Pour faire simple : on n’utilise pas de stockage cloud type Amazon Web Services, Google Cloud ou Microsoft Azure. Sinon on serait clairement perdant.

Ceci est vrai tant qu’on propose de l’illimité sur les photos. Sauf que la première demande au support, devant toutes les autres, c’est : « puis-je ajouter mes vidéos ? », et cela change la donne. Hors de question de proposer de l’illimité sur les vidéos. De l’autre côté, on entend et on comprend la demande des utilisateurs concernant les vidéos. Donc on veut proposer les vidéos, mais il faut en parallèle introduire un quota de stockage.

Ensuite nous avions un souci de cohérence entre l’offre individuelle (stockage illimité mais photos uniquement) et les offres entreprise (quota de stockage et tout type de fichiers). La solution qui nous paraît la meilleure est d’imposer un quota pour toutes les offres, mais un quota généreux. L’offre « Perso » est à 50 Go de stockage, donc largement au-delà de la conso moyenne.

Enfin la principe de l’illimité est problématique. En 12 ans, la perception du grand public sur le numérique a évolué. Je parle spécifiquement de la consommation de ressources que le numérique représente. Le cloud, ce sont des serveurs dans des centres de données qui consomment de l’électricité, etc. En 2023, je pense que tout le monde a intégré le fait que nous vivons dans un monde fini. Ceci n’est pas compatible avec la notion de stockage infini. Je peux vous assurer que certains utilisateurs n’ont pas conscience de cette finitude.

Est-ce que des pros ont utilisé cette offre destinée aux particuliers pour « abuser » ?

Il y a des abus sur l’utilisation de l’espace de stockage, mais pas spécialement par des pros. On a des particuliers qui scannent des documents en haute résolution par dizaine de milliers pour des téraoctets stockés… On a des particuliers qui sont fans de telle ou telle star de cinéma et qui font des captures d’écran chaque seconde de chaque film de cet acteur. Ne rigolez pas, cela existe.

En revanche on avait un soucis de positionnement : l’offre « individuelle » n’était pas très appropriée pour les photographes pros mais l’offre entreprise était trop chère. On a maintenant des offres mieux étagées et on espère que cela sera plus pertinent pour ce type de client.

Enfin on a des entreprises qui essaient de prendre l’offre individuelle en se faisant passer pour des particuliers. Et là on est obligés de faire les gendarmes. On a même détecté des « patterns » de ses entreprises et on annulait les commandes « individuelles » de ces clients. J’en avais personnellement un petit peu ras le bol :-)

Les nouvelles offres, même « Perso » sont accessibles même à des multinationales. Évidemment, les limites qu’on a fixées devraient naturellement les orienter vers nos offres Entreprise (nouvelle génération) voire VIP.

 

Est-ce qu’il s’agissait d’une offre qui se voulait temporaire et que vous avez laissé filer parce que vous étiez sur autre chose ?

 

Pendant 12 ans ? Non non, le choix de proposer de l’illimité en 2010 était réfléchi et « à durée indéterminée ». Les besoins et les possibilités et surtout les demandes ont changé. On s’adapte. On espère ne pas se tromper et si c’est le cas on fera des ajustements.

L’important c’est de pas mettre nos clients au pied du mur : ils peuvent renouveler sur leur offre d’origine. On a toujours proposé cela et on ne compte pas changer cette règle. C’est assez unique dans notre secteur d’activité mais on y tient.

Nous avons vu que votre actualité c’était la nouvelle version de Piwigo NG. Je crois que vous avez besoin d’aide. Vous pouvez nous en parler ?

Nous avons plusieurs actualités et effectivement côté logiciel, c’est la sortie de la version 2 de l’application mobile pour Android. Piwigo NG (comme Next Generation) est le résultat du travail de Rémi, qui travaille sur Piwigo depuis deux ans. Après avoir voulu faire évoluer l’application « native » sans succès, il a créé en deux semaines un prototype d’application mobile en Flutter. Ce qu’il avait fait en deux semaines était meilleur que ce que l’on galérait à obtenir avec l’application native en plusieurs mois. On a donc décidé de basculer sur cette nouvelle technologie. Un an après la sortie de Piwigo NG, Rémi sort une version 2 toujours sur Flutter mais avec une nouvelle architecture « plus propice aux évolutions ». Le fameux « il faut refactorer tous les six mois », devise des développeurs Java.

En effet nous avons besoin d’aide pour bêta-tester cette version 2 de Piwigo NG. Plus nous avons de retours, plus nous pouvons la stabiliser.

Pour aller plus loin

PVH éditions et Ludomire : édités, libérés

Le 12 janvier dernier, PVH éditions a annoncé la libération de sa collection Ludomire. Vu la faible fréquence de ce genre de démarche dans le milieu de l’édition traditionnelle, nous avons eu envie d’aller interroger ce courageux éditeur suisse.

Rencontre avec un éditeur qui libère

Bonjour, pourriez-vous tout d’abord présenter rapidement PVH éditions, son histoire et catalogue ?

PVH éditions est une maison d’édition franco-suisse spécialisée dans la science-fiction, la fantasy et le fantastique, qu’on appelle parfois « littérature de l’Imaginaire » mais je préfère dire SFFF qui rend mieux compte de tous les genres et sous-genres qu’il renferme. Notre activité éditoriale a démarré en 2014, mais nous nous sommes réellement professionnalisés fin 2020. C’est à ce moment où tout s’est accéléré : en deux ans nous avons doublé la taille de notre catalogue, embauché six personnes et obtenu un contrat de diffusion auprès de CED-CEDIF (distribution Pollen).

Pendant les premières années, nous avons beaucoup expérimenté : livre de voyage, jeu de société, etc. Mais en 2021, nous avons resserré notre catalogue qui comprend essentiellement la collection Ludomire (16 romans et recueils de nouvelles), la collection Bretteur (4 romans et recueils de contes), quelques coéditions en jeu de rôle (Mississippi et Oreinidia) et des essais décalés autour de Bitcoin (Objective Thune et La monnaie à pétales).

Couverture de Ceux qui changent

Malgré les évolutions de ces dernières années, l’ADN de PVH éditions reste celle du début : il s’agit d’un projet artistique un peu fou de deux amis, Christophe Gérard et moi. Le caractère bicéphale et binational s’incarne dans deux structures : PVH éditions, dirigé par moi-même à Neuchâtel en Suisse, et PVH Labs, dirigé par Christophe à Montboillon en Haute-Saône (France). L’équipe de quatre personnes de PVH éditions se charge du développement éditorial : édition de livres, projets de traduction, etc. Celle de PVH Labs, quatre personnes également, se charge du développement software, de la commercialisation dans l’UE et un studio de production de nouveaux formats pour nos romans.

Ainsi en ce début 2023, nous commençons une nouvelle phase de la pérennisation de notre structure. L’enjeu est de faire connaître nos auteurs et nos livres et mener à bien deux projets d’envergure : les développements et le lancement de notre boutique en ligne p2p, La Bookinerie, et de nos Romans augmentés. Ces deux projets, basés sur des logiciels libres, sont liés à la libération de la collection Ludomire.

Vous avez décidé de basculer une partie de votre catalogue, à savoir la collection Ludomire, sous licence libre, comment est née cette envie, et pourquoi le faire ?

L’envie a toujours été là. La question devrait être : pourquoi ne l’avons-nous pas fait avant ? Pour ma part, je m’intéresse aux logiciels libres depuis bien longtemps et j’en utilise autant que possible. Je me suis beaucoup intéressé aux licences Creative Commons bien avant d’être éditeur. J’ai suivi les expériences créatives de Ploum et Thierry Crouzet sur leurs blogs. Ce n’est d’ailleurs pas un hasard si j’ai édité certaines de leurs œuvres. Dès 2020, nous avons inscrit dans notre ligne éditoriale notre « intérêt pour la culture libre ». En 2021, nous avons lancé le format print@home sous licence CC BY-NC-SA. La libération des œuvres s’inscrit dans notre ADN, dans une suite logique.

Couverture de One Minute

Alors je la pose : pourquoi ne l’avez-vous pas fait avant ?

Quand on a démarré l’édition, on avait beaucoup de choses à apprendre, à mettre en place. Notre objectif était avant tout de sortir des beaux livres et de rentrer dans nos sous. Rester dans les clous est clairement un confort, on discute avec d’autres éditeurs, on reprend les modèles de contrats que l’on nous partage. L’utilisation de licences libres n’était pas une priorité, même si c’était une envie.

J’avais également le sentiment que libérer des œuvres, comme ça, sans projet, ça aurait été un peu bidon. Pourquoi libérer des œuvres si on continue à fonctionner de la même manière que quand on utilisait un copyright ? Je pense que j’avais besoin de réfléchir au sens d’une telle démarche selon le prisme de l’éditeur. Nous avions également besoin d’arriver à un point de stabilité chez PVH éditions qui nous permette de nous investir dans une telle transformation. Et surtout, je voulais inscrire cette libération dans un projet éditorial ambitieux et cohérent.

C’est ainsi que notre diffusion en France et en Belgique (signée en juillet et en place depuis novembre 2022) a apporté le temps et la stabilité qui m’a permis de préparer cette libération pendant le deuxième semestre 2022. En décembre, nous avons obtenu un financement public important pour la mise en place de notre boutique en ligne p2p, La Bookinerie, sur 2023 et 2024. À présent, si j’ose dire, je déroule un programme mûrement réfléchi.

Vous parlez de la question des répercussions avec les partenaires, quel accueil a reçu votre idée ? Comment ont réagi les collègues éditeurs ? David Revoy avait eu pas mal de souci à l’époque de la première édition chez Glénat de Pepper & Carrot, vous n’êtes pas inquiets ?

Pour le moment, je n’ai pas de retour négatif. Mon diffuseur semble intrigué et il y voit une opportunité pour encore mieux mettre en valeur la collection Ludomire auprès des libraires. Dernièrement, j’ai eu des discussions avec un éditeur européen pour faire traduire certaines œuvres, et il m’a dit : « No problem, I like copyleft ». J’ai également l’impression que le choix d’une telle licence peut être bien vu pour obtenir de l’argent public, même si je pense qu’ils s’en fichent un peu. C’est plutôt encourageant non ?

Clairement, j’avais certaines inquiétudes mais je n’en ai plus vraiment. En réalité, on en fait une énormité mais j’ai surtout l’impression que la plupart des gens se fichent bien de la licence. C’est surtout dans des projets d’adaptation que ça aura de l’importance. Je vous tiendrai au courant.

Couverture de L’héritage des sombres

Pour beaucoup, libérer des œuvres, cela revient à dire qu’elles sont gratuites. Vous venez de l’édition traditionnelle, n’êtes pas des utopistes et avez dû faire quelques calculs. Comment envisagez-vous les choses, financièrement parlant ?

Bien entendu que j’ai fait mes calculs (même si parfois on navigue au doigt mouillé). En réalité, il était important d’assurer une base solide : une belle collection proposée en librairie, des sorties régulières déjà planifiées. La libération de la collection Ludomire n’aura pas d’effet négatif sur ce socle. Le fait que le livre sera disponible gratuitement en version numérique n’aura pas d’influence sur les ventes en librairie. C’est ce que j’ai aussi constaté avec les œuvres de Ploum, qui invitait (avec ma bénédiction) à télécharger gratuitement les e-books. Ça n’a pas empêché Printeurs d’être notre meilleure vente e-book.

Clairement, je pense que cette libération ne peut qu’avoir un effet bénéfique : gagner en visibilité dans les médias, toucher de nouveaux publics, renforcer l’engagement de nos lecteurs. La Bookinerie, qui sera en gros un outil de crowdfunding autohébergé et sans intermédiaire, pourrait être une source financière complémentaire. On est clairement dans l’expérimentation.

Vous avez choisi la licence CC BY SA, qui place les œuvres dans les Communs, et qui est donc plus complexe à intégrer dans des circuits classiques, alors que d’autres licences libres moins engagées existaient (CC BY notamment). Qu’est ce qui a motivé ce choix ?

Nous avons publié un article pour expliquer le choix de notre licence. J’y explique en gros que selon moi pour un éditeur, il y a le choix du copyright ou le choix du copyleft. Le CC BY n’offre aucun avantage et permet la prédation. En tant qu’éditeur, notre métier consiste à exploiter des œuvres et leurs dérivés, soit on les conserve jalousement, soit on espère que d’autres nous aideront à les exploiter. Laisser la possibilité à d’autres de refermer la licence ne nous est donc d’aucune aide.

Après oui, c’est aussi un choix engagé. Si cela ne tenait qu’à moi, la propriété intellectuelle serait abolie, c’est selon moi un archaïsme. Mais c’est aussi un choix pragmatique qui permet de me démarquer des autres éditeurs de SFFF. J’ai également l’intime conviction que le monde de l’édition a besoin de se réinventer pour survivre. La propriété intellectuelle ne sert que les grands acteurs qui ont les moyens de le défendre. Comme challenger, nous avons tout à gagner de sortir du cadre.

Couverture de À l’orée de la ville

Vous allez très loin dans la mise en commun, en proposant une version à imprimer soi-même. Pourquoi aller jusque là ?

Parce que nous nous intéressons à tous les lecteurs potentiels et que plus de la moitié des francophones sont en Afrique. Dans cette région du monde, l’accès au livre est compliqué pour des raisons logistiques et à cause du pouvoir d’achat. Le print@home, inspiré par la difficile accessibilité de nos livres pendant le premier confinement, est un moyen d’offrir un accès imprimé à nos livres pour ces populations. Il sera l’un des formats au cœur de notre boutique online p2p, La Bookinerie.

Et en réalité, si on réfléchit bien à la décision de libérer une œuvre, le but est de la rendre accessible soi-même dans tous les formats pertinents et d’en être la source originelle. C’est ainsi qu’on peut cultiver un public et promouvoir les autres œuvres dans les mêmes formats. La logique commerciale change, je pense. Mais c’est l’expérience qui permettra d’y répondre.

Couverture de La Couronne boréale

Avez-vous un workflow basé sur des outils libres, également ? Si oui, envisagez-vous de le partager ?

La boutique online p2p est un projet de logiciel libre. Il sera bien entendu partagé dès qu’il aura une version stable. Nous développons également des romans augmentés avec le logiciel Ren’Py et nous allons développer des fonctionnalités nouvelles à nos frais qui seront partagées également.

En interne, nous utilisons autant que possible Ubuntu et des logiciels libres, mais ce n’est pas très structuré. J’espère en faire une seconde étape dans le projet de libération de nos collections et de nos outils. Mais, la priorité est déjà de mener à bien la première étape et survivre. Mais il est évident que tout ce que nous développerons de solide sera partagé : contrats, logiciels, procédures, etc.

Parmi les auteurices impliqués, on retrouve des personnes comme Aquilegia Nox, Thierry Crouzet ou Ploum que tu as cités et qui avaient déjà réfléchi aux licences libres. Comment se sont déroulés les échanges avec celleux qui découvraient ? Quelles étaient leurs plus grandes interrogations, leurs plus grandes craintes ?

Effectivement, Thierry, Ploum et Aquilegia Nox sont des vétérans dans le domaine. Il n’y a pas eu besoin de beaucoup d’efforts pour les convaincre. Mais, pour les autres auteurs·rices, ça a été finalement assez facile aussi. Ils nous font confiance. Il y a deux questions qui reviennent souvent : Qu’est-ce que ça change ? Ben pas grand chose en réalité. Dans un contrat d’édition classique, l’auteur cède tous les droits (à l’exception des droits moraux inaliénables) à l’éditeur. Ils perdent de facto le contrôle de leur œuvre et ses adaptations, à discrétion de leur éditeur. L’édition sous licence libre leur redonne en partie ce droit. En gros, avant ils perdaient le contrôle de leur œuvre et ses adaptations, maintenant ils perdent toujours le contrôle mais ils récupèrent le droit de se réapproprier l’œuvre sans l’accord de l’éditeur. C’est donc une amélioration.

La seconde question concerne les détournements immoraux de l’œuvre. Sur ce point, je leur dis qu’ils conservent le droit moral pour s’opposer à des utilisations scandaleuses. Mais je les préviens surtout que dans les faits, c’est très compliqué d’empêcher des adaptations scandaleuses. Même Disney n’arrive pas à les empêcher… Il faut surtout dédramatiser et éviter l’effet Streisand.

Couverture de Printeurs

Avez-vous des espoirs, des attentes, sur ce qui pourrait advenir des œuvres ainsi libérées ? Parmi les auteurices, en connaissez-vous qui souhaitent profiter de cette opportunité pour enrichir, développer leur travail originel ?

Je n’ai pas vraiment d’attente car je ne veux pas être déçu. Je pense que la plupart des développements ou adaptations des œuvres libérées viendront des impulsions de PVH éditions ou des auteur·rices. L’approfondissement des œuvres fait partie de notre ligne éditoriale, on y travaille indépendamment du type de licence. Nous avons toujours encouragé nos auteurs à le faire et nous sommes toujours ouverts à aider à l’éclosion de projets connexes.

Dernièrement, ce n’était pas sur un roman de la collection Ludomire mais sur l’essai La monnaie à pétales nous avons reçu la contribution d’une interprétation audio du texte. Nous avons ouvert la licence de ce livre audio en CC BY-SA et il sera diffusé sur la chaîne youtube de l’interprète. Ce serait génial d’avoir de telles initiatives pour la collection Ludomire et j’espère qu’on pourra s’y associer de la même manière.

Mais mon expérience et mon instinct me disent que des initiatives personnelles externes sont rares, je pense qu’il faut surtout chercher à développer un réseau professionnel et un corpus libre commun, où tout le réseau peut piocher dedans pour développer ses propres projets. Je me dis que c’est ainsi que le copyleft pourra peut-être révéler tout son potentiel.

Couverture de Hoc est corpus

Comme souvent dans nos interviews, avez-vous envie de répondre à une question qui ne vous a pas été posée ? Vous pouvez le faire en conclusion.

On a parlé de beaucoup de licence, de projets mais nous n’avons pas parlé des livres. Et la première source de fierté dans cette collection Ludomire n’est pas sa licence mais sa qualité littéraire. Et comme vous m’en donnez l’occasion, je vais vous la présenter.

Le coffret Les Chroniques des Regards perdus, de Pascal Lovis, est une série d’heroic fantasy. Best-seller suisse, il s’agit de deux romans et une nouvelle qui séduiront les lecteurs qui aiment l’aventure et des fils narratifs entrecroisés. Pour les amateurs de fantasy, c’est une valeur sure.
Le même auteur a écrit également le diptyque Terre hantée. Il s’agit d’une œuvre de science-fiction tirant ses inspirations de films où la réalité ne semble pas être ce qu’elle est tel que The Truman Show et Matrix. Une plume efficace et expérimentée.

Le roman Printeurs et le recueil de nouvelles Le stagiaire au spatioport Omega 3000 et autres joyeusetés que nous réserve le futur sont les œuvres du libriste et blogueur Ploum, Lionel Dricot. Il s’agit d’œuvres engagées qui aborde avec un humour parfois grinçant, parfois absurde les travers de nos sociétés consuméristes basées sur le capitalisme de surveillance. Allez-y les yeux fermés, vous allez passer un bon moment !

Le coffret ONE MINUTE de Thierry Crouzet est sans doute l’opus le plus extraordinaire de la collection. Ouvrage de science-fiction inclassable, il décrit la minute la plus cruciale de l’humanité du point de vue de 380 personnes différentes à travers le monde. Comme un tableau impressionniste, chaque très court chapitre représente un point dans une fresque qui se révèle au fur et à mesure que l’on tourne les pages. Il y aborde et combine de manière surprenante des thématiques classiques de la SF, tel que le premier contact extraterrestre, la singularité informatique, l’hyperconnexion et le rapport de l’humanité avec la nature. Cette série est une expérience de lecture unique.

La série Adjaï aux mille visages, d’Aquilegia Nox, présente la vie chaotique et aventureuse d’un changelin dans le roman Ceux qui changent. Avec naturel, il aborde des questions de transidentité, de tolérance et de rapport au corps, tout en proposant un parcours de vie pleine de rebondissement et d’intrigues. Dans le recueil de nouvelles Ceux qui viennent, l’autrice approfondit son univers en y présentant d’autres lieux, d’autres cultures et d’autres personnages au destin exceptionnel. Une exploration bouleversante.

D’autres livres sortiront en mars et mai, tel qu’Hoc est corpus, roman historique fantastique pendant les croisades au royaume de Jérusalem, ou La couronne boréale, aventure littéraire et loufoque d’une bande d’archéologues à la recherche d’un artefact légendaire (ils n’ont pas de fouet, mais il y a un chat).

Vous pourriez bien découvrir nos livres chez votre libraire et, si ce n’est pas le cas, il pourra vous les commander. Ils sont également en vente en e-book et en papier sur notre site.

Et promis, on vous tiendra au courant de nos projets liés à l’art et le logiciel libres.

Pour aller plus loin

Démystifier les conneries sur l’IA – Une interview

Cet article a été publié à l’origine par THE MARKUP, il a été traduit et republié selon les termes de la licence Creative Commons Attribution-NonCommercial-NoDerivatives
Publication originale sur le site themarkup.org

Démystifier le buzz autour de l’IA

Un entretien avec Arvind Narayanan

par JULIA ANGWIN
Si vous avez parcouru tout le battage médiatique sur ChatGPT le dernier robot conversationnel qui repose sur l’intelligence artificielle, vous pouvez avoir quelque raison de croire que la fin du monde est proche.

Le chat « intelligent » de l’IA a enflammé l’imagination du public pour sa capacité à générer instantanément des poèmes, des essais, sa capacité à imiter divers styles d’écrits, et à réussir à des examens d’écoles de droit et de commerce.

Les enseignants s’inquiètent de la tricherie possible de leurs étudiants (des écoles publiques de New York City l’ont déjà interdit). Les rédacteurs se demandent si cela ne va pas faire disparaître leur travail (BuzzFeed et CNET ont déjà utilisé l’IA pour créer des contenus). Le journal The Atlantic a déclaré que cela pourrait « déstabiliser les professions de cadres supérieurs ». L’investisseur en capital-risque Paul Kedrosky l’a qualifié de « bombe nucléaire de poche » et blâmé ses concepteurs pour l’avoir lancé dans une société qui n’y est pas prête.

Même le PDG de l’entreprise qui a lancé ChatGPT, Sam Altman, a déclaré aux médias que le pire scénario pour l’IA pourrait signifier « notre extinction finale ».

Cependant pour d’autres ce buzz est démesuré. Le principal scientifique chargé de l’IA chez Meta’s AI, Yann LeCun, a déclaré à des journalistes que ChatGPT n’a « rien de révolutionnaire ». Le professeur de langage informatique de l’université de Washington Emily Bender précise que « la croyance en un programme informatique omniscient vient de la science-fiction et devrait y rester ».

Alors, jusqu’à quel point devrions-nous nous inquiéter ? Pour recueillir un avis autorisé, je me suis adressée au professeur d’informatique de Princeton Arvind Narayanan, qui est en train de co-rédiger un livre sur « Le charlatanisme de l’IA ». En 2019, Narayanan a fait une conférence au MIT intitulée « Comment identifier le charlatanisme del’IA » qui exposait une classification des IA en fonction de leur validité ou non. À sa grande surprise, son obscure conférence universitaire est devenue virale, et ses diapos ont été téléchargées plusieurs dizaines de milliers de fois ; ses messages sur twitter qui ont suivi ont reçu plus de deux millions de vues.

Narayanan s’est alors associé à l’un de ses étudiants, Sayash Kapoor, pour développer dans un livre la classification des IA. L’année dernière, leur duo a publié une liste de 18 pièges courants dans lesquels tombent régulièrement les journalistes qui couvrent le sujet des IA. Presque en haut de la liste : « illustrer des articles sur l’IA avec de chouettes images de robots ». La raison : donner une image anthropomorphique des IA implique de façon fallacieuse qu’elles ont le potentiel d’agir dans le monde réel.

Narayanan est également le co-auteur d’un manuel sur l’équité et l’apprentissage machine et dirige le projet Web Transparency and Accountability de l’université de Princeton pour contrôler comment les entreprises collectent et utilisent les informations personnelles. Il a reçu de la Maison-Blanche le Presidential Early Career Award for Scientists and Engineers [N. de T. : une distinction honorifique pour les scientifiques et ingénieurs qui entament brillamment leur carrière].

Voici notre échange, édité par souci de clarté et brièveté.

Angwin : vous avez qualifié ChatGPT de « générateur de conneries ». Pouvez-vous expliquer ce que vous voulez dire ?

Narayanan : Sayash Kapoor et moi-même l’appelons générateur de conneries et nous ne sommes pas les seuls à le qualifier ainsi. Pas au sens strict mais dans un sens précis. Ce que nous voulons dire, c’est qu’il est entraîné pour produire du texte vraisemblable. Il est très bon pour être persuasif, mais n’est pas entraîné pour produire des énoncés vrais ; s’il génère souvent des énoncés vrais, c’est un effet collatéral du fait qu’il doit être plausible et persuasif, mais ce n’est pas son but.

Cela rejoint vraiment ce que le philosophe Harry Frankfurt a appelé du bullshit, c’est-à-dire du langage qui a pour objet de persuader sans égards pour le critère de vérité. Ceux qui débitent du bullshit se moquent de savoir si ce qu’ils disent est vrai ; ils ont en tête certains objectifs. Tant qu’ils persuadent, ces objectifs sont atteints. Et en effet, c’est ce que fait ChatGPT. Il tente de persuader, et n’a aucun moyen de savoir à coup sûr si ses énoncés sont vrais ou non.

Angwin : Qu’est-ce qui vous inquiète le plus avec ChatGPT ?

Narayanan : il existe des cas très clairs et dangereux de mésinformation dont nous devons nous inquiéter. Par exemple si des personnes l’utilisent comme outil d’apprentissage et accidentellement apprennent des informations erronées, ou si des étudiants rédigent des essais en utilisant ChatGPT quand ils ont un devoir maison à faire. J’ai appris récemment que le CNET a depuis plusieurs mois maintenant utilisé des outils d’IA générative pour écrire des articles. Même s’ils prétendent que des éditeurs humains ont vérifié rigoureusement les affirmations de ces textes, il est apparu que ce n’était pas le cas. Le CNET a publié des articles écrits par une IA sans en informer correctement, c’est le cas pour 75 articles, et plusieurs d’entre eux se sont avérés contenir des erreurs qu’un rédacteur humain n’aurait très probablement jamais commises. Ce n’était pas dans une mauvaise intention, mais c’est le genre de danger dont nous devons nous préoccuper davantage quand des personnes se tournent vers l’IA en raison des contraintes pratiques qu’elles affrontent. Ajoutez à cela le fait que l’outil ne dispose pas d’une notion claire de la vérité, et vous avez la recette du désastre.

Angwin : Vous avez développé une classification des l’IA dans laquelle vous décrivez différents types de technologies qui répondent au terme générique de « IA ». Pouvez-vous nous dire où se situe ChatGPT dans cette taxonomie ?

Narayanan : ChatGPT appartient à la catégorie des IA génératives. Au plan technologique, elle est assez comparable aux modèles de conversion de texte en image, comme DALL-E [qui crée des images en fonction des instructions textuelles d’un utilisateur]. Ils sont liés aux IA utilisées pour les tâches de perception. Ce type d’IA utilise ce que l’on appelle des modèles d’apprentissage profond. Il y a environ dix ans, les technologies d’identification par ordinateur ont commencé à devenir performantes pour distinguer un chat d’un chien, ce que les humains peuvent faire très facilement.

Ce qui a changé au cours des cinq dernières années, c’est que, grâce à une nouvelle technologie qu’on appelle des transformateurs et à d’autres technologies associées, les ordinateurs sont devenus capables d’inverser la tâche de perception qui consiste à distinguer un chat ou un chien. Cela signifie qu’à partir d’un texte, ils peuvent générer une image crédible d’un chat ou d’un chien, ou même des choses fantaisistes comme un astronaute à cheval. La même chose se produit avec le texte : non seulement ces modèles prennent un fragment de texte et le classent, mais, en fonction d’une demande, ces modèles peuvent essentiellement effectuer une classification à l’envers et produire le texte plausible qui pourrait correspondre à la catégorie donnée.

Angwin : une autre catégorie d’IA dont vous parlez est celle qui prétend établir des jugements automatiques. Pouvez-vous nous dire ce que ça implique ?

Narayanan : je pense que le meilleur exemple d’automatisation du jugement est celui de la modération des contenus sur les médias sociaux. Elle est nettement imparfaite ; il y a eu énormément d’échecs notables de la modération des contenus, dont beaucoup ont eu des conséquences mortelles. Les médias sociaux ont été utilisés pour inciter à la violence, voire à la violence génocidaire dans de nombreuses régions du monde, notamment au Myanmar, au Sri Lanka et en Éthiopie. Il s’agissait dans tous les cas d’échecs de la modération des contenus, y compris de la modération du contenu par l’IA.

Toutefois les choses s’améliorent. Il est possible, du moins jusqu’à un certain point, de s’emparer du travail des modérateurs de contenus humains et d’entraîner des modèles à repérer dans une image de la nudité ou du discours de haine. Il existera toujours des limitations intrinsèques, mais la modération de contenu est un boulot horrible. C’est un travail traumatisant où l’on doit regarder en continu des images atroces, de décapitations ou autres horreurs. Si l’IA peut réduire la part du travail humain, c’est une bonne chose.

Je pense que certains aspects du processus de modération des contenus ne devraient pas être automatisés. Définir où passe la frontière entre ce qui est acceptable et ce qui est inacceptable est chronophage. C’est très compliqué. Ça demande d’impliquer la société civile. C’est constamment mouvant et propre à chaque culture. Et il faut le faire pour tous les types possibles de discours. C’est à cause de tout cela que l’IA n’a pas de rôle à y jouer.

Angwin : vous décrivez une autre catégorie d’IA qui vise à prédire les événements sociaux. Vous êtes sceptique sur les capacités de ce genre d’IA. Pourquoi ?

Narayanan : c’est le genre d’IA avec laquelle les décisionnaires prédisent ce que pourraient faire certaines personnes à l’avenir, et qu’ils utilisent pour prendre des décisions les concernant, le plus souvent pour exclure certaines possibilités. On l’utilise pour la sélection à l’embauche, c’est aussi célèbre pour le pronostic de risque de délinquance. C’est aussi utilisé dans des contextes où l’intention est d’aider des personnes. Par exemple, quelqu’un risque de décrocher de ses études ; intervenons pour suggérer un changement de filière.

Ce que toutes ces pratiques ont en commun, ce sont des prédictions statistiques basées sur des schémas et des corrélations grossières entre les données concernant ce que des personnes pourraient faire. Ces prédictions sont ensuite utilisées dans une certaine mesure pour prendre des décisions à leur sujet et, dans de nombreux cas, leur interdire certaines possibilités, limiter leur autonomie et leur ôter la possibilité de faire leurs preuves et de montrer qu’elles ne sont pas définies par des modèles statistiques. Il existe de nombreuses raisons fondamentales pour lesquelles nous pourrions considérer la plupart de ces applications de l’IA comme illégitimes et moralement inadmissibles.

Lorsqu’on intervient sur la base d’une prédiction, on doit se demander : « Est-ce la meilleure décision que nous puissions prendre ? Ou bien la meilleure décision ne serait-elle pas celle qui ne correspond pas du tout à une prédiction ? » Par exemple, dans le scénario de prédiction du risque de délinquance, la décision que nous prenons sur la base des prédictions est de refuser la mise en liberté sous caution ou la libération conditionnelle, mais si nous sortons du cadre prédictif, nous pourrions nous demander : « Quelle est la meilleure façon de réhabiliter cette personne au sein de la société et de diminuer les risques qu’elle ne commette un autre délit ? » Ce qui ouvre la possibilité d’un ensemble beaucoup plus large d’interventions.

Angwin : certains s’alarment en prétendant que ChatGPT conduit à “l’apocalypse,” pourrait supprimer des emplois et entraîner une dévalorisation des connaissances. Qu’en pensez-vous ?

Narayanan : Admettons que certaines des prédictions les plus folles concernant ChatGPT se réalisent et qu’il permette d’automatiser des secteurs entiers de l’emploi. Par analogie, pensez aux développements informatiques les plus importants de ces dernières décennies, comme l’internet et les smartphones. Ils ont remodelé des industries entières, mais nous avons appris à vivre avec. Certains emplois sont devenus plus efficaces. Certains emplois ont été automatisés, ce qui a permis aux gens de se recycler ou de changer de carrière. Il y a des effets douloureux de ces technologies, mais nous apprenons à les réguler.

Même pour quelque chose d’aussi impactant que l’internet, les moteurs de recherche ou les smartphones, on a pu trouver une adaptation, en maximisant les bénéfices et minimisant les risques, plutôt qu’une révolution. Je ne pense pas que les grands modèles de langage soient même à la hauteur. Il peut y avoir de soudains changements massifs, des avantages et des risques dans de nombreux secteurs industriels, mais je ne vois pas de scénario catastrophe dans lequel le ciel nous tomberait sur la tête.

Comme toujours, merci de votre attention.

À bientôt,
Julia Angwin
The Markup

On peut s’abonner ici à la lettre hebdomadaire (en anglais) du magazine The Markup, envoyée le samedi.

Contra Chrome : une BD décapante maintenant en version française

Il y a loin de la promotion du navigateur Chrome à ses débuts, un outil cool au service des internautes, au constat de ce qu’il est devenu, une plateforme de prédation de Google, c’est ce que permet de mesurer la bande dessinée de Leah,

Contra Chrome est un véritable remix de la BD promotionnelle originale (lien vers le document sur google.com) que Leah Elliott s’est évertuée à détourner pour exposer la véritable nature de ce navigateur qui a conquis une hégémonie au point d’imposer ses règles au Web.

Nous avons trouvé malicieux et assez efficace son travail qui a consisté à conserver les images en leur donnant par de nouveaux textes un sens satirique et pédagogique pour démontrer la toxicité de Google Chrome.

La traduction qui est aujourd’hui disponible a été effectuée par les bénévoles de Framalang et par Calimero (qui a multiplié sans relâche les ultimes révisions). Voici en même temps que l’ouvrage, les réponses que Leah a aimablement accepté de faire à nos questions.

 

Bonjour, peux-tu te présenter brièvement pour nos lecteurs et lectrices…
Je m’appelle Leah et je suis autrice de bandes dessinées et artiste. J’ai une formation en art et en communication, et je n’ai jamais travaillé dans l’industrie technologique.

Est-ce que tu te considères comme une militante pour la préservation de la vie privée ?

Eh bien, le militantisme en matière de vie privée peut prendre de nombreuses formes. Parfois, c’est être lanceur d’alerte en fuitant des révélations, parfois c’est une bande dessinée, ou la simple installation d’une extension de navigateur comme Snowflake, avec laquelle vous pouvez donner aux dissidents des États totalitaires un accès anonyme à un internet non censuré.

Dans ce dernier sens, j’espère avoir été une militante avant de créer Contra Chrome, et j’espère l’être encore à l’avenir.

Comment t’es venue l’idée initiale de réaliser Contra Chrome ?

Ça s’est fait progressivement.

Lorsque la bande dessinée Chrome de Scott McCloud est sortie en 2008, je n’avais qu’une très vague idée du fonctionnement d’Internet et de la façon dont les entreprises récoltent et vendent mes données. Je me figurais essentiellement que je pouvais me cacher dans ce vaste chaos. Je pensais qu’ils récoltaient tellement de données aléatoires dans le monde entier qu’ils ne pouvaient pas espérer me trouver, moi petite aiguille dans cette botte de foin planétaire.

Et puis les révélations de Snowden ont éclaté, et il a dit : « Ne vous y trompez pas », en dévoilant tous les ignobles programmes de surveillance de masse. C’est alors que j’ai compris qu’ils ne se contenteraient pas de moissonner le foin, mais aussi des aiguilles.

Depuis, j’ai essayé de m’éduquer et d’adopter de meilleurs outils, découvrant au passage des logiciels libres et open source respectueux de la vie privée, dont certains des excellents services proposés par Framasoft.

Lorsque j’ai retrouvé la bande dessinée de McCloud quelque temps après les révélations de Snowden, j’ai soudain réalisé qu’il s’agissait d’un véritable trésor, il ne manquait que quelques pages…

Qu’est-ce qui t’a motivée, à partir de ce moment ?

L’indignation, principalement, et le besoin de faire quelque chose contre un statu quo scandaleux. Il y a un décalage tellement affreux entre la société que nous nous efforçons d’être, fondée sur des valeurs et les droits de l’homme, et les énormes structures d’entreprises barbares comme Google, qui récoltent agressivement des masses gigantesques de données personnelles sans jamais se soucier d’obtenir le consentement éclairé de l’utilisateur, sans aucune conscience de leurs responsabilités sur les retombées individuelles ou sociétales, et sans aucun égard pour les conséquences que cela a sur le processus démocratique lui-même.

En lisant Shoshana Zuboff, j’ai vu comment ce viol massif de données touche à la racine de la liberté personnelle de chacun de se forger sa propre opinion politique, et comment il renforce ainsi les régimes et les modes de pensée autoritaires.

Trop de gens n’ont aucune idée de ce qui est activé en continu 24 heures sur 24 au sein de leur propre maisons intelligente et sur les téléphones de leurs enfants, et je voulais contribuer à changer ça.

Certains aspects de la surveillance via le navigateur Chrome sont faciles à deviner, cependant ta BD va plus en profondeur et révèle la chronologie qui va des promesses rassurantes du lancement à la situation actuelle qui les trahit. Est-ce que tu as bénéficié d’aide de la part de la communauté des défenseurs de la vie privée sur certains aspects ou bien as-tu mené seule ton enquête ?

Comme on peut le voir dans les nombreuses annotations à la fin de la bande dessinée, il s’agit d’un énorme effort collectif. En fin de compte, je n’ai fait que rassembler et organiser les conclusions de tous ces militants, chercheurs et journalistes. J’ai également rencontré certains d’entre eux en personne, notamment des experts reconnus qui ont mené des recherches universitaires sur Google pendant de nombreuses années. Je leur suis très reconnaissante du temps qu’ils ont consacré à ma bande dessinée, qui n’aurait jamais existé sans cette communauté dynamique.

Pourquoi avoir choisi un « remix » ou plutôt un détournement de la BD promotionnelle, plutôt que de créer une bande dessinée personnelle avec les mêmes objectifs ?

En relisant la BD pro-Google de McCloud, j’ai constaté que, comme dans toute bonne bande dessinée, les images et le texte ne racontaient pas exactement la même histoire. Alors que le texte vantait les fonctionnalités du navigateur comme un bonimenteur sur le marché, certaines images me murmuraient à l’oreille qu’il existait un monde derrière la fenêtre du navigateur, où le contenu du cerveau des utilisateurs était transféré dans d’immenses nuages, leur comportement analysé par des rouages inquiétants tandis que des étrangers les observaient à travers un miroir sans tain.

Pour rendre ces murmures plus audibles, il me suffisait de réarranger certaines cases et bulles, un peu comme un puzzle à pièces mobiles. Lorsque les éléments se sont finalement mis en place un jour, ils se sont mis à parler d’une voix très claire et concise, et ont révélé beaucoup plus de choses sur Chrome que l’original.

Lawrence Lessig a expliqué un jour que, tout comme les essais critiques commentent les textes qu’ils citent, les œuvres de remixage commentent le matériel qu’elles utilisent. Dans mon cas, la BD originale de Chrome expliquait prétendument le fonctionnement de Chrome, et j’ai transformé ce matériel en une BD qui rend compte de son véritable fonctionnement.

Est-ce que tu as enregistré des réactions du côté de l’équipe de développement de Chrome ? Ou du côté de Scott Mc Cloud, l’auteur de la BD originale ?

Non, c’est le silence radio. Du côté de l’entreprise, il semble qu’il y ait eu quelques opérations de nettoyage à la Voldemort : Des employés de Google sur Reddit et Twitter, se sont conseillé mutuellement de ne pas créer de liens vers le site, de ne pas y réagir dans les fils de discussion publics, exigeant même parfois que les tweets contenant des images soient retirés.

Quant à Scott, rien non plus jusqu’à présent, et j’ai la même curiosité que vous.

Ton travail a suscité beaucoup d’intérêt dans diverses communautés, de sorte que les traductions plusieurs langues sont maintenant disponibles (anglais, allemand, français et d’autres à venir…). Tu t’attendais à un tel succès ?

Absolument pas. Le jour où je l’ai mis en ligne, il n’y a eu aucune réaction de qui que ce soit, et je me souviens avoir pensé : « bah, tu t’attendais à quoi d’autre, de toutes façons ? ». Je n’aurais jamais imaginé le raz-de-marée qui a suivi. Tant de personnes proposant des traductions, qui s’organisaient, tissaient des liens. Et tous ces messages de remerciement et de soutien, certaines personnes discutent de ma BD dans les écoles et les universités, d’autres l’impriment et la placent dans des espaces publics. Ça fait vraiment plaisir de voir tout ça.

Il y a une sorte de réconfort étrange dans le fait que tant d’êtres humains différents, de tous horizons et de tous les coins de la planète, partagent ma tristesse et mon horreur face au système du capitalisme de surveillance. Cette tristesse collective ne devrait pas me rendre heureuse, et pourtant elle me donne le courage de penser à un avenir très différent.

Quel navigateur utilises-tu au lieu de Chrome ? Lequel recommanderais-tu aux webnautes soucieux de préserver leur vie privée ?

Je suis peut-être allée un peu loin désormais, mais je pratique ce que je prêche dans la BD : pour 95 % de ma navigation, j’utilise simplement le navigateur Tor. Et lorsque Tor est bloqué ou lorsqu’une page ne fonctionne pas correctement, j’utilise Firefox avec quelques modifications et extensions pour améliorer la confidentialité.

Donc généralement, que je cherche des recettes de muffins, que je vérifie la météo ou que je lise les nouvelles, c’est toujours avec Tor. Parce que j’ai l’impression que le navigateur Tor ne peut prendre toute sa valeur que si suffisamment de personnes l’utilisent en même temps, pour qu’un brouillard suffisamment grand de non-sens triviaux entoure et protège les personnes vulnérables dont la sécurité dépend actuellement de son utilisation.

Pour moi, c’est donc une sorte de devoir civique en tant que citoyenne de la Terre. De plus, je peux parcourir mes recettes de muffins en ayant la certitude qu’il ne s’agit que d’un navigateur et non d’un miroir sans tain.

Merci Leah et à bientôt peut-être !


Cliquez sur l’image ci-dessous pour accéder à la version française de Contra chrome

 

❌