❌

Vue normale

Il y a de nouveaux articles disponibles, cliquez pour rafraĂźchir la page.
À partir d’avant-hierFlux principal

L’IA Open Source existe-t-elle vraiment ?

Par : Framalang
31 octobre 2024 Ă  05:10

À l’heure oĂč tous les mastodontes du numĂ©rique, GAFAM comme instituts de recherche comme nouveaux entrants financĂ©s par le capital risque se mettent Ă  publier des modĂšles en masse (la plateforme Hugging Face a ainsi dĂ©passĂ© le million de modĂšles dĂ©posĂ©s le mois dernier), la question du caractĂšre « open-source Â» de l’IA se pose de plus en plus.

Ainsi, l’Open Source Initiative (OSI) vient de publier une premiĂšre dĂ©finition de l’IA Open-Source, et la Linux Foundation (dont le nom peut prĂȘter Ă  confusion, mais qui ne reprĂ©sente surtout qu’une oligarchie d’entreprises du secteur) s’interroge Ă©galement sur le terme.

Au milieu de tout cela, OpenAI devient de maniĂšre assez prĂ©visible de moins en moins « open Â», et si Zuckerberg et Meta s’efforcent de jouer la carte de la transparence en devenant des hĂ©rauts de l’« IA Open-Source Â», c’est justement l’OSI qui leur met des bĂątons dans les roues en ayant une vision diffĂ©rente de ce que devrait ĂȘtre une IA Open-Source, avec en particulier un prĂ©-requis plus Ă©levĂ© sur la transparence des donnĂ©es d’entraĂźnement.

NĂ©anmoins, la dĂ©finition de l’OSI, si elle embĂȘte un peu certaines entreprises, manque selon la personne ayant Ă©crit ce billet (dont le pseudo est « tante Â») d’un Ă©lĂ©ment assez essentiel, au point qu’elle se demande si « l’IA open source existe-t-elle vraiment ? Â».

Note : L’article originel a Ă©tĂ© publiĂ© avant la sortie du texte final de l’OSI, mais celui-ci n’a semble t-il pas changĂ© entre la version RC1 et la version finale.

L’IA Open Source existe-t-elle vraiment ?

Par tante, sous licence CC BY-SA (article originel).
Une traduction Framalang par tcit et deux contributeur·ices anonymes.
Photo de la banniĂšre par Robert Couse-Baker.

 

 

L’Open Source Initiative (OSI) a publiĂ© la RC1 (« Release Candidate 1 Â» signifiant : cet Ă©crit est pratiquement terminĂ© et sera publiĂ© en tant que tel Ă  moins que quelque chose de catastrophique ne se produise) de la « DĂ©finition de l’IA Open Source Â».

D’aucuns pourraient se demander en quoi cela est important. Plein de personnes Ă©crivent sur l’IA, qu’est-ce que cela apporte de plus ? C’est la principale activitĂ© sur LinkedIn Ă  l’heure actuelle. Mais l’OSI joue un rĂŽle trĂšs particulier dans l’écosystĂšme des logiciels libres. En effet, l’open source n’est pas seulement basĂ© sur le fait que l’on peut voir le code, mais aussi sur la licence sous laquelle le code est distribuĂ© : Vous pouvez obtenir du code que vous pouvez voir mais que vous n’ĂȘtes pas autorisĂ© Ă  modifier (pensez au dĂ©bat sur la publication rĂ©cente de celui de WinAMP). L’OSI s’est essentiellement chargĂ©e de dĂ©finir parmi les diffĂ©rentes licences utilisĂ©es partout lesquelles sont rĂ©ellement « open source Â» et lesquelles sont assorties de restrictions qui sapent cette idĂ©e.

C’est trĂšs important : le choix d’une licence est un acte politique lourd de consĂ©quences. Elle peut autoriser ou interdire diffĂ©rents modes d’interaction avec un objet ou imposer certaines conditions d’utilisation. La cĂ©lĂšbre GPL, par exemple, vous permet de prendre le code mais vous oblige Ă  publier vos propres modifications. D’autres licences n’imposent pas cette exigence. Le choix d’une licence a des effets tangibles.

Petit apartĂ© : « open source Â» est dĂ©jĂ  un terme un peu problĂ©matique, c’est (Ă  mon avis) une façon de dĂ©politiser l’idĂ©e de « Logiciel libre Â». Les deux partagent certaines idĂ©es, mais lĂ  oĂč « open source Â» encadre les choses d’une maniĂšre plus pragmatique « les entreprises veulent savoir quel code elles peuvent utiliser Â», le logiciel libre a toujours Ă©tĂ© un mouvement plus politique qui dĂ©fend les droits et la libertĂ© de l’utilisateur. C’est une idĂ©e qui a probablement Ă©tĂ© le plus abimĂ©e par les figures les plus visibles de cet espace et qui devraient aujourd’hui s’effacer.

Qu’est-ce qui fait qu’une chose est « open source Â» ? L’OSI en dresse une courte liste. Vous pouvez la lire rapidement, mais concentrons-nous sur le point 2 : le code source :

Le programme doit inclure le code source et doit permettre la distribution du code source et de la version compilĂ©e. Lorsqu’une quelconque forme d’un produit n’est pas distribuĂ©e avec le code source, il doit exister un moyen bien connu d’obtenir le code source pour un coĂ»t de reproduction raisonnable, de prĂ©fĂ©rence en le tĂ©lĂ©chargeant gratuitement sur Internet. Le code source doit ĂȘtre la forme prĂ©fĂ©rĂ©e sous laquelle un programmeur modifierait le programme. Le code source dĂ©libĂ©rĂ©ment obscurci n’est pas autorisĂ©. Les formes intermĂ©diaires telles que la sortie d’un prĂ©processeur ou d’un traducteur ne sont pas autorisĂ©es.
Open Source Initiative

Pour ĂȘtre open source, un logiciel doit donc ĂȘtre accompagnĂ© de ses sources. D’accord, ce n’est pas surprenant. Mais les rĂ©dacteurs ont vu pas mal de conneries et ont donc ajoutĂ© que le code obfusquĂ© (c’est-Ă -dire le code qui a Ă©tĂ© manipulĂ© pour ĂȘtre illisible) ou les formes intermĂ©diaires (c’est-Ă -dire que vous n’obtenez pas les sources rĂ©elles mais quelque chose qui a dĂ©jĂ  Ă©tĂ© traitĂ©) ne sont pas autorisĂ©s. TrĂšs bien. C’est logique. Mais pourquoi les gens s’intĂ©ressent-ils aux sources ?

Les sources de la vérité

L’open source est un phĂ©nomĂšne de masse relativement rĂ©cent. Nous avions dĂ©jĂ  des logiciels, et mĂȘme certains pour lesquels nous ne devions pas payer. À l’époque, on les appelait des « Freeware Â», des « logiciels gratuits Â». Les freewares sont des logiciels que vous pouvez utiliser gratuitement mais dont vous n’obtenez pas le code source. Vous ne pouvez pas modifier le programme (lĂ©galement), vous ne pouvez pas l’auditer, vous ne pouvez pas le complĂ©ter. Mais il est gratuit. Et il y avait beaucoup de cela dans ma jeunesse. WinAMP, le lecteur audio dont j’ai parlĂ© plus haut, Ă©tait un freeware et tout le monde l’utilisait. Alors pourquoi se prĂ©occuper des sources ?

Pour certains, il s’agissait de pouvoir modifier les outils plus facilement, surtout si le responsable du logiciel ne travaillait plus vraiment dessus ou commençait Ă  ajouter toutes sortes de choses avec lesquelles ils n’étaient pas d’accord (pensez Ă  tous ces logiciels propriĂ©taires que vous devez utiliser aujourd’hui pour le travail et qui contiennent de l’IA derriĂšre tous les autres boutons). Mais il n’y a pas que les demandes de fonctionnalitĂ©s. Il y a aussi la confiance.

Lorsque j’utilise un logiciel, je dois faire confiance aux personnes qui l’ont Ă©crit. Leur faire confiance pour qu’ils fassent du bon travail, pour qu’ils crĂ©ent des logiciels fiables et robustes. Qu’ils n’ajoutent que les fonctionnalitĂ©s dĂ©crites dans la documentation et rien de cachĂ©, de potentiellement nuisible.

Les questions de confiance sont de plus en plus importantes, d’autant plus qu’une grande partie de notre vie rĂ©elle repose sur des infrastructures numĂ©riques. Nous savons tous que nos infrastructures doivent comporter des algorithmes de chiffrement entiĂšrement ouverts, Ă©valuĂ©s par des pairs et testĂ©s sur le terrain, afin que nos communications soient Ă  l’abri de tout danger.

L’open source est – en particulier pour les systĂšmes et infrastructures critiques – un Ă©lĂ©ment clĂ© de l’établissement de cette confiance : Parce que vous voulez que (quelqu’un) soit en mesure de vĂ©rifier ce qui se passe. On assiste depuis longtemps Ă  une poussĂ©e en faveur d’une plus grande reproductibilitĂ© des processus de construction. Ces processus de compilation garantissent essentiellement qu’avec le mĂȘme code d’entrĂ©e, on obtient le mĂȘme rĂ©sultat compilĂ©. Cela signifie que si vous voulez savoir si quelqu’un vous a vraiment livrĂ© exactement ce qu’il a dit, vous pouvez le vĂ©rifier. Parce que votre processus de construction crĂ©erait un artefact identique.

Logo du projet Reproducible builds

Le projet Reproducible builds cherche à promouvoir la reproductibilité des systÚmes libres, pour plus de transparence.
Le projet est notamment financé par le Sovereign Tech Fund.

 

Bien entendu, tout le monde n’effectue pas ce niveau d’analyse. Et encore moins de personnes n’utilisent que des logiciels issus de processus de construction reproductibles – surtout si l’on considĂšre que de nombreux logiciels ne sont pas compilĂ©s aujourd’hui. Mais les relations sont plus nuancĂ©es que le code et la confiance est une relation : si vous me parlez ouvertement de votre code et de la maniĂšre dont la version binaire a Ă©tĂ© construite, il me sera beaucoup plus facile de vous faire confiance. Savoir ce que contient le logiciel que j’exĂ©cute sur la machine qui contient Ă©galement mes relevĂ©s bancaires ou mes clĂ©s de chiffrement.

Mais quel est le rapport avec l’IA ?

Les systĂšmes d’IA et les 4 libertĂ©s

Les systĂšmes d’IA sont un peu particuliers. En effet, les systĂšmes d’IA – en particulier les grands systĂšmes qui fascinent tout le monde – ne contiennent pas beaucoup de code par rapport Ă  leur taille. La mise en Ɠuvre d’un rĂ©seau neuronal se rĂ©sume Ă  quelques centaines de lignes de Python, par exemple. Un « systĂšme d’IA Â» ne consiste pas seulement en du code, mais en un grand nombre de paramĂštres et de donnĂ©es.

Un LLM moderne (ou un gĂ©nĂ©rateur d’images) se compose d’un peu de code. Vous avez Ă©galement besoin d’une architecture de rĂ©seau, c’est-Ă -dire de la configuration des neurones numĂ©riques utilisĂ©s et de la maniĂšre dont ils sont connectĂ©s. Cette architecture est ensuite paramĂ©trĂ©e avec ce que l’on appelle les « poids Â» (weights), qui sont les milliards de chiffres dont vous avez besoin pour que le systĂšme fasse quelque chose. Mais ce n’est pas tout.

Pour traduire des syllabes ou des mots en nombres qu’une « IA Â» peut consommer, vous avez besoin d’une intĂ©gration, une sorte de table de recherche qui vous indique Ă  quel « jeton Â» (token) correspond le nombre « 227 Â». Si vous prenez le mĂȘme rĂ©seau neuronal mais que vous lui appliquez une intĂ©gration diffĂ©rente de celle avec laquelle il a Ă©tĂ© formĂ©, tout tomberait Ă  l’eau. Les structures ne correspondraient pas.

Représentation d'une puce informatique sous la forme d'un cerveau.

Image sous CC BY par Mike MacKenzie & Liam Huang

Ensuite, il y a le processus de formation, c’est-Ă -dire le processus qui a crĂ©Ă© tous les « poids Â». Pour entraĂźner une « IA Â», vous lui fournissez toutes les donnĂ©es que vous pouvez trouver et, aprĂšs des millions et des milliards d’itĂ©rations, les poids commencent Ă  Ă©merger et Ă  se cristalliser. Le processus de formation, les donnĂ©es utilisĂ©es et la maniĂšre dont elles le sont sont essentiels pour comprendre les capacitĂ©s et les problĂšmes d’un systĂšme d’apprentissage automatique : si vous voulez rĂ©duire les dommages dans un rĂ©seau, vous devez savoir s’il a Ă©tĂ© formĂ© sur Valeurs Actuelles ou non, pour donner un exemple.

Et c’est là qu’est le problùme.

L’OSI « The Open Source AI Definition – 1.0-RC1 Â» exige d’une IA open source qu’elle offre quatre libertĂ©s Ă  ses utilisateurs :

  1. Utiliser le systùme à n’importe quelle fin et sans avoir à demander la permission.
  2. Étudier le fonctionnement du systùme et inspecter ses composants.
  3. Modifier le systĂšme dans n’importe quel but, y compris pour changer ses rĂ©sultats.
  4. Partager le systùme pour que d’autres puissent l’utiliser, avec ou sans modifications, dans n’importe quel but.

Jusqu’ici tout va bien. Cela semble raisonnable, n’est-ce pas ? Vous pouvez inspecter, modifier, utiliser et tout ça. GĂ©nial. Tout est couvert dans les moindre dĂ©tails, n’est-ce pas ? Voyons rapidement ce qu’un systĂšme d’IA doit offrir. Le code : Check. Les paramĂštres du modĂšle (poids, configurations) : Check ! Nous sommes sur la bonne voie. Qu’en est-il des donnĂ©es ?

Informations sur les donnĂ©es : Informations suffisamment dĂ©taillĂ©es sur les donnĂ©es utilisĂ©es pour entraĂźner le systĂšme, de maniĂšre Ă  ce qu’une personne compĂ©tente puisse construire un systĂšme substantiellement Ă©quivalent. Les informations sur les donnĂ©es sont mises Ă  disposition dans des conditions approuvĂ©es par l’OSI.

En particulier, cela doit inclure (1) une description dĂ©taillĂ©e de toutes les donnĂ©es utilisĂ©es pour la formation, y compris (le cas Ă©chĂ©ant) des donnĂ©es non partageables, indiquant la provenance des donnĂ©es, leur portĂ©e et leurs caractĂ©ristiques, la maniĂšre dont les donnĂ©es ont Ă©tĂ© obtenues et sĂ©lectionnĂ©es, les procĂ©dures d’étiquetage et les mĂ©thodes de nettoyage des donnĂ©es ; (2) une liste de toutes les donnĂ©es de formation accessibles au public et l’endroit oĂč les obtenir ; et (3) une liste de toutes les donnĂ©es de formation pouvant ĂȘtre obtenues auprĂšs de tiers et l’endroit oĂč les obtenir, y compris Ă  titre onĂ©reux.
Open Source Initiative

Que signifie « informations suffisamment dĂ©taillĂ©es Â» ? La dĂ©finition de l’open source ne parle jamais de « code source suffisamment dĂ©taillĂ© Â». Vous devez obtenir le code source. Tout le code source. Et pas sous une forme obscurcie ou dĂ©formĂ©e. Le vrai code. Sinon, cela ne veut pas dire grand-chose et ne permet pas d’instaurer la confiance.

La dĂ©finition de l’« IA Open Source Â» donnĂ©e par l’OSI porte un grand coup Ă  l’idĂ©e d’open source : en rendant une partie essentielle du modĂšle (les donnĂ©es d’entraĂźnement) particuliĂšre de cette maniĂšre Ă©trange et bancale, ils qualifient d’« open source Â» toutes sortes de choses qui ne le sont pas vraiment, sur la base de leur propre dĂ©finition de ce qu’est l’open source et de ce Ă  quoi elle sert.

Les donnĂ©es d’apprentissage d’un systĂšme d’IA font Ă  toutes fins utiles partie de son « code Â». Elles sont aussi pertinentes pour le fonctionnement du modĂšle que le code littĂ©ral. Pour les systĂšmes d’IA, elles le sont probablement encore plus, car le code n’est qu’une opĂ©ration matricielle gĂ©nĂ©rique avec des illusions de grandeur.

L’OSI met une autre cerise sur le gĂąteau : les utilisateurs mĂ©ritent une description des « donnĂ©es non partageables Â» qui ont Ă©tĂ© utilisĂ©es pour entraĂźner un modĂšle. Qu’est-ce que c’est ? Appliquons cela au code Ă  nouveau : si un produit logiciel nous donne une partie essentielle de ses fonctionnalitĂ©s simplement sous la forme d’un artefact compilĂ© et nous jure ensuite que tout est totalement franc et honnĂȘte, mais que le code n’est pas « partageable Â», nous n’appellerions pas ce logiciel « open source Â». Parce qu’il n’ouvre pas toutes les sources.

Une « description Â» de donnĂ©es partiellement « non partageables Â» vous aide-t-elle Ă  reproduire le modĂšle ? Non. Vous pouvez essayer de reconstruire le modĂšle et il peut sembler un peu similaire, mais il est significativement diffĂ©rent. Cela vous aide-t-il d’« Ă©tudier le systĂšme et d’inspecter ses composants Â» ? Seulement Ă  un niveau superficiel. Mais si vous voulez vraiment analyser ce qu’il y a dans la boĂźte de statistiques magiques, vous devez savoir ce qu’il y a dedans. Qu’est-ce qui a Ă©tĂ© filtrĂ© exactement, qu’est-ce qui est entrĂ© ?

Cette dĂ©finition semble trĂšs Ă©trange venant de l’OSI, n’est-ce pas ? De toute Ă©vidence, cela va Ă  l’encontre des idĂ©es fondamentales de ce que les gens pensent que l’open source est et devrait ĂȘtre. Alors pourquoi le faire ?

L’IA (non) open source

Voici le truc. À l’échelle oĂč nous parlons aujourd’hui de ces systĂšmes statistiques en tant qu’« IA Â», l’IA open source ne peut pas exister.

De nombreux modĂšles plus petits ont Ă©tĂ© entraĂźnĂ©s sur des ensembles de donnĂ©es publics explicitement sĂ©lectionnĂ©s et organisĂ©s. Ceux-ci peuvent fournir toutes les donnĂ©es, tout le code, tous les processus et peuvent ĂȘtre appelĂ©s IA open-source. Mais ce ne sont pas ces systĂšmes qui font s’envoler l’action de NVIDIA.

Ces grands systĂšmes que l’on appelle « IA Â» – qu’ils soient destinĂ©s Ă  la gĂ©nĂ©ration d’images, de texte ou multimodaux – sont tous basĂ©s sur du matĂ©riel acquis et utilisĂ© illĂ©galement. Parce que les ensembles de donnĂ©es sont trop volumineux pour effectuer un filtrage rĂ©el et garantir leur lĂ©galitĂ©. C’est tout simplement trop.

Maintenant, les plus naĂŻfs d’entre vous pourraient se demander : « D’accord, mais si vous ne pouvez pas le faire lĂ©galement, comment pouvez-vous prĂ©tendre qu’il s’agit d’une entreprise lĂ©gitime ? Â» et vous auriez raison, mais nous vivons aussi dans un monde Ă©trange oĂč l’espoir qu’une innovation magique et / ou de l’argent viendront de la reproduction de messages Reddit, sauvant notre Ă©conomie et notre progrĂšs.

L’« IA open source Â» est une tentative de « blanchir Â» les systĂšmes propriĂ©taires. Dans leur article « Repenser l’IA gĂ©nĂ©rative open source : l’openwashing et le rĂšglement sur l’IA de l’UE  Â», Andreas Liesenfeld et Mark Dingemanse ont montrĂ© que de nombreux modĂšles d’IA « Open-Source Â» n’offrent guĂšre plus que des poids de modĂšles ouverts. Signification : Vous pouvez faire fonctionner la chose mais vous ne savez pas vraiment ce que c’est.

Cela ressemble Ă  quelque chose que nous avons dĂ©jĂ  eu : c’est un freeware. Les modĂšles open source que nous voyons aujourd’hui sont des blobs freeware propriĂ©taires. Ce qui est potentiellement un peu mieux que l’approche totalement fermĂ©e d’OpenAI, mais seulement un peu.

Certains modĂšles proposent des fiches de prĂ©sentation du modĂšle ou d’autres documents, mais la plupart vous laissent dans l’ignorance. Cela s’explique par le fait que la plupart de ces modĂšles sont dĂ©veloppĂ©s par des entreprises financĂ©es par le capital-risque qui ont besoin d’une voie thĂ©orique vers la monĂ©tisation.

L’« open source Â» est devenu un autocollant comme le « Commerce Ă©quitable Â», quelque chose qui donne l’impression que votre produit est bon et digne de confiance. Pour le positionner en dehors du diabolique espace commercial, en lui donnant un sentiment de proximitĂ©. « Nous sommes dans le mĂȘme bateau Â» et tout le reste. Mais ce n’est pas le cas. Nous ne sommes pas dans le mĂȘme bateau que Mark fucking Zuckerberg, mĂȘme s’il distribue gratuitement des poids de LLM parce que cela nuit Ă  ses concurrents. Nous, en tant que personnes normales vivant sur cette planĂšte qui ne cesse de se rĂ©chauffer, ne sommes avec aucune de ces personnes.

Photo d'un sticker oĂč il est marquĂ© « Open-Source Fuck Yeah ».

Les libristes adorent pourtant les stickers. Image sous CC BY-SA par Kirsten Comandich.

Mais il y a un autre aspect Ă  cette question, en dehors de redorer l’image des grands noms de la technologie et de leurs entreprises. Il s’agit de la lĂ©galitĂ©. Au moins en Allemagne, il existe des exceptions Ă  certaines lois qui concernent normalement les auteurs de LLM : si vous le faites Ă  des fins de recherche, vous ĂȘtes autorisĂ© Ă  rĂ©cupĂ©rer pratiquement n’importe quoi. Vous pouvez ensuite entraĂźner des modĂšles et publier ces poids, et mĂȘme s’il y a des contenus de Disney lĂ -dedans, vous n’avez rien Ă  craindre. C’est lĂ  que l’idĂ©e de l’IA open source joue un rĂŽle important : il s’agit d’un moyen de lĂ©gitimer un comportement probablement illĂ©gal par le biais de l’openwashing : en tant qu’entreprise, vous prenez de l’« IA open source Â» qui est basĂ©e sur tous les Ă©lĂ©ments que vous ne seriez pas lĂ©galement autorisĂ© Ă  toucher et vous l’utilisez pour construire votre produit. Faites de l’entraĂźnement supplĂ©mentaire avec des donnĂ©es sous licence, par exemple.

L’Open Source Initiative a attrapĂ© le syndrome FOMO (N.d.T : Fear of Missing Out) – tout comme le jury du prix Nobel. Elle souhaite Ă©galement participer Ă  l’engouement pour l’« IA Â».

Mais pour les systĂšmes que nous appelons aujourd’hui « IA Â», l’IA open source n’est pas possible dans la pratique. En effet, nous ne pourrons jamais tĂ©lĂ©charger toutes les donnĂ©es d’entraĂźnement rĂ©elles.

« Mais tante, nous n’aurons jamais d’IA open source Â». C’est tout Ă  fait exact. C’est ainsi que fonctionne la rĂ©alitĂ©. Si vous ne pouvez pas remplir les critĂšres d’une catĂ©gorie, vous n’appartenez pas Ă  cette catĂ©gorie. La solution n’est pas de changer les critĂšres. C’est comme jouer aux Ă©checs avec les pigeons.

 

Un créateur passe de DC (Comics) à DP (Domaine Public)

Par : Framalang
26 septembre 2023 Ă  05:42

Bill Willingham, fort mĂ©content de son Ă©diteur DC Comics, dĂ©cide de porter toutes ses Fables dans le Domaine Public. Il s’en explique dans un communiquĂ© de presse du 14 septembre.

En Ă©dition, le modĂšle auquel nous sommes conformé·es, c’est qu’une personne qui souhaite avoir un revenu de sa plume confie le fruit de son labeur Ă  un tiers, l’éditeur, qui se chargera de le faire fructifier et qui reversera en Ă©change de cet accord encadrĂ© par contrat une partie des revenus gĂ©nĂ©rĂ©s Ă  l’artiste. C’est ce que le droit d’auteur standard dĂ©fend comme modĂšle.

Sauf que la rĂ©alitĂ© est bien loin de cette jolie fiction et les relations conflictuelles qui naissent au sein de l’industrie ne sont pas rares. Auteurs et autrices sont frĂ©quemment confronté·es Ă  des soucis avec leur « partenaire Â» : retards de paiements, mensonges sur les tirages, obfuscation des rĂ©sultats de vente, obligation de participation gratuite au marketing, non-respect des souhaits initiaux, abus au sein des clauses contractuelles.

Bref, il arrive que le capitalisme basĂ© sur la propriĂ©tĂ© intellectuelle ne puisse s’empĂȘcher de traiter auteurs et autrices comme tous ses fournisseurs : comme des quantitĂ©s nĂ©gligeables dont il faut extraire le plus de valeur possible tout en minimisant au maximum les contreparties, quitte Ă  profiter d’un rapport de force favorable pour ne pas honorer ses accords ou en le faisant de façon abusive. Et, comme le prouve l’histoire ci-dessous, la rĂ©action des artistes tend parfois Ă  la radicalitĂ©.

Nous ne pouvons dĂ©terminer exactement quelles seront les consĂ©quences juridiques (et pratiques quant Ă  l’usage de son univers) des dĂ©cisions de Bill Willingham, surtout qu’elles prennent place en milieu anglo-saxon oĂč la propriĂ©tĂ© intellectuelle ne relĂšve pas des mĂȘmes cadres juridiques qu’en France (soumise Ă  la convention de Berne), mais il nous semblait intĂ©ressant de traduire le billet oĂč il exprime son ras-le-bol et sa dĂ©cision d’autant plus surprenante qu’il s’est toujours considĂ©rĂ© comme un conservateur, politiquement parlant.

Vous trouverez au bas de cet article des liens qui exposent la situation des auteurs en France (spoiler alert : c’est pas brillant
).

— Yann Kervran

Publication originale : Willingham Sends Fables Into the Public Domain avec quelques Ă©lĂ©ments de cette auto-interview : More About Fables in the Public Domain

Traduction Framalang : goofy, Henri-Paul, JLuc, Julien / Sphinx

 

Bill Willingham Ă©lĂšve Fables dans le domaine public

entre un lion et un lionceau, une jeune femme endormie, de nombreux papĂźllons bleu sur le fond orange. des "bulles" bleues portent les lettres du mot "Fables"

 

À compter du 15 septembre 2023, la propriĂ©tĂ© de la BD Fables, ce qui inclut tous les personnages et les sĂ©ries dĂ©rivĂ©es, entre dans le domaine public. Ce qui appartenait intĂ©gralement au seul Bill Willingham est dĂ©sormais la propriĂ©tĂ© de tout le monde et pour toujours. C’est chose faite et comme vous le diront la plupart des spĂ©cialistes, une fois que c’est fait, pas de retour en arriĂšre possible. Ce n’est ni possible ni envisageable.

— Pourquoi avoir fait ça ?

Pour plusieurs de raisons. VoilĂ  un certain temps que j’y rĂ©flĂ©chis. Donc, sans ordre particulier :

1. Sous l’angle pratique : quand j’ai signĂ© mon premier contrat d’édition en tant qu’auteur-crĂ©ateur avec DC Comics, l’entreprise Ă©tait dirigĂ©e par des hommes et des femmes honnĂȘtes et intĂšgres. La plupart interprĂ©taient les dĂ©tails du contrat de façon Ă©quitable et transparente. Il arrivait immanquablement que des problĂšmes apparaissent et nous rĂ©glions ça comme des femmes et des hommes raisonnables. Depuis lors, au cours d’une vingtaine d’annĂ©es Ă  peu prĂšs, ces personnes sont parties ou ont Ă©tĂ© virĂ©es pour ĂȘtre remplacĂ©es par un ballet renouvelĂ© d’inconnus sans intĂ©gritĂ© mesurable, qui dorĂ©navant choisissent d’interprĂ©ter chaque dĂ©tail du contrat dans le seul intĂ©rĂȘt de DC Comics et ses filiales. À une Ă©poque la propriĂ©tĂ© des Fables Ă©tait entre de bonnes mains, mais maintenant, avec l’usure et le remplacement des personnels, la propriĂ©tĂ© des Fables est tombĂ©e entre de mauvaises mains.

Comme je n’ai pas les moyens d’intenter un procĂšs Ă  DC Comics pour les contraindre Ă  respecter la lettre et l’esprit de nos accords de longue date, et puisque mĂȘme si je gagnais un procĂšs ça me coĂ»terait des sommes d’argent pharamineuses et des annĂ©es de ma vie (j’ai 67 ans donc pas d’annĂ©es Ă  perdre), j’ai dĂ©cidĂ© de suivre une autre voie et de combattre sur un autre front, inspirĂ© par les principes de la guerre asymĂ©trique.

J’ai choisi de l’offrir Ă  tout le monde. Si je n’ai pas pu empĂȘcher Fables de tomber entre de mauvaises mains, c’est au moins une façon de faire en sorte qu’elles tombent Ă©galement entre de nombreuses bonnes mains. Puisque je crois sincĂšrement qu’il y a encore davantage de bonnes personnes que de mauvaises dans le monde, je considĂšre cela comme une forme de victoire.

2. Sous l’angle philosophique : au cours de la derniĂšre dĂ©cennie, mes rĂ©flexions sur la maniĂšre de rĂ©former les lois sur les marques et le droit d’auteur dans ce pays (et dans d’autres, je suppose) ont subi une transformation radicale. Les lois actuelles sont un mĂ©li-mĂ©lo d’accords sous la table et contraires Ă  l’éthique visant Ă  maintenir les marques et les droits d’auteur entre les mains de grandes entreprises, qui peuvent largement se permettre d’acheter les rĂ©sultats qu’elles souhaitent.

Dans mon modĂšle idĂ©al de rĂ©forme radicale de ces lois, j’aimerais qu’une propriĂ©tĂ© intellectuelle soit la propriĂ©tĂ© de son crĂ©ateur d’origine pendant une pĂ©riode pouvant aller jusqu’à vingt ans Ă  compter de la premiĂšre publication, puis qu’elle tombe dans le domaine public pour que tous puissent l’utiliser. Cependant, Ă  tout moment avant l’expiration de cette pĂ©riode de vingt ans, vous, le propriĂ©taire de la propriĂ©tĂ© intellectuelle, pouvez la vendre Ă  une autre personne physique ou morale, qui peut en avoir l’usage exclusif pendant une durĂ©e maximale de dix ans. C’est ainsi maintenant et il ne peut alors pas ĂȘtre revendu. Cela entre dans le domaine public. Toute propriĂ©tĂ© intellectuelle peut-elle ĂȘtre conservĂ©e Ă  usage exclusif au maximum pendant une trentaine d’annĂ©es au maximum, et pas plus, sans exception.

Bien sĂ»r, si je dois croire Ă  des idĂ©es aussi radicales, quel genre d’hypocrite serais-je si je ne les mettais pas en pratique ? Fables est mon bĂ©bĂ© depuis une vingtaine d’annĂ©es maintenant. Il est temps de laisser tomber. C’est mon premier test de ce processus. Si cela fonctionne, et je ne vois aucune raison lĂ©gale pour laquelle cela ne fonctionnerait pas, d’autres propriĂ©tĂ©s viendront Ă  l’avenir. Étant donnĂ© que DC, ou tout autre personne morale, n’est pas rĂ©ellement propriĂ©taire de l’Ɠuvre, ils n’ont pas leur mot Ă  dire dans cette dĂ©cision.

— Qu’est-ce que DC Comics vous a fait au juste pour provoquer ça ?

Trop de choses pour les lister de maniĂšre exhaustive, mais voici les points essentiels. Pendant toutes ces annĂ©es oĂč j’ai Ă©tĂ© en affaires avec DC Comics, que ce soit avec Fables ou d’autres propriĂ©tĂ©s intellectuelles, DC a toujours violĂ© ses accords avec moi. En gĂ©nĂ©ral sur des points mineurs, comme d’oublier de me demander mon avis sur les artistes pour de nouvelles histoires, ou pour les images de couverture, les formats des nouvelles collections, etc.

À cette Ă©poque, quand on les appelait pour ça, ils rĂ©pondaient Ă  chaque fois : « DĂ©solĂ©, on vous a encore oubliĂ©, c’est passĂ© entre les mailles du filet. Ils ont utilisĂ© si souvent cette expression « passer entre les mailles Â» comme un automatisme que j’ai fini par leur interdire de l’employer encore. Ils sont souvent en retard pour la dĂ©claration des royalties et les sous-estiment souvent, ce qui me force Ă  les poursuivre pour qu’ils paient le reste de ce qu’ils me doivent.

DerniĂšrement, leurs pratiques sont devenues plus que pĂ©nibles, dĂ©bouchant sur une espĂšce de confrontation. Pour commencer, ils ont essayĂ© de m’extorquer la propriĂ©tĂ© de Fables. Lorsque Mark Doyle et Dan Didio (tout deux bons professionnels et licenciĂ©s par DC depuis) m’avaient approchĂ© avec le projet de republier Fables pour son 20e anniversaire, pendant les nĂ©gociations contractuelles pour ces nouvelles parutions, leurs nĂ©gociateurs juridiques ont tentĂ© d’imposer comme condition que le travail soit rĂ©alisĂ© comme prestataire1, transfĂ©rant de fait, et irrĂ©vocablement, la propriĂ©tĂ© Ă  DC.

Lorsque ça n’a pas fonctionnĂ©, leur excuse a Ă©tĂ© : « DĂ©solĂ©, nous n’avons pas lu votre contrat avant ces nĂ©gociations, nous pensions que nous en Ă©tions propriĂ©taires Â».
Plus rĂ©cemment, lors de discussions pour tenter de rĂ©soudre ces diffĂ©rends, les personnes de DC ont admis que leur interprĂ©tation de notre accord de publication et de l’accord subsĂ©quent sur les droits des mĂ©dias, Ă©taient qu’ils pouvaient faire ce que bon leur semble avec cette propriĂ©tĂ© intellectuelle. Ils pourraient changer les histoires ou les personnages Ă  leur convenance. Ils n’auraient aucune obligation de protĂ©ger l’intĂ©gritĂ© et la valeur de la propriĂ©tĂ© intellectuelle, d’eux-mĂȘmes ou de parties tierces (Telltale Games par exemple) et qu’ils pourraient radicalement modifier les personnages, le cadre, le prologue de l’histoire (je suis tombĂ© sur le script (texte) qu’ils avaient essayĂ© de me cacher il y a quelques annĂ©es). Comme une telle licence d’utilisation n’avait pas Ă©tĂ© nĂ©gociĂ©e dans notre accord de publication initial, ils ne me devraient pas non plus d’argent s’ils fournissaient des droits d’usages de Fables Ă  de tierces parties.

Puis, aprĂšs avoir capitulĂ© sur certains points lors de rĂ©unions tĂ©lĂ©phoniques suivantes, promettant de me payer l’argent qu’ils me devaient pour avoir fourni une licence de Fables Ă  Telltale Games, dans le cadre de notre nouvel accord, ils sont revenus sur leur parole et m’ont proposĂ© de me payer le montant comme « honoraires de consultant Â», ce qui leur Ă©vitait d’admettre qu’ils me devaient cet argent, tout en incluant un accord de confidentialitĂ© m’empĂȘchant de dire quoi que ce soit de nĂ©gatif Ă  propos de Telltale ou de la licence.

On pourrait encore continuer longtemps ainsi. Il y a tant d’autres, mais comme je l’ai dit, il s’agit lĂ  de quelques points saillants. À ce moment-lĂ , comme je n’étais pas d’accord avec toutes leurs nouvelles interprĂ©tations de nos accords de longue date, nous Ă©tions en conflit. Ils m’ont pratiquement mis au dĂ©fi de les poursuivre en justice pour faire valoir mes droits, sachant que ce serait une procĂ©dure longue, dĂ©bilitante et coĂ»teuse. Au lieu de cela, j’ai commencĂ© Ă  envisager d’autres solutions.

— ĂŠtes-vous inquiet de savoir ce que DC va faire maintenant ?

Non. Je leur ai donnĂ© des annĂ©es pour faire ce qu’il fallait. J’ai essayĂ© de les raisonner, mais on ne peut pas raisonner ceux qui ne sont pas raisonnables. Ils ont utilisĂ© ces annĂ©es pour faire des promesses lĂ©nifiantes, mentir sur leur volontĂ© de rĂ©soudre le problĂšme et faire traĂźner les choses le plus longtemps possible. Je leur ai donnĂ© l’occasion de renĂ©gocier les contrats de fond en comble, en formulant les choses sans ambiguĂŻtĂ©, et ils ont ignorĂ© cette offre. Je leur ai donnĂ© l’occasion, Ă  deux reprises, de simplement dĂ©chirer nos contrats et de nous sĂ©parer, mais ils ont ignorĂ© ces offres. J’ai essayĂ© de passer par-dessus leur tĂȘte, de traiter directement avec leurs nouveaux maĂźtres et peut-ĂȘtre de trouver quelqu’un disposĂ© Ă  traiter de bonne foi, mais ils ont bloquĂ© toute tentative en ce sens. (Je vous mets au dĂ©fi d’essayer de demander Ă  n’importe quel responsable de DC Comics d’indiquer Ă  qui il rend compte dans la hiĂ©rarchie de l’entreprise). Quoi qu’il en soit, sans leur donner de dĂ©tails, je les ai prĂ©venus des mois Ă  l’avance que ce moment allait arriver. Je leur ai dit que ce que j’allais faire serait « Ă  la fois lĂ©gal et Ă©thique Â». Et maintenant, c’est arrivĂ©.

Notez que mes contrats avec DC Comics sont toujours en vigueur. Je n’ai rien fait pour les rompre et je ne peux pas y mettre fin unilatĂ©ralement. Je ne peux toujours pas publier les bandes dessinĂ©es Fables par l’intermĂ©diaire de quelqu’un d’autre que DC Comics. Je ne peux toujours pas autoriser un film Fables par l’intermĂ©diaire de quelqu’un d’autre que DC Comics. Je ne peux pas non plus concĂ©der de licence pour des jouets, des boĂźtes Ă  lunch ou quoi que ce soit d’autre. Ils doivent toujours me payer pour les livres qu’ils publient. Et je n’abandonne pas les autres sommes qu’ils me doivent. D’une maniĂšre ou d’une autre, j’ai l’intention d’obtenir mes 50 % de l’argent qu’ils me doivent depuis des annĂ©es pour le jeu Telltale et d’autres projets.

De toutes façons, les nouveaux propriĂ©taires Ă  100 % de Fables n’ont jamais signĂ© de tels contrats.

Pour le meilleur et pour le pire, DC et moi sommes enchaĂźnĂ©s par un mariage malheureux, peut-ĂȘtre pour toujours.
Mais pas vous.

Si ma comprĂ©hension de la loi est correcte (et je prĂ©fĂšre vous dire que la loi sur le copyright est un bazar, intentionnellement vague et trouble et qu’il n’y a pas deux avocats, mĂȘme ceux spĂ©cialisĂ©s sur les lois des marques et du copyright, qui tomberaient d’accord sur ces sujets), vous avez le droit de crĂ©er vos propres films, dessins animĂ©s Fables, de publier vos libres Fables, de fabriquer vos jouets Fables, de faire ce que bon vous semble avec cette propriĂ©tĂ©, car c’est de la vĂŽtre dont il s’agit.

Mark Buckingham est libre d’écrire sa propre version de Fables (et j’espĂšre de tout mon cƓur qu’il le fera). Steve Leialoha est libre d’écrire sa version de Fables (que j’aimerais beaucoup voir), etc. Vous n’avez pas besoin de ma permission (mais vous pouvez avoir mon aval ma bĂ©nĂ©diction, selon votre projet). Vous n’avez pas besoin de la permission de DC ou de qui que ce soit d’autres. Vous n’avez jamais signĂ© les accords que j’ai signĂ©s avec DC Comics.

Je possĂšde toujours 100 % de Fables. Mais maintenant, chaque homme, chaque femme et chaque enfant du monde, ainsi que tous ceux qui naĂźtront jusqu’à la fin des temps, possĂšdent Ă©galement 100 % de Fables. Ce n’est pas une propriĂ©tĂ© divisĂ©e entre nous tous, c’est une propriĂ©tĂ© multipliĂ©e Ă  l’infini entre nous tous. PlutĂŽt cool, non ? Chaque personne possĂšde Fables en totalitĂ© et peut dĂ©cider elle-mĂȘme de ce qu’elle veut en faire, le cas Ă©chĂ©ant. C’est un peu comme le miracle de la multiplication des pains et des poissons, mĂ©taphoriquement parlant, bien sĂ»r. Quel que soit le nombre de participants, il y en a assez pour tout le monde.

J’ai eu l’immense joie et le plaisir de vous proposer les rĂ©cits de Fables pendant les vingt derniĂšres annĂ©es. J’ai hĂąte de voir ce que vous allez en faire.

image de l'auteur : devant un monstre menaçant ses enfants (angle gauche), une créature féminine farouche(au centre) armée d'une longue épée lui dit que sur ce qu'elle a de plus sacré, elle vas le tailler en piÚces s'il a le le malheur de toucher un seul cheveu à sa progéniture (5 enfants effrayés dans l'angle droit)

Et maintenant ? Une affaire Ă  suivre


La situation juridique est difficile Ă  dĂ©mĂȘler, comme le souligne cet article du magazine en ligne Comicsblog qui cite la rĂ©action de DC Comics :

« Le comics Fables et ses diffĂ©rents romans graphiques publiĂ©s chez DC Comics, de mĂȘme que les personnages, les histoires et les Ă©lĂ©ments qui les composent, sont la propriĂ©tĂ© de DC Comics et restent protĂ©gĂ©s par la loi des États-Unis sur le copyright et Ă  travers le monde, en accord avec les lois appliquĂ©es sur chaque territoire, et ne font pas partie des Ɠuvres tombĂ©es dans le domaine public.
DC conserve l’intĂ©gralitĂ© des droits et prendra les dĂ©cisions nĂ©cessaires pour protĂ©ger ses droits Ă  la propriĂ©tĂ© intellectuelle. Â»


Liens utiles sur la situation des auteurs en France :


Note :

Zoom et les politiques de confidentialité

Par : Framalang
17 août 2023 à 01:42

Cet article a Ă©tĂ© publiĂ© Ă  l’origine par THE MARKUP, il est traduit et republiĂ© avec l’accord de l’auteur selon les termes de la licence CC BY-NC-ND 4.0

 

Publication originale sur le site themarkup.org

 

Traduction Framalang : goofy, MO, Henri-Paul, Wisi_eu

 

Voilà ce qui arrive quand on se met à lire vraiment les politiques de confidentialité

Une rĂ©cente polĂ©mique sur la capacitĂ© de Zoom Ă  entraĂźner des intelligences artificielles avec les conversations des utilisateurs montre l’importance de lire les petits caractĂšres

par Aaron Sankin

 

Photo de l'extérieur du siÚge de Zoom le 07 février 2023 à San José, Californie. Les cÎtés droit et gauche de la photo sont masqués par deux zones sombres qui ne sont pas mises au point.

Justin Sullivan/Getty Images

 

photo de l'auteurBonjour, je m’appelle Aaron Sankin, je suis journaliste d’investigation Ă  The Markup. J’écris ici pour vous expliquer que si vous faites quelque chose de trĂšs pĂ©nible (lire les documents dans lesquels les entreprises expliquent ce qu’elles peuvent faire avec vos donnĂ©es), vous pourrez ensuite faire quelque chose d’un peu drĂŽle (piquer votre crise en ligne).

Au cours du dernier quart de siĂšcle, les politiques de protection de la vie privĂ©e – ce langage juridique long et dense que l’on parcourt rapidement avant de cliquer sans rĂ©flĂ©chir sur « J’accepte Â» – sont devenues Ă  la fois plus longues et plus touffues. Une Ă©tude publiĂ©e l’annĂ©e derniĂšre a montrĂ© que non seulement la longueur moyenne des politiques de confidentialitĂ© a quadruplĂ© entre 1996 et 2021, mais qu’elles sont Ă©galement devenues beaucoup plus difficiles Ă  comprendre.

Voici ce qu’a Ă©crit Isabel Wagner, professeur associĂ© Ă  l’universitĂ© De Montfort, qui a utilisĂ© l’apprentissage automatique afin d’analyser environ 50 000 politiques de confidentialitĂ© de sites web pour mener son Ă©tude :

« En analysant le contenu des politiques de confidentialitĂ©, nous identifions plusieurs tendances prĂ©occupantes, notamment l’utilisation croissante de donnĂ©es de localisation, l’exploitation croissante de donnĂ©es collectĂ©es implicitement, l’absence de choix vĂ©ritablement Ă©clairĂ©, l’absence de notification efficace des modifications de la politique de confidentialitĂ©, l’augmentation du partage des donnĂ©es avec des parties tierces opaques et le manque d’informations spĂ©cifiques sur les mesures de sĂ©curitĂ© et de confidentialitĂ© Â»

Si l’apprentissage automatique peut ĂȘtre un outil efficace pour comprendre l’univers des politiques de confidentialitĂ©, sa prĂ©sence Ă  l’intĂ©rieur d’une politique de confidentialitĂ© peut dĂ©clencher un ouragan. Un cas concret : Zoom.

En dĂ©but de semaine derniĂšre, Zoom, le service populaire de visioconfĂ©rence devenu omniprĂ©sent lorsque les confinements ont transformĂ© de nombreuses rĂ©unions en prĂ©sentiel en rĂ©unions dans de mini-fenĂȘtres sur des mini-Ă©crans d’ordinateurs portables, a rĂ©cemment fait l’objet de vives critiques de la part des utilisateurs et des dĂ©fenseurs de la vie privĂ©e, lorsqu’un article du site d’actualitĂ©s technologiques Stack Diary a mis en Ă©vidence une section des conditions de service de l’entreprise indiquant qu’elle pouvait utiliser les donnĂ©es collectĂ©es auprĂšs de ses utilisateurs pour entraĂźner l’intelligence artificielle.

version anglaise dĂ©but aoĂ»t, capturĂ©e par la Wayback Machine d’Internet Archive

le texte précise bien l'usage consenti par l'utilisateur de ses données pour l'apprentissage automatique et l'intelligence artificielle

version française fin juillet, capturĂ©e par la Wayback Machine d’Internet Archive

 

Le contrat d’utilisation stipulait que les utilisateurs de Zoom donnaient Ă  l’entreprise « une licence perpĂ©tuelle, non exclusive, libre de redevances, susceptible d’ĂȘtre cĂ©dĂ©e en sous-licence et transfĂ©rable Â» pour utiliser le « Contenu client Â» Ă  des fins diverses, notamment « de marketing, d’analyse des donnĂ©es, d’assurance qualitĂ©, d’apprentissage automatique, d’intelligence artificielle, etc. Â». Cette section ne prĂ©cisait pas que les utilisateurs devaient d’abord donner leur consentement explicite pour que l’entreprise puisse le faire.

Une entreprise qui utilise secrĂštement les donnĂ©es d’une personne pour entraĂźner un modĂšle d’intelligence artificielle est particuliĂšrement controversĂ©e par les temps qui courent. L’utilisation de l’IA pour remplacer les acteurs et les scĂ©naristes en chair et en os est l’un des principaux points d’achoppement des grĂšves en cours qui ont paralysĂ© Hollywood. OpenAI, la sociĂ©tĂ© Ă  l’origine de ChatGPT, a fait l’objet d’une vague de poursuites judiciaires l’accusant d’avoir entraĂźnĂ© ses systĂšmes sur le travail d’écrivains sans leur consentement. Des entreprises comme Stack Overflow, Reddit et X (le nom qu’Elon Musk a dĂ©cidĂ© de donner Ă  Twitter) ont Ă©galement pris des mesures Ă©nergiques pour empĂȘcher les entreprises d’IA d’utiliser leurs contenus pour entraĂźner des modĂšles sans obtenir elles-mĂȘmes une part de l’activitĂ©.

La rĂ©action en ligne contre Zoom a Ă©tĂ© fĂ©roce et immĂ©diate, certaines organisations, comme le mĂ©dia Bellingcat, proclamant leur intention de ne plus utiliser Zoom pour les vidĂ©oconfĂ©rences. Meredith Whittaker, prĂ©sidente de l’application de messagerie Signal spĂ©cialisĂ©e dans la protection de la vie privĂ©e, a profitĂ© de l’occasion pour faire de la publicitĂ© :

« HUM : Les appels vidĂ©o de @signalapp fonctionnent trĂšs bien, mĂȘme avec une faible bande passante, et ne collectent AUCUNE DONNÉE SUR VOUS NI SUR LA PERSONNE À QUI VOUS PARLEZ ! Une autre façon tangible et importante pour Signal de s’engager rĂ©ellement en faveur de la vie privĂ©e est d’interrompre le pipeline vorace de surveillance des IA. Â»

Zoom, sans surprise, a éprouvé le besoin de réagir.

Dans les heures qui ont suivi la diffusion de l’histoire, le lundi mĂȘme, Smita Hashim, responsable des produits chez Zoom, a publiĂ© un billet de blog visant Ă  apaiser des personnes qui craignent de voir  leurs propos et comportements ĂȘtre intĂ©grĂ©s dans des modĂšles d’entraĂźnement d’IA, alors qu’elles souhaitent virtuellement un joyeux anniversaire Ă  leur grand-mĂšre, Ă  des milliers de kilomĂštres de distance.

« Dans le cadre de notre engagement en faveur de la transparence et du contrĂŽle par l’utilisateur, nous clarifions notre approche de deux aspects essentiels de nos services : les fonctions d’intelligence artificielle de Zoom et le partage de contenu avec les clients Ă  des fins d’amĂ©lioration du produit Â», a Ă©crit Mme Hashim. « Notre objectif est de permettre aux propriĂ©taires de comptes Zoom et aux administrateurs de contrĂŽler ces fonctions et leurs dĂ©cisions, et nous sommes lĂ  pour faire la lumiĂšre sur la façon dont nous le faisons et comment cela affecte certains groupes de clients Â».

Mme Hashim Ă©crit que Zoom a mis Ă  jour ses conditions d’utilisation pour donner plus de contexte sur les politiques d’utilisation des donnĂ©es par l’entreprise. Alors que le paragraphe sur Zoom ayant « une licence perpĂ©tuelle, non exclusive, libre de redevances, pouvant faire l’objet d’une sous-licence et transfĂ©rable Â» pour utiliser les donnĂ©es des clients pour « l’apprentissage automatique, l’intelligence artificielle, la formation, les tests Â» est restĂ© intact [N de T. cependant cette mention semble avoir disparu dans la version du 11 aoĂ»t 2023], une nouvelle phrase a Ă©tĂ© ajoutĂ©e juste en dessous :

« Zoom n’utilise aucun Contenu client audio, vidĂ©o, chat, partage d’écran, piĂšces jointes ou autres communications comme le Contenu client (tels que les rĂ©sultats des sondages, les tableaux blancs et les rĂ©actions) pour entraĂźner les modĂšles d’intelligence artificielle de Zoom ou de tiers. Â»

Comment utilisons-nous vos donnĂ©es Ă  caractĂšre personnel ?Les employĂ©s de Zoom n’accĂšdent pas au Contenu client des rĂ©unions, des webinaires, des messageries ou des e-mails (en particulier, l’audio, la vidĂ©o, les fichiers, les tableaux blancs en rĂ©union et les contenus des messageries ou des e-mails), ni au contenu gĂ©nĂ©rĂ© ou partagĂ© dans le cadre d’autres fonctions de collaboration (comme les tableaux blancs hors rĂ©union), et ne les utilisent pas, Ă  moins que le titulaire du compte hĂ©bergeant le produit ou Service Zoom oĂč le Contenu client a Ă©tĂ© gĂ©nĂ©rĂ© ne le demande ou que cela ne soit nĂ©cessaire pour des raisons juridiques, de sĂ»retĂ© ou de sĂ©curitĂ©. Zoom n’utilise aucun Contenu client audio, vidĂ©o, chat, partage d’écran, piĂšces jointes ou autres communications comme le Contenu client (tels que les rĂ©sultats des sondages, les tableaux blancs et les rĂ©actions) pour entraĂźner les modĂšles d’intelligence artificielle de Zoom ou de tiers.

copie d’écran du 16/08/2023, page https://explore.zoom.us/fr/privacy/

 

Dans son billet de blog, Mme Hashim insiste sur le fait que Zoom n’utilise le contenu des utilisateurs que pour former l’IA Ă  des produits spĂ©cifiques, comme un outil qui gĂ©nĂšre automatiquement des rĂ©sumĂ©s de rĂ©unions, et seulement aprĂšs que les utilisateurs auront explicitement choisi d’utiliser ces produits. « Un exemple de service d’apprentissage automatique pour lequel nous avons besoin d’une licence et de droits d’utilisation est notre analyse automatisĂ©e des invitations et des rappels de webinaires pour s’assurer que nous ne sommes pas utilisĂ©s involontairement pour spammer ou frauder les participants Â», Ă©crit-elle. « Le client est propriĂ©taire de l’invitation au webinaire et nous sommes autorisĂ©s Ă  fournir le service Ă  partir de ce contenu. En ce qui concerne l’IA, nous n’utilisons pas de contenus audios, de vidĂ©os ou de chats pour entraĂźner nos modĂšles sans le consentement du client. Â»

La politique de confidentialitĂ© de Zoom – document distinct de ses conditions de service – ne mentionne l’intelligence artificielle ou l’apprentissage automatique que dans le contexte de la fourniture de « fonctions et produits intelligents (sic), tels que Zoom IQ ou d’autres outils pour recommander le chat, le courrier Ă©lectronique ou d’autres contenus Â».

Pour avoir une idĂ©e de ce que tout cela signifie, j’ai Ă©changĂ© avec Jesse Woo, un ingĂ©nieur spĂ©cialisĂ© en donnĂ©es de The Markup qui, en tant qu’avocat spĂ©cialisĂ© dans la protection de la vie privĂ©e, a participĂ© Ă  la rĂ©daction de politiques institutionnelles d’utilisation des donnĂ©es.

M. Woo explique que, bien qu’il comprenne pourquoi la formulation des conditions d’utilisation de Zoom touche un point sensible, la mention suivant laquelle les utilisateurs autorisent l’entreprise Ă  copier et Ă  utiliser leur contenu est en fait assez standard dans ce type d’accord d’utilisation. Le problĂšme est que la politique de Zoom a Ă©tĂ© rĂ©digĂ©e de maniĂšre Ă  ce que chacun des droits cĂ©dĂ©s Ă  l’entreprise soit spĂ©cifiquement Ă©numĂ©rĂ©, ce qui peut sembler beaucoup. Mais c’est aussi ce qui se passe lorsque vous utilisez des produits ou des services en 2023, dĂ©solĂ©, bienvenue dans le futur !

Pour illustrer la diffĂ©rence, M. Woo prend l’exemple de la politique de confidentialitĂ© du service de vidĂ©oconfĂ©rence concurrent Webex, qui stipule ce qui suit : « Nous ne surveillerons pas le contenu, sauf : (i) si cela est nĂ©cessaire pour fournir, soutenir ou amĂ©liorer la fourniture des services, (ii) pour enquĂȘter sur des fraudes potentielles ou prĂ©sumĂ©es, (iii) si vous nous l’avez demandĂ© ou autorisĂ©, ou (iv) si la loi l’exige ou pour exercer ou protĂ©ger nos droits lĂ©gaux Â».

Cette formulation semble beaucoup moins effrayante, mĂȘme si, comme l’a notĂ© M. Woo, l’entraĂźnement de modĂšles d’IA pourrait probablement ĂȘtre mentionnĂ© par une entreprise sous couvert de mesures pour « soutenir ou amĂ©liorer la fourniture de services Â».

L’idĂ©e que les gens puissent paniquer si les donnĂ©es qu’ils fournissent Ă  une entreprise dans un but Ă©vident et simple (comme opĂ©rer un appel de vidĂ©oconfĂ©rence) sont ensuite utilisĂ©es Ă  d’autres fins (comme entraĂźner un algorithme) n’est pas nouvelle. Un rapport publiĂ© par le Forum sur le futur de la vie privĂ©e (Future of Privacy Forum), en 2018, avertissait que « le besoin de grandes quantitĂ©s de donnĂ©es pendant le dĂ©veloppement en tant que « donnĂ©es d’entraĂźnement Â» crĂ©e des problĂšmes de consentement pour les personnes qui pourraient avoir acceptĂ© de fournir des donnĂ©es personnelles dans un contexte commercial ou de recherche particulier, sans comprendre ou s’attendre Ă  ce qu’elles soient ensuite utilisĂ©es pour la conception et le dĂ©veloppement de nouveaux algorithmes. Â»

Pour Woo, l’essentiel est que, selon les termes des conditions de service initiales, Zoom aurait pu utiliser toutes les donnĂ©es des utilisateurs qu’elle souhaitait pour entraĂźner l’IA sans demander leur consentement et sans courir de risque juridique dans ce processus.

Ils sont actuellement liĂ©s par les restrictions qu’ils viennent d’inclure dans leurs conditions d’utilisation, mais rien ne les empĂȘche de les modifier ultĂ©rieurement.
Jesse Woo, ingénieur en données chez The Markup

« Tout le risque qu’ils ont pris dans ce fiasco est en termes de rĂ©putation, et le seul recours des utilisateurs est de choisir un autre service de vidĂ©oconfĂ©rence Â», explique M. Woo. « S’ils avaient Ă©tĂ© intelligents, ils auraient utilisĂ© un langage plus circonspect, mais toujours prĂ©cis, tout en proposant l’option du refus, ce qui est une sorte d’illusion de choix pour la plupart des gens qui n’exercent pas leur droit de refus. Â»

Changements futurs mis Ă  part, il y a quelque chose de remarquable dans le fait qu’un tollĂ© public rĂ©ussisse Ă  obtenir d’une entreprise qu’elle dĂ©clare officiellement qu’elle ne fera pas quelque chose d’effrayant. L’ensemble de ces informations sert d’avertissement Ă  d’autres sur le fait que l’entraĂźnement de systĂšmes d’IA sur des donnĂ©es clients sans leur consentement pourrait susciter la colĂšre de bon nombre de ces clients.

Les conditions d’utilisation de Zoom mentionnent la politique de l’entreprise en matiĂšre d’intelligence artificielle depuis le mois de mars, mais cette politique n’a attirĂ© l’attention du grand public que la semaine derniĂšre. Ce dĂ©calage suggĂšre que les gens ne lisent peut-ĂȘtre pas les donnĂ©es juridiques, de plus en plus longues et de plus en plus denses, dans lesquelles les entreprises expliquent en dĂ©tail ce qu’elles font avec vos donnĂ©es.

Heureusement, Woo et Jon Keegan, journalistes d’investigation sur les donnĂ©es pour The Markup, ont rĂ©cemment publiĂ© un guide pratique (en anglais) indiquant comment lire une politique de confidentialitĂ© et en  identifier rapidement les parties importantes, effrayantes ou rĂ©voltantes.

Bonne lecture !


Sur le mĂȘme thĂšme, on peut s’intĂ©resser Ă  :

 

Publier le code source ne suffit pas


Par : Framalang
17 avril 2023 Ă  05:42

Un court billet oĂč Nicolas Kayser-Bril opĂšre une mise au point : la loi europĂ©enne et les grandes entreprises du Web peuvent donner accĂšs au code source, mais ce n’est qu’un facteur parmi d’autres qui s’avĂšre souvent inutile Ă  lui seul


Article original : The ideology behind publishing Twitter’s source code publiĂ© dans le bulletin d’information (en anglais ou allemand)  d’Algorithmwatch auquel on peut s’abonner sur cette page.

Traduction Framalang relue et rĂ©visĂ©e par l’auteur : Squeeek, goofy, audionuma

L’idĂ©ologie derriĂšre la publication du code source de Twitter

par Nicolas Kayser-Bril

Photo noir/blanc de l'auteur, jeune homme brun souriant.

Photo par Julia Bornkessel licence CC-BY 4.0

Une fuite

Le 31 mars, Twitter a publiĂ© une partie du code source qui alimente son fil d’actualitĂ©. Cette dĂ©cision a Ă©tĂ© prise quelques jours aprĂšs qu’il a Ă©tĂ© rendu public que de grandes parties de ce code avaient dĂ©jĂ  Ă©tĂ© divulguĂ©es sur Github [Gizmodo, 31 mars].

Les 85 797 lignes de code ne nous apprennent pas grand-chose. Les tweets ne contenant pas de liens sont mis en avant. Ceux rĂ©digĂ©s dans une langue que le systĂšme ne peut pas reconnaĂźtre sont rĂ©trogradĂ©s – discriminant clairement les personnes qui parlent une langue qui n’est pas reconnue par les ingĂ©nieurs californiens. Les Spaces (la fonction de podcasting en direct de Twitter) sur l’Ukraine semblent Ă©galement ĂȘtre cachĂ©s [Aakash Gupta, 2 avril].

Le plus intĂ©ressant dans cette affaire reste le billet de blog rĂ©digĂ© par ce qu’il reste de l’équipe d’ingĂ©nieurs de Twitter. Il explique bien comment fonctionne un fil d’actualitĂ© d’un point de vue technique.

Comment (ne pas) ouvrir le code source

Une entreprise a Ă©tĂ© pionniĂšre pour rendre son code source public : Twitter. Il y a deux ans, son Ă©quipe « Ă‰thique, Transparence et ResponsabilitĂ© Â» a publiĂ© le code d’un algorithme de recadrage d’images et a organisĂ© une compĂ©tition permettant Ă  quiconque d’y trouver d’éventuels biais [AlgorithmWatch, 2021]. Cette Ă©quipe a Ă©tĂ© l’une des premiĂšres Ă  ĂȘtre licenciĂ©e l’annĂ©e derniĂšre.

Il ne suffit pas de lire un code source pour l’auditer. Il faut le faire fonctionner (l’exĂ©cuter) sur un ordinateur. En ce qui concerne l’Ukraine, par exemple, nous savons seulement que les Spaces Twitter Ă©tiquetĂ©s « UkraineCrisisTopic Â» subissent le mĂȘme traitement que les articles Ă©tiquetĂ©s « violence Â» ou « porno Â». Mais nous ne savons pas comment cette Ă©tiquette est attribuĂ©e, ni quels en sont les effets. Il semble que le code de ces fonctionnalitĂ©s n’ait mĂȘme pas Ă©tĂ© rendu public.

Dissimulation

Publier du code informatique sans expliquer comment le faire fonctionner peut ĂȘtre pire qu’inutile. Cela permet de prĂ©tendre Ă  la transparence tout en empĂȘchant tout rĂ©el audit. Twitter n’est pas la premiĂšre organisation Ă  suivre cette stratĂ©gie.

La Caisse Nationale des Allocations Familiales a publiĂ© les 7 millions de lignes du code de son calculateur d’allocations suite Ă  une demande d’informations publiques (demande CADA) [NextINpact, 2018]. On ne pouvait rien en tirer. J’ai fait une demande de communication des « documents d’architecture fonctionnelle Â», qui sont mentionnĂ©s dans des commentaires du code. La CNAF a rĂ©pondu qu’ils n’existaient pas.

La loi europĂ©enne sur les services numĂ©riques prĂ©voit que les « chercheurs agrĂ©Ă©s Â» pourront accĂ©der aux « donnĂ©es Â» des trĂšs grandes plateformes, y compris Ă©ventuellement au code source [AlgorithmWatch, 2022]. Pour que la loi sur les services numĂ©riques fonctionne, il est essentiel que les entreprises traitent ces demandes comme le Twitter de 2021, et non comme le Twitter de 2023.

L’idĂ©ologie technologiste

Enfin, la focalisation sur le code source est au service d’un projet politique. J’entends souvent dire que le code est le cƓur d’une entreprise, que c’est un secret commercial prĂ©cieusement gardĂ©. C’est faux. Si c’était le cas, les fuites de code source nuiraient aux entreprises. Suite Ă  des intrusions ou des fuites, le code source de Yandex et de Twitch a Ă©tĂ© publiĂ© rĂ©cemment [ArsTechnica, 2021 et 2023]. À ma connaissance, ces entreprises n’en ont pas souffert.

Le code source n’est qu’un facteur parmi d’autres pour une entreprise du Web. Parmi les autres facteurs, citons les employĂ©s, les relations avec des politiques, les procĂ©dures internes, la position sur le marchĂ©, l’environnement juridique et bien d’autres encore. Mettre le code sur un piĂ©destal implique que les autres facteurs sont sans importance. Les propriĂ©taires de Twitter et de Meta (et ils sont loin d’ĂȘtre les seuls) ont dit trĂšs clairement que les ingĂ©nieurs Ă©taient beaucoup plus importants que le reste de leurs employé·e·s. Pour eux, tout problĂšme est fondamentalement technique et peut ĂȘtre rĂ©solu par du code.

Je suis certain que la publication du code source de Twitter conduira certains technologues Ă  prĂ©tendre que le harcĂšlement en ligne, les agressions et la dĂ©sinformation peuvent dĂ©sormais ĂȘtre « corrigĂ©s Â» par une pull request (lorsqu’un contributeur Ă  un projet open source propose une modification du code). Ce serait un pas dans la mauvaise direction.

Une « Ă©dition Â» minable de Pepper & Carrot sur Amazon

Par : Framalang
10 avril 2023 Ă  05:42

Depuis quelques annĂ©es, Framasoft bĂ©nĂ©ficie des illustrations trĂšs apprĂ©ciĂ©es de David Revoy, un artiste qui sĂ©duit autant par son talent et son imaginaire que par le choix de publier en licence libre (CC-BY), ce qui est plutĂŽt exceptionnel dans le monde de la bande dessinĂ©e. La licence qu’il a choisie autorise Ă  :

  • Partager — copier, distribuer et communiquer le matĂ©riel par tous moyens et sous tous formats
  • Adapter — remixer, transformer et crĂ©er Ă  partir du matĂ©riel, y compris pour un usage commercial.

La seule condition impĂ©rative est l’Attribution

Attribution — Vous devez crĂ©diter l’ƒuvre, intĂ©grer un lien vers la licence et indiquer si des modifications ont Ă©tĂ© effectuĂ©es Ă  l’Ɠuvre. Vous devez indiquer ces informations par tous les moyens raisonnables, sans toutefois suggĂ©rer que l’Offrant vous soutient ou soutient la façon dont vous avez utilisĂ© son ƒuvre.

assortie d’une interdiction :

Pas de restrictions complĂ©mentaires — Vous n’ĂȘtes pas autorisĂ© Ă  appliquer des conditions lĂ©gales ou des mesures techniques qui restreindraient lĂ©galement autrui Ă  utiliser l’Ɠuvre dans les conditions dĂ©crites par la licence.

Comme on peut le lire plus haut et comme le prĂ©cise David lui-mĂȘme dans sa F.A.Q, ce n’est pas parce que la licence est libre que l’on peut se servir sans scrupules des Ɠuvres et du nom de l’auteur :

Ce n’est pas parce que vous pouvez rĂ©utiliser mes Ɠuvres que je suis d’accord avec ce que vous faites, ou que je peux ĂȘtre considĂ©rĂ© comme un auteur actif de votre projet, surtout si mon nom est Ă©crit comme une signature de votre dĂ©rivation ou si vous rĂ©utilisez mon nom pour dire Ă  votre public que je suis « d’accord Â» avec votre projet. Cela ne fonctionne pas comme ça. Restez simple : communiquez la vĂ©ritĂ©,

C’est justement ces prĂ©cautions et ce respect Ă©lĂ©mentaires que n’ont pas pris les Ă©diteurs (mĂ©ritent-ils ce nom ?) d’une publication dĂ©rivĂ©e de Pepper & Carrot (dĂ©jĂ  37 Ă©pisodes traduits en 63 langues !) et qui est en vente sur Amazon, plateforme bien connue pour ses pratiques commerciales Ă©thiques (non)


Alors David, d’ordinaire si aimable, se fĂąche tout rouge et relĂšve toutes les pratiques complĂštement hors-pistes de Fa Comics, dans l’article ci-dessous publiĂ© sur son blog et traduit pour vous par Framalang



Article original de David Revoy sur son blog : Fa Bd Comics books on SCAMazon : don’t buy them

Traduction Framalang : GPSqueek, Sysy, Poca, goofy, macrico

N’achetez pas les BD des Ă©ditions Fa Bd sur SCAMazon

par David Revoy

On atteint un record : avec la communautĂ© de Pepper & Carrot, nous avons trouvĂ© Fa Bd, l’éditeur du pire dĂ©rivĂ© de Pepper & Carrot Ă  ce jour.

Malheureusement, les produits sont publiĂ©s sous mon nom et aussi sous le nom d’artistes qui ont rĂ©alisĂ© des fan-arts de Pepper & Carrot
 VoilĂ  pourquoi j’écris cet article, histoire de dĂ©crire un peu cette arnaque et ce carnage de la publication assistĂ©e par ordinateur qui se perpĂ©tue actuellement sur Amazon, et aussi pour dissuader le public de Pepper & Carrot de les acheter.

Accrochez-vous, car nous entrons dans le territoire du zĂ©ro absolu de la qualitĂ©, des horreurs du graphisme, des cauchemars de la colorimĂ©trie et de l’affreuse mise en page.

Les trois albums

Un grand merci Ă  Craig Maloney qui a achetĂ© les trois albums pour que nous puissions Ă©valuer leur qualitĂ©. Il a Ă©galement rĂ©alisĂ© toutes les photos que vous trouverez ici et a Ă©crit des commentaires sur Amazon sous les albums afin d’avertir d’autres clients potentiels de leur piĂštre qualitĂ©.

1. HĂ©ritage

Lien vers Amazon : https://www.amazon.com/Heritage-David-Revoy/dp/B0BS1ZHM9T/

Il s’agit d’une version imprimable datant de dĂ©cembre 2022 de mon webcomic (Ă©pisode unique) L’hĂ©ritage en couleur publiĂ© en mai 2012 sous la licence Creative Commons Attribution 4.0 International.

 

Mes observations :

(1) bien que la couverture soit correcte, l’impression gĂąche totalement l’histoire elle-mĂȘme : le concept de cette bande dessinĂ©e est la reprĂ©sentation en couleurs des sentiments du personnage principal, pourtant l’éditeur a dĂ©cidĂ© d’imprimer l’histoire complĂšte en noir et blanc. Cela rend le tout le rĂ©cit illisible et dĂ©nuĂ© de sens. Essayez de lire l’original et demandez-vous ce que vaut la bande dessinĂ©e en noir et blanc. Apparemment, c’est assez bon pour ĂȘtre publiĂ© de cette façon par les Ă©ditions FA Bd Comics


(2) L’attribution est lĂ  mais l’éditeur FA BD comics n’indique pas son rĂŽle. Et attendez, une adresse courriel Caramail ? Je croyais qu’ils avaient disparu il y a 20 ans 1. Je n’aime pas la façon dont mon crĂ©dit et mon nom sur la couverture et la page produit donnent l’impression que j’ai approuvĂ© cette publication et que j’y ai collaborĂ©. Il ne s’agit pas d’une « violation d’approbation Â» explicite, mais j’ai honte de voir mon nom figurer sur ces pages.

(3) L’éditeur a oubliĂ© une page dans l’histoire : l’avant-derniĂšre
 ce qui fait que ça casse encore plus l’histoire. Et pour remplir la fin du livre, des parties alĂ©atoires du making of ont Ă©tĂ© tĂ©lĂ©chargĂ©es et dĂ©versĂ©es comme ça sans aucun avertissement, juste aprĂšs la fin de l’histoire.

Davantage de photos ici.

2. Les histoires de Pepper & Carrot

Lien vers Amazon : https://www.amazon.com/Pepper-Carrot-Novels-David-Revoy/dp/B09ZZVJLDT/

Description : Il s’agit d’une compilation imprimable datant de mai 2022 d’un mĂ©lange de Fan-art de Pepper&Carrot contenant des bulles de texte et de BD Fan-art de Pepper & Carrot.

Mes observations :

(1) Mon nom figure en haut de la couverture, alors qu’aucune illustration de moi ne figure sur cet album. C’est trĂšs problĂ©matique, car mĂȘme si j’apprĂ©cie beaucoup le fan-art d’étude de Pepper envoyĂ© par Coyau en 2015 parce que c’était parmi les premiers fan-arts que j’ai reçus sur Pepper & Carrot, je ne pense pas que Coyau s’attendait Ă  ce qu’il soit utilisĂ© comme Ɠuvre d’art/visuel/illustration pour la couverture.

(2) MĂȘme si tous les fan-arts sont correctement attribuĂ©s Ă  leur auteur, l’éditeur a mal lu une information importante sur Pepper & Carrot : l’auteur du fan-art peut mettre son Ɠuvre sous la licence qu’il souhaite. Et sauf mention explicite, ils sont tous protĂ©gĂ©s par le droit d’auteur. C’est Ă©crit clairement dans la case « Licence Â» de chaque fan-art sur le site. « Cette image est un fan-art rĂ©alisĂ© par <nom de l’auteur>. Elle est affichĂ©e sur la galerie de fan-arts de Pepper & Carrot avec sa permission. Ne rĂ©utilisez pas cette image pour votre projet sans l’autorisation de l’auteur Â». L’éditeur, sur les crĂ©dits de son album, assume « basĂ© sur le mĂȘme personnage avec la mĂȘme licence Â». C’est faux et abusif. Notez Ă©galement que l’email de l’éditeur change sur ces crĂ©dits, et que la ligne « Ć“uvre de fiction Â» de HĂ©ritage est Ă©galement prĂ©sente
 Boulot de copier-coller vite fait et nĂ©gligent dĂ©tectĂ© !

(3) Les fan-arts sont imprimĂ©s en noir et blanc. Il n’y a pas d’indication permettant de savoir qui, parmi la liste des auteurs, a dessinĂ© quelle page, et il n’y a pas de mise en page. Les dessins sont simplement collĂ©s sur la page avec de grands espaces vides, mĂȘme lorsque la police est trop petite. Notez que le contraste est Ă©galement faible. Ce n’est pas du tout respectueux des crĂ©ations artistiques.

Davantage de photos ici.

3. Pepper & Carrot Mini

Lien vers Amazon : https://www.amazon.com/Pepper-Carrot-Mini-Nicolas-Artance/dp/B0BHMPMM14/

Il s’agit d’une publication papier d’octobre 2010 de la sĂ©rie Pepper & Carrot Mini par Nicolas Artance. Nicolas Artance est l’un des principaux contributeurs et modĂ©rateurs de la communautĂ© Pepper & Carrot, et joue un rĂŽle important dans la version française de la sĂ©rie principale. Il publie sa sĂ©rie sous Creative Commons Attribution 4.0 International et partage Ă©galement les sources complĂštes.

Mes observations :

(1) La couverture ne provient pas de Pepper & Carrot Mini, elle n’a pas Ă©tĂ© rĂ©alisĂ©e par Nicolas Artance ni par moi-mĂȘme, mais c’est un fan-art de Tessou. Il y a donc un problĂšme de copyright puisque le dessin de Tessou n’est pas publiĂ© sous la licence de Pepper & Carrot. La couverture contient Ă©galement trois noms et il est difficile de savoir qui fait quoi ou qui soutient quoi. Sur le produit Amazon, nous sommes co-auteur avec Nicolas
 Quel bazar !

(2) MĂȘme mensonge que pour l’album prĂ©cĂ©dent Ă  propos de la licence du fan-art, et une grosse faute de frappe dans le nom de Nicolas (Nocolas). Apparemment, cet Ă©diteur n’a aucun correcteur et s’en moque.

(3) La qualitĂ©, la mise en page
 Tout est imprimĂ© en noir et blanc et en faible contraste. Les planches en paysage sont « adaptĂ©es Ă  la largeur Â» de la page. Certaines polices sont Ă  peine lisibles.

Davantage de photos ici.

Et maintenant ?

Tout d’abord, vous pouvez aider : si vous avez un compte Amazon [NdT : il faut un compte sur Amazon.com, ça ne marchera pas depuis un compte Amazon.fr], vous pouvez simplement cliquer sur le bouton « Utile Â» sur les commentaires de Craig sur chaque livre 1, 2 et 3. Ce n’est pas grand-chose, mais cela aidera probablement les acheteurs potentiels Ă  passer leur chemin en voyant l’avis 1 Ă©toile.

Je n’ai clairement pas la charitĂ© de penser que cet Ă©diteur souffre juste d’incompĂ©tence flagrante et qu’il essaie simplement d’aider l’impression d’Ɠuvres culturelles libres. Ils ne m’ont jamais contactĂ©, ils n’ont jamais contribuĂ© Ă  l’écosystĂšme Pepper&Carrot pour autant que je sache, et ils ont juste fait un produit de la plus basse qualitĂ© avec peu d’efforts sur une place de marchĂ© oĂč il n’y a aucun contrĂŽle sur la qualitĂ©.

C’est hors de prix et le fait de voir ce niveau d’irrespect pour mon art et pour l’industrie du livre est clairement ce qui affecte mon humeur. Je ne pense pas que ce produit dĂ©rivĂ© soit d’un grand secours. S’il vous plaĂźt, FA Bd Comic ou Amazon : si vous lisez ceci, retirez ces produits dĂšs que possible.

De mon cĂŽtĂ©, je vais essayer de les contacter tous les deux pour qu’ils retirent les albums. Ils ont tous trop de problĂšmes pour ĂȘtre en ligne, y compris des problĂšmes de copyright. J’écrirai toute mise Ă  jour ultĂ©rieure sous cette rubrique. En attendant, ne les achetez pas !

 

Mises Ă  jour

A. 2023-03-28, 01:20am : J’ai pris le temps de faire un rapport officiel pour violation de copyright sur Amazon. Je vous informerai de l’issue de ce rapport.

B. 2023-03-28, 01:00pm : J’ai reçu ma rĂ©ponse : « Nous n’avons pas Ă©tĂ© en mesure de vĂ©rifier que vous ĂȘtes le propriĂ©taire des droits ou son agent Â». (rĂ©ponse automatique complĂšte). Ok, j’abandonne


 

Informations complĂ©mentaires sur la licence : le texte de cet article est publiĂ© sous Creative Commons Attribution 4.0. Cependant, les images de cet article sont protĂ©gĂ©es : ne les rĂ©utilisez pas : elles contiennent du fan-art, des copyrights et des marques dĂ©posĂ©es.

Google et son robot pipoteur(*), selon Doctorow

Par : Framalang
3 mars 2023 Ă  03:35

Source de commentaires alarmants ou sarcastiques, les robots conversationnels qui reposent sur l’apprentissage automatique ne provoquent pas seulement l’intĂ©rĂȘt du grand public, mais font l’objet d’une course de vitesse chez les GAFAM.

Tout rĂ©cemment, peut-ĂȘtre pour ne pas ĂȘtre Ă  la traĂźne derriĂšre Microsoft qui veut adjoindre un chatbot Ă  son moteur de recherche Bing, voilĂ  que Google annonce sa ferme rĂ©solution d’en faire autant. Dans l’article traduit pour vous par framalang, Cory Doctorow met en perspective cette dĂ©cision qui lui semble absurde en rappelant les Ă©checs de Google qui a rarement rĂ©ussi Ă  crĂ©er quoi que ce soit


(*) Merci Ă  Clochix dont nous adoptons dans notre titre la suggestion.

Article original : Google’s chatbot panic

Traduction Framalang : Fabrice, goofy, jums, Henri-Paul, Sysy, wisi_eu,

L’assistant conversationnel de Google en panique

par Cory Doctorow

 

Photo Jonathan Worth CC-BY-SA

 

 

Il n’y a rien d’étonnant Ă  ce que Microsoft dĂ©cide que l’avenir de la recherche en ligne ne soit plus fondĂ© sur les liens dans une page web, mais de lĂ  Ă  la remplacer par des longs paragraphes fleuris Ă©crits dans un chatbot qui se trouve ĂȘtre souvent mensonger
 — et en plus Google est d’accord avec ce concept.

Microsoft n’a rien Ă  perdre. Il a dĂ©pensĂ© des milliards pour Bing, un moteur de recherche que personne n’utilise volontairement. Alors, sait-on jamais, essayer quelque chose d’aussi stupide pourrait marcher. Mais pourquoi Google, qui monopolise plus de 90 % des parts des moteurs de recherche dans le monde, saute-t-il dans le mĂȘme bateau que Microsoft ?

le long d'un mur de brique rouge sur lequel est suspendu un personnage ovoĂŻde au visage trĂšs inquiet (Humpty-Dumpty le gros Ɠuf), deux silhouettes jumelles (Tweedle-dee et Tweedle-dum les personnages de De l'autre cĂŽtĂ© du_miroir de Lewis Carroll) reprĂ©sentent avec leur logo sur le ventre Bing et google, chacun d'eaux a une tĂȘte qui Ă©voque le robot Hal de 2001, Ă  savoir une lueur rouge sur fond noir qui fait penser Ă  un Ɠil.

Il y a un dĂ©licieux fil Ă  dĂ©rouler sur Mastodon, Ă©crit par Dan Hon, qui compare les interfaces de recherche merdiques de Bing et Google Ă  Tweedledee et Tweedledum :

https://mamot.fr/@danhon@dan.mastohon.com/109832788458972865

Devant la maison, Alice tomba sur deux Ă©tranges personnages, tous deux Ă©taient des moteurs de recherche.
— moi, c’est Google-E, se prĂ©senta celui qui Ă©tait entiĂšrement recouvert de publicitĂ©s
— et moi, c’est Bingle-Dum, fit l’autre, le plus petit des deux, et il fit la grimace comme s’il avait moins de visiteurs et moins d’occasions de mener des conversations que l’autre.
— je vous connais, rĂ©pondit Alice, vous allez me soumettre une Ă©nigme ? Peut-ĂȘtre que l’un de vous dit la vĂ©ritĂ© et que l’autre ment ?
— Oh non, fit Bingle-Dum
— Nous mentons tous les deux, ajouta Google-E

Mais voilĂ  le meilleur :

— Cette situation est vraiment intolĂ©rable, si vous mentez tous les deux.

— mais nous mentons de façon trĂšs convaincante, prĂ©cisa Bingle-Dum

— D’accord, merci bien. Dans ce cas, comment puis-je vous faire jamais confiance ni / confiance Ă  l’un ni/ou Ă  l’autre ? Dans ce cas, comment puis-je faire confiance Ă  l’un d’entre vous ?

Google-E et Bingle-Dum se tournĂšrent l’un vers l’autre et haussĂšrent les Ă©paules.

La recherche par chatbot est une trĂšs mauvaise idĂ©e, surtout Ă  un moment oĂč le Web est prompt Ă  se remplir de vastes montagnes de conneries gĂ©nĂ©rĂ©es via l’intelligence artificielle, comme des jacassements statiques de perroquets alĂ©atoires :

La stratégie du chatbot de Google ne devrait pas consister à ajouter plus de délires à Internet, mais plutÎt à essayer de trouver comment exclure (ou, au moins, vérifier) les absurdités des spammeurs et des escrocs du référencement.

Et pourtant, Google est Ă  fond dans les chatbots, son PDG a ordonnĂ© Ă  tout le monde de dĂ©ployer des assistants conversationnels dans chaque recoin de l’univers Google. Pourquoi diable est-ce que l’entreprise court aprĂšs Microsoft pour savoir qui sera le premier Ă  dĂ©cevoir des espĂ©rances dĂ©mesurĂ©es ?

J’ai publiĂ© une thĂ©orie dans The Atlantic, sous le titre « Comment Google a Ă©puisĂ© toutes ses idĂ©es Â», dans lequel j’étudie la thĂ©orie de la compĂ©tition pour expliquer l’insĂ©curitĂ© croissante de Google, un complexe d’anxiĂ©tĂ© qui touche l’entreprise quasiment depuis sa crĂ©ation :

L’idĂ©e de base : il y a 25 ans, les fondateurs de Google ont eu une idĂ©e extraordinaire — un meilleur moyen de faire des recherches. Les marchĂ©s financiers ont inondĂ© l’entreprise en liquiditĂ©s, et elle a engagĂ© les meilleurs, les personnes les plus brillantes et les plus crĂ©atives qu’elle pouvait trouver, mais cela a crĂ©Ă© une culture d’entreprise qui Ă©tait incapable de capitaliser sur leurs idĂ©es.

Tous les produits que Google a crĂ©Ă©s en interne, Ă  part son clone de Hotmail, sont morts. Certains de ces produits Ă©taient bons, certains horribles, mais cela n’avait aucune importance. Google, une entreprise qui promouvait la culture du baby-foot et la fantaisie de l’usine Willy Wonka [NdT: dans Charlie et la chocolaterie, de Roald Dahl], Ă©tait totalement incapable d’innover.

Toutes les rĂ©ussites de Google, hormis son moteur de recherche et gmail, viennent d’une acquisition : mobile, technologie publicitaire, vidĂ©os, infogĂ©rance de serveurs, docs, agenda, cartes, tout ce que vous voulez. L’entreprise souhaite plus que tout ĂȘtre une sociĂ©tĂ© qui « fabrique des choses Â», mais en rĂ©alitĂ© elle « achĂšte des choses Â». Bien sĂ»r, ils sont trĂšs bons pour rendre ces produits opĂ©rationnels et Ă  les faire « passer Ă  l’échelle Â», mais ce sont les enjeux de n’importe quel monopole :

La dissonance cognitive d’un « gĂ©nie crĂ©atif Â» autoproclamĂ©, dont le vĂ©ritable gĂ©nie est de dĂ©penser l’argent des autres pour acheter les produits des autres, et de s’en attribuer le mĂ©rite, pousse les gens Ă  faire des choses vraiment stupides (comme tout utilisateur de Twitter peut en tĂ©moigner).
Google a longtemps montrĂ© cette pathologie. Au milieu des annĂ©es 2000 – aprĂšs que Google a chassĂ© Yahoo en Chine et qu’il a commencĂ© Ă  censurer ses rĂ©sultats de recherche, puis collaborĂ© Ă  la surveillance d’État — nous avions l’habitude de dire que le moyen d’amener Google Ă  faire quelque chose de stupide et d’autodestructeur Ă©tait d’amener Yahoo Ă  le faire en premier lieu.

C’était toute une Ă©poque. Yahoo Ă©tait dĂ©sespĂ©rĂ© et Ă©chouait, devenant un cimetiĂšre d’acquisitions prometteuses qui Ă©taient dĂ©pecĂ©es et qu’on laissait se vider de leur sang, laissĂ©es Ă  l’abandon sur l’Internet public, alors que les princes duellistes de la haute direction de Yahoo se donnaient des coups de poignard dans le dos comme dans un jeu de rĂŽle genre les MĂ©dicis, pour savoir lequel saboterait le mieux l’autre. Aller en Chine fut un acte de dĂ©sespoir aprĂšs l’humiliation pour l’entreprise que fut le moteur de recherche largement supĂ©rieur de Google. Regarder Google copier les manƓuvres idiotes de Yahoo Ă©tait stupĂ©fiant.

C’était dĂ©concertant, Ă  l’époque. Mais Ă  mesure que le temps passait, Google copiait servilement d’autres rivaux et rĂ©vĂ©lait ainsi une certaine pathologie d’insĂ©curitĂ©. L’entreprise Ă©chouait de maniĂšre rĂ©currente Ă  crĂ©er son rĂ©seau « social Â», et comme Facebook prenait toujours plus de parts de marchĂ© dans la publicitĂ©, Google faisait tout pour le concurrencer. L’entreprise fit de l’intĂ©gration de Google Plus un « indictateur1 de performance Â» dans chaque division, et le rĂ©sultat Ă©tait une agrĂ©gation Ă©trange de fonctionnalitĂ©s « sociales Â» dĂ©faillantes dans chaque produit Google — produits sur lesquels des milliards d’utilisateurs se reposaient pour des opĂ©rations sensibles, qui devenaient tout Ă  coup polluĂ©es avec des boutons sociaux qui n’avaient aucun sens.

La dĂ©bĂącle de G+ fut Ă  peine croyable : certaines fonctionnalitĂ©s et leur intĂ©gration Ă©taient excellentes, et donc logiquement utilisĂ©es, mais elles subissaient l’ombrage des incohĂ©rences insistantes de la hiĂ©rarchie de Google pour en faire une entreprise orientĂ©e rĂ©seaux sociaux. Quand G+ est mort, il a totalement implosĂ©, et les parties utiles de G+ sur lesquelles les gens se reposaient ont disparu avec les parties aberrantes.

Pour toutes celles et ceux qui ont vĂ©cu la tragi-comĂ©die de G+, le virage de Google vers Bard, l’interface chatbot pour les rĂ©sultats du moteur de recherche, semble tristement familier. C’est vraiment le moment « Mourir en hĂ©ros ou vivre assez longtemps pour devenir un mĂ©chant Â». Microsoft, le monopole qui n’a pas pu tuer la jeune pousse Google Ă  cause de son expĂ©rience traumatisante des lois antitrust, est passĂ© d’une entreprise qui crĂ©ait et dĂ©veloppait des produits Ă  une entreprise d’acquisitions et d’opĂ©rations, et Google est juste derriĂšre elle.

Pour la seule annĂ©e derniĂšre, Google a virĂ© 12 000 personnes pour satisfaire un « investisseur activiste Â» privĂ©. La mĂȘme annĂ©e, l’entreprise a rachetĂ© 70 milliards de dollars en actions, ce qui lui permet de dĂ©gager suffisamment de capitaux pour payer les salaires de ses 12 000 « Googleurs Â» pendant les 27 prochaines annĂ©es. Google est une sociĂ©tĂ© financiĂšre avec une activitĂ© secondaire dans la publicitĂ© en ligne. C’est une nĂ©cessitĂ© : lorsque votre seul moyen de croissance passe par l’accĂšs aux marchĂ©s financiers pour financer des acquisitions anticoncurrentielles, vous ne pouvez pas vous permettre d’énerver les dieux de l’argent, mĂȘme si vous avez une structure Ă  « double pouvoir Â» qui permet aux fondateurs de l’emporter au vote contre tous les autres actionnaires :

https://abc.xyz/investor/founders-letters/2004-ipo-letter/

ChatGPT et ses clones cochent toutes les cases d’une mode technologique, et sont les dignes hĂ©ritiers de la derniĂšre saison du Web3 et des pics des cryptomonnaies. Une des critiques les plus claires et les plus inspirantes des chatbots vient de l’écrivain de science-fiction Ted Chiang, dont la critique dĂ©jĂ  culte est intitulĂ©e « ChatGPT est un une image JPEG floue du Web Â» :

https://www.newyorker.com/tech/annals-of-technology/chatgpt-is-a-blurry-jpeg-of-the-web

Chiang souligne une diffĂ©rence essentielle entre les rĂ©sultats de ChatGPT et ceux des humains : le premier jet d’un auteur humain est souvent une idĂ©e originale, mal exprimĂ©e, alors que le mieux que ChatGPT puisse espĂ©rer est une idĂ©e non originale, exprimĂ©e avec compĂ©tence. ChatGPT est parfaitement positionnĂ© pour amĂ©liorer la soupe de rĂ©fĂ©rencement que des lĂ©gions de travailleurs mal payĂ©s produisent dans le but de grimper dans les rĂ©sultats de recherche de Google.

En mentionnant l’article de Chiang dans l’épisode du podcast « This Machine Kills Â», Jathan Sadowski perce de maniĂšre experte la bulle de la hype ChatGPT4, qui soutient que la prochaine version du chatbot sera si Ă©tonnante que toute critique de la technologie actuelle en deviendra obsolĂšte.

Sadowski note que les ingĂ©nieurs d’OpenAI font tout leur possible pour s’assurer que la prochaine version ne sera pas entraĂźnĂ©e sur les rĂ©sultats de ChatGPT3. Cela en dit long : si un grand modĂšle de langage peut produire du matĂ©riel aussi bon qu’un texte produit par un humain, alors pourquoi les rĂ©sultats issus de ChatGPT3 ne peuvent-ils pas ĂȘtre utilisĂ©s pour crĂ©er ChatGPT4 ?

Sadowski utilise une expression gĂ©niale pour dĂ©crire le problĂšme :  « une IA des Habsbourg Â». De mĂȘme que la consanguinitĂ© royale a produit une gĂ©nĂ©ration de prĂ©tendus surhommes incapables de se reproduire, l’alimentation d’un nouveau modĂšle par le flux de sortie du modĂšle prĂ©cĂ©dent produira une spirale infernale toujours pire d’absurditĂ©s qui finira par disparaĂźtre dans son propre trou du cul.

 

CrĂ©dit image (modifiĂ©e) : Cryteria, CC BY 3.0

Le Fediverse n’est pas Twitter, mais peut aller plus loin

Par : Framalang
17 février 2023 à 05:12

Maintenant que Mastodon a suscitĂ© l’intĂ©rĂȘt d’un certain nombre de migrants de Twitter, il nous semble important de montrer concrĂštement comment peuvent communiquer entre eux des comptes de Mastodon, PeerTube, Pixelfed et autres
 c’est ce que propose Ross Schulman dans ce billet de l’EFF traduit pour vous par Framalang


 

source : The Breadth of the Fediverse

Traduction Framalang : CLC, Goofy, Henri-Paul

 

L’étendue du Fediverse

par Ross Schulman

Le Washington Post a rĂ©cemment publiĂ© une tribune de Megan McArdle intitulĂ©e : « Twitter pourrait ĂȘtre remplacĂ©, mais pas par Mastodon ou d’autres imitateurs Â». L’article explique que Mastodon tombe dans le piĂšge habituel des projets open source : Ă©laborer une alternative qui a l’air identique et amĂ©liore les choses dont l’utilisateur type n’a rien Ă  faire, tout en manquant des Ă©lĂ©ments qui ont fait le succĂšs de l’original. L’autrice suggĂšre plutĂŽt que dĂ©passer Twitter demandera quelque chose d’entiĂšrement nouveau, et d’offrir aux masses quelque chose qu’elles ne savaient mĂȘme pas qu’elles le dĂ©siraient.

Nous pensons, contrairement Ă  Megan, que Mastodon (qui fait partie intĂ©grante du Fediverse) offre en rĂ©alitĂ© tout cela, car c’est un rĂ©seau social vĂ©ritablement interopĂ©rable et portable. ConsidĂ©rer que Mastodon est un simple clone de Twitter revient Ă  oublier que le Fediverse est capable d’ĂȘtre ou de devenir la plate-forme sociale dont vous rĂȘvez. C’est toute la puissance des protocoles. Le Fediverse dans son ensemble est un site de micro-blogging, qui permet de partager des photos, des vidĂ©os, des listes de livres, des lectures en cours, et bien plus encore.

Comme beaucoup de gens se font, comme Megan, une fausse idĂ©e sur le Fediverse, et comme une image vaut mieux qu’un long discours, voyons comment l’univers plus large d’ActivityPub fonctionne dans la pratique.

Parlons de PeerTube. Il s’agit d’un systĂšme d’hĂ©bergement de vidĂ©os, grĂące auquel les internautes peuvent en suivre d’autres, tĂ©lĂ©charger des vidĂ©os, les commenter et les « liker Â».
Voici par exemple la page de la chaüne principale du projet open source Blender et c’est là que vous pouvez vous abonner à la chaüne


fenĂȘtre dans la page de peertube.tv oĂč l'on peut s'abonner au canal blender en utilisant son compte activityPub, ici un compte de mastodon

Dans cet exemple nous avons crĂ©Ă© un compte Mastodon sur l’instance (le serveur) framapiaf.org. Une fois qu’on clique sur « S’abonner Ă  distance Â», nous allons sur le compte Mastodon, Ă  partir duquel il nous suffit de cliquer sur « Suivre Â» pour nous permettre de
suivre depuis Mastodon le compte du PeerTube de Blender.

fenĂȘtre de mastodon dans laquelle on peut confirmer vouloir suivre un canal peertube (de Blender dans cet exemple) en cliquant sur "Suivre"

Maintenant, dĂšs que Blender met en ligne une nouvelle vidĂ©o avec PeerTube, la mise Ă  jour s’effectue dans le fil de Mastodon, Ă  partir duquel nous pouvons « liker Â» (avec une icĂŽne d’étoile « ajouter aux favoris Â») la vidĂ©o et publier un commentaire.


 de sorte que le « like Â» et la rĂ©ponse apparaissent sans problĂšme sur la page de la vidĂ©o.

un commentaire-réponse posté sur mastodon apparaßt sur le canal peertube

Pixelfed est un autre service basĂ© sur ActivityPub prenant la forme d’un rĂ©seau social de partage de photographies. Voici la page d’accueil de Dan Supernault, le principal dĂ©veloppeur.

On peut le suivre depuis notre compte, comme nous venons de le faire avec la page PeerTube de Blender ci-dessus, mais on peut aussi le retrouver directement depuis notre compte Mastodon si nous connaissons son nom d’utilisateur.

capture : aprĂšs recherche du nom d’utilisateur « dansup Â», mastodon retrouve le compte pixelfed recherchĂ©

Tout comme avec PeerTube, une fois que nous suivons le compte de Dan, ses images apparaĂźtront dans Mastodon, et les « likes Â» et les commentaires apparaĂźtront aussi dans Pixelfed.

capture d'écran montrant une photo du chat de Dansup publiée sur pixelfed mais qui s'affiche ici sur le compte mastodon que l'on "suit".

VoilĂ  seulement quelques exemples de la façon dont des protocoles communs, et ActivityPub en particulier, permettent d’innover en termes de mĂ©dias sociaux, Dans le Fediverse existent aussi BookWyrm, une plateforme sociale pour partager les lectures, FunkWhale, un service de diffusion et partage de musique ainsi que WriteFreely, qui permet de tenir des blogs plus Ă©tendus, pour ne mentionner que ceux-lĂ .

Ce que garantit le Fediverse, c’est que tous ces Ă©lĂ©ments interagissent de la façon dont quelqu’un veut les voir. Si j’aime Mastodon, je peux toujours y voir des images de Pixelfed mĂȘme si elles sont mieux affichĂ©es dans Pixelfed. Mieux encore, mes commentaires s’afficheront dans Pixelfed sous la forme attendue.

Les personnes qui ont migrĂ© de Twitter ont tendance Ă  penser que c’est un remplaçant de Twitter pour des raisons Ă©videntes, et donc elles utilisent Mastodon (ou peut-ĂȘtre micro.blog), mais ce n’est qu’une partie de son potentiel. La question n’est pas celle du remplacement de Twitter, mais de savoir si ce protocole peut se substituer aux autres plateformes dans notre activitĂ© sur la toile. S’il continue sur sa lancĂ©e, le Fediverse pourrait devenir un nouveau nƓud de relations sociales sur la toile, qui engloberait d’autres systĂšmes comme Tumblr ou Medium et autres retardataires.

 

De la friture sur le Fediverse ?

Par : Framalang
13 novembre 2022 Ă  04:06

Nous vous avons proposĂ© dĂ©jĂ  trois articles qui font Ă©cho Ă  l’actualitĂ© rĂ©cente autour de Mastodon en voici un 4e, celui d’Aral Balkan, traduit pour vous par Framalang. Le hĂ©raut du SmallWeb insiste avec humour sur un point en effet crucial : la taille gĂ©ante de certaines instances, due Ă  la conception technique mĂȘme du FĂ©diverse, risque d’ĂȘtre problĂ©matique


Donc, aprĂšs :

Voici Is the fediverse about to get Fryed ?

Traduction Framalang :  Claire, Fabrice, goofy, Henri-Paul, jums

Le FĂ©diverse va-t-il stephenfrire ?

(Ou « Pourquoi chaque pouet est aussi potentiellement une attaque par dĂ©ni de service Â»)

par Aral Balkan

bandeau du compte mastodon de Fry, avec sa tĂȘte (homme ĂągĂ© barbu souriant) en mĂ©daillon. le compte annonce (au moment de sa capture 5 pouets, 0 abonnements 27 000 abonnĂ©s"

Stephen Fry est une cĂ©lĂ©britĂ© outre-Manche  : Ă©crivain, humoriste, acteur et vedette de la TV (sa page WikipĂ©dia)

 

Stephen est un gros poisson dans une petite mare (oui, j’en ai d’autres en rĂ©serve).

Attention : le FĂ©divers est sur le point de frire. Stephen Fry(re) bien sĂ»r.

À la suite du rĂ©cent rachat de Twitter par un milliardaire proto-fasciste immature, des gens ont fui1 vers le FĂ©diverse2. Parmi eux, certains avaient, au moins sur Twitter, des millions de followers, comme Greta Thunberg et, plus rĂ©cemment, Stephen Fry3

— Eh bien, c’est sĂ»rement une bonne chose, non ? Tout le monde va parler du FĂ©diverse, de la dĂ©centralisation, et peut-ĂȘtre mĂȘme de ce Small Web dont tu parles tout le temps, Aral, non ?

Eh bien, oui et non
 Trop de bonnes choses tue les bonnes choses. Et, dans le FĂ©diverse actuel, les bonnes choses seraient les « comptes populaires Â». En fait, cela pourrait bien ĂȘtre fatal (pour les instances Mastodon). Je vais essayer de dĂ©tailler dans cet article ce que je veux dire en prenant mon propre compte comme exemple.

Comment tuer un Mastodon(te)

(indice : en Ă©tant bavard quand vous ĂȘtes populaire)

Inutile de le préciser, je ne suis pas une célébrité.
Et pourtant, dans le FĂ©diverse, je me retrouve dans une situation un peu unique dans laquelle :

1. J’ai ma propre instance Mastodon, juste pour moi4.
2. Je suis suivi par pas mal de personnes. Plus de 22 000, pour ĂȘtre prĂ©cis5.
3. Je suis beaucoup de personnes, et j’aime vraiment avoir des conversations avec elles (je pense que c’est ce que les jeunes branchĂ©s appellent « l’engagement Â»).

Malheureusement, la combinaison de ces trois facteurs a crĂ©Ă© la tempĂȘte parfaite6, ce qui veut dire que dĂ©sormais, chaque fois que je poste quelque chose qui suscite beaucoup d’engagement, je finis par conduire une attaque par dĂ©ni de service contre moi-mĂȘme.

Mastodon : dĂ©ni de service en tant que service ?

Hier, c’était mon anniversaire.
Et, bien sĂ»r, j’ai postĂ© sur ce sujet depuis mon instance Mastodon.

tĂȘte d'Aral qui fait l'andouille sur un pouet de mastodon et demande en anglais : "qui a deux pouces et 46 ans aujourd'hui ?"

J’ai eu pas mal de rĂ©ponses. Et, pour ĂȘtre poli, j’ai commencĂ© Ă  rĂ©pondre Ă  tout le monde avec des messages de remerciements. Oh non, mon pauvre naĂŻf ! Qu’est-ce que tu n’avais pas fait ?

Je vais laisser mon ami Hugo Gameiro, qui gĂšre masto.host et hĂ©berge mon instance, expliquer ce qui s’est passĂ© ensuite7 :

Vous avez beaucoup d’engagement et cela sollicite beaucoup Sidekiq8.

Prenez, par exemple, votre message d’anniversaire. En plus de demander Ă  des milliers de serveurs de traiter votre demande de rĂ©alisation (on appelle ça des « jobs Â») pour propager votre message (pour 23 000 abonnĂ©s, disons 3 000 serveurs), votre serveur au moment de la crĂ©ation de votre message va crĂ©er 3 000 jobs Sidekiq. Et comme votre Sidekiq n’a que 12 threads, traiter 3 000 jobs va prendre du temps puisqu’il ne peut en traiter que 12 Ă  la fois.
Ensuite, pour chaque réponse à ce message, 3 000 jobs sont à nouveau créés, afin que vos abonnés puissent voir votre réponse sans avoir à changer de serveur ou aller sur votre profil. Et puis, si vous répondez à votre réponse, 3 000 jobs supplémentaires sont créés, etc.
Si vous rĂ©pondez aux 100 rĂ©ponses que vous avez reçues en 10 minutes (en supposant que l’estimation de mon nombre de serveurs est correcte), vous crĂ©ez 300 000 jobs Sidekiq. C’est pour cela que ça bouchonne.

Mais qu’est-ce que tout cela veut bien dire, si on omet le jargon technique ?
Eh bien, que je parlais trop en Ă©tant trop connu de tous.

tableau de bord de sidekiq avec plusieurs graphiques et des chiffres qui montrent un pic de fréquentation que le logiciel a du mal à traiter
VoilĂ  Ă  quoi ressemble un embouteillage sur Mastodon.

Alors, quelle est la solution ?
Eh bien, il n’y a qu’une chose Ă  faire quand vous vous retrouvez dans ce pĂ©trin : agrandir votre instance Mastodon9. Le problĂšme ? Ça commence Ă  coĂ»ter cher.
Avant la derniĂšre migration de Twitter10, je payais environ 280 €/an (un peu plus de 20 €/mois) pour mon instance Mastodon grĂące Ă  un partenariat que j’avais avec Hugo depuis le dĂ©but. Cette semaine, je l’ai agrandie avec un plan Ă  50 €/mois. Et ce n’est toujours pas assez, comme le montre mon message d’anniversaire, donc Hugo a gentiment suggĂ©rĂ© de me proposer un plan sur mesure.
Le problĂšme n’est pas rĂ©solu pour autant, il est juste repoussĂ© (sauf si cet article Ă©nerve tout le monde, bien sĂ»r).
Heureusement, comme j’ai ma propre instance, la seule personne pĂ©nalisĂ©e par cette dĂ©pense supplĂ©mentaire, c’est moi. Mais que se serait-il passĂ© si j’étais sur une instance publique gĂ©rĂ©e par quelqu’un d’autre ?

Tu dĂ©connes, Elon ?

tweet iroique d'Aral en anglais ; Silicon Vallée : on va rendre les gens dépendants en leur filan des sucreries gratuites pour qu'ils ne se rendent pas compte qu'on les trait comme des vaches à lait / Elon Musk : faisons-les payer 8 dollars par moi pour les sucreries

Si Elon Musk voulait dĂ©truire mastodon.social, l’instance phare de Mastodon, il lui suffirait de s’y inscrire11.
Heureusement, Elon n’est pas assez intelligent pour ça.

Je plaisante, bien sĂ»r
 Eugen bannirait trĂšs probablement son compte dĂšs qu’il le verrait. Mais ça illustre un problĂšme : Elon est facile Ă  bannir. Stephen Fry l’est beaucoup moins. C’est un vĂ©ritable trĂ©sor national pour nous tous. On ne le bannit pas comme ça.
Et pourtant, Stephen peut lui aussi (bien qu’involontairement) coĂ»ter trĂšs cher aux gens qui gĂšrent des instances Mastodon, simplement en rejoignant l’une d’elles12..
La solution, pour Stephen tout du moins, est simple : il devrait gĂ©rer sa propre instance personnelle.
Ou demander à quelqu’un de le faire à sa place, comme je le fais13.
GĂ©rer sa propre instance apporterait aussi Ă  Stephen un autre bĂ©nĂ©fice : il serait automatiquement vĂ©rifiĂ©. AprĂšs tout, si vous parlez Ă , mettons, @stephen@social.stephenfry.com, vous pouvez ĂȘtre certain que c’est bien lui parce que vous savez qu’il gĂšre son propre domaine.

Des instances personnelles Ă  la rescousse

Mon discours au Parlement européen sur les problÚmes avec la Big Tech et les approches différentes que proposent Mastodon, le Fédiverse, et le Small Web.

— Attends, je suis largué  Tu ne viens pas de dire que les instances personnelles Ă©taient une partie du problĂšme ?
— Oui et non : elles le sont et elles ne devraient pas l’ĂȘtre.

Si ActivityPub (le protocole) et Mastodon (un serveur qui adhĂšre Ă  ce protocole) avaient Ă©tĂ© conçus pour promouvoir la dĂ©centralisation, alors avoir plus d’instances sur le rĂ©seau ne serait pas un problĂšme. En fait, ça serait mĂȘme le signe d’un rĂ©seau dĂ©centralisĂ© sain.
Cependant, ActivityPub et Mastodon ont Ă©tĂ© conçus de la mĂȘme maniĂšre que la Big Tech / Big Web : pour encourager des services qui hĂ©bergent le plus d’utilisateurs14 possible.
Cette architecture est Ă  la fois complexe (ce qui la rend difficile et coĂ»teuse Ă  hĂ©berger) et trĂšs efficace pour la Big Tech (oĂč les choses sont centralisĂ©es et passent Ă  l’échelle verticalement, et oĂč le but est d’avoir / de contrĂŽler / d’exploiter autant d’utilisateurs que possible).
Dans la Big Tech, le coĂ»t initial pour passer Ă  l’échelle est subventionnĂ© par de nombreuses sociĂ©tĂ©s de capital-risque (des personnes riches investissant dans de nouveaux business d’extraction et d’exploitation – ce que la Silicon Valley appelle des startups – dans le but de devenir encore plus riches), et ça mĂšne Ă  ces silos gĂ©ants15 que sont aujourd’hui les Google, Facebook et Twitter.
Toutefois, Ă  la diffĂ©rence de la Big Tech, le but avouĂ© du FĂ©diverse est de dĂ©centraliser les choses, pas de les centraliser. Du coup, comment pourrions-nous atteindre l’opposĂ© des buts de la Big Tech en adoptant leurs architectures de base ?
Lorsque vous adoptez le design de quelque chose, vous héritez aussi des critÚres de réussite qui ont mené à ce design. Si ces critÚres de réussite ne correspondent pas à vos objectifs, vous avez un sacré problÚme.
Pour le dire plus simplement :
N’adoptez pas les critĂšres de rĂ©ussite de la Big Tech, sinon vous deviendrez la Big Tech.

Ce n’est pas la taille qui compte

Aujourd’hui, il y a une Ă©quivalence entre la taille de mastodon.social (l’instance gĂ©rĂ©e par Eugen) et le succĂšs de Mastodon (le logiciel crĂ©Ă© par Eugen). C’est trĂšs dangereux. Plus mastodon.social grossit, plus il va ressembler Ă  Twitter.
Je peux presque vous entendre crier : « Mais Aral, c’est fĂ©dĂ©rĂ© ! Au moins, il n’y a pas de verrous sur mastodon.social ! Â».
Et c’est vrai.
Vous savez ce qui est Ă©galement fĂ©dĂ©rĂ© ? L’e-mail.
Avez-vous dĂ©jĂ  entendu parler de cette petite et vieille instance appelĂ©e Gmail ? (Ou peut-ĂȘtre les termes « adopte, Ă©tend, Ă©touffe Â» ?)
Savez-vous ce qui arrive Ă  votre e-mail si Google dĂ©clare (Ă  tort ou Ă  raison) que vous ĂȘtes un spam ? Personne ne voit votre e-mail.
Vous savez ce qui se passe si mastodon.social bloque votre instance ? Des centaines de milliers de gens (bientĂŽt des millions ?) ne pourront plus dĂ©cider d’afficher ou non vos messages.
Que se passe-t-il quand votre instance bloque mastodon.social ? Absolument rien.
C’est un rĂ©el dĂ©sĂ©quilibre des puissances.

La dĂ©centralisation commence par soi-mĂȘme

Mastodon est non-lucratif, et je n’ai pas de raison de croire qu’Eugen n’ait pas les meilleures intentions du monde. Et pourtant, la dĂ©centralisation commence par se dĂ©centraliser soi-mĂȘme.
C’est dans l’intĂ©rĂȘt du FĂ©diverse que mastodon.social donne le bon exemple en limitant sa taille volontairement.
En fait, ça devrait mĂȘme ĂȘtre intĂ©grĂ© au logiciel. Les instances Mastodon devraient ĂȘtre empĂȘchĂ©es de croĂźtre au-delĂ  d’une certaine taille. Les instances qui sont dĂ©jĂ  trop grosses devraient avoir des moyens d’encourager les gens Ă  migrer vers des plus petites.
En tant que communautĂ©, nous devrions aborder les grandes instances comme des tumeurs : comment pouvons-nous les dĂ©truire pour qu’elles ne soient plus un danger pour l’organisme ?
En poussant ce raisonnement, on arrive au concept du Small Web, un internet oĂč nous possĂ©dons et maĂźtrisons notre propre lieu (ou nos propres lieux).

Cliquez sur l’image pour voir une vidĂ©o (sur aperi.tube, une instance PeerTube) : Aral expliquant ce qu’est pour lui le Small Web


Small is beautiful ! (Petit c’est mieux) (octobre 2022) : Qu’est-ce que le Small Web et pourquoi en avons-nous besoin ?

 

Cui-cui ?

Je ne dis pas que les protocoles et applications actuels du FĂ©diverse peuvent, vont, ou mĂȘme devraient Ă©voluer vers le Small Web16. Pour l’instant, le FĂ©diverse est un palliatif inestimable qui fournit un lieu plus sĂ»r que les fosses septiques centralisĂ©es de la Silicon Valley.

Le temps que durera le palliatif dĂ©pendra de notre capacitĂ© Ă  rĂ©sister Ă  la centralisation. Les designs des serveurs et des protocoles qui incitent au passage Ă  l’échelle vertical ne rendront pas forcĂ©ment cette tĂąche plus facile. Et pourtant, il y a des moyens de pression sociaux que nous pouvons utiliser pour contrer leurs effets.

La derniĂšre chose qu’on souhaite, c’est qu’une poignĂ©e de Zuckerbergs au petit pied gouvernent le FĂ©diverse. Ou pire encore, que vous deveniez vous-mĂȘme un de ces mini-Zuckerbergs.

J’aime le fait que le FĂ©diverse existe. Et j’ai le plus grand respect pour les efforts gargantuesques qui lui sont dĂ©diĂ©s. Mais je suis aussi trĂšs prĂ©occupĂ© par les dĂ©cisions prises en termes d’architecture qui incitent Ă  la centralisation, et non Ă  la dĂ©centralisation. Je nous implore de reconnaĂźtre cela, pour limiter les risques du mieux que nous le pouvons, pour nous efforcer d’apprendre de nos erreurs, et pour faire encore mieux demain.
Gens d’ActivityPub et de Mastodon :
Considérez-moi comme votre canari dans une mine de charbon

« Cui-cui ! Cui-cui ! Cui-cui ! Â»

 

*Si vous souhaitez soutenir la Small Technology Foundation, qui est sans but lucratif : https://small-tech.org/fund-us

❌
❌