Y’a @ilusenn qui se posait des questions sur l’éthique de Mistral AI

Première question à se poser face à une question : questionner la question ! 

C’est ici : https://corneill.es/@ilusenn/115480242918200951

Dans le thread il est précisé que la recherche de l’éthique est plutôt vue du côté des données d’entraînement …

TL;DR y’a une solution «geeke» universitaire : https://eurollm.io/

C’est le modèle le moins sombre que je connaisse.

Et pour le reste … on va plonger dans un océan d’horreurs

#ia #ai

Alors je vais m’aventurer sur des domaines où mon expertise est pas énorme.

Je n’ai jamais entraîné moi-même de modèle et j’ai uniquement vu des collègues faire du fine-tuning.

Mais baignant dans le domaine, j’vais p’tet apporter des précisions que j’estime connues de toustes alors qu’en fait, non 🙃

Va savoir 🤷

#ia #ai

  1. Droit d’auteur

Bon, pour entraîner un modèle qui sache parler et dise parfois des choses qui ont du sens, faut des corpus de textes qui outepassent de loin le seul domaine public, même augmenté des CC-0

En fait, il est communément admis que tout Internet y suffit à peine actuellement. Oupsy…

Il y aura forcément pillage de la création des autres et non-respect du droit d’auteur.

#ia #ai

  1. Environnement

« qu’est-ce qui fait 107db de volume sonore, qui dégage une fumée âcre et cancérigène, qui consomme 270 litres d’essence par heure et coupe une pomme en 4 ? 

Une machine soviétique prévue pour couper les pommes en 3 »

Les algos actuels d’entraînement des modèles sont terriblement consommateurs d’électricité (et in fine d’eau). Et les utiliser n’est pas gratuit non-plus, même si ça s’améliore un peu.

#ia #ai

2bis. Environnement

Attention, c’est un problème collectif, pas individuel hein.

Le modèle entraîné, disponible à l’usage, y renoncer doit être un choix individuel, pas une obligation individuelle.

Comme renoncer à l’avion, à la voiture etc.

Comme tant d’autres sujets, c’est un problème collectif à résoudre collectivement.

Le syndrome du pipi sous la douche, toussa

#ia #ai 4bis/n

  1. les alternatives

C’est très personnel comme vision, mais je vais classer les LLM en groupes

GroupeA: les fascistes (aka trumpistes) ChatGPT (OpenAI dites le !), Ollama (facebook), grok

GroupeB: les capitalistes alias tous les autres Claude (Anthropic), Mistral, Deepseek, Qwen, Aleph Alpha, Composer1 (de cursor, un nouveau)

Et toi, t’es plutôt peste bubonique ou choléra ? 

Je dois creuser le sujet de https://eurollm.io/ depuis quelques temps : est-ce clean ? 🤔

#ia #ai

  1. Que faire ?

A. Y aller à fond : c’est un grand NON B. Adopter selon tes usages: soit attentiv·fe, soit conscient·e des problèmes C. Tester, essayer, utiliser si on en a besoin (genre déficience visuelle): ça semble le plus sage D. Ignorer totalement, refuser: ok mais n’oublie pas que c’est un choix individuel

Comme on peut prendre l’avion et être contre l’avion

Comme on peut être cycliste et posséder une voiture

La pureté militante, toussa toussa

#ia #ai

4bis. Que faire ? 

J’ai un thread qui arrive à ce sujet. Le post précédent est ’achement court et facile à critiquer.

Mais pour ce soir, je creuse pas plus et je finis ici ; j’ai Mei à coucher 😊

#ia #ai 6bis/6

  1. Et le logiciel libre ?

Ça semble mal engagé, y’a même la réflexion de savoir si c’est juste possible

Je sais que côté Gnu et de @aprilorg ça prépare des choses intéressantes

En attendant y’a ça à se mettre sous la dent et c’est déjà pas mal

https://www.gnu.org/philosophy/po/words-to-avoid.fr-en.html#ArtificialIntelligence

https://www.gnu.org/savannah-checkouts/non-gnu/metacosm/en/RFC/html/Vocabulary-RFC/g54.html#AI

En ce moment je creuse https://www.jan.ai/ et j’aime bien, pour faire des logiciels IA grand-public "bordés" (on peut faire des systèmes plus dédiés mais c’est un autre sujet)

#ia #ai