• [^] # Re: Inutile

    Posté par . En réponse à la dépêche Nouvelles sur l’IA de février 2026. Évalué à 2. Dernière modification le 05 mars 2026 à 16:58.

    Je remets juste en cause le discours de arnaudus qui semble dire que ces questions sont tranchése, que les améliorations des benchmarks ne font que renforcer une seule hypothèse comme si les autres hypothèses n'avaient aucun sens et était une forme de dénie. je rappelle juste qu'il y a encore beaucoup de flous et d'hypothèses sur la table et que la question ne semble pas tranchée et qu'il faudra probablement du temps pour évaluer tout ça et améliorer les protocoles d'évaluation car la question est finalement très récente. D'autant plus que savoir mesurer exactement d'où viennent ces gains et ce que ça implique c'est important et ça a des implications fortes. Le sujet reste réellement complexe.

    Retournons à l’image du COVID.

    En février 2020, il y a toujours des débats de savoir si le COVID est transmis par l’air ou pas. Point de vue simpliste : les gens qui ont le COVID toussent. Le COVID semble une maladie respiratoire. Mettez vos masques. Point de vue complexe : c’est pas parce que les voies respiratoires sont irritées que le patient rejette des particules virales. Plus de recherche est nécessaire.

    À un instant donné, il faut prendre des décisions et se faire une opinion en fonction des données qu’on a, pas des données qu’on aimerait avoir (sauf si tu peux avoir ces données que tu veux facilement et rapidement, évidemment) :

    "Faut-il que je m’achète un masque ?" / "Est-ce qu’il faut commencer à s’inquiéter de ces gens qui disent ouvertement vouloir construire une superintelligence, ou est-ce des paroles en l’air d’escrocs en mal d’argent d’investisseurs ?"

    Sur l’IA, les données qu’on a, c’est essentiellement METR. Les données sont elles parfaites et permettent-elles de répondre à toutes nos interrogations ? non. À la question « ces développement sont-ils inquiétants », ces données vont elles clairement dans un sens ? Oh que oui.

    Je ne pense pas qu’arnaudus dise que toutes les questions sont littéralement tranchées. Je pense qu’arnaudus dit qu’on a assez de données pour avoir une opinion nécessairement provisoire et imparfaite mais tout de même assez informée pour décider d’acheter un masque.

    Je remets juste en cause le discours de arnaudus qui semble dire que ces questions sont tranchése, que les améliorations des benchmarks ne font que renforcer une seule hypothèse comme si les autres hypothèses n'avaient aucun sens et était une forme de dénie

    Je crois que vous n’avez pas la même idée en tête de « ces autres hypothèses ».

    Je pense (je peux me tromper) que dans ta tête ces autres hypothèses sont du genre « il est trop tôt pour décider à quel point les performances généralisent aux domaines sur lesquels l’IA n’est pas entraînée ». C’est possiblement raisonnable. J’aimerai qu’on me montre les évaluations où l’IA ne progresse pas, ceci dit. Il y a des évaluations ésotériques tierces qui testent clairement les modèles dans des domaines où ils ne sont pas entraînés (par exemple « Claude plays Pokemon »). Je n’en connais pas un seul qui ne montre un certain progrès.

    Les "hypothèses" qu’arnaudus a en tête (encore une fois, pas télépathe, je peux me tromper) : « les progrès de l’IA sont un mensonge marketing pour faire vendre ChatGPT ». Et oui : à ce niveau, je le rejoint, on peut clairement appeler ça du déni, pas besoin d’invoquer des subtilités sur les complexités du sujet.

    Je suis convaincu que la démarche de l'UE d'essayer de réguler est la bonne

    Ça va me faire une belle jambe de savoir que mon usage de ChatGPT est régulé en Europe si OpenAI est en train de créer une superintelligence aux US.

    La démarche de l’UE devrait être de faire pression sur les US pour que eux régulent.

    Malheureusement, avec Trump, c’est un poil compliqué.