Qu’est-ce qui différencie ChatGPT des autres modèles linguistiques précédents ?
La décision d’OpenAI de mettre ChatGPT gratuitement à la disposition du public était audacieuse, compte tenu des coûts importants associés à la maintenance du système tout en traitant des millions de questions d’utilisateurs curieux – des coûts que le P.-D. G. d’OpenAI, Sam Altman, a lui-même qualifiés d’« exorbitants ». Cependant, cette décision s’est avérée non seulement hardie, mais aussi ingénieuse. En rendant ChatGPT accessible à tous, OpenAI a déclenché une étincelle de curiosité et d’intérêt qui a attiré l’attention du monde entier.
En réalité, ChatGPT n’a pas été le premier modèle à être mis à la disposition du public gratuitement. Galactica, de Meta, a tenté le même exploit, a subi un échec cuisant et a été abandonné au bout de quelques jours seulement. Alors, comment ChatGPT a-t-il réussi, alors que Galactica n’a pas abouti ? La réponse est principalement liée à la manière dont il a été annoncé et à qui. Galactica a été présenté à la communauté universitaire comme une IA capable de rédiger sans effort des articles scientifiques – un domaine où le public est exigeant et critique, et qu’il est aisé de décevoir. D’un autre côté, ChatGPT – et ses limites – a été présenté publiquement comme un outil ouvert et accessible à tous, que chacun peut expérimenter et apprécier. Cette approche, combinée aux performances de ChatGPT, l’a distingué des modèles précédents et a changé la donne dans le monde de l’IA.
La décision de mettre ChatGPT à la disposition du grand public n’a pas été sans contraintes. Contrairement aux modèles à source ouverte, ChatGPT n’est disponible que de manière limitée, les chercheurs intéressés ne pouvant pas regarder « sous le capot » du modèle ou l’adapter à leurs besoins spécifiques. Il s’agit d’une approche différente de celle adoptée par OpenAI avec son exceptionnel modèle Whisper, dont la transparence était remarquable. D’un point de vue commercial, la décision d’OpenAI d’offrir ChatGPT au public, malgré les coûts élevés qu’elle implique, s’est avérée être la meilleure, car elle a attiré l’attention et des fonds.
Comment les autres entreprises ont-elles réagi ?
ChatGPT a suscité une attention et une concurrence sans précédent dans le monde de l’IA. L’intérêt considérable du public à son égard a incité les principaux acteurs du secteur à réagir rapidement. Ce type de compétition est sans aucun doute passionnant, mais il peut aussi entraîner des pertes. Néanmoins, les stratégies employées sont assez curieuses.
Microsoft n’a pas hésité à consacrer 10 milliards de dollars à l’intégration de ChatGPT dans tous ses produits phares, y compris Skype, Teams et Word. Elle l’a fait rapidement et ouvertement en réponse à l’intérêt et à la popularité considérables de ChatGPT auprès du public, créant ainsi un exemple à suivre.
Google a annoncé à la hâte qu’il intégrerait le modèle de Bard dans Google Search, mais a
échoué dans sa première étape lorsque Bard a commis une erreur de fait dans sa démo de lancement. La stratégie de Google s’est traduite par d’importantes pertes initiales pour l’entreprise, une chute de 10 % du cours de l’action ayant effacé 170 milliards de dollars de la valeur marchande de Google.
Malgré le revers causé par la publication et la mise en libre accès du modèle Galactica, Meta persiste dans son intention de mettre en libre accès ses modèles d’IA de pointe. Avec l’ouverture récente de son plus grand modèle de langage, appelé « modèle LLaMa », Meta semble tenter de réduire la dépendance des utilisateurs à l’égard de l’API OpenAI GPT en donnant accès à de nouveaux modèles. LLaMa n’est pas le premier modèle à grande échelle à être ouvert – BLOOM et OPT sont disponibles depuis un certain temps –, mais leur application a été limitée en raison de leurs exigences matérielles élevées. LLaMa est environ dix fois plus petit que ces modèles et peut fonctionner sur un seul processeur graphique, ce qui pourrait permettre à un plus grand nombre de chercheurs d’accéder à des modèles linguistiques de grande taille et de les étudier. Dans le même temps, LLaMa obtient des résultats similaires à ceux de GPT-3.
Les géants chinois de la technologie n’ont pas perdu de temps : Baidu prévoit d’intégrer son chatbot Ernie (abréviation de Enhanced Representation through kNowledge IntEgration) dans son moteur de recherche en mars et, à terme, dans toutes ses activités.
En Chine, ChatGPT n’est pas officiellement disponible, mais les utilisateurs ont pu y accéder grâce à des solutions de contournement. Toutefois, les autorités de régulation ont demandé aux principales entreprises technologiques chinoises de ne pas intégrer ChatGPT dans leurs services, car le logiciel « pourrait aider le gouvernement américain à diffuser de la désinformation et à manipuler les informations mondiales pour servir ses propres intérêts géopolitiques ». Les entreprises technologiques chinoises devront également rendre compte aux régulateurs avant de déployer leurs propres services de type ChatGPT.
L’impact de l’IA générative sur notre avenir
Les développements de février dans le domaine de l’IA générative ont une fois de plus soulevé la question suivante : l’IA va-t-elle prendre le contrôle de nos emplois ? C’est pourquoi les craintes qu’une nouvelle technologie rende le travail humain superflu sont omniprésentes à chaque fois que l’on parle d’une nouvelle technologie.
Nos collègues du Diplo’s AI Lab, qui ont également utilisé des modèles de langage pour développer des outils d’IA très performants (nous sommes partiaux ici), pensent que l’IA ne rendra pas la plupart des emplois superflus. Certains emplois ont une nature intrinsèquement interhumaine, et l’IA aura du mal à les remplacer.
Cependant, l’IA rendra certains emplois superflus, comme cela a été le cas pour toutes les nouvelles technologies. La bonne nouvelle est que les outils d’IA permettront aux travailleurs de gagner du temps en supprimant les tâches courantes de leur liste. Et, si certains emplois disparaîtront, de nouveaux apparaîtront, comme l’ont déjà dit le P.-D. G. de Microsoft, Satya Nadella, et le fondateur de Microsoft, Bill Gates. La question est la suivante : comment faire en sorte que les générations actuelles et futures soient préparées à faire face aux changements actuels et à venir sur le marché du travail ?
Vous souhaitez nous faire part de vos réflexions sur l’IA générative ? Écrivez-nous à [email protected] !
Baromètre
Les développements de la politique numérique qui ont fait la une
Le paysage de la politique numérique évolue quotidiennement. Voici donc les principaux éléments du mois de février. Nous les avons décodés en petites mises à jour qui font autorité. Vous trouverez plus de détails dans chaque mise à jour sur le Digital Watch observatory.
Les ministres de l’UE examinent une version modifiée du projet de loi sur la cyberrésilience (CRA), un règlement sur les exigences en matière de cybersécurité pour les produits numériques.
La Commission européenne a lancé une consultation publique sur l’avenir de la connectivité, considérée comme un prélude à des projets qui pourraient obliger les grandes entreprises technologiques à payer leur part des coûts liés à l’infrastructure numérique. Elle a également publié une proposition de loi sur l’infrastructure Gigabit.
PayPal a suspendu le lancement de son système de monnaie stable en raison d’une surveillance réglementaire accrue. La Commission australienne de la concurrence et de la consommation (ACCC) va examiner les produits et services interconnectés offerts par les plateformes numériques pour savoir s’ils nuisent à la concurrence et aux consommateurs.
Les signataires du code de pratique 2022 sur la désinformation, qui comprend toutes les grandes plateformes en ligne, ont mis en place un centre de transparence qui garantit la transparence de leurs efforts de lutte contre la désinformation, et ont publié des rapports sur la mise en œuvre des engagements pris dans le cadre du code.
La Chine a annoncé la création d’un bureau national des données, qui établira un système de données pour le pays et coordonnera l’utilisation des ressources en données.
La Cour constitutionnelle fédérale allemande a jugé contraire à la Constitution l’utilisation par la police de l’analyse automatisée des données pour prévenir la criminalité.
Les représentants de 59 pays ont lancé un appel commun à l’action sur le développement, le déploiement et l’utilisation responsables de l’IA dans le domaine militaire.
Le Comité sur l’IA du Conseil de l’Europe a poursuivi les discussions sur une convention sur l’IA et les droits de l’homme, et a publié un projet de texte. Les Pays-Bas restreindront l’exportation des technologies les plus avancées en matière de semi-conducteurs, y compris les systèmes de lithographie dans l’ultraviolet profond (DUV).
Comment les algorithmes mettent-ils l’article 230 à l’épreuve ?
Il a longtemps été avancé que la loi américaine qui protège les plateformes de médias sociaux de toute responsabilité concernant le contenu publié par les utilisateurs sur ces plateformes – l’article 230 de la loi sur la décence des communications (Communications Decency Act) – devrait être restreinte ou carrément supprimée.
L’article 230, qui a fait l’objet de tant de débats, est une règle astucieuse de deux phrases qui stipule que : (a) les plateformes ne sont pas des éditeurs (elles ne sont donc pas responsables du contenu publié par les utilisateurs, contrairement aux éditeurs) ; (b) dans les cas où les plateformes assurent elles-mêmes le contrôle du contenu de tiers, elles ne peuvent pas être sanctionnées pour d’autres contenus préjudiciables qu’elles ne retirent pas.
Il faut reconnaître que cette règle a permis à Internet de prospérer. Les plateformes ont pu héberger une grande quantité de contenus d’utilisateurs, sans crainte de responsabilité. Elles ont également permis la publication instantanée de contenus, sans que les plateformes soient tenues de les examiner avant de les rendre publics. La liberté d’expression a prospéré.
Mais aujourd’hui, l’ère des algorithmes met l’article 230 à l’épreuve. Il y a quelques semaines, la Cour suprême des États-Unis a commencé à examiner des arguments dans deux affaires, toutes deux jugées initialement par le neuvième district, qui pourraient avoir des répercussions sur l’article 230.
Gonzales vs Google
Dans un procès contre Google, la famille d’une Américaine tuée lors d’une attaque à Paris par des militants islamistes a fait valoir que l’algorithme de Google recommandait aux utilisateurs de YouTube des contenus provenant du groupe militant. La famille fait appel du premier jugement en faisant valoir que l’article 230 ne confère pas d’immunité aux plateformes en ce qui concerne les contenus recommandés par les algorithmes, étant donné que les suggestions faites par les algorithmes ne sont pas des contenus de tiers, mais les propres contenus de l’entreprise. L’argument de Google, en revanche, est que l’article 230 ne vise pas seulement à protéger les entreprises contre les contenus de tiers, mais va jusqu’à stipuler que les plateformes ne devraient pas être considérées comme des éditeurs.
De nombreuses entreprises et organisations ont déposé des recours en justice pour soutenir Google. Twitter, par exemple, fait valoir que les algorithmes permettent de donner la priorité à certains contenus par rapport à d’autres (« les contenus les plus récents par rapport aux plus anciens »), mais qu’ils ne véhiculent aucun contenu propre. Microsoft soutient que les algorithmes sont tellement essentiels à la vie quotidienne que l’article 230 ne devrait pas être restreint ou réinterprété, car cela « causerait des ravages sur l’Internet tel que nous le connaissons ».
Twitter vs Taamneh
La seconde affaire est un appel intenté par Twitter après que le neuvième circuit a écarté l’article 230 et autorisé la poursuite de l’affaire. Il a ensuite été statué que Twitter et d’autres plateformes n’avaient pas pris les mesures adéquates pour empêcher l’apparition de contenus terroristes sur la plateforme. La famille d’un Jordanien a accusé Twitter de ne pas avoir surveillé la plateforme après un attentat en 2017 qui a entraîné la mort de l’homme et de 38 autres victimes.
Cette affaire est axée sur la loi antiterroriste, mais, comme l’appel pourrait infirmer le jugement de la juridiction inférieure (qui comprenait une décision sur l’article 230), l’appel pourrait également avoir des répercussions sur l’article 230.
Quels sont les enjeux ?
Bien que les deux affaires soient liées, c’est l’affaire Gonzales qui devrait aborder la question des algorithmes : les plateformes peuvent-elles être tenues responsables du contenu promu par leurs algorithmes ?
Les deux actions en justice, qui seront tranchées d’ici la fin du mois de juin, peuvent avoir plusieurs issues. La plus radicale serait que le tribunal supprime les protections accordées aux plateformes en vertu de l’article 230. Mais, compte tenu de l’enjeu, cette solution est peu probable.
Il serait plus réaliste que la Cour suprême maintienne l’interprétation actuelle de l’article 230 ou, tout au plus, qu’elle introduise une restriction subtile. Il appartiendra alors au pouvoir législatif de répondre au mécontentement exprimé par les décideurs politiques ces dernières années.
Mise à jour des politiques de la Genève internationale
De nombreuses discussions politiques ont lieu chaque mois à Genève. Voici ce qui s’est passé en février.
La troisième session du groupe de travail à composition non limitée (GTCNL) sur la réduction des menaces spatiales s’est tenue à l’Office des Nations unies à Genève. Le GTCNL est chargé, entre autres, de formuler des recommandations sur les normes, les règles et les principes de comportement responsable possibles en ce qui concerne les menaces que les États font peser sur les systèmes spatiaux. Il a été créé par la résolution 76/23 de l’Assemblée générale des Nations unies et s’est déjà réuni deux fois : (a) du 9 au 13 mars 2022, (b) puis les 12 et 13 septembre 2023. Le GTCNL devrait se réunir à nouveau du 7 au 11 août 2023 et soumettre un rapport final à la 78e Assemblée générale des Nations unies en septembre 2023.
L’Union internationale des télécommunications (UIT) a organisé une série de webinaires sur la lutte contre la contrefaçon et les appareils TIC volés. Dans le premier épisode, des intervenants de différents groupes de parties prenantes ont présenté les problèmes et les défis liés à la circulation des dispositifs TIC contrefaits. Une attention particulière a été accordée aux solutions possibles par le biais de la normalisation.
Explorez la Genève numérique !
Besoin d’un guide sur la gouvernance de l’Internet à Genève ? Notre Geneva Digital Atlas, dans lequel vous trouverez les coordonnées des 46 acteurs les plus importants de la politique numérique, vous accompagnera tout au long de votre voyage. Gardez un œil sur nos Instagram, Twitter, YouTube, Facebook et LinkedIn pour les vidéos hebdomadaires Geneva Digital Tours, dans lesquelles des personnalités de haut niveau vous guident à travers leurs institutions. Au mois de mars, les organisations impliquées dans la normalisation et l’infrastructure seront présentées. Notre première invitée est Doreen Bogdan-Martin, secrétaire générale de l’UIT !
Les principaux événements du mois de mars en matière de politique numérique
11–16 Mars 2023,ICANN76 (Paris, France) L’ICANN76 offrira à sa communauté la possibilité d’aborder diverses questions relatives à son activité et à la gestion du système de noms de domaine (DNS). Le programme de ce forum communautaire de l’ICANN76 comprend le développement des capacités / la formation, l’interaction entre les communautés, l’élaboration de politiques, la sensibilisation / l’engagement, la sécurité / les questions techniques et les rapports / les mises à jour.
Le thème du Forum 2023 du Sommet mondial sur la société de l’information (SMSI) est « Lignes d’action du SMSI pour reconstruire en mieux et accélérer la réalisation des ODD ». Le Forum du SMSI est une plateforme mondiale multipartite destinée à faire progresser le développement durable par la mise en œuvre des grandes orientations du SMSI. Il facilite le partage d’informations et de connaissances, la création de connaissances, l’identification des tendances émergentes et la promotion de partenariats avec les organisations des Nations unies et les cofacilitateurs des lignes d’action du SMSI.
Diplo et la Geneva Internet Platform (GIP), avec le soutien des missions permanentes de Djibouti, du Kenya et de la Namibie, co-organisent une session pendant le Forum du SMSI pour débattre de la diplomatie numérique de l’Afrique. La session explore la manière dont l’Afrique peut renforcer sa participation à la gouvernance numérique mondiale, compte tenu de la croissance de ses économies numériques, de ses écosystèmes de start-up et de sa transformation numérique dynamique. Elle vise à identifier les priorités en matière de politique numérique, à améliorer la participation de l’Afrique aux processus de gouvernance numérique mondiale, et à offrir des idées pratiques pour renforcer la diplomatie numérique de l’Afrique dans les processus internationaux liés à la cybersécurité, à l’IA, à la gouvernance des données, à l’accès et à l’infrastructure. Enfin, la session proposera des mesures pratiques pour développer la diplomatie numérique africaine.
La Commission de la science et de la technologie au service du développement (CSTD) tiendra sa 26e séance sous les thèmes principaux suivants : Technologie et innovation pour une production plus propre, plus performante et plus compétitive ; Assurer l’eau potable et l’assainissement pour tous : la solution par la science et l’innovation ; Technologie et innovation pour une production plus propre, plus efficace et plus compétitive.La commission se concentrera sur la manière dont la science, la technologie et l’innovation peuvent servir de catalyseurs à l’Agenda 2030, en particulier dans des domaines cruciaux tels que le développement économique, environnemental et social. La CSTD examinera également les progrès réalisés dans la mise en œuvre et le suivi des résultats du Forum du SMSI aux niveaux régional et international, et entendra des présentations sur les examens en cours des politiques de la science, de la technologie et de l’innovation.
La septième séance de la conférence de l’Organisation mondiale de la propriété intellectuelle (OMPI) portera sur la propriété intellectuelle et les technologies d’avant-garde, et se concentrera sur l’intersection de la propriété intellectuelle et du métavers, en explorant les technologies d’avant-garde qui le rendent possible et en examinant les défis qu’elles posent au système de propriété intellectuelle existant. L’objectif principal de la séance est de fournir une stratégie pour relever ces défis, et de faire en sorte que l’innovation et le développement continuent de profiter à tout le monde.