Partager:
L'intelligence artificielle a envahi le quotidien d'une bonne partie d'entre nous, de manière active ou passive. Mais cette révolution a un coût énergétique colossal, et pose des questions au niveau de la sécurité et de la vie privée. Heureusement, les avancées technologiques permettent de plus en plus de traiter l'IA localement sur nos appareils, comme les nouveaux Chromebooks Plus de Google et les PC Copilot+ de Microsoft. Alors, sommes-nous à l'aube d'une nouvelle ère de l'IA "on device" ?
Depuis 2022, l'intelligence artificielle a franchi une nouvelle étape, sortant des laboratoires et s'insérant dans la vie de tous les jours. Portée par les interfaces conversationnelles et génératives que sont ChatGPT, Gemini ou MidJourney, l'IA est désormais utilisée directement (via ChatGPT par exemple) ou indirectement (votre service de streaming musical ou vidéo qui vous recommande de nouveaux contenus) par de plus en plus de gens - et la courbe est exponentielle, croyez-moi.
Le revers de la médaille, on en a déjà beaucoup parlé, c'est une consommation importante d'énergie. Car toutes ces IA ont besoin d'une puissance de calcul plus ou moins importante, nécessitant des data center remplis de serveurs informatiques piqués aux hormones. Mais la situation évolue, notamment grâce à l'inévitable augmentation des performances des processeurs: une partie des tâches d'IA habituellement confiées (à distance, nécessitant une connexion constante) à des serveurs, peut désormais être traitée par l'ordinateur, en 'local' (hors connexion, donc). Est-ce le début d'une nouvelle ère pour l'intelligence artificielle ?
Un pas prudent du côté de Google
Les Chromebook sont encore trop méconnus du grand public. Ces ordinateurs pourtant bon marché (car nécessitant peu de ressources matérielles) tournent sous un système d'exploitation très simplifié, à la base construit autour du navigateur Chrome (les navigateurs internet permettant de faire de plus en plus de choses sans le besoin d'applications tierces). Leur seul inconvénient, outre l'impossibilité d'installer des applications tierces lourdes telles que Photoshop, était qu'ils nécessitaient d'être connectés pour fonctionner au mieux. Mais ChromeOS étant mis à jour très régulièrement, il est par exemple possible d'écrire un doc ou de créer un tableau (via Google Docs) même en étant hors ligne.
Ce qui nous intéresse aujourd'hui, c'est que depuis quelques mois, Google a lancé, en collaboration avec Acer ou HP, par exemple (car le géant américain ne fabrique pas - encore - ses propres Chromebook), les Chromebook Plus. Plus puissants, ils permettent forcément une fluidité accrue de l'ensemble de l'OS et de l'expérience de navigation - certains sites étant très gourmands en ressources. Mais surtout, Google peut intégrer davantage Gemini, le nouveau nom de son IA qui s'intègre un peu partout dans les nombreux services de l'entreprise. On retrouve donc, dès le premier lancement du Acer Chromebook Plus 515 que j'ai pu essayer (une version avec i3 non tactile à 499€, voir photo ci-dessus):
- L'application Gemini est intégrée à la barre des tâches. Vous recevrez même, normalement, 12 mois gratuits d'abonnement à Goole One AI Premium (2TB de stockage et la version avancée de Gemini), si vous remplissez les conditions. Cette application n'a rien d'exclusif: sur un navigateur, vous pouvez y accéder. Mais elle a l'avantage d'être bien intégrée et facilement accessible (cependant, Gemini ne fonctionne qu'en étant connectée, donc la plus-value est minime). Gemini est une IA générative conversationnelle identique à ChatGPT, même si elle accuse encore un peu de retard sur le pionnier.
- Plus concret et plus "on device" (même si à nouveau, il faut être connecté...) : la fonction Retouche magique dans l'application Google Photo, la même qu'on retrouve sur les smartphones récents de Google (les Pixel 8). Retouche magique "regarde" la photo, la comprend (portrait, paysages lointains et sombres, etc) et suggère des améliorations. Et ça fonctionne plutôt pas mal, je dois dire.
- Concret aussi, mais plutôt gadget: créer un fond d'écran personnalisable avec l'IA. Une fonction qui existe sur les Pixel 8 notamment, et qui nécessite, à nouveau d'être connecté :
C'est un peu maigre, mais c'est un début. Et il y aura bientôt plus. Pour les anglophones (ou ceux qui utilisent les services de Google en anglais, comme moi), il existe déjà l'option "Help me write" ("Aide-moi à rédiger"), qui s'affiche à plusieurs endroits dans le Chromebook, notamment Gmail et Docs, pour parler des plus connus. C'est comme si Gemini était intégré avec un prompt d'assistance à l'écriture, et vous lui dites ce que vous voulez écrire:
A venir (via des mises à jour): "Aide-moi à lire" pour résumer des PDF ou des pages web. Tout ça est très beau, mais vu qu'il faut être connecté pour en profiter, je me demande si l'IA est vraiment traitée localement, ou si tout est fait à distance par les serveurs de Google. Auquel cas, toutes ces fonctionnalités ne sont que logicielles, et pourraient être débloquées sur un simple ordinateur Windows avec un navigateur Chrome (voire même un autre navigateur...). J'ai posé la question à Google, qui m'a répondu qu'effectivement, "presque toutes les fonctionnalités d'IA sont basées sur le cloud et nécessitent donc une connexion internet ; de cette manière, nous pouvons garantir un traitement très puissant tout en nous assurant que les fonctionnalités sont toujours à jour". Le Chromebook Plus n'a donc pas, à proprement parler, des capacités d'IA internes particulières ; disons qu'il y a un accès privilégié, et que ses performances générales sont plus importantes que les Chromebook 'normaux'.
Du Copilot+ plus concret chez Microsoft
Fort de son alliance profonde avec OpenAI (il est un gros investisseurs et un partenaire privilégié), Microsoft a une longueur d'avance grâce aux performances de ChatGPT, notamment. D'une manière pas très transparente, l'entreprise américaine utilise l'expertise d'OpenAI dans l'IA à travers sa suite bureautique: Windows, Word, Excel, Edge, etc. Il utilise à cette fin la notion de Copilot, une interface conversationnelle pour recevoir de l'aide de l'IA contextualisée par rapport aux tâches en cours (rédaction, tableur, surf, etc).
Plus tôt cette année, Microsoft, comme Google, a lancé en partenariat avec quelques fabricants (comme Dell ou HP), des ordinateurs labellisés "Copilot+ PC". Mais il a aussi sorti une nouvelle génération de ses propres ordinateurs, dont le Surface Laptop 7, que j'ai également pu essayer durant quelques semaines (voir photo ci-dessus). Des ordinateurs plus polyvalents (Windows 11), plus jolis et plus puissants que les Chromebook Plus, mais aussi nettement plus cher (minimum 999€). Parle-t-on vraiment, cette fois, d'intelligence artificielle on device ?
- La réponse est oui, dès la première option mise en avant par Microsoft: Cocreators. Les ordinateurs Copilot+ ajoutent cette option au logiciel Paint. Elle permet de vous aider à créer des images et des dessins avec du prompt et quelques coups de stylet (ou de doigts, dans mon exemple). Une option qui peut s'avérer très utile dans certains cas, car il est souvent difficile d'obtenir exactement ce qu'on veut des IA générationnelles d'image comme Midjourney. Avec Cocreators, vous pouvez uploader l'image d'une tortue, puis la transformer avec du prompt (texte en français) et du dessin à la main :
- La deuxième option est, elle aussi, très concrète et très 'on device': le Sous-titrage en direct (Live Captions en anglais). Cette option, qui est donc exclusive aux PC Copilot+, permet de traduire en direct depuis 40 langues vers l'anglais (oui, pour l'instant, uniquement vers l'anglais...) n'importe quel contenu en cours de lecture, que ce soit un son MP3 en local ou une vidéo en ligne. Il faut activer cette fonction quand vous en avez besoin, et ça peut se faire via les réglages rapides (quand vous cliquez en bas à droite sur l'icône réseau/son/batterie). J'ai fait le test avec une vidéo RTL info, et même s'il y a une bonne seconde de décalage, ça fonctionne très bien :
- Enfin, dernière fonctionnalité, plus anecdotique celle-là (sauf si vous passez votre vie en visio): l'amélioration et la personnalisation de la vidéo enregistrée par la webcam, via le réglage Effets Windows Studio. La webcam est déjà de bonne qualité sur cet ordinateur, mais en améliorant encore l'image, vous aurez l'air d'une star lors de votre prochaine réunion Teams. Vous pouvez même demander à l'IA de faire en sorte que vos yeux restent orientés vers la caméra, plutôt que de regarder ailleurs sur l'écran :
- Pour être complet, sachez que la touche Copilot ne sert qu'à lancer l'application Copilot, qui est, comme le raccourci Gemini, une fenêtre faisant office de conversation avec l'IA générative de Microsoft (basée sur ChatGPT en partie).
Conclusions
Très concrètement du côté de Microsoft, de manière plus distante du côté de Google, l'IA débarque dans nos ordinateurs. Et elle devrait y rester pour un bout de temps. En effet, les avantages de l'IA "embarquée" sont multiples, en opposition à l'IA actuelle (qui est traitée à distance par les serveurs d'OpenAI ou Google, par exemple):
- Réactivité et rapidité : les traitements se font localement, ce qui réduit la latence et améliore la vitesse d'exécution.
- Confidentialité : les données restent sur l'appareil, ce qui réduit les risques associés à la transmission et au stockage des données dans le cloud.
- Fonctionnement hors ligne : l'IA peut fonctionner sans connexion internet, offrant une disponibilité constante des fonctionnalités.
En résumé, l'IA "on device" améliore l'expérience utilisateur en intégrant des technologies intelligentes directement dans les appareils, rendant les interactions plus fluides, sécurisées et personnalisées. Les PC "Copilot +" et les "Chromebook Plus" illustrent, même si on n'en est qu'aux prémices pour certains, comment ces technologies peuvent être mises en œuvre pour bénéficier directement aux consommateurs, sans intermédiaires (parfois payants...).