Les développeurs d’IA tentent depuis longtemps de pénétrer au cœur du PDA, en proposant un service intelligent, facile à interagir et toujours disponible. Gemini Live, annoncé lors de la conférence Made by Google plus tôt cette semaine, est une nouvelle tentative de Google dans ce sens. J’ai donc donné à cette IA une période d’essai de 24 heures pour voir à quel point elle était réellement utile.
Même si je n’ai pas l’habitude de discuter directement avec les assistants IA, à part leur demander de régler des minuteries pendant la cuisson, je voulais voir quel était l’avantage d’avoir une conversation ouverte avec un assistant comme Gemini. Après cette journée de tests, je suis au moins confiant dans l’intérêt de parler ainsi à l’IA, même si j’ai moins confiance dans certaines des réponses qu’elle donne pour le moment.
Bien que mes expériences avec Gemini Live étaient loin d’être un test formel de ses capacités, l’étendue des questions que je lui ai posées nous a donné une bonne idée de ce pour quoi il était bon et de ce pour quoi il n’était pas bon. Je suis donc convaincu que Gemini Live sera un bon ajout au package Gemini, et peut-être une raison suffisante pour inciter certains utilisateurs gratuits à se convertir en utilisateurs payants de Gemini Advanced pour 20 $ par mois. Même si le programme n’a pas encore atteint tous ses objectifs.
Jeudi après-midi – préparation
Gemini Live fait partie de l’abonnement Gemini Advanced, mais bien qu’il soit en cours de déploiement au moment où j’écris cet article, il n’est pas encore disponible pour tous les utilisateurs. Heureusement, j’avais un Google Pixel 9 Pro XL pour l’essayer. Si vous souhaitez en savoir plus sur le téléphone, vous pouvez consulter notre examen pratique des Google Pixel 9 Pro et Pro XL, où nous nous concentrerons exclusivement sur Gemini Live ici.
Un autre problème est que vous devez actuellement définir la langue de votre Gemini sur l’anglais américain pour l’utiliser. Heureusement, même après cela, j’ai toujours pu sélectionner une voix britannique pour discuter avec Gemini, appelée « Capella », parmi les dix proposées. Ils semblent tous tout à fait normaux, avec juste des niveaux d’enthousiasme et de ton de voix différents. Même lorsque vous commencez à poser des questions, il est rare que vous tombiez sur une erreur ou une phrase mal formulée.
Jeudi soir – retour à la maison
Après avoir tout configuré, ma première grande interaction avec Gemini Chat a été de lui demander comment rentrer chez moi. Gemini Live ne m’a pas initialement dit ce qu’il avait trouvé une fois que je lui ai indiqué le mode de transport choisi et confirmé les arrêts entre lesquels je voulais me rendre. Après une longue attente, je lui ai demandé de me raconter ce qu’il avait trouvé et de me décrire l’itinéraire.
Je serais probablement rentré chez moi par le même chemin. Cependant, le voyage n’allait pas du tout se dérouler sans heurts. Gemini a mal identifié une ligne de train et une gare, a négligé de noter que l’un des changements qu’il a apporté techniquement nécessitait de circuler entre deux gares, puis a semblé avoir inventé un train à partir de rien. Ce qui est assez étrange car Gemini prétend avoir consulté le site Web de TfL pour obtenir des informations.
Il s’agit d’un problème avec le modèle d’IA de base et non avec Gemini Live, mais la présence d’une voix qui ressemble à celle d’une autorité (avec un accent britannique en plus) suggère que l’itinéraire pourrait conduire quelqu’un de moins familier avec les transports publics de Londres à obtenir perdu. On dirait qu’il vaut mieux s’en tenir à Google Maps pour ce genre de choses.
Vendredi matin – point de presse
Le lendemain, j’ai demandé à Jiminy de me tenir au courant des dernières nouvelles de la journée alors que je me préparais à aller travailler. Avec des gestes simples, il a pu m’en dire beaucoup sur les changements de présentateurs de Good Morning Britain et This Morning, ainsi qu’une brève référence à la récente agression au couteau à Leicester Square. Mais quand je lui ai demandé de me mettre au courant de la technologie, les choses sont devenues encore plus bizarres.
Google Gemini m’a d’abord dit que Microsoft avait annoncé le Surface Duo 3 – un appareil qui n’a pas été confirmé et qui fait en fait l’objet de rumeurs depuis des mois concernant son annulation. La PS5 Slim est réelle, mais elle est sortie l’automne dernier, et nous pouvons supposer qu’elle fait référence à la panne de Crowdstrike du mois dernier avec son récent commentaire.
J’ai ensuite demandé à Gemini Live de se concentrer sur les rumeurs sur l’iPhone, mais au départ, ses réponses concernaient uniquement la gamme d’iPhone 15 actuellement disponible. Après avoir poussé davantage, il a décrit certaines des rumeurs concernant l’appareil photo de l’iPhone 16, mais pas avec beaucoup de détails.
Vendredi en milieu de matinée – Guide de brassage
Après quelques heures de travail, il était temps de faire une pause café, alors j’ai essayé de demander à Gemini Live de m’aider à préparer un café V60.
J’espérais des instructions étape par étape de la part de l’IA, mais le problème ici est que vous devez constamment inviter ou interrompre Gemini Live pour le forcer à donner ses réponses sous forme d’étapes. Cependant, il a réussi à interrompre la conversation et à fournir des réponses qui semblaient convaincantes, même si la transcription montrait qu’il n’avait pas entendu mes invites au départ.
L’application Gemini Live était un mélange d’informations. Il a donné quelques astuces qui plaisent aux passionnés, comme filtrer l’eau avant de la faire bouillir. Malgré sa simplicité, la recette globale a abouti à une tasse buvable. Mais l’application Gemini Live m’a également suggéré un poids de café en cuillères à soupe de grains au lieu de grammes ou d’onces, ce qui n’est pas une mesure typique lors de la préparation du café. Mais grâce à des conseils supplémentaires, j’ai pu obtenir la quantité en grammes.
Déjeuner du vendredi – Discussion sur le combat
Après en avoir eu l’occasion pendant le déjeuner, j’ai eu une brève discussion avec Gemini Live à propos de Street Fighter 6, le jeu auquel je joue beaucoup en ce moment. Le site a correctement mentionné le champion Evo 2024 de SF6 de cette année, ainsi que son adversaire, mais encore une fois, n’a pas fourni beaucoup de détails initiaux.
J’ai déplacé la conversation vers des conseils d’entraîneur (j’ai tendance à trop me fier à certains mouvements), où j’ai reçu quelques suggestions sur la façon de repenser mon approche du match. C’est plus facile à dire qu’à faire lorsque votre adversaire vous lance des boules de feu, mais c’était quand même un bon conseil.
J’ai également essayé d’obtenir des conseils sur les endroits où trouver des rencontres en personne, mais cela n’a pas vraiment fonctionné. J’ai essayé de consulter le site officiel pour plus de détails, mais j’ai découvert qu’il n’y avait rien en dehors des tournois officiels de Capcom. Ensuite, elle a trouvé un groupe Facebook à proximité, mais elle n’a pas pu me donner de lien pour y accéder plus tard dans le texte.
Vendredi après-midi – Conseils d’écriture
En guise de dernière mission pour Gemini, j’ai décidé de parler de MATA, et non, nous ne parlons pas de Llama 3. Je lui ai demandé de m’aider à rédiger l’introduction de cet article particulier.
Ayant rencontré Gémeaux en négligeant de me donner beaucoup de détails dans mes réponses précédentes, j’ai été surpris de voir à quel point Gémeaux était disposé à suggérer des formules spécifiques. Lorsque je lui ai demandé d’inclure plus d’informations ou de changer d’angle, il a répondu d’une manière logique. Comme Google l’a fièrement souligné lors de sa démo Made by Google, Gemini Live est capable de gérer les interruptions et d’ajuster ses réponses à la volée.
C’est le meilleur que j’ai jamais ressenti sur Gemini Live, où répéter une pensée à voix haute semble tout à fait naturel, même lorsque vous parlez dans une onde lumineuse dans votre téléphone. En fin de compte, j’ai écrit l’introduction de cet article à partir de zéro. Mais peut-être pourrez-vous voir des échos de sa dernière suggestion si vous faites défiler vers le haut pour la comparer à ce qu’il m’a donné.
Google Gemini Live : réflexions finales
Vous pourriez supposer à partir de cet article que je n’apprécie pas Gemini Live, mais ce n’est pas tout à fait vrai. Ma pire critique concerne le modèle Gemini Advanced qu’il exécute, car il semble mal comprendre ce qu’il recherche dans de nombreux scénarios de test. Curieusement, la récente confrontation Gemini contre Gemini Advanced que nous avons eue a montré que j’aurais peut-être mieux fait de m’en tenir au programme de base Gemini.
Pendant ce temps, l’application Gemini Live elle-même était impressionnante. Et pouvoir avoir une conversation continue avec un chatbot, à condition que vous soyez prêt à la clarifier et à l’interrompre si elle dérape, semble être une bien meilleure façon d’interagir que par le biais de texte ou d’images. Vous pouvez poser des questions de suivi aux assistants numériques habituels, mais ce n’est toujours pas aussi fluide que Gemini Live l’a prouvé. Cette facilité est ce qui le rend pratique, en vous aidant à répondre aux questions et à fournir des instructions non seulement en mains libres, mais aussi sans les yeux, vous permettant ainsi de vous concentrer sur autre chose pendant que vous et le chatbot parlez.
Mais la grande question de savoir comment cela se compare au prochain ChatGPT Voice demeure, d’autant plus que Gemini Live s’appuie sur l’interprétation de la parole sous forme de texte avant de fournir sa réponse, tandis que ChatGPT Voice peut traiter la parole directement. Mais même avec les mises en garde habituelles en matière d’IA, il semble que Google soit sur la bonne voie dans la poursuite du rêve du PDA.