RnD Café ☕️ – #362

14 septembre 2024

Agents en vue

Bonjour à toutes et à tous,

Deux grosses annonces cette semaine.

Cela devient lassant…

o1

Commençons par OpenAI. Difficile de passer à côté.
La rumeur bruissait depuis une semaine : OpenAI a confirmé jeudi soir le lancement de la o1 Series (prononcer O One), un modèle d’IA 100 fois plus puissant que GPT-4 (selon son PDG…).

En deux mots ?

OpenAI lance deux nouveaux modèles d’IA pour abonnés payants, avec des tarifs potentiellement plus élevés pour les entreprises. Ces modèles promettent de « réfléchir » avant de répondre (révolutionnaire, n’est-ce pas ?). Grâce à des techniques comme le « Chain of Thought », ils visent un raisonnement autonome et la résolution de problèmes complexes (avec une très importante puissance de calcul ➡️ temps de réponse plus long et consommation élevée d’énergie).

o1 surclasse GPT-4 sur les problèmes d’olympiades mathématiques (83% vs 13%) et rivalise avec des doctorants en physique, biologie et chimie (Zain Kahn)

Si le nouveau modèle GPT o1 d’OpenAI excelle dans les tâches nécessitant de la planification, surpassant significativement GPT-4o, il n’est pas supérieur dans tous les domaines, notamment en rédaction.

Avec 1 million d’utilisateurs payant, OpenAI serait en discussion pour lever 6,5 milliards de dollars à une valorisation de 150 milliards !

Cette avancée laisse entrevoir l’arrivée d’agents « intelligents », ouvrant la voie dans notre secteur, à de nouvelles perspectives pour l’automatisation et la personnalisation des stratégies marketing (mais chaque chose en son temps). On en parle plus bas.

L’autre annonce de la semaine concernait Apple

Lundi soir, c’était compote.

Apple a donc lancé sa stratégie IA avec « Apple Intelligence« , intégrée à iOS 18 et à l’iPhone 16. Cette nouvelle offre promet des fonctionnalités avancées en matière de traitement de texte, création d’images, et assistant virtuel amélioré, tout en mettant l’accent sur la confidentialité. Cependant, les premières impressions sont mitigées, certains qualifiant l’IA d’Apple de « magiquement médiocre« .

Apple Intelligence is not that scary, not that advanced, and definitely not finished.

En attendant les premiers tests, on peut quand même noter qu’Apple propose une IA locale (mais pas à 100 %). À lire chez Benoit Raphael.

Vos requêtes seront traitées en partie par un modèle Apple en local, 3 milliards de paramètres, ce qui est rikiki par rapport à ChatGPT et consorts (on parle en trillion) mais du coup plus confidentiel, plus rapide.

En fonction de la requête, Apple a aussi un autre modèle sur son cloud (souvenons nous qu’il y a eu un deal Open AI / Apple) et soutien que son modèle ne sera pas alimenté par les données utilisateurs ce qui est pourtant monnaie courante. N’est-ce pas Meta ? Facebook et l’IA : Collecte massive de données australiennes sans consentement

Pour en savoir plus sur la promesse de confidentialité d’Apple : lire l’article de Wired.
Cela dit en termes d’IA, pour nous français, rien avant probablement le premier semestre 2025 et côté génération d’image, encore un petit effort Apple ?

Mais quoi qu’il en soit, les analystes prévoient un « super cycle » de mises à niveau, avec des ventes potentielles de 250 millions d’iPhones en 2025, marquant potentiellement le plus grand cycle de renouvellement d’iPhone depuis le passage à la 5G.

Ok… Et alors ?
Le concept d’un assistant dans la poche va donc être expérimenté par de nombreux consommateurs dès cette année. Leurs attentes en termes d’expérience utilisateur vont donc s’accroître. Les marques vont devoir suivre.

Régulation

Montagnes russes pour Apple cette semaine, car l’autre nouvelle les concernant a probablement été moins bien accueillie à Cupertino.

Apple vient en effet d’être définitivement condamné à rembourser 13 milliards d’euros d’avantages fiscaux jugés illégaux par la Cour de Justice de l’UE. Ces avantages, offerts par l’Irlande entre 2003 et 2014, avaient permis à Apple de payer moins de 1% d’impôt en Europe. Cette décision marque une victoire pour Bruxelles, après un revers dans une affaire similaire avec Amazon. Le dossier est clos, et l’Irlande devra récupérer la somme.

Les utilisateurs européens d’Apple pourront par ailleurs bientôt supprimer certaines applications préinstallées comme l’App Store, Safari ou Photos, grâce au règlement européen sur les marchés numériques (DMA). Seules les apps « Réglages » et « Téléphone » resteront obligatoires.

Vous voulez développer une app Calculatrice aux couleurs de votre marque… C’est le moment !

Côté Google, son accusation de monopole aux États-Unis n’aura pas d’effet immédiat, même si l’Europe commence à s’y intéresser : « La Commission européenne n’adoptera pas de décision avant l’année prochaine dans sa procédure antitrust contre Google« .

Intelligence Artificielle

AGENTS & USAGES

Finalement le point commun entre les deux annonces de la semaine, c’est cette musique qui tourne de l’arrivée prochaine des agents : à la fois capable de répondre à la voix (Apple) et de gérer des tâches de plus en complexes (Open AI).

Quels premiers enseignements ?

En termes d’expérience client (le graal), nous allons avoir dans les prochains mois de nombreux outils pour fluidifier et personnaliser les parcours.

En termes d’efficacité, de nombreuses tâches pourront être automatisées.

En parlant d’automatisation (un sujet fréquent ici), un article intéressant de Zapier (même si bien sûr, ils vendent leur sauce) cette semaine aide à mieux comprendre le concept. Le terme est souvent utilisé à tort et à travers, et pas toujours de manière appropriée.

L’automatisation et l’IA ne sont pas identiques : l’automatisation gère les tâches répétitives, tandis que l’IA analyse des données et prend des décisions. Ce qui est certain, c’est que combinées elles optimisent les processus en alliant régularité et analyse. Mais le vrai combo c’est : Automatisation + IA + HUMAIN !

Les grands éditeurs surfent sur cette vague. Oracle a ainsi annoncé cette semaine avoir lancé plus de 50 agents d’IA dédiés à des rôles spécifiques dans sa suite Oracle Fusion Cloud Applications. Ces agents automatisent les tâches répétitives, offrent des recommandations personnalisées et automatisent les processus dans des domaines clés comme la finance, la chaîne d’approvisionnement, les RH, les ventes et le marketing.

Cocorico

Mistral AI, notre modèle IA national, continue de se positionner face aux leaders de l’IA en démocratisant l’accès aux applications visuelles et en renforçant son offre. Pixtral 12B, son modèle intègre à la fois le traitement du langage et des images. Contrairement à OpenAI et Anthropic, Mistral adopte une approche différente en rendant son modèle disponible en téléchargement via Hugging Face et GitHub, avec une future intégration sur son chatbot web et sa plateforme API. Ce que cela signifie : nous pouvons déployer sur vos serveurs un service français qui peut ouvrir des perspectives pour l’analyse visuelle avancée. L’un de ses fondateurs emblématiques, Arthur Mensch, rentre ainsi dans le TOP 100 du Time des personnalités de l’IA (vu chez Nicolas Guyon).

Les usages de la semaine ?

Harvard Business Review s’est penché sur l’utilisation de l’IA générative par les dirigeants dans la réflexion stratégique. Beaucoup la considèrent comme une révolution pour la prise de décision, avec des outils comme ChatGPT, Claude.ai et you.com permettant d’identifier des opportunités invisibles jusque-là. Évidemment il y a des limites (et pas qu’un peu…). Par exemple, Keith, PDG de Trident, a utilisé l’IA pour définir ses défis stratégiques. Bien que l’outil ait fourni des perspectives intéressantes sur les « avancées technologiques » et les « demandes clients », il a omis des aspects essentiels comme la rentabilité et la gestion des succursales. En résumé, l’IA générative est puissante pour générer des idées, mais elle doit être utilisée avec discernement, toujours en complément de l’expertise humaine. Ca parait évident à dire comme ça mais je vous assure que parfois l’effet génie de la lampe fait perdre son esprit critique.

Vous êtes une marque dans l’agroalimentaire ? Attendez encore un peu avant d’utiliser SideChef, le service qui analyse une photo d’un plat pour vous en sortir la recette. Bilan encore contrasté… Les résultats manquent souvent de précision et l’IA complexifie parfois inutilement les recettes simples.

Vous avez beaucoup de contenus et vous souhaitez surfer sur la vague des podcast ? Google a introduit Audio Overview dans NotebookLM, une fonctionnalité qui transforme vos documents en discussions audio, animées par deux IA. Ces hôtes résument et discutent de vos sources, facilitant l’apprentissage par l’écoute. Encore en phase expérimentale, cette option est accessible via le bouton « Générer » dans votre notebook.

Vous cherchez à mieux comprendre comment rédiger un prompt pour tester de nouveaux usages ? Jeter un coup d’œil à ces exemples. Toujours intéressant de comprendre la structure. Mais pour rappel : ne jamais lésiner sur les itérations pour arriver à un résultat qui vous satisfasse complètement.

La question juridique de la semaine

Repérée chez Betty Jeulin :
« Puis-je commercialiser des contenus générés par IA ?« .
La première étape est de consulter les conditions d’utilisation des outils d’IA que vous employez, car elles varient selon les plateformes et abonnements. En général, la commercialisation est permise, mais la protection juridique de ces contenus par le droit d’auteur n’est pas toujours garantie. Cela dépend de votre degré d’intervention créative sur le contenu généré. Attention également : une commercialisation autorisée n’exclut pas les risques associés à d’éventuelles contrefaçons ou traitements illégaux de données à caractère personnel…

CREATION, OUTILS

Encore beaucoup de nouvelles concernant les outils de création.

Mais peut-être un point à mettre en exergue.

Adobe renforce sa suite avec de nouvelles fonctionnalités IA, notamment pour automatiser la prise de notes de réunions : transcription, résumé, recherche et analyse des conversations vocales sur différentes plateformes. Côté vidéo, l’IA permet désormais de transformer un simple texte en vidéo en quelques minutes. De plus, la personnalisation des animations et effets devient plus intuitive, et tout cela s’intègre parfaitement avec Adobe Creative Cloud pour un flux de travail fluide et efficace.

Vu chez Pierrick Chevallier.

Pourquoi est-ce intéressant ?
C’est peut-être un signal envoyé à tous les outils d’IA générative du moment Text to Image/vidéo/3D/Sons/… Ils seront tôt ou tard intégrés dans les suites logicielles majeures qui ont des parts de marché colossales.

En attendant, en matière de génération d’images fixes, Flux et ses outils de personnalisation (les LORA) continuent de voler à vedette à MidJourney y compris en intégrant des outils de retouche comme Reshot.ai.

Les français de Sezam se sont aussi appuyé sur Flux pour proposer leur propre déclinaison.

Voir les expérimentations de Mathieu Crucq ou Gilles Guerraz (encore eux 😅).

MidJourney se prépare à la 3D et reste quand même encore l’une des meilleures solutions surtout lorsque l’on en maîtrise les subtilités : 20 astuces clés de Midjourney(▶️) -> utiliser des raccourcis pour gagner du temps, combiner des styles artistiques pour des résultats uniques, affiner les images avec des techniques comme le remix subtil ou le paramètre chaos, et créer des éléments personnalisés (logos, polices, portraits, etc.). L’accent est également mis sur la personnalisation des images (fiches de personnages, portraits familiaux, vieillissement).

Mais selon vos besoins, deux benchmarks sont sortis cette semaine.

https://www.imgenarena.ai/ vous permet de sélectionner les meilleurs résultats selon un prompt donné, permettant ainsi l’édition d’un classement des outils. Et… MidJourney s’est fait détrôner.

Autre benchmark proposé par Kirthigan V selon ses propres usages.

Mais la bonne nouvelle, c’est que quel que soit l’outil, c’est toujours la créativité qui gagne !

Prompt : The streets were lined with small shops and houses made of clouds and cotton candy, made of wool felt –ar 3:4 –sref 680572301 –v 6.1 –stylize 1000 –personalize kzilt9y
Source : https://www.m2z1.com/ (Corée)

AVATARS

L’utilisation des avatars dans les interfaces ne semble pas près de s’arrêter.

L’un des principaux acteurs du domaine (Heygen) vient d’annoncer une 3ème version plus expressive.

Sur le son aussi, les émotions seront de plus en plus réalistes. En attendant le mode vocal de ChatGPT, Hume a lancé EVI 2, une IA vocale capable de détecter et de répondre aux émotions. Chaque personnage d’EVI a une voix et une personnalité uniques, offrant une immersion bien plus réaliste que Siri ou Alexa. Cependant, l’IA a encore des limites : elle peine sur les longues conversations et peut avoir des temps de latence. Malgré cela, son accessibilité est un atout majeur : il suffit de se connecter comme pour un appel Zoom et de commencer à discuter.

Si vous avez oublié de brancher le micro sur la caméra lorsque vous avez enregistré le mot de la rentrée de votre président, https://www.readtheirlips.com/ peut peut-être quelque chose pour vous…
Le site permet de télécharger une vidéo d’une personne parlant sans son, et d’en transcrire le discours. C’est une première étape vers la lecture automatique sur les lèvres. Il y a encore des progrès à faire. Branchez le micro plutôt.

PUB

Trois points remontés cette semaine.

L’IA permet de personnaliser les publicités sportives en temps réel (Vu chez Steve Nouri). Dans cette vidéo, les annonces dans les stades peuvent être adaptées en temps réel en fonction de la chaîne, de la localisation ou même du foyer, sans que le public s’en aperçoive. Bien que cette vidéo ne soit pas faite par IA, elle pourrait l’être facilement.

Amazon intègre désormais des publicités dans son IA générative Rufus, un assistant d’achat qui aide les utilisateurs à trouver des produits sur l’application mobile. Les publicités sponsorisées apparaîtront en fonction des requêtes des utilisateurs, avec du contenu généré par Rufus lui-même. Actuellement testé aux États-Unis, ce format pourrait bouleverser la découverte de produits sur Amazon. Vu chez Fred Cavazza.

Distraction Control, une nouvelle fonctionnalité de Safari sur iOS 18, permet aux utilisateurs de masquer tout élément d’une page web, qu’il s’agisse de publicités, de contenu ou même de fenêtres de consentement. Apple facilite ainsi la navigation en éliminant les distractions, mais cela pose des problèmes majeurs pour les éditeurs et annonceurs. L’impact pour les éditeurs est inquiétant : les consent walls, souvent utilisés pour monétiser les contenus, peuvent être supprimés, permettant aux utilisateurs d’accéder aux articles sans contrepartie. Pour les annonceurs, les publicités masquées continueront d’être servies et facturées, même sans visibilité réelle, créant un biais dans les KPI et poussant potentiellement à un retrait des investissements publicitaires sur le web ouvert. Source Journal du Net.

CONTENUS

« Content is King ». On est d’accord.

Offrir à vos audiences des contenus de qualité renforce la visibilité et l’engagement. Mais attention à ne pas céder à la facilité (ie produire plus vite grâce à l’IA mais pour quelle qualité ?)

La moitié des contenus des entreprises sera créée par l’IA d’ici 2026 .

Et quel sera notre rapport à ces contenus, et plus généralement à l’information en… 2050 ?
C’est la question que s’est posée l’INA. Très bon dossier à lire ici.

En gros, trois scénarios sont identifiés :

Le Miracle Informationnel : Âge d’or de l’information, démocratie mondiale, financement citoyen des médias, IA au service du journalisme, régulation stricte des tech, éducation aux médias.

Information liquéfiée : Chaos informationnel, disparition de l’information indépendante, vérification impossible, désinformation massive, information « liquéfiée » et instable, creusement des inégalités d’accès.

Information éclatée : Fragmentation de l’information, échec relatif de l’IA, limitation des terminaux, « neurodroits », scepticisme accru, disparition des grands médias, demande d' »information confortable », fragilisation démocratique.

Comment les marques se positionneront-elles ? Diront-elles (elles aussi) n’importe quoi de manière décomplexée ?

En tout cas, très légère éclaircie sur le front des fake news : une étude sur 2 000 complotistes montre que ChatGPT parvient à convaincre 1 sur 5 que leurs théories sont fausses (vu via Fred Cavazza).

Et finalement sur les questions d’attaques informationnelles pour les JO ? Quel est le bilan ? 43 manœuvres informationnelles ainsi que 2 campagnes numériques planifiées et coordonnées de manipulation de l’information ont été identifiées (source Viginum). Et sur le front Cyber ? L’ANSSI a recensé 548 événements de cybersécurité liés aux Jeux Olympiques et Paralympiques (mai-septembre 2024), dont :

465 signalements : impacts mineurs, intervention limitée de l’ANSSI
83 incidents : actions réussies d’acteurs malveillants, confirmées par l’ANSSI

WEB3

À l’approche des élections américaine, la blockchain refait parler d’elle.

Polymarket utilise la blockchain pour créer un marché prédictif sur les résultats électoraux. Les utilisateurs parient de l’argent réel sur différents scénarios politiques, créant ainsi un « sondage » basé sur les enjeux financiers. Cette approche offre une alternative aux sondages traditionnels, reflétant potentiellement mieux les opinions réelles des participants. Pour les marketeurs, cela représente une nouvelle source de données pour comprendre les tendances politiques (ou pas) et ajuster leurs stratégies de communication en conséquence.

SEARCH

Alors que l’on continue de parler de chiffres relativement faibles chez Google en matière de résultats générés par l’IA (7%), Perplexity prend des parts de marché.

Google continue d’innover avec de nouvelles fonctionnalités. La dernière en date permet de retrouver des sites tels qu’ils étaient à une date précise, grâce à un partenariat avec Internet Archive (Wayback Machine).

Et si vous vous posez des questions sur le bon référencement de vos vidéos YouTube, éléments de réponses à regarder ici (▶️).

INSOLITE

Et pour finir en beauté, Elisabeth Gravil nous a encore déniché une pépite. Connaissez-vous la Data Archéologie, cette discipline qui utilise l’IA pour redonner vie aux artefacts historiques avec un réalisme surprenant (colorisation de films, reconstitution 3D de monuments disparus, ou recréation d’événements sportifs historiques).

Cette technologie ouvre de nouvelles perspectives pour le storytelling et l’engagement client, mais soulève des questions d’exactitude historique.

En attendant, c’est beau et c’est probablement le plus important.

Très bon week-end !