- Mister IA
- Posts
- đ€ GPT-4 devient (enfin) multimodal !
đ€ GPT-4 devient (enfin) multimodal !
5 min de lecture đ
Aujourdâhui dans Mister IA :
đ€ Mister IA : lancement de lâIndex France IA !
đ„ Open AI : GPT-4 devient (enfin) multimodal !
đ° Anthropic : 2 milliards de plus grĂące Ă Google
đŠ Hallucinations : enfin un moyen de les Ă©liminer ?
đ«đ· Mistral : Ă la recherche de 300 millions dâeuros
Et pour découvrir toutes les newsletters précédentes : https://www.mister-ia-newsletter.com/
Sous les projecteurs
đ€ Mister IA lance un tout nouveau baromĂštre !

Nous sommes fiers de vous annoncer la crĂ©ation dâun tout nouveau baromĂštre mensuel chez Mister IA : lâIndex France IA.
Lâobjectif ? Vous donner une idĂ©e de lâengouement autour de lâIA en France, de son dĂ©veloppement et de son potentiel, en suivant quelques indicateurs trĂšs prĂ©cis.
Pour lâinstant, on ne vous en dit pas plus, mais on vous demande juste ci-dessous une petite contribution. Et pour le premier baromĂštre, câest la semaine prochaine !
Quel est votre sentiment général actuel à propos de l'IA ? |
đ„ GPT-4 devient (enfin) multimodal !

Câest certainement la plus grosse news sur CHatGTP depuis le lancement de GPT-4 ! Et pourtant, câest quelque chose que lâon vous promettait depuis longtemps..
Rappelez-vous en mars 2023, lorsque ChatGPT annonce la sortie de son tout nouveau modĂšle GPT-4, une caractĂ©ristique fait le tour de tous les mĂ©dias : GPT-4 sera multimodal, ce que nâĂ©tait pas GPT-3.5. Il pourra lire des images, comprendre des PDF, nous parler, bref, il maitrisera aussi bien la voix, que lâĂ©crit, que lâimage ou mĂȘme âŠla vidĂ©o ?
Oui mais. TrĂšs vite, on se rend compte que cette caractĂ©ristique multimodale nâest en fait pas du tout accessible au commun des mortels via lâinterface ChatGPT. Pendant plusieurs mois, mĂȘme en utilisant GPT-4, on se devra se contenter du texte.
Puis, au fur et Ă mesure de lâannĂ©e, OpenAI sort sur son interface ChatGPT de plus en plus de fonctionnalitĂ©s qui laissent entrevoir la multimodalitĂ© du modĂšle : possibilitĂ© dâenvoyer des fichiers Excel via Data Analysis, de crĂ©er des images avec le plug-in Dall-E, dâupload un fichier PNG directement sur lâinterface, etc. En bref, tous ces onglets que vous pouvez trouver sous cette forme lorsque vous ĂȘtes abonnĂ© payant.

Mais ces petits onglets sont ENFIN de lâhistoire ancienne, car dimanche OpenAI a annoncĂ© que GPT-4 devenait officiellement multimodal ! Pour les experts, certes ce nâest pas le modĂšle GPT-4 qui devient multimodal, car il lâĂ©tait dĂ©jĂ , mais câest sa multimodalitĂ© qui devient accessible Ă tous via notre interface prĂ©fĂ©rĂ©e ; ChatGPT !
Kezako ?
Depuis lâinterface classique de ChatGPT, celle que vous retrouvez aujourdâhui dans lâonglet âDefaultâ, vous pourrez directement demander une image, tĂ©lĂ©charger une image, faire une requĂȘte sur internet ou encore analyser un fichier Excel. Ainsi, GPT-4 devient un modĂšle tout puissant qui peut rĂ©pondre directement Ă une grande partie des cas dâusage.
Petit cadeau de Sam Altman : vous pourrez également désormais faire de la lecture et analyse de PDF directement dans ChatGPT, sans passer par un plug-in !
Cette multimodalitĂ© arrive petit Ă petit sur les machines des abonnĂ©s payants. Si vous ne lâavez pas encore, ce nâest quâune question de jours.
Alors, est-ce la mort des plug-in qui misaient sur des limites de ChatGPT dĂ©sormais effacĂ©es ? Le dĂ©but dâun produit ChatGPT Ă part entiĂšre, au-delĂ mĂȘme du âsimpleâ modĂšle ?
Si vous voulez un bout de rĂ©ponses, connectez vous aux OpenAI Dev Day le 6 novembre Ă 18h, annonces garanties đ
đ° Anthropic lĂšve ENCORE 2 milliards auprĂšs de Google

La course Ă lâargent nâen finit plus dans le monde des LLMs. Que dire ici, si ce nâest Ă©crire le mĂȘme article que jâai Ă©crit il y a 1 mois pour annoncer la levĂ©e de 4 milliards de dollars dâAnthropic auprĂšs dâAmazon.
Si, peut-ĂȘtre vous dire quâAnthropic, qui dĂ©veloppe le modĂšle concurrent Ă ChatGPT nommĂ© Claude, a besoin dâencore et toujours plus dâargent, que Google avait dĂ©jĂ mis un ticket de 500M⏠dans lâentreprise en dĂ©but dâannĂ©e, ou quâAnthropic sâest engagĂ©e sur un contrat Ă plus de 3 milliards dâeuros avec Google Cloud pour utiliser leurs services.
Pour le reste, rien de nouveau sous le soleil. La course au plus gros modĂšle fait rage entre OpenAI et Anthropic. On leur prĂȘterait mĂȘme, selon plusieurs experts, lâambition non pas dâĂȘtre le leader du marchĂ© BtoB de lâIA gĂ©nĂ©rative, mais dâĂȘtre la premiĂšre entreprise Ă dĂ©velopper une AGI, comprenez une intelligence artificielle gĂ©nĂ©rale, beaucoup, beaucoup plus puissante que les modĂšles actuels.
đŠ Un nouveau systĂšme qui corrige les hallucinations des LLMs
Des chercheurs ont mis au point "Woodpecker", une solution innovante pour rĂ©soudre le problĂšme persistant des "hallucinations" dans les systĂšmes d'intelligence artificielle (IA). Ce problĂšme, oĂč l'IA interprĂšte ou gĂ©nĂšre des informations incorrectes ou non pertinentes, a longtemps Ă©tĂ© un obstacle majeur Ă la fiabilitĂ© et Ă la prĂ©cision des systĂšmes d'IA.
Woodpecker vise à identifier et à corriger ces erreurs en temps réel, permettant ainsi aux systÚmes d'IA de fonctionner de maniÚre plus fiable. Cette avancée pourrait avoir des implications majeures pour de nombreux domaines, allant de la reconnaissance d'images à la génération de texte, en passant par la conduite autonome.
L'un des principaux avantages de Woodpecker est sa capacitĂ© Ă fonctionner avec divers modĂšles d'IA, offrant ainsi une solution polyvalente qui peut ĂȘtre intĂ©grĂ©e dans une multitude de systĂšmes existants, de GPT-4 Ă Claude en passant par Llama.
Les chercheurs espÚrent que cette technologie contribuera à renforcer la confiance dans les applications d'IA, en garantissant que les systÚmes fonctionnent comme prévu et en minimisant les erreurs.
đ«đ· Mistral chercherait Ă lever 300 millions dâeuros

Il nây a donc pas que les AmĂ©ricains qui lĂšvent beaucoup dâargent pour tenter de concurrencer ChatGPT.
Mistral, le français qui a sorti son propre modĂšle de langage il y a peu, quelques mois aprĂšs une annonce de levĂ©e de fonds de 100 millions dâeuros pour se dĂ©velopper, serait dĂ©sormais Ă la recherche de plus de 300 millions dâeuros pour continuer son ascension.
Si vous voulez participer, manifestez-vous.
La caisse Ă outils
Tapasom : Une plateforme qui réunit les créateurs et les marques pour un impact puissant et imparable (lien)
OctiAI : Un générateur de prompts innovant alimenté par l'IA (lien)
Longshot : ChatGPT pour les entreprises. Téléchargez vos documents, vérifiez les faits, assurez-vous qu'il n'y a pas d'hallucinations et intégrez-les partout (lien)
Archive Super Search : Utilisation de l'IA, du NLP et des avancées neuronales pour une recherche rapide d'images et de vidéos (lien)
ReclaimAI : Application d'automatisation de la planification AI qui trouve le meilleur moment pour vos réunions, vos tùches, vos habitudes et vos pauses (lien)
Mister IA Entreprises
Vous souhaitez booster vos collaborateurs et vos process grĂące Ă lâIA ?
Mister IA est lĂ pour vous !
Nous accompagnons dĂ©sormais les entreprises avec 3 nouveaux services qui vous permettront de tirer profit de la rĂ©volution de ChatGPT et de lâIA gĂ©nĂ©rative :
Audit & conseil
Formation de vos collaborateurs
Conférences
Si cela vous intéresse, contactez-nous !
Le prompt de la semaine
Réinventez votre Logo (fonctionnalité "Vision" et Dall-E) :
Ă l'Ăšre du numĂ©rique, l'image de marque est plus que jamais au cĆur des prĂ©occupations des entreprises. Un logo, en particulier, est le visage d'une marque ; il incarne ses valeurs, sa mission et son histoire. Pourtant, avec l'Ă©volution rapide des tendances, mĂȘme les logos les plus emblĂ©matiques peuvent nĂ©cessiter un rafraĂźchissement ou une rĂ©invention.
Heureusement, il n'a jamais été aussi simple de revitaliser l'identité visuelle de votre entreprise. Grùce à GPT-4 Vision, vous pouvez non seulement vous inspirer des logos qui ont fait leurs preuves, mais aussi redéfinir et moderniser votre propre logo. En combinant les compétences analytiques de Vision avec la puissance créative de DALL-E, vous avez la possibilité de redéfinir votre marque tout en restant fidÚle à son essence.
Ătapes pour le redesign de votre logo :
Analyser le logo actuel : Envoyez votre logo actuel Ă GPT-4 Vision pour qu'il dĂ©taille ses caractĂ©ristiques stylistiques et son essence. Exemple de Prompt : âChatGPT, voici mon logo actuel, Je souhaite gĂ©nĂ©rer un logo similaire Ă celui-ci. Analyse ce logo et dĂ©cris le puis GĂ©nĂšre moi un prompt que j'utiliserais dans DALL-E pour y parvenir.â
GĂ©nĂ©rer des idĂ©es de redesign : InsĂ©rez ce prompt dans lâoutil DALL-E de ChatGPT, orientez DALL-E pour qu'il gĂ©nĂšre une version modernisĂ©e de votre logo. IntĂ©grez des informations supplĂ©mentaires sur votre entreprise pour guider la crĂ©ation : description, secteur d'activitĂ©, valeurs, public cible, etc.
Revoir et affiner : Sur la base des propositions de DALL-E, demandez des ajustements spécifiques pour mieux aligner le nouveau design avec votre vision.
Exporter votre nouvelle création : Téléchargez votre logo remanié, combinant le meilleur de votre identité originale avec une touche moderne et pertinente.
Le résultat :


Le tuto IA (anglais)
Comprendre les LLM et leur ecosystĂšme :
đ DĂ©couvrir
La newsletter vous a plu ? đ |
Reply