Si ChatGPT, Gemini ou encore Grok progressent aussi vite, c’est en grande partie grâce à un ingrédient-clé : les données massives disponibles sur Internet. Et désormais, on sait un peu mieux d’où elles proviennent. Une infographie publiée par Statista a analysé les réponses fournies par ChatGPT, Perplexity, AI Overviews et le mode IA de Google pour déterminer quelles sources ces intelligences artificielles exploitent le plus.En tête du classement, surprise : Reddit apparaît dans 40 % des réponses, loin devant Wikipedia (26,3 %), YouTube (23,5 %) et même Google (23,3 %). Autrement dit, le savoir collectif et les discussions informelles des internautes sont au cœur de l’entraînement des IA. Des plateformes comme Yelp, Tripadvisor ou Facebook fournissent aussi des données précieuses… et gratuites. C’est là que le débat s’ouvre : combien de temps encore ces trésors de contenu généré par les utilisateurs resteront-ils exploitables librement ? Déjà, les ayants droit peinent à faire respecter leur propriété intellectuelle. Et pour le contenu du domaine public, la récolte continue, sans que ses auteurs touchent quoi que ce soit.Exemple parlant : depuis juin, Meta utilise vos données personnelles pour entraîner son IA, Meta AI, sauf si vous vous y êtes formellement opposé. Tout ce que vous publiez ou commentez sur Facebook, Instagram, WhatsApp ou Messenger entre dans ses bases d’apprentissage. Pour l’instant, Meta AI est optimisée pour le public américain, mais la firme veut adapter son outil aux usages et à la culture européenne. En clair, vos interactions en ligne pourraient bientôt façonner un modèle pensé pour mieux répondre… à vous. Derrière la magie des réponses fluides et “intelligentes” des IA, il y a donc un constat simple : elles se construisent sur nos traces numériques, offertes souvent sans que nous en mesurions vraiment la valeur. Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
No persons identified in this episode.
This episode hasn't been transcribed yet
Help us prioritize this episode for transcription by upvoting it.
Popular episodes get transcribed faster
Other recent transcribed episodes
Transcribed and ready to explore now
3ª PARTE | 17 DIC 2025 | EL PARTIDAZO DE COPE
01 Jan 1970
El Partidazo de COPE
13:00H | 21 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana
12:00H | 21 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana
10:00H | 21 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana
13:00H | 20 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana
12:00H | 20 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana