Apple s’appuie sur le « web ouvert » pour perfectionner son intelligence artificielle
Apple a récemment dévoilé qu’elle utilisait les informations du « web ouvert » pour entraîner ses modèles d’intelligence artificielle. Cette démarche n’est pas récente dans le domaine de l’IA, mais elle suscite des interrogations quant à la rémunération des éditeurs de sites web dont les informations sont utilisées.
Les larges modèles de langage (LLM) sont cruciaux pour l’IA générative et requièrent une grande quantité d’informations pour être performants. Apple a acquis des licences auprès d’éditeurs pour ses propres LLM, mais a également employé son robot Applebot pour recueillir des données sur le réseau. Applebot est un outil d’indexation utilisé pour améliorer les résultats de recherche dans Siri et Spotlight, mais il a aussi été mobilisé pour l’entraînement des modèles d’IA de la compagnie.
Les éditeurs qui désirent éviter que leurs contenus ne soient exploités gratuitement par Apple peuvent refuser l’accès à Applebot, cependant toute information collectée jusqu’à présent demeure utilisée. Cette pratique a été confirmée par Apple dans un article de blog consacré à l’apprentissage automatique, ainsi que par les hauts dirigeants de la société.
John Giannandrea, en charge de l’IA chez Apple, a mentionné lors d’une conférence que l’entreprise avait initialement utilisé les informations du réseau public pour ses modèles d’IA. Cela sous-entend que du contenu issu du « web ouvert » peut être intégré dans les produits et services basés sur l’IA d’Apple.
Les petits éditeurs désavantagés par l’utilisation de leurs informations
Les éditeurs de sites web plus modestes qui ne peuvent pas se permettre de demander une licence se retrouvent à la merci des sociétés comme Apple qui exploitent leurs informations sans autorisation. Tim Cook, PDG d’Apple, a souligné l’importance des licences pour les éditeurs de presse, même si il est parfois complexe pour les petits acteurs d’obtenir une rétribution équitable.
Apple n’est pas la seule société à exploiter les informations du « web ouvert » pour son IA, mais ceci met en lumière le rôle des petits éditeurs et des sites web indépendants dans le perfectionnement de l’IA. Ces acteurs contribuent involontairement à l’avancée de la technologie, sans toujours profiter de retombées financières.
Il est crucial pour les éditeurs de sites web de prendre conscience de l’utilisation de leurs informations par les entreprises d’IA, et de mettre en place des mesures pour protéger leurs contenus si nécessaire.
Suivez 01net sur Google Actualités et WhatsApp pour être tenu informé de toutes les actualités sur l’IA.
Source : MacStories
Source : www.01net.com