Les principaux sites web bloquent les robots d’IA d’accéder à leur contenu
Les principaux sites web bloquent les robots d'IA
.fav_bar { float:left; border:1px solid #a7b1b5; margin-top:10px; margin-bottom:20px; } .fav_bar span.fav_bar-label { text-align:center; padding:8px 0px 0px 0px; float:left; margin-left:-1px; border-right:1px dotted #a7b1b5; border-left:1px solid #a7b1b5; display:block; width:69px; height:24px; color:#6e7476; font-weight:bold; font-size:12px; text-transform:uppercase; font-family:Arial, Helvetica, sans-serif; } .fav_bar a, #plus-one { float:left; border-right:1px dotted #a7b1b5; display:block; width:36px; height:32px; text-indent:-9999px; } .fav_bar a.fav_print { background:url(‘/images/icons/print.gif’) no-repeat 0px 0px #FFF; } .fav_bar a.fav_print:hover { background:url(‘/images/icons/print.gif’) no-repeat 0px 0px #e6e9ea; } .fav_bar a.mobile-apps { background:url(‘/images/icons/generic.gif’) no-repeat 13px 7px #FFF; background-size: 10px; } .fav_bar a.mobile-apps:hover { background:url(‘/images/icons/generic.gif’) no-repeat 13px 7px #e6e9ea; background-size: 10px} .fav_bar a.fav_de { background: url(/images/icons/de.gif) no-repeat 0 0 #fff } .fav_bar a.fav_de:hover { background: url(/images/icons/de.gif) no-repeat 0 0 #e6e9ea } .fav_bar a.fav_acm_digital { background:url(‘/images/icons/acm_digital_library.gif’) no-repeat 0px 0px #FFF; } .fav_bar a.fav_acm_digital:hover { background:url(‘/images/icons/acm_digital_library.gif’) no-repeat 0px 0px #e6e9ea; } .fav_bar a.fav_pdf { background:url(‘/images/icons/pdf.gif’) no-repeat 0px 0px #FFF; } .fav_bar a.fav_pdf:hover { background:url(‘/images/icons/pdf.gif’) no-repeat 0px 0px #e6e9ea; } .fav_bar a.fav_more .at-icon-wrapper{ height: 33px !important ; width: 35px !important; padding: 0 !important; border-right: none !important; } .a2a_kit { line-height: 24px !important; width: unset !important; height: unset !important; padding: 0 !important; border-right: unset !important; border-left: unset !important; } .fav_bar .a2a_kit a .a2a_svg { margin-left: 7px; margin-top: 4px; padding: unset !important; }
Près de 20% des 1000 premiers sites Web mondiaux bloquent les bots crawler qui collectent des données Web pour les services d’IA, selon de nouvelles données de Originality.AI, un détecteur de contenu d’IA.
Pourquoi cela compte : En l’absence de règles légales ou réglementaires claires régissant l’utilisation de matériel protégé par des droits d’auteur par l’IA, les sites Web de toutes tailles prennent les choses en main.
Les faits marquants : OpenAI a introduit son crawler GPTBot début août, déclarant que les données collectées “pourraient être potentiellement utilisées pour améliorer les modèles futurs”, promettant que le contenu payant serait exclu et donnant des instructions aux sites Web sur comment bloquer le crawler.
- L’Agent de Recherche Répondre au défi de répondre aux questions basées sur un vaste corpus de texte
- Analyse des données géospatiales avec Python (Partie 2 – Test d’hypothèse)
- Libéré des Limitations La Validation des Hallucinations des Machines au MoMA
Peu de temps après, plusieurs sites d’actualités de haut niveau, dont le New York Times, Reuters et CNN, ont commencé à bloquer GPTBot, et beaucoup d’autres ont suivi depuis. (Axios en fait partie.)
Depuis Axios Voir l’article complet
We will continue to update IPGirl; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Dévoiler les hallucinations de l’IA décoder le côté sombre des modèles d’IA
- Le rapport sur les salaires des professionnels de la science des données et de l’IA de Burtch Works 2023 est arrivé !
- Création d’une intelligence conversationnelle L’impact de l’apprentissage automatique sur les messages textuels automatisés personnalisés
- Complaisance de l’automatisation Comment remettre les humains dans la boucle
- Tanguy Chau, Co-Fondateur et PDG de Paxton AI – Série d’interviews
- L’ingénierie de prompt n’est pas une chose.
- Implémenter la descente de gradient avec un modèle de régression linéaire