Home Ciencia y Tecnología Reddit cube que está bloqueando el archivo de Web para evitar que...

Reddit cube que está bloqueando el archivo de Web para evitar que los raspadores de IA astutos accedan a su contenido

58
0

Reddit Inc. dijo hoy que ha decidido bloquear el Archivo de internet Desde indexar sus populares foros internet para evitar que las empresas de inteligencia artificiales astutos desechen su contenido con fines de capacitación.

Según los informes, Reddit encontró evidencia de que las compañías de IA estaban raspando su contenido a través de la plataforma de Web Archive, después de que les restringió a hacerlo utilizando su sitio internet oficial. La decisión significa que la organización in style Wayback Machine El servicio ya no podrá archivar páginas, hilos, perfiles o comentarios de Reddit, nada, excepto lo que se muestra en su página de inicio.

Un informe en El borde Significa que, en el futuro, el archivo solo podrá mostrar qué publicaciones y titulares de noticias eran populares en un día determinado. Anteriormente, Wayback Machine pudo archivar cada página, documentando todo lo que se publicó en la “página principal de Web”, ya que Reddit se proclama a sí mismo.

Reddit no dijo qué compañías de IA estaban usando la máquina Wayback para evitar sus prohibiciones sobre ellos raspando su contenido. Un portavoz de la compañía le dijo a The Verge que “se ha dado cuenta de los casos en que las compañías de IA violan las políticas de plataformas … y raspan los datos de la máquina Wayback”.

La compañía parece pensar que el archivo de Web debería tomar medidas para evitar este raspado, por lo que hay esperanza de que la decisión no sea permanente. Sin embargo, el informe también destaca una preocupación por parte de Reddit que Wayback Machine tiene una tendencia a archivar las publicaciones y comentarios del usuario que luego se eliminan, diciendo que esto es problemático para la privacidad del usuario.

“Hasta que puedan defender su sitio y cumplir con las políticas de la plataforma, estamos limitando parte de su acceso a los datos de Reddit para proteger a los redditores”, dijo la compañía.

Aunque Reddit plantea el problema de la privacidad del usuario, es possible que su principal motivación para bloquear los raspadores sea el dinero. Las compañías de IA tienen expresamente que se rastree su sitio internet, a menos que estén dispuestos a pagar para acceder a esos datos. Varias compañías han tomado Reddit en esa oferta, especialmente Google LLC y OpenAI.

Reddit nunca ha revelado cuánto vale su trato con OpenAi, pero el acuerdo con Google es. vale alrededor de $ 60 millones. Reddit también ha declarado anteriormente que espera generar hasta $ 200 millones a partir de dichos acuerdos de licencia en los próximos tres años.

Una compañía que no parece preparada para pagar es el PBC antrópico. En junio, Reddit presentó una demanda en su contra, diciendo que continuaba raspando su contenido incluso después de que afirmó que ya no lo hacía.

El archivo de Web no es la primera organización en ser bloqueada por Reddit sobre las preocupaciones de raspado. En junio de 2024, la firma de redes sociales dijo que había bloqueado los motores de búsqueda más pequeños de Microsoft Corp., como Duckduckgo, Mojeek y Qwant, para evitar que su contenido se raspe a través de sus archivos.

No está claro de inmediato si el archivo de Web intentará tomar medidas para evitar que sus archivos se raspen para que pueda levantar las restricciones de Reddit. En un comunicado, el director de Wayback Machine, Mark Graham, dijo que su equipo se dedica a “discusiones continuas sobre este asunto”.

Imagen: Siliconangle/Microsoft Designer

Apoye nuestra misión de mantener el contenido abierto y gratuito comprometiéndose con la comunidad de Thecube. Únase a la pink de Alumni Belief de Thecubedonde los líderes tecnológicos se conectan, comparten inteligencia y crean oportunidades.

  • 15m+ movies de espectadores de thecubeimpulsando conversaciones a través de IA, nubes, ciberseguridad y más
  • 11.4k+ alumnos de thecube -Conéctese con más de 11,400 líderes tecnológicos y empresariales que dan forma al futuro a través de una pink única basada en confianza.

Acerca de Siliconangle Media

Siliconangle Media es un líder reconocido en innovación de medios digitales, uniendo tecnología innovadora, concepts estratégicas y compromiso de audiencia en tiempo actual. Como la empresa matriz de Siliconangle, red de thecube, Investigación de THECUBE, Cube365, THECUBE AI y los superstudios de TheCube, con ubicaciones emblemáticas en Silicon Valley y la Bolsa de Valores de Nueva York, Siliconangle Media opera en la intersección de medios, tecnología e IA.

Fundada por los visionarios tecnológicos John Furrier y Dave Vellante, Siliconangle Media ha construido un ecosistema dinámico de marcas de medios digitales líderes en la industria que alcanzan más de 15 millones de profesionales de la tecnología de élite. Nuestra nueva nube de video de IA de THECUBE está abriendo firme en la interacción de la audiencia, aprovechando la pink neuronal de thecubeai.com para ayudar a las empresas de tecnología a tomar decisiones basadas en datos y mantenerse a la vanguardia de las conversaciones de la industria.

fuente