Reddit limita l’accés de la Wayback Machine per protegir dades i frenar l’ús no autoritzat en IA
Reddit ha restringit l’accés de la Wayback Machine de l’Internet Archive a gairebé tot el seu contingut, i l’Archive ha confirmat que està en converses amb Reddit després del bloqueig per abordar la situació. Segons Reddit, algunes empreses d’IA haurien evitat les polítiques de la plataforma rascant dades a través de còpies guardades a la Wayback Machine.
Punts clau:
- Què es bloqueja: la Wayback Machine només podrà rastrejar la **pàgina d’inici** de Reddit; ja no podrà arxivar **subreddits, fils de detalls, comentaris ni perfils**. Això redueix la preservació històrica a simples instantànies del que era més destacat cada dia.
- Motiu de Reddit: evitar que **empreses d’IA** utilitzin contingut de Reddit per entrenar models sense pagar llicències, aprofitant còpies de l’Archive per esquivar restriccions directes. Reddit destaca que hi ha hagut “instàncies” de violacions de polítiques a través del Wayback Machine.
- Context empresarial i legal: Reddit ha convertit el **llicenciament de dades** en una línia de negoci (acords multimilionaris amb OpenAI i Google) i ha intensificat accions contra l’scraping no autoritzat, incloent una demanda contra Anthropic. Altres plataformes (LinkedIn, Meta) també han reforçat mesures i litigis contra l’scraping, tot i que el debat legal sobre dades publicades en obert continua obert.
- Impacte públic: menys **transparència i memòria històrica** per a investigadors i la societat, en limitar-se l’arxiu de converses i contextos dins de Reddit.
Situació actual: l’Internet Archive diu que manté **converses en curs** amb Reddit després del bloqueig per explorar solucions, però, de moment, les noves restriccions ja limiten fortament l’arxivament de Reddit.
Font original: Veure article original