# Reddit vs. Perplexity y SerpApi: el pulso por los datos de Google que puede redefinir el SEO (y los agentes de IA)

_Publicado: 2025-10-23 · https://negociario.com/reddit-vs-perplexity_

> Reddit ha presentado una demanda en EE. UU. contra Perplexity y SerpApi, entre otros, por la presunta extracción a escala de información procedente de Google Search y de contenidos de Reddit. El caso no es un choque más entre plataformas: apunta al corazón del negocio de datos de búsqueda y al sumin...

---

Reddit ha presentado una demanda en EE. UU. contra **Perplexity** y **SerpApi**, entre otros, por la presunta extracción a escala de información procedente de *Google Search* y de contenidos de Reddit. El caso no es un choque más entre plataformas: apunta al corazón del negocio de **datos de búsqueda** y al suministro que nutre a herramientas SEO y a asistentes de inteligencia artificial. Según agencias y medios, Reddit alega que los demandados habrían *eludido controles* y obtenido contenido sin autorización; Perplexity niega actuar de forma ilícita y ha publicado su postura. 

**
“En la economía de la atención, el valor no está solo en ver los datos, sino en cómo, cuándo y con qué permisos se pueden *recolectar* y *revender*.”

## Qué dice cada parte (versión corta)

### Lo que afirma Reddit

- Extracción masiva** de información (“industrial-scale scraping”) de resultados de Google y de hilos de Reddit con fines comerciales. 

- **Elusión** de medidas técnicas y uso de intermediarios para obtener datos sin licencia. 

### Lo que responden los demandados

- **Perplexity** sostiene que actúa “de forma justa” y rechaza la narrativa de Reddit; invita a separar *indexación* de *entrenamiento* y apunta a que cita fuentes y busca acuerdos con editores. 

- **SerpApi** se define como un servicio para obtener SERP en tiempo real y publicita explícitamente que *gestiona proxies y resuelve CAPTCHAs* para entregar datos estructurados. (Este posicionamiento comercial está en el centro del debate). 

## El perímetro legal (por qué no es un matiz menor)

*

### Punto de apoyo: términos y políticas de Google

- Las **políticas de spam** de Google prohíben el tráfico automatizado* a Search sin permiso expreso, incluyendo scraping para rank checking u otros usos. 

- Esta lógica aparece, además, reflejada históricamente en sus **Términos de Servicio** (archivos) con cláusulas de “no automated querying”. 

Traducción para negocio: que una página sea pública no implica que su *recolección sistemática* con fines comerciales esté permitida. La autorización (y, cada vez más, la **licencia**) se vuelve pieza crítica del modelo de datos.

## Por qué este caso importa al SEO y a la IA aplicada

### Impactos probables si el entorno se endurece

<table class="has-fixed-layout"><thead><tr><th>Actor</th><th>Qué puede cambiar</th><th>Respuesta práctica</th></tr></thead><tbody><tr><td>Equipos SEO</td><td>Menos acceso a SERP “en bruto”, mayor coste/licencia; latencias superiores</td><td>Reforzar *first-party data*, Search Console, paneles propios y experimentación on-site. Consulta también sobre [Black Hat GEO](https://negociario.com/el-black-hat-geo-es-real)</td></tr><tr><td>Herramientas y vendors</td><td>Necesidad de acuerdos formales y auditoría del origen de datos</td><td>Transitar a **APIs/licencias**, *clean rooms* y enriquecimiento con señales de cliente</td></tr><tr><td>Agentes/IA</td><td>Menos “tiempo real” universal; dependencia de partners de datos</td><td>Diseños *hybrid*: conocimiento propio + fuentes con permiso + cachés verificables</td></tr></tbody></table>

## Contexto: una escalada que viene de lejos

*

- Reddit ya había emprendido acciones previas por uso no autorizado de su corpus y, en paralelo, ha cerrado acuerdos de licencia con grandes actores. El patrón apunta a **monetizar de forma directa** su base de datos y a marcar límites al uso de terceros. 

- En los últimos meses, varios medios han cuestionado el uso de sus contenidos por parte de motores de respuesta basados en IA, y Perplexity ha aparecido en ese debate público. (Antecedente útil para entender la sensibilidad del caso). 

## Lo que puedes hacer hoy (checklist ejecutivo)

### 1) Gobernanza de datos

- Exige a tus proveedores **origen**, **licencia** y **límite de uso** de los datos de SERP.

- Documenta dependencias de reporting que quedarían afectadas por cambios de acceso.

### 2) Resiliencia de medición

- Dobla la apuesta por **Search Console**, analítica con eventos server-side y tests controlados (títulos, esquemas, UX de resultados).

- Diseña páginas que conviertan mejor con el tráfico que ya tienes (estructura, copy*, velocidad). Si necesitas fortalecer tu base digital, considera una mejora de [diseño web](https://ilernetwork.com/diseno-web-corporativa/) enfocada a conversión.

### 3) Estrategia con IA

- Evita automatizaciones que puedan vulnerar TOS o medidas técnicas. Lee nuestro análisis sobre la [UE investigando a Google por uso de contenido en IA](https://negociario.com/la-union-europea-investiga-a-google-por-el-uso-de-contenido-de-editores-en-sus-respuestas-de-ia) para más contexto. También evita: el riesgo legal/operativo supera el beneficio táctico.

- Cuando uses asistentes, prioriza **fuentes citables** y datasets con permiso; Perplexity, por ejemplo, enfatiza respuestas con citas y oferta para empresas, pero el cumplimiento real depende del *stack* y de tus acuerdos. 

## Preguntas rápidas y respuestas breves

### ¿Esto significa que las herramientas SEO “desaparecen”?

No. Significa que el acceso a datos de búsqueda tenderá a pasar por **licencias** y APIs oficiales o por proveedores que acrediten permisos. Revisa contratos y SLAs.

### ¿El scraping es siempre ilegal?

No en todos los contextos. Depende de jurisdicción, términos, medidas técnicas y derechos sobre bases de datos. Lo que el caso subraya es que el “cómo” y el “para qué” importan tanto como el “de dónde”. 

### ¿Qué papel juega SerpApi aquí?

Se posiciona como API de SERP *real-time* que gestiona proxies y CAPTCHAs para devolver resultados estructurados; justo ese modelo está bajo escrutinio cuando el origen son páginas con TOS restrictivos. 

## Fuentes principales

- Demanda y cobertura de agencia: [Reuters](https://www.reuters.com/world/reddit-sues-perplexity-scraping-data-train-ai-system-2025-10-22/), [AP](https://apnews.com/article/reddit-perplexity-ai-copyright-scraping-lawsuit-3ad8968550dd7e11bcd285a74fb6e2ff). 

- Políticas aplicables: [Google Search — Spam policies](https://developers.google.com/search/docs/essentials/spam-policies). 

- Postura pública de Perplexity: [comunicado en Reddit](https://www.reddit.com/r/perplexity_ai/comments/1odpofv/our_response_to_reddits_lawsuit/) y [página “About”](https://www.perplexity.ai/). 

- Descripción del servicio de SerpApi: [sitio oficial](https://serpapi.com/). 

Si tu captación depende de orgánico, este contexto es una oportunidad para reforzar lo que controlas: [arquitectura y diseño web orientados a conversión](https://ilernetwork.com/diseno-web-corporativa/), y una medición que no se rompa con cambios de terceros. Si quieres ordenar fuentes, dashboards y flujos de contenido, aquí tienes una vía de [presencia digital bien planteada](https://ilernetwork.com/servicios/).
Actor	Qué puede cambiar	Respuesta práctica
Equipos SEO	Menos acceso a SERP “en bruto”, mayor coste/licencia; latencias superiores	Reforzar first-party data, Search Console, paneles propios y experimentación on-site. Consulta también sobre [Black Hat GEO](https://negociario.com/el-black-hat-geo-es-real)
Herramientas y vendors	Necesidad de acuerdos formales y auditoría del origen de datos	Transitar a APIs/licencias, clean rooms y enriquecimiento con señales de cliente
Agentes/IA	Menos “tiempo real” universal; dependencia de partners de datos	Diseños hybrid: conocimiento propio + fuentes con permiso + cachés verificables