Perplexity: El buscador AI que desafía las normas de la web

Perplexity, la startup respaldada por Jeff Bezos que busca cambiar la forma en que utilizamos Internet, podría estar rompiendo sus propias reglas para lograrlo. Según un informe del desarrollador Robb Knight, confirmado por Wired, la compañía parece ignorar un estándar web ampliamente aceptado, el Protocolo de Exclusión de Robots. Perplexity está rastreando partes de la web que los operadores no desean que sean accedidas por bots, a pesar de que los propietarios de los sitios han bloqueado el acceso en sus archivos “robots.txt”.

Perplexity es un servicio que resume artículos en la web, prometiendo ofrecer “respuestas confiables” sin necesidad de hacer clic en enlaces adicionales. Sin embargo, Wired y Knight descubrieron que Perplexity utiliza una dirección IP no listada para evitar los bloqueos de los archivos “robots.txt” y así poder rastrear los sitios web. Aunque Wired bloqueó a Perplexity en su sitio web a principios de 2024, este motor de búsqueda AI todavía es capaz de resumir los artículos en detalle.

A pesar de todo esto, Perplexity afirma respetar el Protocolo de Exclusión de Robots en la documentación de su sitio web. El CEO de Perplexity, Aravind Srinivas, afirmó que los informes tenían una “profunda y fundamental malinterpretación de cómo funciona Perplexity y la Internet”, pero no refutó directamente los hallazgos. Perplexity enfrenta amenazas legales adicionales por infringir derechos de autor, ya que se le acusa de utilizar contenido de Forbes sin atribución adecuada.

El producto de Perplexity, aunque útil, desvía el tráfico en Internet. Google también indexa páginas web y ofrece resúmenes generados por IA, pero dirige directamente el tráfico hacia las páginas web de origen. En cambio, Perplexity crea artículos detallados generados por IA que evitan que los usuarios hagan clic en los sitios web, lo que afecta el modelo de negocio de los medios digitales.

OpenAI ha establecido alianzas con empresas de medios para abordar este problema, pagándoles por adelantado para obtener licencias de contenido. Perplexity también está trabajando en asociaciones similares, pero en lugar de pagar una tarifa plana, Perplexity busca compartir los ingresos generados. Sin embargo, estas asociaciones aún no se han concretado, por lo que, por ahora, Perplexity parece estar pasando por alto las barreras de pago y rastreando sitios web para obtener la información necesaria para alimentar sus respuestas generadas por IA.

Se informa que Perplexity, respaldada por Jeff Bezos, está rompiendo las reglas del Protocolo de Exclusión de Robots al rastrear partes de la web bloqueadas en los archivos “robots.txt” de los sitios web. Aunque Wired bloqueó a Perplexity en su sitio web, el motor de búsqueda AI aún puede resumir artículos en detalle. Se acusa a Perplexity de infringir derechos de autor al utilizar contenido de Forbes sin atribución adecuada. El producto de Perplexity desvía el tráfico en Internet al generar artículos generados por IA que evitan que los usuarios visiten los sitios web. OpenAI ha establecido alianzas con empresas de medios para abordar este problema, mientras que Perplexity busca compartir ingresos en lugar de pagar una tarifa plana a través de asociaciones similares, pero aún no se han concretado. Por ahora, Perplexity parece estar rastreando sitios web sin permiso para obtener la información necesaria.

Definiciones:
– Protocolo de Exclusión de Robots: Es un estándar web que permite a los propietarios de los sitios web indicar a los bots qué partes de su sitio deben ser rastreadas y cuáles no.
– AI (Inteligencia Artificial): Tecnología que permite a las máquinas realizar tareas que normalmente requieren de la inteligencia humana.

Enlaces relacionados:
1. Wired
2. Forbes
3. OpenAI