OpenAI implementa un rastreador web para reforzar las capacidades de GPT-5

monitor 1307227 1280

OpenAI, ha anunciado la implementación de una herramienta de rastreo web llamada “GPTBot”, cuyo objetivo es reforzar las capacidades de los futuros modelos GPT.

La compañía dice que los datos recopilados a través de GPTBot podrían mejorar la precisión del modelo y ampliar sus capacidades, lo que marca un paso significativo en la evolución de los modelos de lenguaje impulsados por IA.

GPTBot de OpenAI tendrá un propósito distinto al de los rastreadores web tradicionales, que se utilizan para indexar el contenido de Internet. En cambio, GPTBot se centrará en recopilar datos disponibles públicamente, evitando cuidadosamente fuentes que involucren muros de pago, recopilación de datos personales o contenido que contravenga las políticas de OpenAI.

Los propietarios de sitios web tienen la capacidad de evitar que GPTBot rastree sus sitios simplemente implementando un comando “no permitir” dentro de un archivo de servidor estándar. Esto les otorga control sobre qué partes de su contenido son accesibles para el rastreador web.

El anuncio de OpenAI sigue de cerca la presentación por parte de la compañía de una solicitud de marca registrada para “GPT-5”, que se espera que suceda al modelo actual GPT-4.

La presentación, realizada ante la Oficina de Patentes y Marcas de los Estados Unidos el 18 de julio, abarca el uso de “GPT-5” en voz y texto humanos basados ​​en IA, conversión de audio a texto, reconocimiento de voz y síntesis de voz.

Sin embargo, si bien la solicitud de marca GPT-5 ha generado entusiasmo entre los entusiastas de la IA, el director ejecutivo de OpenAI, Sam Altman, advirtió contra las expectativas prematuras. Altman reveló que la empresa aún está lejos de iniciar la capacitación GPT-5, ya que es necesario realizar extensas auditorías de seguridad antes de embarcarse en el proceso.

Los esfuerzos recientes de OpenAI no han estado exentos de controversia. Han surgido preocupaciones sobre las prácticas de recopilación de datos de la empresa, particularmente en torno a cuestiones de derechos de autor y consentimiento.

En junio, el regulador de privacidad de Japón emitió una advertencia a OpenAI sobre la recopilación de datos no autorizada. A principios de este año, Italia prohibió temporalmente el uso de ChatGPT debido a supuestas violaciones de las leyes de privacidad de la Unión Europea.

OpenAI y Microsoft también enfrentan actualmente una demanda colectiva presentada por 16 demandantes que afirman que se accedió a información privada de las interacciones de los usuarios de ChatGPT sin el consentimiento adecuado. Las empresas también se han visto afectadas por una demanda por GitHub Copilot, y los demandantes alegan que la herramienta de generación de código infringió los derechos de los desarrolladores al eliminar su código sin proporcionar la debida atribución.

Si estas acusaciones resultan ciertas, tanto OpenAI como Microsoft podrían ser encontrados en violación de la Ley de Abuso y Fraude Informático, un precedente legal relevante para los casos de web scraping.

A medida que OpenAI continúa superando los límites de la tecnología de IA, debe afrontar estos desafíos para garantizar un desarrollo responsable y ético en el panorama de la IA.

Análisis

La implementación de GPTBot por parte de OpenAI es un movimiento importante y audaz que podría tener un impacto significativo en el desarrollo de la IA. Si el rastreador web es capaz de recopilar datos suficientes y de alta calidad, podría ayudar a mejorar significativamente la precisión y las capacidades de los modelos GPT futuros.

Sin embargo, es importante que OpenAI aborde las preocupaciones sobre sus prácticas de recopilación de datos. La compañía debe garantizar que GPTBot cumpla con todas las leyes y regulaciones aplicables, y que se proteja la privacidad de los usuarios.

Si OpenAI puede superar estos desafíos, GPT-5 podría tener el potencial de revolucionar la forma en que interactuamos con la tecnología.

Loading

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)
Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para mostrarte publicidad relacionada con sus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos.
Privacidad