ChatGPT

Un usuario engaña a ChatGPT en Bing para obtener documentos internos de Microsoft

El usuario es un estudiante de la Universidad de Stanford. Consiguió documentos internos de Microsoft mediante un ataque de 'inyección de prompt' consiguiendo engañar a la IA de ChatGPT.

Imagen de archivo de un edificio de Microsoft

Imagen de archivo de un edificio de MicrosoftPixabay

Publicidad

La llegada de ChatGPT en 2022 ha hecho mella en el sector de la Inteligencia Artificial (IA). Microsoft lleva la delantera en la implementación de este tipo de herramientas tras integrar ChatGPT en Bing Search con el objetivo de ofrecer al usuario un chat interactivo que ayuda al internauta.

Aunque para acceder a este nuevo diseño de Bing hay que entrar en una lista de espera, son muchos los usuarios que han podido probarlo o para desvelar secretos de Microsoft. Es el caso de un usuario, que ha mostrado cómo ha engañado a la IA para obtener documentos internos de Bing Search.

Sidney, más concretamente ChatGPT, ha sido víctima de un ataque de 'inyección de prompt'. Este tipo de ataques consisten en engañar a una IA introduciendo un input malicioso o contradictorio con el objetivo de realizar una tarea que no forma parte del objetivo inicial y romper las reglas del motor conversacional.

La persona en cuestión que obtuvo los documentos fue Kevin Liu, un estudiante de la Universidad de Stanford. El joven consiguió un documento interno con todas las directrices que Microsoft le dio a la IA para dar respuestas a los usuarios. Liu ha compartido la conversación con Sidney en Twitter.

La información que la IA soltaba tenía relación con aspectos sobre la instrucción recibida para la introducción, su nombre en clave, el número de idiomas que admite y otras instrucciones sobre su comportamiento. La información fue confirmada por otro estudiante, que se hacía pasar por desarrollador del OpenAI para engañar a la IA.

¿Qué es ChatGPT?

ChatGPT se trata de un sistema de chat con IA. Esta nueva tecnología es capaz de responder a cualquier cosa que le pidas, pues está entrenada para mantener conversaciones.

Es un sistema de chat basado en el modelo de lenguaje por Inteligencia Artificial GPT-3, desarrollado por la empresa OpenAI. Sus algoritmos son capaces de entender qué le estás preguntando y responderte de forma coherente.

Esta nueva herramienta puede elaborar textos con un número máximo de caracteres o palabras explicando sucesos o personajes. También puede explicarte un concepto, entre otras cosas. E incluso se le puede pedir líneas de código, que escriba poemas, chistes o canciones.

Publicidad

Usuario y contraseña

Filtradas 16.000 millones de contraseñas: el mayor hallazgo de credenciales de Google, Apple y Facebook

La mayor filtración de contraseñas conocida hasta la fecha ha dejado al descubierto más de 16.000 millones de credenciales, muchas vinculadas a cuentas de Google, Apple o Facebook

La mitad de los jóvenes ha sufrido discursos de odio en Internet en el último año

La mitad de los jóvenes ha sufrido discursos de odio en Internet en el último año

El 50,1 % de las personas jóvenes en España ha sido víctima de discursos de odio en internet en el último año y un 61,1 % ha tenido que bloquear perfiles por recibir insultos o amenazas. Son cifras dela Oficina del Parlamento Europeo y de Fad Juventud, que han lanzado juntos la campaña 'El odio marca'.