"¡Miente!" como "prompt"

Leí hace un tiempo unas declaraciones de uno de esos ideólogos de internet en el que venía a decir que recibía muchas comunicaciones (correos electrónicos, etc.) obviamente redactados por LLMs y que no le interesaba tanto el texto propiamente como el propmt a partir del cual se había generado. El prompt es, efectivamente, mucho más informativo —en particular de la intención del mensaje— que el mismo mensaje.

El problema es que el prompt no es público, no es explícito. Hay gente que, a fuerza de paciencia e ingenio, consigue exfiltrar los prompts de algunos LLMs. A veces, sin embargo, los prompts se publican, frecuentemente por error o fallos de cálculo.

Hay un vídeo muy comentado de una charla de Pablo Simón (comentada y enlazada aquí) en la que sostiene esto:

Yo soy enormemente partidario de mentir. MEEENTID. Mentid, decid que la Unión Europea les puede dar más becas, aunque no tenga competencias sobre esto más allá de los fondos Next Generation o de los Erasmus. ¡Da lo mismo, da lo mismo! Incluso jugad con la polarización (…) Hay que jugar sucio. Y lo digo así de claro, hay que jugar sucio, porque los malos juegan sucio.

Es todo un prompt exfiltrado mucho más informativo que cualquier otra cosa que uno oiga decir a Pablo Simón (y, por extensión y analogía, a mucha otra gente, tanto de su cuerda como de la contraria).