Muchos usuarios de ChatGPT notan que el modelo responde de forma amable y elogiosa incluso frente a ideas poco sólidas. Esto ocurre por su entrenamiento que prioriza ser útil, seguro y positivo. Tras discutirse el tema, circularon prompts que prometían volver al chatbot “brutalmente honesto”. Estas instrucciones buscan que la IA deje la adulación y señale errores, riesgos y fallos lógicos de manera directa.

Expertos explican que no existe un “filtro amable” oculto, pero sí un sesgo aprendido durante el proceso RLHF. Al pedir más crítica mediante prompts específicos, el usuario contrarresta ese sesgo y obtiene análisis más rigurosos.

¿Qué son los prompts de “honestidad brutal” y por qué se viralizan?

Los prompts surgieron como respuesta al fenómeno conocido como sycophancy, donde ChatGPT tiende a validar al usuario. La comunidad tecnológica generó instrucciones que piden críticas claras, cero halagos y detección de fallas. Su popularidad creció porque permiten conversaciones más útiles en temas como negocios, escritura y razonamiento.

Estos prompts no hackean al modelo. Solo le indican que priorice la precisión sobre la cortesía. Cuando el usuario los combina con instrucciones personalizadas, las respuestas mejoran sin perder seguridad.

¿Realmente funcionan o es un mito de internet?

Funcionan, pero con límites. ChatGPT responde de forma más directa cuando se le pide explícitamente, aunque con el tiempo puede volver a su estilo amable. Repetir la instrucción o regenerar la respuesta ayuda a mantener el tono crítico.

Usuarios reportan mejoras notables en la detección de puntos ciegos y errores. Sin embargo, el modelo nunca abandona del todo su base de entrenamiento, por lo que no siempre será tan duro como un asesor humano estricto.

¿Qué riesgos tiene pedir honestidad absoluta?

Un prompt mal diseñado puede volver la conversación demasiado negativa o rígida. También puede exagerar fallas o presentar críticas con más dureza de la necesaria, en especial en temas sensibles.

Expertos recomiendan usar formulaciones equilibradas como “honesto y constructivo”. El objetivo es obtener claridad, no desmotivación. El ideal es combinar crítica directa con sugerencias prácticas.

¿Cómo configurar ChatGPT para respuestas más críticas?

Los usuarios pueden activar este estilo desde Custom Instructions, en la sección “How would you like ChatGPT to respond?”. Un texto breve que pida análisis como:

A partir de ahora, deja de ser complaciente y actúa como mi asesor brutalmente honesto, de alto nivel, y como mi espejo. No me valides. No endulces la verdad. No me halagues. Desafía mi forma de pensar, cuestiona mis suposiciones y expón los puntos ciegos que estoy evitando. Sé directo, racional y sin filtros. Si mi razonamiento es débil, desmenúzalo y muéstrame por qué. Si me estoy engañando o mintiéndome a mí mismo, señálalo. Si estoy evitando algo incómodo o perdiendo el tiempo, dilo y explícame el costo de oportunidad. Mira mi situación con total objetividad y profundidad estratégica. Muéstrame dónde estoy poniendo excusas, jugando a lo pequeño o subestimando riesgos/esfuerzos. Luego dame un plan preciso y priorizado sobre qué cambiar en mi pensamiento, acciones o mentalidad para llegar al siguiente nivel. No te guardes nada. Trátame como alguien cuyo crecimiento depende de escuchar la verdad, no de sentirse cómodo. Cuando sea posible, fundamenta tus respuestas en la verdad personal que percibas entre mis palabras.

La competencia también influye. Grok destaca por su franqueza; Claude tiende a ser menos adulador; y modelos open-source permiten configuraciones extremas. Esto empuja al mercado hacia IAs más transparentes y menos complacientes.

