Por qué la escritura con IA de un solo intento suena a IA
El cuarenta por ciento de los mensajes laborales que la gente envía a ChatGPT son sobre escritura. Esa cifra proviene del estudio conjunto de OpenAI y NBER publicado en septiembre de 2025, que analizó una muestra del tráfico de consumidores de ChatGPT preservando la privacidad. El mismo paper reveló algo más interesante. De esos mensajes de escritura, aproximadamente dos tercios eran personas modificando texto que ya tenían, no pidiéndole al modelo que generara algo desde una página en blanco.
Esa proporción es la verdad silenciosa de cómo funciona realmente la escritura con IA. La mayoría de los usuarios ya han aprendido, mediante un doloroso ensayo y error, que pedirle a un chatbot que "escriba un ensayo de 2.000 palabras sobre X" produce algo que se lee como un ensayo de 2.000 palabras sobre X. Genérico. Hinchado. Confiadamente equivocado en los detalles. Los borradores siempre son gramaticalmente limpios y casi siempre olvidables.
La razón es estructural, no mágica. La escritura de formato largo no es una sola tarea. Son al menos cinco tareas: descubrir qué quieres decir realmente, decidir el orden en que decirlo, encontrar la voz para decirlo, poner a prueba si se sostiene, y terminar la prosa. Cuando aplastas las cinco en un único prompt, el modelo lo promedia todo. Audiencia promedio. Argumento promedio. Oraciones promedio. Voz promedio. La salida es la mediana de cada ensayo sobre el tema que alguna vez terminó en datos de entrenamiento.
Esto no es un problema de ingeniería de prompts que puedas resolver con un prompt más largo. Es un problema de flujo de trabajo. La solución es descomponer el trabajo en las etapas que siempre fueron, y usar la IA para aquello en lo que es genuinamente buena dentro de cada etapa. Ese es el flujo que describe este artículo. Los nombres son míos. El patrón, una vez que lo ves, parecerá obvio. La mayoría de los buenos métodos lo hacen.
Visión general del flujo de 5 etapas
Aquí está todo el flujo en una página. Cinco etapas, cada una con un alcance reducido y un traspaso claro. En negrita en su primer uso porque las trataremos como los términos propios del método.
Brief → Skeleton (Esqueleto) → Voice (Voz) → Pressure-Test (Prueba de Presión) → Polish (Pulido)
| Etapa | Rol de la IA | Rol humano | Resultado |
|---|---|---|---|
| 1. Brief | Entrevistadora, hace preguntas aclaratorias | Decidir audiencia, argumento, criterios de éxito | Documento de brief de una página |
| 2. Skeleton | Generadora de esquemas contrastantes | Elegir la estructura que encaja con tu argumento | Esquema con encabezados y pulso de cada sección |
| 3. Voice | Analista de estilo que extrae reglas de muestras | Aportar de 3 a 5 muestras de tu mejor trabajo | Una lista de reglas de voz en lenguaje sencillo |
| 4. Pressure-Test | Editora hostil y escéptica | Decidir qué críticas atender | Borrador marcado con puntos débiles señalados |
| 5. Polish | Solo señaladora de patrones, sin reescribir | Hacer cada microedición a mano | Pieza terminada que sigue sonando a ti |
Dos cosas a notar en esta tabla. Primero, el rol de la IA cambia en cada etapa. No es la misma herramienta cinco veces. Es una colaboradora distinta en cada pase. Segundo, el rol humano se hace mayor hacia el final, no menor. La etapa Brief consiste sobre todo en decidir cosas. La etapa Polish (Pulido) eres tú por completo. La forma del trabajo es una pirámide invertida en la que la IA hace más al inicio y tú haces más al cierre.
Esto es lo opuesto a cómo la mayoría de la gente usa la IA para escribir, que es no hacer nada durante una hora, escribir un prompt largo y luego pasar veinte minutos editando ligeramente lo que regrese. Ese orden está al revés. El pensamiento más caro pertenece al frente, donde es barato rehacerlo, no al final, donde te has comprometido con un borrador que estuvo equivocado desde la segunda oración.
Etapa 1: Brief, el contexto que te niegas a saltar
El Brief es lo que casi nadie escribe y lo que casi todos necesitan. Es una página, escrita por ti, que el modelo lee antes de que se genere cualquier prosa. Sin él, cada etapa posterior es adivinanza.
Un Brief funcional tiene seis campos. Audiencia, en una oración con suficiente textura para que no sea "todos". Argumento central, en una oración, la versión que dirías en voz alta. Criterios de éxito, qué haría que esta pieza valiera la pena publicar. Frases prohibidas, los tics de la IA y las metáforas cansadas que no quieres ver. Referencias de voz, de tres a cinco piezas existentes (tuyas, o de escritores que admires, o ambas). Y restricciones, longitud y formato y cualquier punto innegociable.
Aquí está la plantilla que uso. Es sencilla, esa es la idea.
# Brief: [título provisional]
## Audiencia
Una oración que describa quién lee esto. Incluye su nivel de
conocimiento previo y qué vino a buscar.
## Argumento central
La única oración por la que existe toda la pieza. Si no puedes
escribirlo en una oración, la pieza no está lista.
## Criterios de éxito
- ¿Qué hace, comparte o cree distinto un lector?
- ¿Qué haría que esta pieza valga sus 14 minutos?
## Frases prohibidas
- "en el mundo acelerado de hoy"
- "vamos a sumergirnos"
- "revolucionario"
- (añade los tics de IA que personalmente odias)
## Referencias de voz
- [Enlace a una de tus piezas]
- [Enlace a una pieza de un escritor que admiras]
- [Una más, idealmente en un registro distinto]
## Restricciones
- Longitud: 2.500 palabras
- Tono: con opinión pero sin ser despectivo
- Debe incluir: una tabla, tres ejemplos concretos
Nota que el Brief no es un prompt. Es un documento de contexto. Esta es la misma idea que defendí extensamente en Context Engineering: The Skill That Replaces Prompt Engineering. Los briefs son activos de ingeniería de contexto. Están aguas arriba de cada prompt del resto del camino.
La etapa Brief es también donde decides si la IA debería ayudar siquiera. Algunas piezas, las que vienen de un lugar genuinamente tuyo y aún no articulado, empeoran con cualquier intervención del modelo antes de que tengas un borrador. El Brief es como descubres qué tipo de pieza es esta. Si no puedes escribir el argumento central en una oración, ningún modelo lo descubrirá por ti.
Si usas el resaltador web de Glasp como yo lo hago, la etapa Brief es también donde tus highlights guardados se convierten en material fuente. Saca cinco highlights que toquen el tema, pégalos en el Brief, y tendrás evidencia y citas listas para alimentar cada etapa posterior.
Etapa 2: Skeleton (Esqueleto), trabajando hacia atrás desde la conclusión
Una vez que el Brief existe, la etapa Skeleton es rápida y barata. El trabajo no es escribir prosa. El trabajo es producir de tres a cinco esquemas que defiendan el mismo punto en formas distintas, y luego elegir el que coincide con lo que realmente quieres decir.
La razón por la que esto supera a escribir prosa de inmediato es estructural. Los esquemas son baratos de tirar. Los borradores no. Si escribes 800 palabras antes de darte cuenta de que la estructura está mal, probablemente conservarás las 800 palabras de todos modos porque las escribiste. Eso es coste hundido vestido de compromiso. Los esquemas no activan ese sesgo porque no hay nada que perder.
El prompt que uso en esta etapa es corto.
Eres un generador de esquemas, no un escritor. Lee el Brief de
abajo. Luego produce tres esquemas contrastantes para esta pieza.
Cada esquema debe defender el mismo argumento central pero usar una
estrategia estructural distinta:
1. Cronológico / narrativo
2. Afirmación seguida de evidencia
3. Problema, mecanismo, implicación
Para cada esquema, dame:
- Encabezados de sección (de 4 a 6 secciones)
- Una oración que describa el pulso de cada sección
- Una nota sobre qué audiencia atiende mejor esta estructura
No escribas prosa. Solo esquemas.
[pega el Brief aquí]
Lo que recibes son tres esqueletos. Léelos con el Brief abierto. El correcto suele ser obvio en treinta segundos. A veces el esquema correcto es un híbrido de dos de ellos, y el modelo es una caja de resonancia útil para esa síntesis. A veces ninguno de los tres es correcto, lo que también es información. Suele significar que el Brief era vago.
Esta es también la etapa donde encuentro que ChatGPT supera ligeramente a Claude en variedad estructural pura. Claude tiende a dar tres esquemas que se sienten primos. GPT da tres que se sienten extraños. Para la etapa Skeleton, los extraños son útiles. El razonamiento completo sobre qué modelo encaja con qué tarea está en The AI Task and Model Matrix.
Etapa 3: Voice (Voz), por qué "escribe en mi estilo" no funciona
Esta es la etapa que decide si la pieza terminada suena como si la escribiera un humano. La mayoría usa el prompt equivocado aquí. El prompt equivocado es "escribe esto en mi estilo", porque el modelo no tiene idea de cuál es tu estilo, e incluso si has escrito cientos de piezas en su set de entrenamiento, lo que sabe sobre tu estilo está promediado con los estilos de cada escritor adyacente con el que aprendió a la vez que tú.
La solución son dos pasos. Primero, haz que el modelo extraiga reglas de estilo concretas a partir de muestras que tú elijas. Segundo, haz que escriba a esas reglas extraídas, no a "tu voz".
Aquí está el meta-prompt que hace la extracción.
Eres una analista de estilo, no una crítica. Voy a pegar tres piezas
de escritura abajo. Léelas las tres con cuidado y produce un perfil
de estilo de la voz del autor como una lista de reglas concretas y
falsables.
Para cada regla:
- Plantéala específicamente (no "usa oraciones cortas" sino
"60% de las oraciones tienen menos de 18 palabras")
- Da un ejemplo de las muestras
- Anota cuándo el autor rompe la regla (toda voz tiene excepciones)
Cubre al menos:
- Distribución de longitud de oraciones
- Longitud y ritmo de párrafos
- Patrones de elección de palabras (¿prefiere sustantivos concretos
o abstractos?)
- Verbos (activos o pasivos, fuertes o débiles)
- Uso de contracciones, fragmentos, listas
- Patrones de apertura y cierre
- Palabras y frases que el autor evita
No interpretes el contenido. Solo describe el estilo.
[pega muestra 1]
---
[pega muestra 2]
---
[pega muestra 3]
Lo que regresa es una lista de quince a veinte reglas. Algunas estarán mal. Algunas serán obvias. Unas pocas serán cosas que no sabías que hacías. Lee la lista, borra las reglas que estén mal, afila las que sean vagas, y ahora tienes un documento de estilo que puedes entregar a cualquier prompt posterior como restricción.
Esto funciona porque el modelo es mucho mejor describiendo patrones que generando desde una sensación que no tiene. Cuando pides "tu voz", estás pidiendo una sensación. Cuando le pides escribir a quince reglas específicas, estás pidiendo emparejamiento de patrones. El emparejamiento de patrones es lo que estos sistemas hacen bien.
La selección de muestras importa. Usa de tres a cinco piezas de tu mejor escritura sobre temas relacionados, no una mezcla aleatoria. Si la nueva pieza tiene opinión, no le des tus guías neutrales tipo cómo-hacer. El perfil de voz promedia lo que sea que le des.
Etapa 4: Pressure-Test (Prueba de Presión), haz que la IA sea la escéptica
Para el final de la Etapa 3 tienes un borrador. Puede ser el borrador del modelo siguiendo tus reglas de voz, o tu propio borrador después de usar las reglas de voz como lista de auto-revisión. De cualquier forma, el borrador ahora necesita sobrevivir a un lector hostil. Esto es algo en lo que la IA es irracionalmente buena si lo pides correctamente.
El modo de fallo por defecto es un modelo complaciente. Tal cual vienen, tanto Claude como ChatGPT te dirán que tu borrador es genial con unas pocas sugerencias menores. Están afinados con RLHF para ser útiles, y decir "este argumento tiene un agujero por el que podrías meter un camión" no es el camino de menor fricción. Hay que sacarlos de la complacencia con instrucciones.
Aquí están los seis prompts que ejecuto en esta etapa. Los corro uno por uno, en hilos separados, porque mezclarlos diluye cada uno.
1. "¿Cuál es el contraargumento más fuerte a la afirmación central
de esta pieza? Plantéalo en su mejor versión. No respondas todavía,
solo expón la versión más fuerte de la opinión opuesta."
2. "Eres una editora hostil de una revista conocida por recortar
despiadadamente. Marca cada oración que no se gana su lugar.
Cita la oración y explica por qué se va."
3. "¿Dónde en esta pieza estoy asumiendo que el lector ya está de
acuerdo conmigo? Cita las oraciones específicas donde doy por
sentado terreno común."
4. "¿Qué evidencia falta en esta pieza que un lector escéptico
exigiría? Lista afirmaciones específicas que necesitan una cita,
un número o un ejemplo que no he aportado."
5. "¿Dónde estoy enterrando lo más interesante? En concreto: ¿cuál es
la oración más interesante de esta pieza, y a qué profundidad
aparece? ¿Debería ir antes?"
6. "Imagina que han pasado 12 meses y este artículo ha envejecido mal.
¿Qué cambió sobre el tema que hizo que la pieza estuviera equivocada?
¿Qué párrafos específicos están más expuestos a ese futuro?"
Ejecútalos. Obtendrás una versión marcada de tu borrador de cada prompt. La mayoría de las críticas estarán mal o serán débiles, lo cual está bien. Solo necesitas que algunas aterricen. El prompt de editora hostil casi siempre encuentra tres o cuatro oraciones que deben morir. El prompt de "enterrar lo más interesante" casi siempre reordena algo útil.
Si tienes una biblioteca de Glasp activa, esta etapa es también donde la función de chat con IA sobre tus highlights se gana su sueldo. Preguntarle al chat "qué contraevidencia hay en mis propios highlights contra el argumento de este borrador" es una pregunta distinta a preguntarle a un modelo nuevo, y más honesta, porque la respuesta viene de fuentes que ya elegiste confiar.
Para más patrones de prompts en esta familia, ver Prompt Patterns for Thinking.
Etapa 5: Polish (Pulido), el pase final que la IA no debe hacer
Esta es la etapa donde la mayoría de los flujos arruinan todo lo que construyeron. La tentación es real. Tienes un borrador casi terminado. El modelo está ahí mismo. Un pase más para limpiarlo, suavizar los bordes, arreglar las oraciones torpes. Tomará tres minutos.
No lo hagas.
La razón es la misma por la que "escribe en mi estilo" no funciona. Un pase de pulido es la operación más sensible a la voz en la escritura. Es donde viven el ritmo, la elección de palabras y las pequeñas idiosincrasias que hacen que la prosa suene como una persona. Cuando le pides al modelo que pula, promedia esas microdecisiones. Recibes un borrador que es técnicamente más suave y se siente menos como tú. El lector no podrá nombrar qué cambió. Solo sentirá que algo está mal.
Lo que la IA debe hacer en la etapa Polish es señalar candidatos, no editar. Usa este prompt.
Eres una auditora de estilo, no una editora. Lee el borrador de abajo.
No reescribas nada. Produce una lista de:
- Cada oración de más de 25 palabras
- Cada párrafo que abre con la misma palabra que el párrafo anterior
- Cada nominalización donde un verbo sería más fuerte ("tomó una
decisión" vs "decidió")
- Cada verbo débil ("hay", "es", "esto es")
- Cada adverbio que podría cortarse
- Cada metáfora o cliché que se sienta genérico
Cita las oraciones ofensoras. No sugieras nada.
Recibirás una lista larga. Recórrela oración por oración y decide. La mayoría de las oraciones señaladas están bien. Algunas no. La decisión de cuál es cuál es tu voz. El acto de tomarla, cincuenta veces seguidas, es lo que produce un texto que alguien puede reconocer como tuyo desde el primer párrafo.
Verlyn Klinkenborg, en Several Short Sentences About Writing, tiene una línea en la que pienso constantemente: "The longer the sentence, the less it means." Eso no es literalmente cierto, pero la sensibilidad sí. Las oraciones largas se esconden. Las cortas se comprometen. La etapa Polish es donde te comprometes. Un modelo no puede comprometerse en tu nombre porque el compromiso es lo que no tiene.
Stephen King lo dice más rotundamente en On Writing: "Kill your darlings, kill your darlings, even when it breaks your egocentric little scribbler's heart, kill your darlings." Usa el modelo para encontrar los favoritos. Usa a ti mismo para matarlos.
Poniendo el flujo en una sola página
Aquí está la chuleta. Imprímela, pégala sobre tu monitor, consúltala durante la próxima pieza de formato largo que escribas.
| Etapa | Tiempo | Rol de la IA | Rol humano | Herramientas |
|---|---|---|---|---|
| 1. Brief | 30 a 45 min | Entrevistadora | Decidir audiencia, argumento, frases prohibidas | Documento Markdown, highlights de Glasp |
| 2. Skeleton | 15 a 30 min | Generadora de esquemas | Elegir el ajuste estructural | ChatGPT (variedad) |
| 3. Voice | 30 a 45 min | Extractora de reglas de estilo | Curar de 3 a 5 muestras | Claude (calidad de extracción) |
| 4. Pressure-Test | 30 a 45 min | Editora hostil | Decidir qué críticas atender | Claude, seis hilos separados |
| 5. Polish | 30 a 60 min | Solo señaladora de patrones | Cada microedición a mano | Tú, con café |
El tiempo total para una pieza de 2.500 palabras va de 2 a 4 horas. Compara eso con treinta minutos de prompt único, y las cuentas se ven mal hasta que comparas las salidas. La versión de un solo intento no llega a ningún lado porque nadie termina de leerla. La versión de cinco etapas sí se comparte.
Un ritmo útil si escribes con regularidad: mantén una colección de Glasp activa para el tema sobre el que estés rondando. Cuando los highlights crucen una masa crítica (aproximadamente cinco fuertes), abre un Brief y recorre el flujo. Los highlights se vuelven evidencia en la Etapa 1, material fuente en la Etapa 4, y contrapeso cuando el modelo se pone demasiado complaciente. La línea de producción funciona sola una vez que el hábito de resaltar está en su sitio.
Preguntas frecuentes {#frequently-asked-questions}
¿Funciona este flujo para correos o piezas cortas?
No. Cualquier cosa por debajo de unas 1.500 palabras no necesita cinco etapas. La sobrecarga se come el beneficio. Para un correo o una publicación corta, escribe el Brief en tu cabeza, sáltate el Skeleton y ve directo a redactar. El flujo está construido para piezas donde las decisiones estructurales importan más que las decisiones a nivel de oración, y las piezas cortas son lo opuesto.
¿Qué IA debería usar en cada etapa?
Honesta apreciación tras usar ambas extensamente. Claude tiende a ser más fuerte en Brief, extracción de Voice y Pressure-Test, sobre todo porque sigue instrucciones largas y estructuradas con más fiabilidad y es menos ansioso por agradar en la etapa Pressure-Test. ChatGPT tiende a ser más fuerte en Skeleton porque produce estructuras de esquema genuinamente más variadas. Cualquiera funciona para señalar en Polish ya que el prompt es mecánico. Evita Perplexity para cualquiera de estas etapas. Es una herramienta de investigación, no una compañera de escritura. La respuesta más larga está en The AI Task and Model Matrix.
¿Las herramientas de detección de IA marcarán la salida?
Si haces realmente la Etapa 5 a mano, los patrones personales sobreviven y las herramientas de detección tienen menos a lo que aferrarse. El paper Princeton GEO de KDD 2024 (Aggarwal et al.) estudió cómo los modelos de lenguaje citan y reproducen estilo. La conclusión relevante aquí es que la voz se parece más a una huella dactilar que a una receta. Los modelos entrenados con texto agregado tienen problemas para falsificar las microdecisiones de un escritor específico, que es exactamente por qué importa la etapa Polish. Dicho esto, si tu escritura es de alto riesgo (legal, académica, periodística), ningún flujo te garantiza pasar la detección. Usa la IA como andamiaje, no como escritora.
¿Cuánto tarda realmente este flujo?
De dos a cuatro horas para una publicación de 2.500 palabras. Compara con treinta minutos de prompt único más el tiempo que pasarías reescribiendo el mal borrador que recibiste, que suele ser otra hora, y la brecha se reduce. El intercambio no es realmente velocidad. El intercambio es si la pieza terminada vale la pena publicarse.
¿Puedo saltarme la etapa Brief si tengo prisa?
No. Saltarse el Brief es la forma más fiable de producir un borrador que se lee como IA. Cada otra etapa depende de que el Brief sea claro. Sin él, la etapa Skeleton te da esquemas para una pieza que no es la pieza que querías. La etapa Voice extrae reglas que se aplican al contenido equivocado. La etapa Pressure-Test critica el argumento equivocado. Si tienes diez minutos en total, gasta nueve en el Brief y uno en un único esqueleto, y terminarás más adelante que si gastaras diez minutos haciendo prompts desde cero.
Conclusión {#conclusion}
La razón por la que la escritura con IA de un solo intento falla no es que los modelos sean malos. La razón es que la escritura de formato largo son cinco trabajos, y pedirle a cualquier modelo que haga cinco trabajos en un solo intento produce el promedio de los cinco. Brief, Skeleton, Voice, Pressure-Test, Polish. Cada uno con un alcance reducido. Cada uno una colaboradora distinta. El rol humano crece hacia el final, donde vive la voz, en lugar de encogerse.
Si escribes lo suficiente como para que algo de esto importe, el flujo se paga solo en la primera pieza. Si escribes raramente, guarda este artículo y ábrelo la próxima vez que el tema se sienta demasiado grande para un solo prompt.
De cualquier forma: deja de pedirle al modelo que escriba el ensayo. Empieza a pedirle que te entreviste, que estructure contra ti, que extraiga voz de tus muestras, que ataque el borrador y que señale los patrones. Luego escribe la cosa. El modelo es la sala. Tú sigues siendo el escritor.