Cómo aprender un idioma con IA (2026)

La ciencia que la IA heredó: Krashen, el i+1 y el filtro afectivo

Antes de los chatbots, hubo una hipótesis. A principios de los años ochenta, el lingüista Stephen Krashen sostuvo que en realidad no aprendemos un idioma memorizando reglas. Lo adquirimos, de la misma manera silenciosa en que lo hacen los niños, al entender mensajes.

Su hipótesis del Input Comprensible, expuesta por completo en su libro de 1985 The Input Hypothesis, hace una afirmación específica: la adquisición ocurre cuando recibimos grandes cantidades de input que podemos entender en su mayor parte, situado apenas un paso más allá de nuestra capacidad actual. Krashen llamó a ese nivel "i+1", donde i es lo que uno sabe ahora y +1 es el material un poco más difícil que el cerebro se esfuerza por comprender.

De esto se desprenden dos cosas, y ambas importan para cómo debería usar la IA.

Primero, el cuello de botella nunca fue la información. Era la información comprensible en el nivel adecuado. Un artículo de noticias para nativos no es i+1 para un principiante: es ruido. Un libro infantil puede ser i menos 3 para un estudiante de nivel intermedio: es aburrido. Durante décadas, encontrar un suministro constante de material justo en el límite de uno significaba un tutor, un profesor o mucha suerte.

Segundo, la hipótesis del Filtro Afectivo de Krashen dice que el estrés, la ansiedad y la baja confianza bloquean físicamente la adquisición. El input con el que uno está demasiado avergonzado o nervioso para implicarse no se fija. Cualquiera que se haya quedado en blanco a mitad de una frase en una clase de francés del instituto conoce la sensación.

Conserve esas dos ideas. Una fuente a demanda de input adaptado al nivel y de baja ansiedad es exactamente lo que los estudiantes de idiomas han deseado durante cuarenta años. Ese es el hueco en el que entra la IA de 2026.

El input no basta: Swain y la Hipótesis del Output

La visión de Krashen centrada en el input fue influyente, y también fue cuestionada casi de inmediato. El mismo año en que apareció The Input Hypothesis, la lingüista aplicada Merrill Swain publicó su Hipótesis del Output (1985), basada en un hallazgo llamativo de los programas de inmersión en francés en Canadá.

Esos estudiantes recibieron años de input rico y comprensible. Su comprensión auditiva y lectora era excelente. Sin embargo, su expresión oral y escrita seguía siendo obstinadamente deficiente. El argumento de Swain: también hay que producir lengua. El acto de formar una frase obliga a notar los huecos en lo que uno realmente sabe, a poner a prueba hipótesis sobre la gramática y a pasar del reconocimiento vago al control preciso.

Así que la síntesis honesta, la que ha adoptado la mayor parte del campo, se ve así:

El input construye comprensión y alimenta el modelo subconsciente que uno tiene del idioma. Sobre todo lectura y escucha.
El output construye producción, fluidez y la capacidad de recuperar palabras bajo presión. Habla y escritura.
El feedback corrige los errores antes de que se fosilicen en hábitos permanentes.

Durante casi toda la historia, conseguir los tres salía caro. El input se podía rebuscar. El output y el feedback requerían a una persona paciente que hablara con uno y corrigiera con suavidad sus errores durante horas. Esa persona era el recurso escaso. Téngalo presente mientras vemos qué cambia la IA.

Lo que la IA hace realmente bien en 2026

Si dejamos a un lado el marketing, la contribución de la IA al aprendizaje de idiomas se reduce a unas pocas capacidades concretas, cada una de las cuales se corresponde con la ciencia anterior.

Input comprensible a demanda. Pídale a un modelo que vuelva a contar una noticia "para un principiante, usando solo el presente y las 500 palabras más frecuentes" y obtendrá input i+1 instantáneo sobre un tema que le importa. La misma herramienta puede tomar un artículo real que es un poco demasiado difícil y simplificarlo un nivel, que es la definición literal de bajar algo a i+1.

Un compañero de conversación con paciencia infinita. El modo de voz le permite hablar, trastabillar, repetir y preguntar "¿cómo lo diría un nativo?" sin el reloj social de una persona corriendo. Aquí es donde rinde el punto del Filtro Afectivo: menos ansiedad significa más output, y más output es lo que Swain decía que le faltaba.

Feedback instantáneo y específico. Pegue lo que escribió y pida correcciones más una explicación de una línea de cada una. Eso estrecha el ciclo output-feedback de "la lección de la semana que viene" a "ahora mismo".

Traducción y explicación al pasar el cursor. Leer un texto en otro idioma y glosar las palabras desconocidas in situ lo mantiene dentro del input en lugar de saltar a un diccionario y perder el hilo.

Repetición espaciada que de verdad se programa sola. El vocabulario que uno extrae hay que repasarlo, y la manera respaldada por la investigación de hacerlo es FSRS (el Free Spaced Repetition Scheduler), el algoritmo moderno ya integrado en Anki. Predice cuándo está a punto de olvidar una tarjeta y se la muestra entonces, lo que es mucho más eficiente que releer.

Así es como encajan las piezas frente a la teoría subyacente:

Necesidad de aprendizaje	La ciencia detrás	Papel de la herramienta de IA en el sistema
Input comprensible en i+1	Krashen 1985	Simplificación, recuentos por nivel, lectura glosada
Práctica de producción (output)	Swain 1985	Conversación de voz, consignas de escritura, juego de roles
Corrección de errores	Ciclo de feedback de la Hipótesis del Output	Corrección instantánea con explicaciones breves
Bajar el Filtro Afectivo	Filtro Afectivo de Krashen	Práctica privada, repetible y sin juicios
Retención de vocabulario nuevo	Efecto de espaciamiento, programación FSRS	Tarjetas autogeneradas, programación SRS

El hilo conductor: la IA no es una nueva teoría del aprendizaje. Es un mecanismo de entrega para una teoría antigua y bien fundamentada.

El sistema semanal: input, output, repaso

Las listas de capacidades no le enseñan un idioma a nadie. Lo hace una rutina. Aquí tiene un sistema semanal concreto que respeta la estructura input-output-repaso y que cabe en aproximadamente una hora al día. Ajuste los minutos a su vida; las proporciones importan más que los totales.

Input diario (20-30 min). Lea o escuche algo ligeramente por encima de su nivel sobre un tema que consumiría en su lengua materna de todos modos. Cocina, fútbol, el resumen de una serie, lo que sea que lo mantenga enganchado. Si es demasiado difícil, pídale a la IA que lo simplifique un nivel en lugar de abandonarlo. Los adultos leen no ficción a unas 238 palabras por minuto y ficción cerca de 260 en su lengua materna (el metaanálisis de 2019 de Brysbaert); en un idioma nuevo empezará mucho más lento, y eso es lo esperable. Volumen por encima de velocidad al principio.

Output un día sí y otro no (15-20 min). Hable con un compañero de voz de IA o escriba unos párrafos. Elija una situación real: pedir en un restaurante, describir su fin de semana, defender una opinión moderada. Empuje un poco más allá de su zona de confort para chocar con los huecos que le importaban a Swain. Luego pida correcciones.

Repaso diario (10 min). Pase su mazo de repetición espaciada. Las tarjetas deberían venir de palabras que de verdad encontró en su input, no de una lista genérica de las 1000 más frecuentes. El vocabulario arraigado en un contexto se fija mejor porque uno tiene un anzuelo de memoria para él. Esto es directamente recuerdo activo más espaciamiento, las dos técnicas de estudio de mayor rendimiento que existen.

Punto de control humano semanal (opcional pero valioso). Una sesión con un tutor, un intercambio de idiomas o una clase. Aquí es donde detecta las cosas que la IA equivoca en silencio, y donde vive el feedback cultural y social real.

Una forma útil de ver la misma semana es por la habilidad que entrena cada bloque:

Actividad	Entrena	Frecuencia	Papel de la IA
Lectura por nivel + vocabulario glosado	Input / comprensión	Diaria	Simplificar, glosar, explicar
Conversación de voz	Output / fluidez	3-4 veces por semana	Compañero + corrector
Escritura con feedback	Output / corrección	2 veces por semana	Consigna + corrector
Repaso de repetición espaciada	Retención	Diario	Generación de tarjetas + programación
Tutor humano / intercambio	Todo + cultura	Semanal	Ninguno (el sentido es la persona)

Si quiere una comparación más a fondo de cómo se corresponden las funciones de estudio con IA y los modos de aprendizaje, vea nuestro análisis de los modos de estudio con IA comparados.

Convertir la web y YouTube en input comprensible

La parte más difícil del modelo de Krashen en la práctica es el problema del suministro. ¿De dónde sale un flujo constante de input interesante y adecuado al nivel una vez que ha agotado los diálogos del libro de texto? La respuesta en 2026 es la web abierta y el video, vueltos comprensibles.

Empiece por la lectura. La internet en lengua extranjera es la mayor biblioteca gratuita de input jamás reunida. Blogs de recetas, foros deportivos, wikis de fans, columnas de opinión. El truco es quedarse dentro del texto. Use el resaltador web de Glasp para subrayar las palabras y frases que no conoce mientras lee, de modo que marque huecos reales en su contexto en lugar de copiar palabras aisladas a un diccionario. Cuando una frase resulte genuinamente confusa, el chat de IA de Glasp puede explicarle por qué está estructurada como está, justo donde la encontró.

El video es donde la mayoría de los estudiantes se atascan, porque el habla a velocidad nativa es brutal al principio. Aquí es exactamente donde las transcripciones lo rescatan. Pase un video en lengua extranjera por YouTube Summary para extraer la transcripción y las ideas clave, y luego lea a la vez que escucha. De pronto la manguera de habla se convierte en input comprensible que puede pausar, releer y minar para sacar vocabulario. Un vlog de viajes en español o un canal de cocina en japonés se transforma en una lección estructurada sin que nadie escriba un plan de estudios.

Esto encaja de forma natural con cómo hemos escrito sobre aprender de YouTube en términos más amplios: el video es la materia prima, y la transcripción más sus subrayados son lo que convierte el ver en adquisición real.

El sentido de todo esto es la repetición con variedad. El i+1 de Krashen no es una única frase mágica; es una avalancha de input ligeramente desafiante a través de muchos temas, de modo que la misma gramática y vocabulario reaparecen con distinto ropaje hasta que el cerebro deja de notarlos como ajenos.

Construir una biblioteca personal de input que pueda repasar

El input que entendió una vez y nunca volvió a ver está en su mayor parte desperdiciado. Los estudiantes que de verdad progresan tratan su input como un activo que revisitar, no como una corriente que consumir y olvidar. Este es el puente entre el input de Krashen y la mitad de repaso de su sistema semanal.

Cada subrayado que hace al leer artículos en lengua extranjera pasa a formar parte de una biblioteca personal de input comprensible: una colección buscable y creciente de lengua real a su nivel, sobre temas que usted eligió. Con los meses, esa biblioteca se convierte en un registro mucho mejor de su aprendizaje que cualquier mazo prefabricado, porque cada entrada tiene un contexto que recuerda.

Los libros también pertenecen aquí. Si lee libros en lengua extranjera en un Kindle, sus subrayados de Kindle se sincronizan con la misma biblioteca, de modo que una novela que está leyendo en italiano alimenta la misma cadena de repaso que los artículos y los videos.

Después, cierre el ciclo. Exporte sus subrayados y conviértalos en tarjetas de memoria para su sistema de repetición espaciada. Un subrayado ya viene con su frase, lo que significa que sus tarjetas tienen contexto incorporado en lugar de pares de palabras sueltos. Ese contexto es lo que hace que la repetición espaciada para lectores sea tan eficaz: no está memorizando "manzana = apple", está reencontrándose con una frase que una vez entendió, lo que se acerca mucho más a cómo funciona en realidad la adquisición.

El flujo de trabajo en una línea: lea o vea, subraye lo que está en su límite, exporte a tarjetas, repase con una programación FSRS, repita. El input se convierte en memoria retenida en lugar de en una tarde agradable que olvida para el jueves.

Dónde se queda corta la IA (lea esto antes de confiar en ella)

La honestidad aquí protege su tiempo. La IA es un mecanismo de entrega potente, pero tiene modos de fallo específicos y bien documentados, y quienes la venden rara vez empiezan por ahí.

Alucina gramática. Pídale a un modelo que explique una regla y le responderá con seguridad siempre, también cuando se equivoca. Puede inventar excepciones, exponer mal la concordancia de género o racionalizar una formulación "natural" que ningún nativo usaría. Para gramática de alto riesgo, verifíquela contra una referencia real o un profesor. Una respuesta equivocada que suena fluida es más peligrosa que ninguna respuesta.

El feedback de pronunciación es indulgente. El feedback de texto es sólido; el oído es más débil. Los modelos a menudo aceptan pronunciaciones que un hablante nativo señalaría, lo que puede fijar en silencio un acento más difícil de corregir más adelante. La escucha humana real, o al menos un curso centrado en la fonética, llena este hueco.

Los matices culturales y pragmáticos quedan aplanados. Saber cuándo una frase es grosera, íntima, regional o sarcástica es la parte difícil y humana de la fluidez, y es exactamente lo que la IA pasa por alto. Le enseñará con gusto una frase correcta de manual que cae mal en una conversación real.

Puede convertirse en un sustituto cómodo de la parte que da miedo. Hablar con una máquina es seguro, lo que es estupendo para bajar el Filtro Afectivo de Krashen y terrible si reemplaza el hecho de hablar alguna vez con una persona. La fricción de una conversación real es parte del entrenamiento.

Por eso las fuentes más creíbles plantean la IA como más eficaz cuando se combina con cursos estructurados de alta calidad, inmersión cultural e interacción humana real, no como un reemplazo de ellos. Use la IA para multiplicar sus repeticiones y bajar la barrera para empezar. Use a las personas y los cursos estructurados para detectar lo que la IA no puede ver. La combinación supera a cualquiera de las dos por separado.

Preguntas frecuentes

¿Puedo llegar a la fluidez usando solo IA?

Probablemente no a un nivel alto. La IA es excelente para el volumen de input, la práctica de output de bajo riesgo y el repaso, que es la mayor parte del trabajo duro. Pero corrige poco la pronunciación, aplana los matices culturales y de vez en cuando alucina gramática. Trátela como el motor de las repeticiones diarias y combínela con conversación humana real y un curso estructurado para las partes que no puede juzgar.

¿De verdad es mejor el input comprensible que estudiar reglas de gramática?

No son enemigos. Krashen (1985) sostuvo que el input hace el trabajo pesado de la adquisición, y décadas de evidencia respaldan que el volumen de input importa enormemente. Pero el estudio explícito de la gramática y el output (Swain 1985) aceleran la corrección y ayudan a notar los huecos. Las rutinas más fuertes usan el input como cimiento y añaden gramática y conversación específicas encima.

¿Qué herramienta de repetición espaciada debería usar?

Anki ejecutando el algoritmo FSRS es la opción por defecto respaldada por la investigación en 2026. FSRS predice cuándo está a punto de olvidar una tarjeta y programa el repaso para ese momento, lo que es mucho más eficiente que los intervalos fijos o releer. Siembre su mazo con vocabulario que de verdad encontró en sus lecturas y videos, no con una lista de frecuencia genérica, para que cada tarjeta tenga contexto.

¿Cómo hago comprensibles los videos de YouTube de nativos siendo principiante?

Use la transcripción. Pase el video por YouTube Summary para obtener la transcripción completa y las ideas clave, y luego lea a la vez que escucha y pause con libertad. La transcripción convierte el habla a velocidad nativa, que de otro modo abruma, en input comprensible que puede releer y minar para sacar palabras nuevas.

¿Cuánto tiempo al día necesito en realidad?

Una hora al día, repartida aproximadamente en 20-30 minutos de input, 15-20 de output unas cuantas veces por semana y 10 minutos de repaso a diario, hará avanzar a la mayoría de forma constante. La constancia gana a las sesiones maratonianas. Dos horas concentradas el domingo pierden contra veinte minutos cada día, porque el espaciamiento y la recuperación frecuente son lo que construye memoria duradera.

Conclusión

La ciencia estaba zanjada mucho antes de que llegaran las herramientas. Krashen nos dijo en 1985 que adquirimos los idiomas a partir de input abundante, adecuado al nivel y de baja ansiedad. Swain nos recordó, el mismo año, que también tenemos que producir lengua para hacerla verdaderamente nuestra. Lo que faltaba nunca fue la teoría. Era una manera barata, paciente y siempre disponible de entregar input, provocar output y corregir errores. Esa es la parte que la IA por fin resolvió.

Construya el ciclo y déjelo correr: input comprensible cada día, output unas cuantas veces por semana, repaso cada día y una persona en la mezcla cuando pueda arreglárselas. Después, haga que su input se acumule en lugar de evaporarse.

Subraye artículos y videos en lengua extranjera con el resaltador web de Glasp para construir una biblioteca personal de input comprensible, haga comprensibles los videos difíciles con YouTube Summary, incorpore libros en otro idioma a través de sus subrayados de Kindle, pregunte sobre frases confusas con el chat de IA de Glasp y exporte sus subrayados a tarjetas de repetición espaciada, para que la lengua que entendió una vez se convierta en la lengua que conserva.