En 2026, Glasp empezó a hacer algo que no aparece en ningún manual de crecimiento para startups que hayamos leído: comenzamos a publicar artículos de investigación en arXiv.
No eran entradas de blog disfrazadas con gráficos. Eran artículos de verdad, con secciones de metodología, umbrales prerregistrados, conjuntos de prueba reservados y repositorios públicos. Escritos por un equipo que se puede contar con los dedos de una mano, entre todo lo demás que exige una startup.
Este capítulo trata de por qué lo hicimos, qué descubrimos y por qué creemos que la investigación original puede ser uno de los canales de crecimiento más infravalorados de la era de la IA.
Por qué una startup publica investigación
La respuesta honesta tiene dos mitades, una idealista y otra estratégica, y contaríamos mal la historia si ocultáramos cualquiera de las dos.
La mitad idealista: es la misión a otra altitud. Glasp existe para hacer público el aprendizaje, para garantizar que lo que una persona descubre pueda beneficiar a la siguiente. Durante años eso significó subrayados y notas individuales. Pero después de que millones de personas guardaran millones de subrayados, la propia plataforma había aprendido algo sobre cómo leen los seres humanos, y mantener eso encerrado en una base de datos privada nos parecía una violación de nuestra propia premisa. Si los subrayados de un usuario merecen sobrevivir al momento, también lo merecen los patrones que atraviesan todos ellos.
La mitad estratégica: en la era de los motores de respuesta que describimos en el Capítulo 6, la investigación original está entre los contenidos más citables que existen. Los motores de respuesta están hambrientos de fuentes primarias, de afirmaciones que llegan acompañadas de evidencia. Mil entradas de blog se repiten unas a otras; un artículo con hallazgos novedosos es lo que todas acaban citando. Publicar investigación es una diferenciación que no se puede copiar rápidamente, porque la única manera de copiarla es hacer el trabajo.
Lo que nos enseñaron los subrayados
Nuestra línea principal de investigación planteaba una pregunta engañosamente simple: cuando subrayas un pasaje, ¿cuánto de esa elección eres tú?
La intuición con la que empezamos, y que comparte la mayor parte del mundo de la gestión del conocimiento personal, es que subrayar es algo profundamente personal. Tus subrayados son tu huella intelectual. Una IA entrenada con ellos debería poder predecir lo que te parecerá importante de un modo que ningún modelo genérico podría igualar.
Los datos dijeron algo más interesante. Cuando distintas personas subrayan el mismo artículo, coinciden mucho más de lo que difieren. Lo que destaca en un texto destaca, en su mayor parte, para todo el mundo; la saliencia es en gran medida compartida, social más que idiosincrásica. La individualidad es real, pero no vive donde esperábamos. Vive en la selección: con qué documentos eliges involucrarte en primer lugar, a qué temas vuelves, qué decides que merece tu atención. Y resulta que ese comportamiento de selección es notablemente estable en el tiempo, menos parecido a un estado de ánimo y más parecido a un rasgo.
En otras palabras: dentro de un documento, leemos como una multitud. Entre documentos, leemos como nosotros mismos.
Llegar a este hallazgo significó romper algunas de nuestras propias suposiciones, incluidas algunas que nos habían entusiasmado. Una versión temprana de un análisis parecía mostrar que los estilos individuales de subrayado superaban a la multitud; nuestra propia auditoría encontró errores y fugas de datos en ese resultado, y retractamos y reconstruimos el trabajo antes de publicarlo. La versión honesta del artículo era distinta de la que habíamos esperado escribir, y fue más sólida precisamente por eso.
Un experimento natural en AEO
También dirigimos la lente de la investigación hacia nosotros mismos.
El paso de los motores de búsqueda a los motores de respuesta, el mismo que forzó el cambio de estrategia del Capítulo 6, es exactamente el tipo de acontecimiento que los investigadores llaman un experimento natural. Estábamos viviendo dentro de él, con nuestros propios datos de tráfico y citas como laboratorio. Así que estudiamos la transición con rigor y también publicamos ese análisis.
Había algo satisfactoriamente recursivo en ello: la propia estrategia de crecimiento se convirtió en conocimiento abierto. Del mismo modo que una vez convertimos entrevistas con usuarios en casos de estudio, convertimos un cambio de plataforma en un artículo que cualquiera puede leer, comprobar y aprovechar.
Abiertos por defecto
Cada artículo salió acompañado de un repositorio público. Era el instinto de código abierto del Capítulo 5 llevado a su conclusión: habíamos liberado herramientas como código abierto, y ahora estábamos liberando hallazgos.
Las razones son las mismas que hicieron funcionar la apertura de nuestras herramientas de IA. La transparencia genera confianza, y la confianza se acumula, un principio al que volveremos en el próximo capítulo. Los investigadores que pueden verificar tu trabajo se convierten en sus defensores. Y en una era en la que los sistemas de IA deciden cada vez más en qué fuentes apoyarse, un historial de investigación verificable y reportada con honestidad es la señal de confianza más profunda que sabemos enviar.
Hay además un beneficio de disciplina que no anticipamos del todo. Saber que el trabajo será público, con el análisis abierto a inspección, obliga a un nivel de rigor que los paneles internos nunca exigen. Publicar nos hizo más honestos con nosotros mismos sobre lo que nuestros datos muestran y lo que no.
Qué pueden llevarse los fundadores de esto
Algunas lecciones transferibles, para cualquiera que tenga datos de producto y se lo esté preguntando.
Los datos de tu producto probablemente contienen hallazgos publicables. No métricas de interacción, que no interesan a nadie fuera de tu sala de juntas, sino preguntas genuinas sobre el comportamiento humano que solo tu posición privilegiada puede responder. Nosotros pudimos estudiar cómo subraya la gente porque somos el lugar donde la gente subraya. Sea cual sea tu producto, eres el observador mejor situado del mundo de algo.
El rigor es el precio de entrada, y es más alto que el del marketing de contenidos. Prepárate para cuestionar con más dureza tu hipótesis favorita, para que tu mejor hallazgo se disuelva bajo auditoría y para publicar el resultado honesto en lugar del emocionante. Lo descubrimos de primera mano. El artículo retractado y reconstruido nos enseñó más de lo que lo habría hecho un éxito sin tropiezos.
Y la recompensa no se parece a la de otros canales. Una funcionalidad viral sube en pico y decae. Un hallazgo de investigación, una vez citado, sigue siendo citado; pasa a formar parte de cómo un campo habla de un tema. Es de nuevo el efecto compuesto, operando en el horizonte temporal más largo que hemos encontrado hasta ahora.
Para una empresa cuya pregunta fundacional era cómo el conocimiento sobrevive a la persona que lo encontró, publicar investigación no es un desvío de la misión. Puede que sea la expresión más directa de ella que hemos lanzado.