Data & IA

ArXiv prohíbe por un año a autores que deleguen toda su investigación en IA: el debate que sacude a la ciencia

Benjamin Garrido

27 may. 2026 • 3 min read

🎧

Escucha este artículo

La comunidad científica tiene un problema serio con la IA, y ArXiv acaba de plantar bandera. El repositorio de preprints más influyente del mundo ha anunciado que baneará durante un año a cualquier autor que permita que un modelo de lenguaje grande (LLM) realice el grueso de su trabajo de investigación. No es una advertencia suave: es una sanción con nombre y apellido.

¿Qué ha cambiado exactamente en las políticas de ArXiv?

ArXiv, que alberga más de dos millones de artículos en disciplinas como física, matemáticas, ciencias de la computación y biología, ha endurecido sus normas sobre el uso de inteligencia artificial generativa en la redacción y elaboración de investigaciones. La nueva política establece con claridad que la IA puede ser una herramienta de apoyo, pero no puede ser la autora intelectual del trabajo.

El criterio clave es la responsabilidad: si un investigador no puede responder preguntas sobre su propio artículo, defender sus metodologías o explicar sus conclusiones sin depender del texto generado por un modelo, entonces no cumple los requisitos mínimos de autoría científica. En la práctica, ArXiv exige que los autores declaren explícitamente cómo han utilizado herramientas de IA y que puedan demostrar que el pensamiento crítico y el juicio científico siguen siendo humanos.

La sanción por incumplimiento no es menor: un año de inhabilitación para publicar en la plataforma. Para muchos investigadores, especialmente en física teórica o computación, donde ArXiv es el canal principal de difusión antes de la revisión por pares formal, esto equivale a un año de invisibilidad académica.

El problema real: la IA está inflando el volumen, no la calidad

Esta decisión no surge del vacío. En los últimos dos años, el volumen de envíos a ArXiv ha crecido a un ritmo inusual, y los moderadores han detectado patrones preocupantes: artículos con prosa genérica, argumentaciones circulares, referencias fabricadas y una llamativa falta de originalidad conceptual. Las señales clásicas de texto generado por LLMs sin supervisión crítica.

El fenómeno tiene consecuencias reales para la ciencia:

Contaminación del corpus científico: los modelos de IA se entrenan con literatura científica. Si esa literatura incluye cada vez más texto generado por IA de baja calidad, el ciclo de degradación se retroalimenta.
Erosión de la revisión por pares: los revisores, que también son humanos con tiempo limitado, tienen más dificultades para identificar trabajos superficiales disfrazados de rigor técnico.
Presión sobre investigadores honestos: cuando algunos actores inflan artificialmente su producción académica, distorsionan las métricas con las que se evalúa a todos los demás.

No es que usar IA sea malo. Es que sustituir el pensamiento por IA sin criterio es una trampa epistémica que amenaza la integridad del conocimiento científico.

¿Dónde está la línea entre asistencia legítima y delegación inaceptable?

Esta es la pregunta que más incomoda, y con razón. Usar un LLM para corregir el inglés de un artículo no es lo mismo que pedirle que genere la sección de resultados. Usar IA para explorar literatura relacionada no equivale a pedirle que formule hipótesis originales. El problema es que la frontera es contextual, difusa y fácilmente manipulable.

ArXiv apuesta por la declaración explícita y la responsabilidad del autor como mecanismo de control. Es un enfoque pragmático, aunque imperfecto: depende en gran medida de la honestidad de los investigadores y de la capacidad de los moderadores para detectar usos indebidos. Las herramientas de detección de texto generado por IA siguen siendo imprecisas y generan falsos positivos que pueden perjudicar a autores legítimos que simplemente escriben con claridad.

Otras instituciones académicas observan este movimiento con atención. Nature, Science y varias universidades de primer nivel llevan meses debatiendo políticas similares. ArXiv, al actuar con contundencia, está forzando una conversación que el ecosistema académico necesitaba tener antes de que el problema se normalizara por inercia.

Conclusión: la IA como espejo de nuestra responsabilidad

La decisión de ArXiv no es un ataque a la inteligencia artificial. Es un recordatorio de que las herramientas no tienen responsabilidad epistémica, los investigadores sí. La IA puede acelerar el trabajo científico, ayudar a identificar patrones en grandes volúmenes de datos o mejorar la claridad expositiva. Pero no puede reemplazar la curiosidad, el escepticismo y el juicio que definen a un científico.

La pregunta que deberían hacerse todos los profesionales que usan IA en su trabajo —no solo en ciencia— es esta: ¿puedo defender con conocimiento propio cada decisión que hay detrás de lo que firmo? Si la respuesta es no, el problema no es la IA. El problema es quién está al otro lado del teclado.