Hay archivos en tu web que nunca has revisado — y están decidiendo si Google y ChatGPT te encuentran
Blog
Desarrollo Web·25 de junio de 2026·7 min de lectura

Hay archivos en tu web que nunca has revisado — y están decidiendo si Google y ChatGPT te encuentran

robots.txt, llms.txt, structured data... son archivos técnicos de tu web que controlan si Google y la IA te encuentran. Te explicamos qué son sin tecnicismos.

#SEO técnico#llms.txt#robots.txt#posicionamiento web

Tu web tiene archivos que nunca has visto — y están mandando más que tú

Cuando alguien te hace una web, ya sea un freelance, una agencia o una plantilla de WordPress, hay una capa de configuración que queda debajo del diseño y del contenido. No se ve. No aparece en el menú. Pero existe, y está tomando decisiones importantes sobre tu negocio cada día.

Esa capa decide qué partes de tu web puede leer Google y cuáles no. Decide si ChatGPT o Perplexity pueden usar tu contenido cuando alguien hace una búsqueda. Decide si cuando alguien busca tu empresa en Google aparece la información correcta o un párrafo aleatorio de tu web. La mayoría de pymes nunca ha revisado esto. No porque no les importe, sino porque nadie se lo ha explicado en un lenguaje que tenga sentido.

No es un problema de programación. Es un problema de que nadie te ha contado que esto existe y que está afectando a tu visibilidad ahora mismo.

robots.txt: el portero de tu web que quizás está bloqueando a quien no debe

Imagina que tu web es un edificio. El robots.txt es el portero en la puerta principal. Cuando Google manda a su robot a leer tu web para indexarla, lo primero que hace ese robot es preguntar al portero: '¿Puedo pasar? ¿A qué zonas tengo acceso?'. El portero lee las instrucciones del robots.txt y le responde.

El problema es que en muchas webs ese portero está mal configurado. A veces bloquea páginas que deberían aparecer en Google. A veces deja pasar a robots que no debería, como los que recopilan datos para entrenar IA sin permiso. Y con la llegada de ChatGPT, Perplexity, Claude y otros, ahora hay docenas de robots distintos llamando a la puerta — cada uno de una empresa diferente — y el robots.txt tiene que saber cómo tratar a cada uno. Si el tuyo lleva años sin tocarse, probablemente no sabe ni que existen.

Puedes ver el robots.txt de cualquier web escribiendo su dirección seguida de /robots.txt en el navegador. Por ejemplo: tuempresa.com/robots.txt — si aparece un texto raro o una página de error, ya tienes una señal de alerta.

llms.txt: el archivo nuevo que decide si la IA habla bien de ti

En 2024 empezó a extenderse un nuevo estándar llamado llms.txt. La idea es sencilla: así como robots.txt le explica a Google cómo rastrear tu web, llms.txt le explica a los modelos de inteligencia artificial qué es tu empresa, qué haces, cuáles son tus páginas más importantes y cómo quieres que te presenten cuando alguien pregunte sobre tu sector.

Piénsalo así: cuando alguien le pregunta a ChatGPT '¿cuál es la mejor consultoría de digitalización en Barcelona?', ChatGPT tiene que decidir qué empresas mencionar y cómo describirlas. Si tu web tiene un llms.txt bien escrito, le estás dando a la IA un resumen claro y preciso de quién eres. Si no lo tienes, la IA improvisa a partir de lo que encuentre por ahí — que puede ser tu home de hace tres años, una reseña de Google o nada. El llms.txt no garantiza que aparezcas, pero sin él claramente no controlas cómo te presentan.

El llms.txt es como escribirle una ficha de presentación a la IA antes de que alguien le pregunte por ti. Si no lo haces tú, lo inventa ella.

Structured data: el lenguaje invisible que hace que Google entienda tu negocio de verdad

Hay una tercera capa que va todavía más allá. Se llama structured data o datos estructurados, y es básicamente un lenguaje estándar que le dice a Google — y a los modelos de IA — exactamente qué es cada cosa en tu web. No solo 'aquí hay texto', sino 'este texto es el nombre de la empresa', 'este número es el precio del servicio', 'esta frase es una pregunta frecuente con su respuesta'.

Cuando una web tiene esto bien configurado pasan cosas concretas: en Google aparece tu dirección, horario y valoraciones directamente en los resultados sin que el usuario tenga que entrar a tu web. Aparecen las preguntas frecuentes desplegadas debajo de tu enlace. Y los modelos de IA tienen mucho más fácil entender qué ofreces y a quién. Sin structured data, tu web es texto plano para los algoritmos. Con él, es información organizada que pueden leer e interpretar.

Si tu web no tiene structured data de LocalBusiness configurado, estás perdiendo la caja de información que aparece a la derecha en Google cuando buscan tu empresa. Esa caja la controlas tú — o la deja vacía Google.

Qué tipos de structured data son más importantes para una pyme

  • LocalBusiness: nombre, dirección, teléfono, horario y sector de tu empresa
  • FAQPage: tus preguntas frecuentes, que pueden aparecer desplegadas en Google
  • Service: descripción de cada servicio con precio orientativo si aplica
  • Article: para que tus posts de blog se indexen mejor y aparezcan como artículos en IA
  • BreadcrumbList: la navegación de tu web, para que Google entienda su estructura

Lo que probablemente tiene mal tu web ahora mismo (sin que nadie te lo haya dicho)

Después de auditar decenas de webs de pymes en España, hay un patrón que se repite casi siempre. No es culpa de nadie — es que cuando se hace la web nadie revisa esta capa, y luego pasan años sin que nadie la toque.

Estas son las situaciones más comunes que encontramos:

Errores técnicos más frecuentes en webs de pymes españolas

  • robots.txt que bloquea páginas importantes o que nunca se ha actualizado desde que se instaló WordPress
  • Sin llms.txt — prácticamente ninguna pyme lo tiene todavía, y es una ventaja fácil de conseguir ahora
  • Structured data inexistente o copiado de una plantilla con los datos de otra empresa
  • Sitemap desactualizado que incluye páginas eliminadas o no incluye las nuevas
  • Meta descriptions duplicadas o vacías que hacen que Google improvise el texto que aparece en resultados

Qué puedes hacer esta semana — aunque no sepas nada de programación

No necesitas entender cómo funciona nada de esto para tomar acción. Solo necesitas saber que existe y pedir que alguien lo revise. Estos son los pasos concretos que puedes dar ahora.

Esta semana: entra a tuempresa.com/robots.txt y tuempresa.com/llms.txt en el navegador. Si el primero da error o parece un texto rarísimo que nadie ha tocado en años, hay trabajo por hacer. Si el segundo directamente no existe, ya sabes que te falta uno de los archivos más relevantes de 2025 en adelante. Con eso ya tienes dos preguntas concretas que hacerle a quien te gestiona la web.

Si no tienes a nadie que te lo gestione, o si quieres una revisión completa de todo esto de una vez — robots.txt, llms.txt, structured data, sitemap, velocidad y el resto de la capa técnica — en GNERAI hacemos un diagnóstico gratuito donde revisamos tu web en detalle y te explicamos exactamente qué está frenando tu visibilidad en Google y en IA. Sin tecnicismos, con un plan claro de qué arreglar primero.

Diagnóstico gratuito en gnerai.com/diagnostico — revisamos tu web completa y te decimos en 30 minutos qué está fallando y qué costaría arreglarlo.

GNERAI

¿Quieres aplicar esto en tu empresa?

Hacemos un diagnóstico gratuito de 30 minutos donde analizamos tu situación y te decimos exactamente qué tiene sentido para tu negocio.

Hablar con el equipo
Hablemos de tu proyecto