Cómo evitar que se noten los rastros de ChatGPT en tu HTML

Índice de contenido

Ayer, mientras buceaba en LinkedIn, me topé con un post de Carlos Sánchez Donate que me llamó la atención. En él compartía una técnica para eliminar los atributos data-start y data-end que incluye ChatGPT cuando le pedimos que genere un texto. Estos atributos, aunque inofensivos, se incrustan en el código HTML generado por la IA y pueden dejar una huella bastante evidente de que el contenido ha sido creado automáticamente.

Carlos propone una solución práctica que, si sueles pegar directamente el HTML generado en tu CMS, puede venirte genial. Pero me pareció buen momento para compartir la técnica que yo utilizo, que es algo distinta (y diría que más sencilla).

¿Qué son esos atributos data-start y data-end?

Cuando pedimos a ChatGPT que genere un texto y copiamos directamente el resultado desde la vista por defecto (no el editor de texto), el contenido suele ir acompañado de metadatos embebidos como data-start, data-end, y otros similares. Esto ocurre especialmente si copiamos directamente desde el HTML renderizado, ya que OpenAI utiliza estos atributos para controlar los límites de edición dentro de su interfaz.

En principio no hay ningún problema funcional. Pero si estás trabajando en entornos profesionales —por ejemplo, generando contenido para clientes, subiéndolo a CMS como WordPress o editando artículos directamente en HTML—, esos atributos pueden ensuciar tu código o levantar sospechas innecesarias sobre la autoría del contenido.

Mi técnica personal: modificar el prompt

Yo utilizo un método algo más directo (y, para mí, más cómodo). Simplemente añado al final del prompt:

✍️ «Genera el texto en el editor de textos»

Con esto, ChatGPT cambia automáticamente la interfaz y genera el texto dentro del editor de texto enriquecido (el mismo donde puedes poner encabezados, listas, negritas…). Y aquí viene la magia:

  • El HTML resultante solo contiene un único atributo:
    data-pm-slice=»1 1 []».

Este atributo aparece en el primer elemento del HTML generado (sea texto plano o un heading). Nada más. Un único rastro que puede eliminarse muy fácilmente.

Limpieza final con html-online.com

Aunque ese data-pm-slice es inofensivo, a veces prefiero eliminarlo del todo. Para ello suelo utilizar https://html-online.com/editor/. Es un editor HTML muy útil que te permite ver el código fuente, limpiar estilos innecesarios y aplicar algunos toques finales como:

  • Poner negritas
  • Justificar texto
  • Cambiar encabezados
  • Insertar etiquetas personalizadas para SEO
  • Ajustar la densidad de palabras clave

La verdad es que ya lo tengo integrado en mi flujo de trabajo, así que me resulta muy cómodo hacer la limpieza ahí.

¿Vale la pena preocuparse por esto?

Depende del uso que le estés dando a los textos generados por IA. Si es para consumo personal o notas internas, probablemente no te importe. Pero si estás generando contenido para:

  • Subir a una web profesional
  • Mandar a clientes
  • Publicar en medios externos
  • Entregar como parte de un proyecto SEO

… entonces puede ser buena idea asegurarte de que el HTML esté limpio y sin rastro de atributos generados automáticamente.

No es que Google penalice esto (al menos, de momento), pero ya sabemos que la limpieza del código es un pequeño plus en cualquier entorno profesional.

Te dejo aquí este método por si quieres probarlo. Si utilizas alguna técnica mejor o diferente, déjamela en los comentarios.

Picture of Nacho Molla
Nacho Molla
Team Lead SEO & Analytics
También te puede interesar…

Recibe la Guía SEO ¡GRATIS!

Suscríbete a la Newsletter y obtén nuestra Guía SEO