Ayer, mientras buceaba en LinkedIn, me topé con un post de Carlos Sánchez Donate que me llamó la atención. En él compartía una técnica para eliminar los atributos data-start y data-end que incluye ChatGPT cuando le pedimos que genere un texto. Estos atributos, aunque inofensivos, se incrustan en el código HTML generado por la IA y pueden dejar una huella bastante evidente de que el contenido ha sido creado automáticamente.
- 👉 Aquí tenéis su post: Ir a LinkedIn
Carlos propone una solución práctica que, si sueles pegar directamente el HTML generado en tu CMS, puede venirte genial. Pero me pareció buen momento para compartir la técnica que yo utilizo, que es algo distinta (y diría que más sencilla).
¿Qué son esos atributos data-start y data-end?
Cuando pedimos a ChatGPT que genere un texto y copiamos directamente el resultado desde la vista por defecto (no el editor de texto), el contenido suele ir acompañado de metadatos embebidos como data-start, data-end, y otros similares. Esto ocurre especialmente si copiamos directamente desde el HTML renderizado, ya que OpenAI utiliza estos atributos para controlar los límites de edición dentro de su interfaz.
En principio no hay ningún problema funcional. Pero si estás trabajando en entornos profesionales —por ejemplo, generando contenido para clientes, subiéndolo a CMS como WordPress o editando artículos directamente en HTML—, esos atributos pueden ensuciar tu código o levantar sospechas innecesarias sobre la autoría del contenido.
Mi técnica personal: modificar el prompt
Yo utilizo un método algo más directo (y, para mí, más cómodo). Simplemente añado al final del prompt:
✍️ «Genera el texto en el editor de textos»
Con esto, ChatGPT cambia automáticamente la interfaz y genera el texto dentro del editor de texto enriquecido (el mismo donde puedes poner encabezados, listas, negritas…). Y aquí viene la magia:
- El HTML resultante solo contiene un único atributo:
data-pm-slice=»1 1 []».
Este atributo aparece en el primer elemento del HTML generado (sea texto plano o un heading). Nada más. Un único rastro que puede eliminarse muy fácilmente.
Limpieza final con html-online.com
Aunque ese data-pm-slice es inofensivo, a veces prefiero eliminarlo del todo. Para ello suelo utilizar https://html-online.com/editor/. Es un editor HTML muy útil que te permite ver el código fuente, limpiar estilos innecesarios y aplicar algunos toques finales como:
- Poner negritas
- Justificar texto
- Cambiar encabezados
- Insertar etiquetas personalizadas para SEO
- Ajustar la densidad de palabras clave
La verdad es que ya lo tengo integrado en mi flujo de trabajo, así que me resulta muy cómodo hacer la limpieza ahí.
¿Vale la pena preocuparse por esto?
Depende del uso que le estés dando a los textos generados por IA. Si es para consumo personal o notas internas, probablemente no te importe. Pero si estás generando contenido para:
- Subir a una web profesional
- Mandar a clientes
- Publicar en medios externos
- Entregar como parte de un proyecto SEO
… entonces puede ser buena idea asegurarte de que el HTML esté limpio y sin rastro de atributos generados automáticamente.
No es que Google penalice esto (al menos, de momento), pero ya sabemos que la limpieza del código es un pequeño plus en cualquier entorno profesional.
Te dejo aquí este método por si quieres probarlo. Si utilizas alguna técnica mejor o diferente, déjamela en los comentarios.