Nada es definitivo. Habrá ocasiones, tal y como vimos en nuestra entrada anterior sobre eliminación de URL, en las que te interese bloquear una página por completo o suprimirla de tu sitio. Otras veces, puede que sólo cambies algunas partes de una página o suprimas determinados fragmentos de texto. En función de la frecuencia con la que se rastree una página, es posible que los cambios efectuados tarden algún tiempo en reflejarse en los resultados de búsqueda.
En esta entrada del blog, hablaremos sobre los pasos a seguir si observas que en los resultados de búsqueda todavía mostramos contenido obsoleto previamente eliminado, tanto en forma de fragmento de texto en los resultados de búsqueda, como en la página en caché asociada al resultado de la búsqueda. Estas instrucciones te resultarán especialmente útiles cuando el contenido antiguo incluya información sensible que necesites suprimir cuanto antes.
Si lo que deseas es simplemente actualizar un sitio web de manera normal, no es necesario seguir estos pasos.
A modo de ejemplo, te recomendamos que le eches un vistazo al siguiente resultado de búsqueda ficticio:
Para solicitar que se elimine el fragmento o la página en caché, primero necesitarás cambiar la página en si. A menos que se cambie una página que es públicamente visible, los procesos automáticos de Google continuarán mostrando partes del contenido en los resultados de búsqueda.
Una vez que se ha cambiado el contenido de la página, dispones de diferentes opciones para reflejar estos cambios en los resultados de búsqueda:
1. Espera a que el robot de Google vuelva a rastrear y a indexar la página:
Éste es el método habitual de actualización de la mayor parte del contenido de Google. A veces, el proceso puede ser bastante largo en función de la frecuencia con la que el robot de Google rastree la página en cuestión. Una vez rastreada e indexada la página, lo más probable es que el contenido antiguo deje de estar visible y se sustituya por el contenido actual. Siempre y cuando el robot de Google no esté bloqueado (mediante un archivo robots.txt o debido a la imposibilidad de acceder correctamente al servidor) y pueda rastrear la página, no tendrás que realizar ninguna otra acción. Por lo general, no se pueden agilizar los procesos de rastreo e indexación, ya que se encuentran totalmente automatizados y dependen de un gran número de factores externos.
2. Utiliza la herramienta pública de eliminación de URL de Google para solicitar la eliminación de contenido en la página web de otro usuario:
Si utilizas esta herramienta, necesitarás introducir la URL exacta de la página modificada, seleccionar la opción “El contenido se ha eliminado de la página” y, a continuación, especificar una o varias palabras que se hayan eliminado de la página por completo.
Ten en cuenta que ninguna de las palabras que introduzcas podrá aparecer en la página. Aunque se haya eliminado una palabra de una parte de la página, se denegará tu solicitud si la palabra en cuestión aún aparece en otras secciones. Asegúrate de que seleccionas una palabra (o palabras) que ya no aparezca(n) en ninguna parte de la página. Si en el ejemplo anterior eliminaste “dispositivo de alto secreto para la captura del Velocitus Incalculii”, deberás introducir estas palabras en lugar de expresiones como “mi proyecto”. Sin embargo, si las palabras “alto” o “dispositivo” se encuentran en alguna otra parte de la página, se denegará la solicitud. Para aumentar las probabilidades de éxito, lo más sencillo suele ser introducir sólo una palabra que no aparezca en ningún otro apartado de la página con toda seguridad.
Una vez procesada la solicitud y tras comprobar que la(s) palabra(s) introducida(s) no aparece(n) en ningún otro apartado de la página, el resultado de búsqueda dejará de mostrar un fragmento y la página en caché ya no estará disponible. El título y la URL de la página seguirán estando visibles y es posible que la entrada todavía aparezca en los resultados de las búsquedas relacionadas con el contenido eliminado (como las búsquedas de [Velocitus Incalculii]), aunque estas palabras ya no estén presentes en el fragmento. No obstante, tras volver a rastrear y a indexar la página, el nuevo fragmento y la página en caché se podrán ver en los resultados de búsqueda.
Ten en cuenta que necesitaremos visualizar la página con el fin de comprobar que se haya(n) eliminado la(s) palabra(s). Si la página ya no existe y el servidor genera un código de estado HTTP 404 ó 410 que nos impide visualizar la página, te recomendamos que solicites la eliminación de la página completa.
3. Utiliza la herramienta de eliminación de URL en Herramientas para webmasters de Google para solicitar la eliminación de información de una página de tu sitio web:
Si dispones de acceso al mencionado sitio web y has confirmado la propiedad del mismo en Herramientas para webmasters de Google, podrás utilizar la herramienta de eliminación de URL (en Información del sitio > Acceso de rastreadores) para solicitar que se eliminen el fragmento y la página en caché hasta que se vuelva a rastrear la página. Para utilizar esta herramienta, sólo tendrás que introducir la URL exacta de la página (no necesitarás especificar las palabras eliminadas). Una vez procesada la solicitud, eliminaremos el fragmento y la página en caché de los resultados de búsqueda. El título y la URL de la página seguirán estando visibles y es posible que la página continúe apareciendo en los resultados de las búsquedas relacionadas con el contenido eliminado. Tras volver a rastrear y a indexar la página, se podrá ver el resultado de la búsqueda con un fragmento actualizado y la página en caché (en función del nuevo contenido).
Google no sólo indexa y clasifica los elementos en función del contenido de una página, sino también de otros factores externos, como los enlaces internos de la URL. Así pues, es posible que una URL continúe apareciendo en los resultados de búsqueda relacionados con contenido que ya no se encuentra en la página, incluso después de volver a rastrearla y a indexarla. Aunque la herramienta de eliminación de URL puede suprimir el fragmento y la página en caché de un resultado de búsqueda, no cambiará ni suprimirá el título de dicho resultado, así como tampoco modificará la URL mostrada ni evitará que la página aparezca al realizar búsquedas relacionadas con contenido antiguo o actual. Si lo estimas oportuno, asegúrate de que la URL cumpla los requisitos necesarios para la total eliminación de los resultados de búsqueda.
Eliminación de contenido que no sea HTML
Si el contenido modificado no está en formato (X)HTML (por ejemplo, si se ha modificado una imagen, un archivo Flash o un archivo PDF), no podrás utilizar la herramienta de eliminación de la memoria caché. Por lo tanto, si no deseas que el contenido antiguo aparezca en los resultados de búsqueda, la solución más rápida consistirá en cambiar la URL del archivo con el fin de que la URL antigua genere un código de resultado HTTP 404 y en utilizar la herramienta de eliminación de URL para suprimir la URL antigua. Por el contrario, si decides permitir que Google actualice la información de manera normal, debes saber que es posible que las previsualizaciones de contenido que no sea HTML (como enlaces de Vista rápida para PDF) [inglés] tarden más en actualizarse tras el proceso de rastreo que las páginas HTML normales.
Prevención proactiva de la aparición de fragmentos o versiones en caché
Como webmaster, tienes la opción de utilizar metaetiquetas con el fin de evitar de manera proactiva en robots.txt la aparición de fragmentos o versiones en caché sin utilizar nuestras herramientas de eliminación. A pesar de que no recomendamos que se aplique este procedimiento de manera sistemática (el fragmento puede ayudar a los usuarios a reconocer un resultado de búsqueda relevante con mayor rapidez, mientras que una página en caché permite visualizar el contenido incluso en el caso de que el servidor no esté disponible de forma inesperada), puedes utilizar la metaetiqueta “nosnippet” para evitar que se muestre un fragmento o “noarchive” con el fin de inhabilitar el almacenamiento en caché de una página. Ten en cuenta que, si esto se modifica en páginas existentes y conocidas, el robot de Google deberá volver a rastrearlas y a indexarlas antes de que el cambio se haga visible en los resultados de búsqueda.
Esperamos que esta entrada del blog sirva para arrojar un poco de luz sobre los procesos de la herramienta de eliminación de URL para páginas actualizadas. En nuestra próxima entrada, hablaremos sobre las distintas maneras de solicitar la eliminación de contenido de otros propietarios. ¡No te lo pierdas!
Como siempre, te agradecemos cualquier comentario o pregunta que desees publicar en nuestro Foro de ayuda de webmasters.
Publicado por John Mueller, Webmaster Trends Analyst. Traducido por Cristina, equipo de Calidad de búsqueda.






Ningn usuario enviaron comentarios sobre " Cómo eliminar URL. Parte 2: eliminación de texto delicado de una página "
Follow-up comment rss e enví un Trackback