Como eliminar URLs indexadas en google

A veces, eliminamos alguna página de nuestro sitio web por cualquier motivo, si esas páginas estaban indexadas en Google (aparecían en los resultados de búsqueda), se seguirán mostrando en el buscador, pero al hacer click en ellas nos llevarán a un error 404.
Estos errores 404 (página no encontrada) provocan que se muestren resultados de búsqueda de nuestros sitios webs que realmente no existen, por lo que tendremos que intentar no tener muchos de estos errores.
¿Cómo eliminamos esas urls de los resultados de búsqueda de Google?
El procedimiento es sencillo, no necesitaremos unos conocimientos avanzados, simplemente con la herramienta que proporciona Google a los webmasters lo podremos solucionar en unos sencillos pasos.
Lo primero que tienes que hacer es darte de alta en Google Search Console (antes llamado Webmaster Tools). Si ya dispones de una cuenta de Gmail, puedes darte de alta ingresando en la citada web con tu misma cuenta de correo. Con esta herramienta podremos controlar muchos aspectos de la indexación de nuestras webs en este buscador, además de conocer datos muy importantes como son los links que apuntan a tu sitio, mediante qué palabras encuentran tu web y otros datos interesantes que te permitirán controlar tu visibilidad en el buscador de referencia.
Una vez dado de alta en la herramienta, agregaremos por lo menos una página web de la que seamos dueños o administradores, ya que deberemos verificar la propiedad del sitio mediante uno de los métodos que te ofrecen.
Una vez verificada la propiedad del sitio, veremos una pantalla como la siguiente:
Eliminar URL’s de los resultados de Google mediante la Google Search Console
Seleccionamos el sitio web que queremos administrar y nos dirigimos al menú que aparece a la izquierda, concretamente a Rastreo > Errores de rastreo. Aquí veremos los diferentes errores de rastreo que Google encuentra en nuestro sitio. Seleccionamos la pestaña “No se encuentra”. Y abajo obtendremos una lista de las urls que muestran los errores 404.
Para agilizar el trabajo, podemos seleccionar toda la lista y descargarla en formato csv, que puedes abrir con excel o un programa similar.
Una vez tengamos la lista de URLs a desindexar guardada, nos dirigimos de nuevo a Rastreo>Errores de rastreo, y podemos marcar todos los errores como solucionados, ya que la lista ya la hemos guardado en formato csv.
A continuación, nos dirigimos al menú de nuestro «Search Console» y hacemos click en «Índice de Google«, se nos abre un nuevo submenú, donde seleccionaremos «Eliminación de URL«, hacemos click.
Una vez dentro, nos aparece una ventana como se ve en la imagen. Para empezar a eliminar URLs hacemos click en «Crear una nueva solicitud de eliminación«.
Se nos abrirá un cuadro donde deberemos introducir la URL a eliminar. Te pedirá que selecciones si quieres eliminar de los resultados de búsqueda y de la caché, solo de la caché o eliminar directorio (esta opción elimina todas las páginas dentro del directorio de tu web que le indiques, ten cuidado que puedes eliminar páginas importantes).
En principio seleccionaremos «Eliminar de los resultados de búsqueda y de la caché» para URL’s que tengamos con errores 404. Para otros casos, se podría elegir una de las otras dos opciones.
Eliminar URLs de los resultados de búsqueda de Google mediante Robots.txt
Una vez obtenido el listado de URLs que queremos eliminar, de la forma explicada más arriba:
Primero, deberemos abrir nuestro archivo robots.txt e incluir todas las URLs que queremos desindexar, indicando antes el atributo «Disallow«. Por ejemplo:
Disallow:/http://seofilo.com/category/ejemplo/
Disallow:/http://seofilo.com/examples
etc.
Volvemos a subir el nuevo robots.txt a nuestro servidor, y la próxima vez que las arañas de Google pasen por nuestro sitio, leerán el archivo txt y desindexarán esas URLs que nos estaban afectando.
En teoría, en 24-48 horas, Google desindexará las URLs que le hayamos indicado.
Estas prácticas son muy beneficiosas para tus sitios web, ya que lo “depuran” de imperfecciones ante el algoritmo de Google y pueden mejorar el posicionamiento, así que si tienes algún error 404, anímate a solucionarlo.