Volver a Blog
Web ScrapingRPA
¿Cómo raspar los resultados de búsqueda de Google Maps a través de Nstbrowser RPA?
¿Cómo realizar el web scraping de la forma más eficiente? Sí, las herramientas RPA pueden aumentar en gran medida la eficiencia y reducir los costes. En este blog, usted aprenderá cómo rastrear los resultados de búsqueda de Google Maps utilizando la herramienta Nstbrowser RPA.
May 14, 2024

El uso de herramientas RPA para la recopilación de datos web es un medio común de recopilación de datos, y RPA también puede mejorar en gran medida la eficiencia de la recopilación de datos y reducir el costo de recopilación. Obviamente, Nstbrowser RPA le brinda la mejor experiencia de RPA y la mejor eficiencia en el trabajo.

Después de leer este tutorial, podrás:

  • Comprender cómo utilizar RPA para la recopilación de datos
  • Aprenda cómo guardar los datos recopilados por RPA

Paso 1: Preparación

Necesitas:

  1. tenga una cuenta de Nstbrowser e inicie sesión en el cliente de Nstbrowser.
  2. vaya a la página de flujo de trabajo del módulo RPA y haga clic en "Crear flujo de trabajo".

Ahora podemos comenzar a configurar el flujo de trabajo para el rastreo de RPA según los resultados de búsqueda de mapas de Google.

Paso 2: Visite El Sitio Web De Destino

Antes de buscar el contenido de destino, debemos visitar nuestro sitio web de destino: https://www.google.com/maps.

  1. Elija el nodo Goto Url.
  2. Configure la URL del sitio web.

Y puede visitar el sitio web de destino ahora.

usando el nodo Ir a URL

Paso 3: Busque El Contenido De Destino

Después de llegar al sitio web, debemos buscar la dirección de destino. Aquí debe utilizar Chrome Devtool para ubicar los elementos HTML.

Abra DevTools y use el mouse para seleccionar el cuadro de búsqueda. Entonces podemos ver:

usando la herramienta Devtool
  • Nuestro elemento del cuadro de entrada de destino tiene un atributo "id", que se puede utilizar como selector CSS para ubicar el cuadro de entrada.

Entonces, necesitamos hacer:

  1. Agregue el nodo Contenido de entrada. Seleccione "Selector" para la opción Elemento y Selector para la opción Selector.
  2. Complete el valor del id que hemos posicionado en el cuadro de entrada e ingrese el contenido que queremos buscar en la opción Contenido.

Hemos completado la acción de escribir en el cuadro de entrada:

Agregar el nodo Contenido de entrada

Después de escribir, debemos hacer que Google Maps busque el contenido que hemos completado:

  • Esto se puede hacer rápidamente utilizando el nodo Teclado para simular la tecla "Entrar" de un teclado.
usando el nodo Teclado

Paso 4: Extracción De Datos

Bien, continúa, hemos obtenido con éxito el contenido que queremos y el siguiente paso es eliminarlo.

A través de la observación, podemos encontrar que los resultados de búsqueda de Google Maps se muestran en forma de lista (una forma muy clásica). Aquí solo se mostrará cierta información importante y, si hace clic en un elemento en particular, toda la información detallada correspondiente aparecerá junto a él.

resultado de búsqueda del mapa de google

Nuevamente, abra DevTools para ubicar cada resultado en la lista:

Localizar resultados de búsqueda

Iterando a través de todos los resultados

Dado que cada elemento de la lista usa un diseño HTML, necesitamos usar el nodo Elemento de bucle para recorrer todos los resultados de la consulta:

Usando el nodo Elemento de bucle

Deberíamos guardar cada uno de los elementos recorridos en la variable del mapa y el índice de cada elemento en el recorrido del índice del mapa para su uso posterior.

Todos los resultados de la búsqueda se obtienen a través de una solicitud web, por lo que debemos agregar una acción de "esperar" antes de recorrer para asegurarnos de obtener el elemento más reciente y correcto. Nstbrowser RPA proporciona dos acciones de espera: tiempo de espera y solicitud de espera.

  • Tiempo de espera: se utiliza para esperar un período de tiempo determinado. Puede elegir un tiempo fijo o un tiempo aleatorio según su situación específica.
  • Solicitud de espera: se utiliza para esperar el final de la solicitud de red. Es aplicable al caso de obtención de datos a través de una solicitud de red.
Intensifique el nodo Tiempo de espera

Al hacer clic en un elemento de la lista

Después de recorrer los resultados de cada elemento, debemos recopilar los datos.

Antes de obtener la información completa, haga clic en el elemento "lista". Aquí necesitamos usar el nodo Obtener datos del elemento para ubicar el elemento de destino en el que hacer clic en función de los elementos guardados en la variable del mapa:

Configurar el nodo Obtener datos del elemento

Luego, use el nodo Elemento de clic para simular un "clic":

Usando el nodo Hacer clic en elemento
  • Arrastre y suelte los nodos anteriores dentro del elemento de bucle para que estos nodos se ejecuten dentro del bucle.

Obtener datos del elemento

¡Después de realizar las acciones anteriores, ya podemos ver la información específica de cada resultado de búsqueda! Ahora es el momento de usar el nodo Obtener datos del elemento para obtener los datos que queremos:

obtener datos con obtener datos del elemento
  1. Utilice DevTools para posicionar nuestro elemento de destino una vez más.
  2. Aplique el nodo para recuperar el contenido del elemento y guarde la información en nuestra tabla prediseñadas:
Guardar información

¡Felicitaciones!

¡En este punto, hemos terminado de rastrear información desde un único resultado de búsqueda!

Paso 5: Repetir El Raspado

Por supuesto, recopilar datos de una sola búsqueda no es suficiente, y la funcionalidad RPA de Nstbrowser facilita este trabajo repetitivo con un solo nodo.

  • El nodo Repetir flujo se utiliza para repetir la ejecución de un nodo ya existente. Todo lo que necesitas hacer es configurar el número de repeticiones o la condición final. Como resultado, Nstbrowser puede repetir la acción automáticamente según sus necesidades.

Supongamos que necesitamos extraer datos para 2 solicitudes más, luego simplemente configure el recuento de repeticiones en 2:

configurar el número de rastreos

Paso 6: Guarde Los Resultados

Hasta ahora hemos adquirido todos los datos que queremos recopilar y es hora de guardarlos.

Nstbrowser RPA proporciona dosformas de guardar datos: Guardar en archivo y Guardar en Excel.

  • Guardar en archivo proporciona tres tipos de archivos entre los que puede elegir: .txt, . csv, .json.
  • Guardar en Excel, por otro lado, sólo puede guardar datos en un archivo de Excel.

Para una fácil visualización, elegimos guardar los datos recopilados en Excel:

  1. Agregue el nodo Guardar en Excel.
  2. Configure la ruta del archivo y el nombre del archivo necesario para guardar.
  3. Seleccione el contenido de la tabla a guardar.
guardar los resultados

Paso 7: Ejecutar RPA

¿Cómo ejecutarlo automáticamente? Necesitamos que:

  1. Guarde nuestro flujo de trabajo configurado.
  2. Crea un nuevo horario.
  3. Haga clic en el botón ejecutar.

¡Entonces podremos comenzar a recopilar datos de Google Maps!

ejecutar rpa

Después de completar, echemos un vistazo a los resultados que recopilamos:

resultado de raspado

Es muy genial, ¿no?

Solo necesita configurar el flujo de trabajo una vez y luego podrá realizar la extracción de datos en cualquier momento. ¡Es por eso que Nstbrowser RPA es encantador!

¡Disfruta De Nstbrowser Ahora!

La extracción del resultado de búsqueda de Google Maps ahora está disponible en el mercado de RPA de Nstbrowser, ¡y puede ir al mercado de RPA para obtenerlo directamente! Simplemente cambie el contenido que desea buscar y la ruta del archivo que desea guardar después de obtenerlo, y podrá comenzar su viaje de rastreo de RPA.

RPA marketplace
Más