Использование инструментов RPA для сбора веб-данных является распространенным способом сбора данных, и RPA также может значительно повысить эффективность сбора данных и снизить стоимость сбора. Очевидно, что Nstbrowser RPA обеспечивает лучший опыт RPA и лучшую эффективность работы.
Прочитав это руководство, вы сможете:
Вам необходимо:
Теперь мы можем приступить к настройке рабочего процесса для ползания RPA по результатам поиска на картах Google.
Прежде чем приступить к поиску целевого содержимого, нам необходимо посетить целевой веб-сайт: https://www.google.com/maps.
Goto Url
.Теперь вы можете посетить целевой сайт.
После перехода на сайт нам нужно найти целевой адрес. Для этого нужно использовать инструмент Chrome Devtool, чтобы найти HTML-элементы.
Откройте DevTools и с помощью мыши выберите поле поиска. После этого мы сможем увидеть:
id
", который может быть использован в качестве CSS-селектора для определения местоположения поля ввода.Итак, нам нужно сделать следующее:
Input Content
. Выберите "Selector" для параметра Element и Selector для параметра Selector.Мы завершили действие по вводу текста в поле ввода:
После ввода нам нужно заставить Google Maps искать содержимое, которое мы ввели:
Клавиатура
для имитации нажатия клавиши "Enter" на клавиатуре.Итак, мы успешно получили нужный нам контент, и следующим шагом будет соскабливание этого контента!
Понаблюдав, мы можем обнаружить, что результаты поиска Google Maps отображаются в виде списка (очень классический способ). Здесь отображается только часть важной информации, и если вы нажмете на один конкретный пункт, то рядом с ним появится вся подробная соответствующая информация.
Снова откройте DevTools, чтобы найти каждый результат в списке:
Поскольку каждый элемент списка использует HTML-макет, нам нужно использовать узел Loop Element
для итерации по всем результатам запроса:
Мы должны сохранить каждый из пройденных элементов в переменной map
и индекс каждого элемента в map-index обхода для последующего использования.
Все результаты поиска получаются через веб-запрос, поэтому мы должны добавить действие "ждать" перед обходом, чтобы убедиться, что мы получим последний и правильный элемент. Nstbrowser RPA предоставляет два действия ожидания: Wait Time
и Wait Request
.
Wait Time
: используется для ожидания в течение определенного периода времени. Вы можете выбрать фиксированное или случайное время в зависимости от конкретной ситуации.Wait Request
: используется для ожидания окончания сетевого запроса. Применяется в случае получения данных через сетевой запрос.После просмотра результатов для каждого элемента нам нужно собрать данные.
Чтобы получить полную информацию, щелкните на элементе "список". Здесь нам нужно использовать узел Get Element Data
, чтобы найти целевой элемент для щелчка на основе элементов, сохраненных в переменной map
:
Затем используйте узел Click Element
для имитации "щелчка":
После выполнения описанных выше действий мы уже можем видеть конкретную информацию о каждом результате поиска! Теперь пришло время использовать узел Get Element Data
для получения нужных нам данных:
Поздравляем!
На этом мы закончили сбор информации из одного результата поиска!
Конечно, одного сбора данных недостаточно, и функциональность RPA в Nstbrowser облегчает эту повторяющуюся работу с помощью всего одного узла!
Repeat Flow
используется для повторного выполнения уже существующего узла. Все, что вам нужно сделать, - это настроить количество повторений или конечное условие. В результате Nstbrowser сможет автоматически повторять действия в соответствии с вашими потребностями.Предположим, нам нужно собрать данные еще для 2 запросов, тогда просто настройте количество повторений на 2:
К этому моменту мы получили все данные, которые хотели собрать, и настало время их сохранить.
Nstbrowser RPA предоставляет два способа сохранения данных: Сохранить в файл
и Сохранить в Excel
.
Сохранить в файл
предлагает три типа файлов на выбор: .txt, . csv, .json.Сохранить в Excel
позволяет сохранять данные только в файл Excel.Для удобства просмотра мы решили сохранить Сохранить в Excel:
Как выполнить его автоматически? Нам нужно:
После этого мы можем начать сбор данных с Google Maps!
После завершения работы давайте посмотрим на результаты, которые мы собрали:
Очень круто, не правда ли?
Вам нужно только один раз настроить рабочий процесс, а затем вы можете заниматься сбором данных в любое время. Вот почему Nstbrowser RPA очарователен!
Скраппинг результатов поиска Google Maps теперь доступен на рынке RPA Nstbrowser, и вы можете перейти на рынок RPA, чтобы получить его напрямую! Просто измените содержимое, которое вы хотите искать, и путь к файлу, который вы хотите сохранить после получения, и вы можете начать свое путешествие по RPA-скраппингу.