Quay lại Blog
Web ScrapingRPA
Làm cách nào để thu thập kết quả tìm kiếm của Google Maps thông qua Nstbrowser RPA?
Làm thế nào để thực hiện quét web hiệu quả nhất? Có, các công cụ RPA có thể tăng hiệu quả và giảm chi phí đáng kể. Trong blog này, bạn sẽ tìm hiểu cách thu thập dữ liệu kết quả tìm kiếm trên bản đồ Google bằng công cụ Nstbrowser RPA.
May 14, 2024

Sử dụng các công cụ RPA để quét dữ liệu web là một phương tiện thu thập dữ liệu phổ biến và RPA cũng có thể cải thiện đáng kể hiệu quả của việc quét dữ liệu và giảm chi phí thu thập. Rõ ràng, Nstbrowser RPA cung cấp cho bạn trải nghiệm RPA tốt nhất và hiệu quả công việc tốt nhất.

Sau khi đọc hướng dẫn này, bạn sẽ:

  • Hiểu cách sử dụng RPA để thu thập dữ liệu
  • Tìm hiểu cách lưu dữ liệu được RPA thu thập

Bước 1: Chuẩn bị

Bạn cần phải:

  1. có tài khoản Nstbrowser và đăng nhập vào ứng dụng khách Nstbrowser.
  2. đi tới trang quy trình làm việc của mô-đun RPA và nhấp vào "Tạo quy trình công việc".

Bây giờ, chúng ta có thể bắt đầu định cấu hình quy trình thu thập thông tin RPA dựa trên kết quả tìm kiếm trên bản đồ của Google.

Bước 2: Truy cập trang web mục tiêu

Trước khi tìm kiếm nội dung mục tiêu, chúng tôi cần truy cập trang web mục tiêu của mình: https://www.google.com/maps.

  1. Chọn nút Goto Url.
  2. Định cấu hình URL trang web.

Và bạn có thể truy cập trang web mục tiêu ngay bây giờ.

sử dụng nút Goto Url

Bước 3: Tìm kiếm nội dung mục tiêu

Sau khi truy cập vào trang web, chúng ta cần tìm kiếm địa chỉ mục tiêu. Tại đây, bạn cần sử dụng Chrome Devtool để định vị các phần tử HTML.

Mở DevTools và sử dụng chuột để chọn hộp tìm kiếm. Sau đó chúng ta có thể thấy:

sử dụng công cụ Devtool
  • Phần tử hộp nhập liệu mục tiêu của chúng tôi có thuộc tính "id", thuộc tính này có thể được sử dụng làm bộ chọn CSS để định vị hộp nhập liệu.

Vì vậy, chúng ta cần phải làm:

  1. Thêm nút Nội dung đầu vào. Chọn "Bộ chọn" cho tùy chọn Phần tử và Bộ chọn cho tùy chọn Bộ chọn.
  2. Điền giá trị id mà chúng ta đã định vị vào ô nhập liệu và nhập nội dung muốn tìm kiếm vào tùy chọn Content.

Chúng ta đã hoàn tất thao tác gõ vào ô nhập liệu:

Thêm nút Nội dung đầu vào

Sau khi gõ xong chúng ta cần thực hiện tìm kiếm trên Google Maps nội dung chúng ta đã điền:

  • Điều này có thể được thực hiện nhanh chóng bằng cách sử dụng nút Bàn phím để mô phỏng thao tác "Enter" của bàn phím.
sử dụng nút Bàn phím

Bước 4: Quét dữ liệu

Được rồi, tiếp tục ngay bây giờ, chúng ta đã lấy thành công nội dung mình muốn và bước tiếp theo là loại bỏ những nội dung này!

Qua quan sát, chúng ta có thể thấy kết quả tìm kiếm của Google Maps được hiển thị dưới dạng danh sách (một cách rất cổ điển). Ở đây chỉ một số thông tin quan trọng sẽ được hiển thị và nếu bạn nhấp vào một mục cụ thể, tất cả thông tin chi tiết tương ứng sẽ xuất hiện bên cạnh mục đó.

kết quả tìm kiếm của google map

Một lần nữa, hãy mở DevTools để tìm từng kết quả trong danh sách:

Định vị kết quả tìm kiếm

Lặp lại tất cả các kết quả

Vì mỗi mục trong danh sách sử dụng bố cục HTML nên chúng ta cần sử dụng nút Phần tử vòng lặp để lặp qua tất cả các kết quả của truy vấn:

Sử dụng nút Phần tử vòng lặp

Chúng ta nên lưu từng phần tử được duyệt vào biến bản đồ và chỉ mục của từng phần tử vào phần duyệt qua chỉ mục bản đồ để sử dụng sau này.

Tất cả các kết quả tìm kiếm đều có được thông qua yêu cầu web, vì vậy chúng tôi phải thêm hành động "chờ" trước khi duyệt qua để đảm bảo chúng tôi sẽ nhận được phần tử mới nhất và chính xác. Nstbrowser RPA cung cấp hai hành động chờ: Thời gian chờYêu cầu chờ.

  • Thời gian chờ: dùng để chờ trong một khoảng thời gian nhất định. Bạn có thể chọn thời gian cố định hoặc thời gian ngẫu nhiên tùy theo tình huống cụ thể của mình.
  • Yêu cầu chờ: dùng để chờ kết thúc yêu cầu mạng. Nó được áp dụng cho trường hợp lấy dữ liệu thông qua yêu cầu mạng.
tăng cường nút Thời gian chờ

Nhấp vào một mục danh sách

Sau khi duyệt qua kết quả cho từng mục, chúng tôi cần thu thập dữ liệu.

Trước khi nhận được thông tin đầy đủ, hãy nhấp vào mục "danh sách". Ở đây chúng ta cần sử dụng nút Get Element Data để định vị phần tử đích cần nhấp vào dựa trên các phần tử được lưu trong biến bản đồ:

Thiết lập nút Lấy dữ liệu phần tử

Sau đó, sử dụng nút Phần tử nhấp chuột để mô phỏng "nhấp chuột":

Sử dụng nút Phần tử nhấp chuột
  • Kéo và thả các nút trên vào trong Phần tử vòng lặp để các nút này được thực thi bên trong vòng lặp.

Lấy dữ liệu phần tử

Sau khi thực hiện các thao tác trên, chúng ta đã có thể xem được thông tin cụ thể của từng kết quả tìm kiếm! Bây giờ, đã đến lúc sử dụng nút Get Element Data để lấy dữ liệu chúng ta muốn:

lấy dữ liệu với dữ liệu phần tử get
  1. Sử dụng DevTools để định vị lại phần tử mục tiêu của chúng ta.
  2. Áp dụng nút để truy xuất nội dung của phần tử và lưu thông tin vào bảng được thiết kế sẵn của chúng tôi:
Lưu thông tin

Xin chúc mừng!

Tại thời điểm này, chúng tôi đã hoàn tất việc thu thập thông tin từ một kết quả tìm kiếm duy nhất!

Bước 5: Lặp lại việc cạo

Tất nhiên, việc thu thập dữ liệu từ một tìm kiếm là không đủ và chức năng RPA của Nstbrowser tạo điều kiện thuận lợi cho công việc lặp đi lặp lại này chỉ với một nút!

  • Nút Luồng lặp lại được sử dụng để lặp lại việc thực thi một nút đã tồn tại. Tất cả những gì bạn cần làm chỉ là cấu hình số lần lặp lại hoặc điều kiện kết thúc. Do đó, Nstbrowser có thể tự động lặp lại hành động theo nhu cầu của bạn.

Giả sử chúng ta cần thu thập dữ liệu cho 2 yêu cầu nữa, sau đó chỉ cần định cấu hình số lần lặp lại thành 2:

định cấu hình số lần thu thập thông tin

Bước 6: Lưu kết quả

Đến bây giờ, chúng tôi đã có được tất cả dữ liệu chúng tôi muốn thu thập và đã đến lúc lưu chúng.

Nstbrowser RPA cung cấp haicách lưu dữ liệu: Save To FileSave To Excel.

  • Lưu vào tập tin cung cấp 3 loại file cho bạn lựa chọn: .txt, . csv, .json.
  • Lưu vào Excel, Mặt khácchỉ, có thể lưu dữ liệu vào file Excel.

Để dễ xem chúng ta chọn lưu dữ liệu thu thập được vào Excel:

  1. Thêm nút Lưu vào Excel.
  2. Định cấu hình đường dẫn tệp và tên tệp cần lưu.
  3. Chọn nội dung bảng cần lưu.
lưu kết quả

Bước 7: Thực thi RPA

Làm thế nào để thực hiện nó tự động? Chúng ta cần phải:

  1. Lưu quy trình làm việc đã cấu hình của chúng tôi.
  2. Tạo một lịch trình mới.
  3. Bấm vào nút chạy.

Sau đó, chúng ta có thể bắt đầu thu thập dữ liệu từ Google Maps!

thực hiện rpa

Sau khi hoàn thành, chúng ta cùng xem kết quả chúng ta thu thập được:

kết quả cạo

Nó rất tuyệt phải không?

Bạn chỉ cần định cấu hình quy trình làm việc một lần và sau đó bạn có thể thực hiện thu thập dữ liệu bất cứ lúc nào. Đó là lý do tại sao Nstbrowser RPA lại hấp dẫn!

Tận hưởng Nstbrowser ngay!

Quét kết quả tìm kiếm của Google Maps hiện có sẵn trên thị trường Nstbrowser RPA và bạn có thể truy cập thị trường RPA để lấy trực tiếp! Chỉ cần thay đổi nội dung bạn muốn tìm kiếm và đường dẫn của tệp bạn muốn lưu sau khi nhận được và bạn có thể bắt đầu hành trình thu thập thông tin RPA của mình.

Thị trường RPA Nstbrowser
Hơn