Sử dụng các công cụ RPA để quét dữ liệu web là một phương tiện thu thập dữ liệu phổ biến và RPA cũng có thể cải thiện đáng kể hiệu quả của việc quét dữ liệu và giảm chi phí thu thập. Rõ ràng, Nstbrowser RPA cung cấp cho bạn trải nghiệm RPA tốt nhất và hiệu quả công việc tốt nhất.
Sau khi đọc hướng dẫn này, bạn sẽ:
Bạn cần phải:
Bây giờ, chúng ta có thể bắt đầu định cấu hình quy trình thu thập thông tin RPA dựa trên kết quả tìm kiếm trên bản đồ của Google.
Trước khi tìm kiếm nội dung mục tiêu, chúng tôi cần truy cập trang web mục tiêu của mình: https://www.google.com/maps.
Goto Url
.Và bạn có thể truy cập trang web mục tiêu ngay bây giờ.
Sau khi truy cập vào trang web, chúng ta cần tìm kiếm địa chỉ mục tiêu. Tại đây, bạn cần sử dụng Chrome Devtool để định vị các phần tử HTML.
Mở DevTools và sử dụng chuột để chọn hộp tìm kiếm. Sau đó chúng ta có thể thấy:
Vì vậy, chúng ta cần phải làm:
Nội dung đầu vào
. Chọn "Bộ chọn" cho tùy chọn Phần tử và Bộ chọn cho tùy chọn Bộ chọn.id
mà chúng ta đã định vị vào ô nhập liệu và nhập nội dung muốn tìm kiếm vào tùy chọn Content.Chúng ta đã hoàn tất thao tác gõ vào ô nhập liệu:
Sau khi gõ xong chúng ta cần thực hiện tìm kiếm trên Google Maps nội dung chúng ta đã điền:
Bàn phím
để mô phỏng thao tác "Enter" của bàn phím.Được rồi, tiếp tục ngay bây giờ, chúng ta đã lấy thành công nội dung mình muốn và bước tiếp theo là loại bỏ những nội dung này!
Qua quan sát, chúng ta có thể thấy kết quả tìm kiếm của Google Maps được hiển thị dưới dạng danh sách (một cách rất cổ điển). Ở đây chỉ một số thông tin quan trọng sẽ được hiển thị và nếu bạn nhấp vào một mục cụ thể, tất cả thông tin chi tiết tương ứng sẽ xuất hiện bên cạnh mục đó.
Một lần nữa, hãy mở DevTools để tìm từng kết quả trong danh sách:
Vì mỗi mục trong danh sách sử dụng bố cục HTML nên chúng ta cần sử dụng nút Phần tử vòng lặp
để lặp qua tất cả các kết quả của truy vấn:
Chúng ta nên lưu từng phần tử được duyệt vào biến bản đồ và chỉ mục của từng phần tử vào phần duyệt qua chỉ mục bản đồ để sử dụng sau này.
Tất cả các kết quả tìm kiếm đều có được thông qua yêu cầu web, vì vậy chúng tôi phải thêm hành động "chờ" trước khi duyệt qua để đảm bảo chúng tôi sẽ nhận được phần tử mới nhất và chính xác. Nstbrowser RPA cung cấp hai hành động chờ: Thời gian chờ
và Yêu cầu chờ
.
Thời gian chờ
: dùng để chờ trong một khoảng thời gian nhất định. Bạn có thể chọn thời gian cố định hoặc thời gian ngẫu nhiên tùy theo tình huống cụ thể của mình.Yêu cầu chờ
: dùng để chờ kết thúc yêu cầu mạng. Nó được áp dụng cho trường hợp lấy dữ liệu thông qua yêu cầu mạng.Sau khi duyệt qua kết quả cho từng mục, chúng tôi cần thu thập dữ liệu.
Trước khi nhận được thông tin đầy đủ, hãy nhấp vào mục "danh sách". Ở đây chúng ta cần sử dụng nút Get Element Data
để định vị phần tử đích cần nhấp vào dựa trên các phần tử được lưu trong biến bản đồ:
Sau đó, sử dụng nút Phần tử nhấp
chuột để mô phỏng "nhấp chuột":
Phần tử vòng lặp
để các nút này được thực thi bên trong vòng lặp.Sau khi thực hiện các thao tác trên, chúng ta đã có thể xem được thông tin cụ thể của từng kết quả tìm kiếm! Bây giờ, đã đến lúc sử dụng nút Get Element Data
để lấy dữ liệu chúng ta muốn:
Xin chúc mừng!
Tại thời điểm này, chúng tôi đã hoàn tất việc thu thập thông tin từ một kết quả tìm kiếm duy nhất!
Tất nhiên, việc thu thập dữ liệu từ một tìm kiếm là không đủ và chức năng RPA của Nstbrowser tạo điều kiện thuận lợi cho công việc lặp đi lặp lại này chỉ với một nút!
Luồng lặp lại được sử
dụng để lặp lại việc thực thi một nút đã tồn tại. Tất cả những gì bạn cần làm chỉ là cấu hình số lần lặp lại hoặc điều kiện kết thúc. Do đó, Nstbrowser có thể tự động lặp lại hành động theo nhu cầu của bạn.Giả sử chúng ta cần thu thập dữ liệu cho 2 yêu cầu nữa, sau đó chỉ cần định cấu hình số lần lặp lại thành 2:
Đến bây giờ, chúng tôi đã có được tất cả dữ liệu chúng tôi muốn thu thập và đã đến lúc lưu chúng.
Nstbrowser RPA cung cấp haicách lưu dữ liệu: Save To File
và Save To Excel
.
Lưu vào tập tin
cung cấp 3 loại file cho bạn lựa chọn: .txt, . csv, .json.Lưu vào Excel
, Mặt khácchỉ, có thể lưu dữ liệu vào file Excel.Để dễ xem chúng ta chọn lưu dữ liệu thu thập được vào Excel:
Lưu vào Excel
.Làm thế nào để thực hiện nó tự động? Chúng ta cần phải:
Sau đó, chúng ta có thể bắt đầu thu thập dữ liệu từ Google Maps!
Sau khi hoàn thành, chúng ta cùng xem kết quả chúng ta thu thập được:
Nó rất tuyệt phải không?
Bạn chỉ cần định cấu hình quy trình làm việc một lần và sau đó bạn có thể thực hiện thu thập dữ liệu bất cứ lúc nào. Đó là lý do tại sao Nstbrowser RPA lại hấp dẫn!
Quét kết quả tìm kiếm của Google Maps hiện có sẵn trên thị trường Nstbrowser RPA và bạn có thể truy cập thị trường RPA để lấy trực tiếp! Chỉ cần thay đổi nội dung bạn muốn tìm kiếm và đường dẫn của tệp bạn muốn lưu sau khi nhận được và bạn có thể bắt đầu hành trình thu thập thông tin RPA của mình.