ongke0711 > 12-08-20, 09:27 AM
(12-08-20, 09:21 AM)mrsiro Đã viết: Cho mình hỏi bạn ongke dùng kỹ thuật gì để lấy dữ liệu từ trang masothue.vn, trang này không có cung cấp API. Mình thấy demo bạn dùng IE rồi lấy dữ liệu qua các element, nếu trang web nó thay đổi thứ tự các element hoặc tên thì lấy dữ liệu sẽ sai đúng không bạn.
mrsiro > 12-08-20, 09:56 AM
(12-08-20, 09:27 AM)ongke0711 Đã viết: Chính xác là vậy. Hy vọng chủ trang này không rảnh và dư tiền thay đổi thiết kế hoài.Dùng cách này thì hơi phiêu lưu nhỉ, thường khi thay đổi thiết kế trang thì họ không có thông báo, vì thế sẽ xảy ra sai sót. Còn đối với các trang có API thì khi thay đổi API họ thường có thông báo để dev biết mà thay đổi code theo.
ledangvan > 19-08-20, 10:12 PM
ongke0711 > 20-08-20, 12:18 PM
(19-08-20, 10:12 PM)ledangvan Đã viết: Tôi gửi lên đây bản Ongke0711 đã chỉnh sửa , các bạn cần có thể tải về, bác nào hiểu biết hơn có thể cho ý kiến chỉnh sửa để code được tốt hơn.
Set wshShell = WScript.CreateObject("WScript.Shell")
wshShell.Run "iexplore -nomerge",0,true
ongke0711 > 23-08-20, 06:13 PM
(12-08-20, 09:56 AM)mrsiro Đã viết: Dùng cách này thì hơi phiêu lưu nhỉ, thường khi thay đổi thiết kế trang thì họ không có thông báo, vì thế sẽ xảy ra sai sót. Còn đối với các trang có API thì khi thay đổi API họ thường có thông báo để dev biết mà thay đổi code theo.
Mình có tiếp xúc qua 1 vài tool cũng dùng cách lấy theo element kiểu này, cứ lâu lâu lỗi thì họ bảo phải cài IE bản mới.
Nếu không dùng IE có thể dùng 1 trình duyệt khác không bạn google chrome chẳng hạn.
ledangvan > 12-05-21, 10:10 PM
ongke0711 > 12-05-21, 10:31 PM
ngoctrung3108@gmail.com > 21-06-21, 03:09 PM
ledangvan > 17-07-21, 04:33 PM
paulsteigel > 09-09-21, 10:21 PM
(23-08-20, 06:13 PM)ongke0711 Đã viết:(12-08-20, 09:56 AM)mrsiro Đã viết: Dùng cách này thì hơi phiêu lưu nhỉ, thường khi thay đổi thiết kế trang thì họ không có thông báo, vì thế sẽ xảy ra sai sót. Còn đối với các trang có API thì khi thay đổi API họ thường có thông báo để dev biết mà thay đổi code theo.
Mình có tiếp xúc qua 1 vài tool cũng dùng cách lấy theo element kiểu này, cứ lâu lâu lỗi thì họ bảo phải cài IE bản mới.
Nếu không dùng IE có thể dùng 1 trình duyệt khác không bạn google chrome chẳng hạn.
Cách lấy cào thông tin từ web xuống thì như bài trên tôi có nói là dùng thư viện XMLHTTPRequest là ngon nhất nhưng gặp trang bảo mật cao thì cũng potay phải dùng thư viện Internet Explorer để lấy dữ liệu.
Sau này IE sẽ bị khai tử nên tôi nghĩ các an toàn là dùng thư viện bên ngoài để hỗ trợ. Hiện tại tôi chỉ biết có Selenium hỗ trợ các loại trình duyệt như: FireFox, Chrome, IE, MSEdge, Opera...Dùng Selennium thì buộc người dùng phải cài thêm thư viện của nó nên cũng gây ra phiền phức khi phân phối ứng dụng nhưng không còn cách nào khác.
Để rảnh tôi sẽ làm demo dùng thư viện Selenium này xem sao.