Извлечение данных из более чем 100 гиперссылок веб-страницы


-2

Я использую этот сайт, который имеет гиперссылку для ряда компаний. Я хочу извлечь детали компаний.

Когда я нажимаю на компанию, появляется гиперссылка «Сертификат» с названием, адресом, номером телефона, номером факса, продуктом. Я копирую данные из гиперссылок сертификатов.

Можно ли как-нибудь автоматизировать эту процедуру и извлечь данные в Excel?

я не могу добавить изображение пожалуйста, попробуйте с указанным выше путем файла. В сертификате отображаются данные о формиате изображения.


Всякий раз, когда я нажимаю на такую ​​ссылку «Сертификат», я получаю сообщение об ошибке 404, например, fieo.org/certificate.php?memberfieotoken=26015
slhck

да, я думаю, что есть проблема с сервером. но если веб-страница имеет конечный номер гиперссылки на странице, возможно ли извлечь данные из этих гиперссылок?
Маг

Если бы вы были действительно заинтересованы, вы могли бы определенно автоматизировать это с PowerShell. Затем Powershell может сохранить всю информацию в формате, совместимом с Excel
mrwhale

Ответы:


0

Возможно, вы найдете следующее полезное: http://webscraper.io/ имеет бесплатное расширение для Chrome. Я не пробовал это. Я использовал плагины Firefox Down Them All плюс Flashgot, но я нашел это немного хитрым.

Я не думаю, что какой-либо из этих подходов сразу даст вам файлы Excel - тогда вам придется выполнить какое-то преобразование.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.