Да, иногда .
Есть две вещи, которые обычно случаются. Ваша ссылка больше не работает, поэтому я не уверен в реальном сценарии в этом случае, поэтому я подведу итоги по другой ссылке.
HTTP перенаправление
Это то, что вы видите с Bit.lyдругими услугами. Что тогда сделать, это предоставить ответ перенаправления HTTP. Когда вы посещаете http://bit.ly/oH3410, он перенаправляет на фактический URL. Иногда один URL перенаправляет на другой. Это может произойти, если вы подключите URL-адрес к http://web-sniffer.net/ или, используя [curl][1] -I http://bit.ly/oH3410его, увидите 301, указывающий на новое местоположение.
Таким образом, чтобы справиться с перенаправлением HTTP, вам просто нужно зациклить запрос HTTP HEAD, пока вы не перестанете получать ответы в 300-х (надеюсь, получая 200). Имейте в виду, что они могут перенаправляться в цикле, который никогда не закончится. Вы можете сделать это с помощью CURL или любого другого инструмента HTTP.
Страница загрузчика
Это то, что используют большинство сайтов загрузки. Вы нажимаете на ссылку для скачивания, и вы переходите на страницу с кучей рекламы и сообщаете: «Ваша загрузка начнется в ближайшее время», что-то аналогично. [ Пример ]. С их помощью вы можете попытаться проанализировать фактическую прямую ссылку из URL, но это будет зависеть от конкретного сайта, и большинство сайтов не будут включать ее, чтобы вы не смогли ее обойти. Это делается либо с помощью meta http-equiv="refresh"тега в заголовке, либо с помощью JavaScript (чаще всего). У JS обычно есть запасной вариант заголовка.
Хотя есть решение. Если вы посмотрите на источник на странице загрузки, вы обычно увидите <meta http-equiv="refresh">тег (обычно в <noscript>теге) с атрибутом, URLкоторый указывает на фактическую загрузку. Поэтому используйте CURL (или любой другой инструмент HTTP), чтобы загрузить страницу, разобрать ее и получить это значение. Сайт может исключить это, хотя, если они хотят быть очень противными, что требует наличия JavaScript для загрузки файлов.
Вероятно, есть блок JavaScript, который также ссылается на загрузку. Это может быть запутано или связано с другого URL. Ваш пробег может варьироваться, пытаясь разобрать это. На странице также может быть «прямая ссылка». Вы можете попробовать несколько методов, чтобы найти это, но опять же это может быть запутано с помощью JavaScript или даже пропущено все вместе.
editчтобы увидеть источник уценки, как я это сделал.