#4108

Note : Respawn est sur la bonne voie.

Ouf.

Dernier essai du dimanche soir : mon script récupère (enfin) avec succès la page principale de www.opera.com.

Pourquoi cette page ? Parce que c’est l’une des plus tordues que j’ai jamais vu.
Le code est simple, mais il y a plein de fichiers liés, y compris dans les fichiers CSS externes : avec les url() (genre les background), mais aussi et surtout avec des @import, et ceci a plusieurs niveaux de récurrence, donc les fichiers ont eux aussi des url()…

Si vous voulez vous exercer sur la construction d’un proxy/téléchargeur de page html ou autres truc qui a besoin de regarder/parser toutes les requêtes externes dans un code source du web, prenez cette page : vous aurez tous les cas imaginables, en plus d’avoir un code parfaitement légal et valide :D.

(oh, et en cas de teste d’un proxy : bloquez le site testé via le proxy (ex. youtube) avec vos DNS : vous serez sûr que votre requête passe (ou ne passe pas) vie votre proxy, et non via une liaison HTTP normale.)

Bon, demain je me lève à 4h50… et mardi aussi et tous les jours. Bonne nuit .o/

EDIT : PS : je préviens, le code source de mon truc en PHP est une abomination sans nom. J’ai pratiquement tout écrit moi même, mais c’est une horreur. Par exemple, 3 ou 4 boucles foreach() imbriquées, le tout dans un while, sans compter les fonctions, qui sont pareille… Youpi !
http://lehollandaisvolant.net/index.php?mode=links&id=20121202221645