A WEBMESTER 1924-ban írta :
>Ha igy all a dolog, akkor en mondjuk irnek egy Perl, vagy PHP szkriptet,
>amit raeresztenek az allomanyra, ami kihamozna belole az osszes html-t,
Két gond van ezzel. Egyrészt nem egy site-ot, csak egy page-et tartalmaz
(bocs az angol szavakért, csak ez magyarul nem mindig egyértelmű), azaz egy
db html (ha nincsenek keretek) és a hozzá tartozó képek stb. Ez még mindig
egész jól kibontható lenne, csak a fájlnevekkel elég zavarosan bánik el,
nem ad nekik nevet, viszont úgy csinál, mintha az eredeti abszolút címmel
lennének. Itt vannak jellemző részletek a http://hix.hu mht-s mentéséből (a
kihagyásokat ... jellel jelöltem; remélem, nem fogom összezavarni a
listaszervert; a nem túl nagy forgalom miatt, remélem, senkit nem zavar a
bővebb idézet; az első sor külön érdekessége, hogy MSIE 6-tal mentettem,
azt se tudja, fiú-e vagy lány; a kódolt sorokkal kicsit csaltam, mert a
sortörés különben zavaró kavarokat csinálna):
From: <Mentette: az Internet Explorer 5>
Subject: FOTEXNet HIX
Date: Mon, 26 Aug 2002 03:23:03 +0200
MIME-Version: 1.0
Content-Type: multipart/related;
boundary="----=_NextPart_000_0000_01C24CAF.E36610E0";
type="multipart/alternative"
X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2600.0000
This is a multi-part message in MIME format.
------=_NextPart_000_0000_01C24CAF.E36610E0
Content-Type: image/jpeg
Content-Transfer-Encoding: base64
Content-Location: http://hix.hu/images/logo_gray.jpg
/9j/4AAQSkZJRgABAgAAZABkAAD/7AARRHVja3kAAQAEAAAAPAAA/+4AJkFkb2JlAGTAAAAAAQM
FQQDBgoNAAACcwAAA5EAAASyAAAGA//bAIQABgQEBAUEBgUFBgkGBQYJCwgGBggLDAoKCwoKDBA
...
U/hfU774f8nefD/k4X7IQ0N+Q//aAAgBAwMBPxDzPEPlH7Sf3vudv8/c7f5+52Pz9zkfuRKZK8/
/9k=
------=_NextPart_000_0000_01C24CAF.E36610E0
Content-Type: application/octet-stream
Content-Transfer-Encoding: base64
Content-Location: http://newshop.fotexnet.hu/cgi-bin/audit.cgi?1
R0lGODlhAQABAJH/AP///wAAAP///wAAACH/C0FET0JFOklSMS4wAt7tACH5BAEAAAIALAAAAAA
AAEAAAICVAEAOw==
------=_NextPart_000_0000_01C24CAF.E36610E0
Content-Type: image/gif
Content-Transfer-Encoding: base64
Content-Location: http://hix.hu/images/spacer.gif
R0lGODlhAQABAJH/AP///wAAAP///wAAACH/C0FET0JFOklSMS4wAt7tACH5BAEAAAIALAAAAAA
AAEAAAICVAEAOw==
...
------=_NextPart_000_0000_01C24CAF.E36610E0
Content-Type: text/css;
charset="iso-8859-2"
Content-Transfer-Encoding: quoted-printable
Content-Location: http://hix.hu/style.css
.headerselect {
FONT-WEIGHT: normal; FONT-SIZE: 10pt; COLOR: #000000; FONT-FAMILY: =
Arial; TEXT-DECORATION: none
}
...
Verdana, Tahoma, Arial; TEXT-DECORATION: none
}
------=_NextPart_000_0000_01C24CAF.E36610E0
Content-Type: application/octet-stream
Content-Transfer-Encoding: base64
Content-Location: http://as.fotexnet.hu/default.gif?1225716564
R0lGODlhAQABAJEAAAAAAP///////wAAACH5BAkAAAIALAAAAAABAAEAAAgEAAMEBAA=
------=_NextPart_000_0000_01C24CAF.E36610E0
Content-Type: multipart/alternative;
boundary="----=_NextPart_001_001B_01C24CAF.E36DB200"
------=_NextPart_001_001B_01C24CAF.E36DB200
Content-Type: text/html;
charset="Windows-1252"
Content-Transfer-Encoding: quoted-printable
Content-Location: http://hix.hu/
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD><TITLE>FOTEXNet HIX</TITLE>
<META http-equiv=3DContent-Type content=3D"text/html; =
charset=3Dwindows-1252"><LINK=20
href=3D"http://hix.hu/style.css" type=3Dtext/css rel=3Dstylesheet>
<META content=3D"MSHTML 6.00.2719.2200" name=3DGENERATOR></HEAD>
<BODY text=3D#000000 bottomMargin=3D0 bgColor=3D#ffffff leftMargin=3D0 =
topMargin=3D0=20
rightMargin=3D0 marginheight=3D"0" marginwidth=3D"0">
<SCRIPT language=3DJavaScript>=0A=
...
method=3Dpost=20
target=3D_top>
<TD align=3Dleft width=3D"5%" height=3D26><IMG=20
src=3D"http://hix.hu/images/logo_gray.jpg"></TD>
<TD class=3Dheaderlink vAlign=3Dcenter align=3Dright width=3D"85%" =
height=3D26><A=20
class=3Dheaderlink =
...
width=3D1> </NOSCRIPT></BODY></HTML>
------=_NextPart_001_001B_01C24CAF.E36DB200
Content-Type: application/octet-stream
Content-Transfer-Encoding: quoted-printable
Content-Location:
http://as.fotexnet.hu/adserver.ads/45/0/0/51441030324963807
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<!--FOTEXNet.hu Adserver Engine Code Start--><HTML><HEAD>
<META http-equiv=3DContent-Type content=3D"text/html; =
...
End--></BODY></HTML>
------=_NextPart_001_001B_01C24CAF.E36DB200--
------=_NextPart_000_0000_01C24CAF.E36610E0--
Üdv: Attila
|