Webmester Eszközök: hibás 404-es hibaoldalak feltérképezése
Korábban már írtam a jelenségről, amikor látszólag azt a hibaüzenetet kapjuk egy oldalon, hogy a keresett oldal nem található, de a webszerver által visszaadott állapotkód nem ezt tükrözi. Mostantól az ilyen ál 404-es hibaoldalakat is feltérképezhetjük saját webhelyeinken a Webmester Eszközökben.
404, 410, 200 – mi van?
Ahogy azt az előző bejegyzésben már részleteztem, a webszerverek különféle állapotkódokkal jelzik a böngésző programok felé, hogy az éppen lekért oldal, kép, bármilyen tartalom (nem túl szép szóhasználattal élve) milyen státuszban, milyen állapotban van az adott szerveren.
Ha minden rendben, a kért oldal, kép a megadott címen ott van és lekérhető, akkor jellemzően egy 200-as állapot kóddal nyugtázzák a böngészők felé ezt az információt. A látogató ebből gyakorlatilag semmit sem vesz észre, ez része a webszerver és a böngésző program közti kommunikációnak.
Olyan oldallal már bizonyára mindenki találkozott, amelynek címsorában “A keresett oldal nem található” üzenetet látjuk. Több oldalon is megjelenik ilyenkor a 404-es állapot kód. Ennek drasztikusabb változata a 410-es állapotkód, ami azt jelenti, hogy gyakorlatilag nincs is esély arra, hogy a “nem található” státusz a jövőben átváltozzon a “meg van (=200)” állapotra.
Mi köze van ennek a Google-hoz?
A Google botjai, amikor feltérképezik weboldalainkat, lényegében hasonlóan működnek, mint egy Internet Explorer, vagy egy Mozilla Firefox: lekérik az oldalak tartalmát, a kapcsolódó képeket, grafikai elemeket, csak éppen nem egy monitoron jelenítik meg a kapott tartalmakat, hanem feldolgozzák és eltárolják saját adatbázisaikban, hogy aztán ezekből jelenítsék meg a találati lista elemeit.
Ebből kifolyólag fontos, hogy mindig a megfelelő állapotkódot adja vissza webszerverünk, weboldalunk.
A mostani fejlesztésnek köszönhetően feltérképezhetjük azon oldalainkat, amelyek vélhetően ilyen 404-es hibakóddal szeretnék közölni, hogy az adott tartalom (már) nem található meg oldalunkon, de vagy a webszerver hibás beállítása, vagy az általunk használt tartalomkezelő rendszer hibája miatt a böngészők és a Google bot felé azt az állapot kód jut el, hogy minden rendben.






Gr3nT szerint:
2010. június 08. 09:51Igen, én is csak lestem mikor megláttam hogy Ál-404-es hibát találtam. Ez persze nem rossz, de még is jó lenne tudni hogy akkor mi a probléma, mi az orvoslat erre.
DuracellTomi szerint:
2010. június 08. 10:04Először is meg kell nézni, hogy milyen tartalomkezelő rendszerről beszélünk. Ha saját, akkor meg kell keresni azt a programrészt, amivel ezt a hibaoldalt megjeleníted.
Ha PHP, akkor ide kell egy header(“HTTP/1.1 404 Not Found”); parancs, még mielőtt bármilyen tartalmat is átadsz a kliens böngészőnek.
Ha nem PHP, akkor ennek ekvivalensét kell eszközölni.
Ha pedig nem saját rendszerről beszélünk, akkor szólni kell a fejlesztőknek, hogy valami nem görbe. WordPress-ben ilyen probléma például legjobb tudomásom szerint nincs