Mi az a feltérképezési büdzsé? A Google elmagyarázta!
A feltérképezési büdzsé, mint kifejezés az elmúlt néhány hónap egyik leginkább felkapott SEO kifejezése volt a szakmában, amivel annyiszor és annyian bombázták már a Google csapatát, hogy a keresőóriás most egy külön blogbejegyzésben magyarázta el, hogy miről is van szó. A történet megértéséhez azt kell tudni a feltérképezési büdzsé előzményéről, hogy egy oldal hatékony feltérképezése – kifejezetten a nagyobb internetes áruházak esetén – a Google számára ugyebár komoly kihívást jelenthet, hiszen vannak olyan oldalak, amelyek akár több millió URL-el is rendelkeznek, amikor a Google feltérképezési sebessége csődöt mondott. Ilyenkor kap szerepet a feltérképezési büdzsé!
A dolog lényege, hogy tegyük fel: adott egy internetes portál, amelynek több százezer URL-je van, és ez folyamatosan bővül is. Ilyenkor adja magát a kérdés, hogy vajon a Google-nek sikerült mind a többszázezer URL-t feltérképeznie és egyet sem hagyott ki, vagy akad néhány, amelyek örökre elvesztek az éterben? Ha ez a kérdés minket is foglalkoztat, akkor fontos, hogy ismerjük a feltérképezési büdzsé fogalmát!
Amit a feltérképezési büdzséről legalább tudni kell
A Google a közleményben hangsúlyozta, hogy a feltérképezési büdzsé alapesetben nem egy olyan dolog, amivel a weboldal-tulajdonosok jelentős többségének alapesetben foglalkoznie kellene, de nem árt, ha tudunk róla. Mint ismert, a Google az újabb oldalakat általában 1-2 napon belül térképezi fel és indexeli, és amennyiben ez megtörténik, akkor nem kell aggódnunk, mint ahogyan akkor sem, ha oldalunknak maximum pár száz vagy pár ezer URL-je van. A nagyobb oldalaknál nyilván már más a helyzet, esetükben ugyanis lényeges lehet, hogy a Google milyen URL-eket indexeljen elsőként, sőt mikor és mennyire indexelje őket, ezzel ugyanis optimalizálni lehet a szerver erőforrásait.
A feltérképezési büdzsé kapcsán nagyon fontos tisztázni a feltérképezési ütem korlátainak fogalmát. Mint ismert, a Googlebot egyik elsődleges célja az, hogy megpróbálja úgy feltérképezni a honlapokat, hogy közben egy pillanatig se rontsa a felhasználói élményt. Ezt hívja a Google Crawl Rate Limitnek, ami nem más, mint egy határérték ahhoz kapcsolódóan, hogy a Googlebot milyen gyakran kérje le egy weboldal URL-jeit.
Ez azért lényeges, mert ha a lekérés túl gyakori, akkor az nyilván alaposan megterhelheti a szervert, ezzel pedig lassul az oldal, és romlik a felhasználói élmény. A határérték tehát megszabja, hogy egyszerre hány lekérést hajthat végre a Googlebot, és milyen időközönként indítson újabb lekérdezéseket. Ennek értéke két tényezőn múlik! Az egyik a feltérképezés egészsége, vagyis ha az oldal gyorsan reagál, akkor a határérték emelkedik, ha lassan, akkor csökken. A másik a Search Console értéke, ahol manuálisan is beállíthatjuk a feltérképezési küszöböt, amivel csökkentheti a gyakoriság.
Lényeges még definiálni a feltérképezési igény fogalmát is! Ennek a lényege, hogy a Googlebot addig nem használja fel a teljes feltérképezési lehetőségeket, ameddig erre ténylegesen nincs szüksége. Hogy mi lehet az a feltérképezési igény? Ezt különféle tényezők határozzák meg! Ilyen például a népszerűség, vagyis ha az URL-ek, amelyek népszerűbbek, sokkal gyakrabban kerülnek feltérképezésre azért, hogy frissek maradjanak. Ha a Googlebot régi URL-t talál, rögtön sürgőssé és fontossá válik a szemében pont a fentiek miatt. Persze a feltérképezést a domain egészének történései is befolyásolják, ha egy oldal URL-jei megváltoznak, akkor arra a Google minden esetben nagyobb figyelmet szentel.
A feltérképezési határértéke és a feltérképezési igény tehát együtt, közösen határozzák meg a feltérképezési büdzsét, vagyis azt a számot, ahány URL-t a Google egy oldalról fel tud és fel is akar térképezni egy bizonyos idő alatt.
A feltérképezési büdzsét befolyásoló tényezők
A feltérképezési büdzsét számtalan különféle tényező befolyásolhatja, így például az alacsony minőségű URL-ek, amelyek az indexelést és a feltérképezést egyaránt nagyon negatívan befolyásolhatják. A Google kiemelte azonban, hogy a gyenge minőségű oldalak is ide sorolható, amelyek gyengeségük alapján fontossági sorrendbe sorolhatók. Ilyeneket a tipikus szűrő oldalak, aztán az oldalt érintő duplikációk, a 404-es hibák, a feltört oldalak, a végtelen értéktelen oldalak, valamint az alacsony minőségű tartalommal, szinte csak spammel ellátott weboldalak.
A Google szerint az efféle tartalmak feltérképezése minden esetben csak erőforrás-pazarlás, hiszen vesztegetjük vele a szerver előforrásait, és hátráltatjuk a jó minőségű oldalak feltérképezését. A feltérképezési büdzsé tehát a SEO legmagasabb szintje, azonban sokk portálnak mégis érdemes lehet foglalkozni vele!