SEO

Satan, SEO a Subdomény – VOL V. – SEOfirot stromu života

Zdeněk Nešpor

SEO

Strom kategorií, který tvoří jádro webu a proudí přes něj životodárná míza. 

Úvod

SEOfirot stromu života je pátý díl ze série textů „Satan, SEO a Subdomény“. V předchozí části Jedna vládne MFI jsme probírali přesun z mobilní subdomény na plně responzivní web. Po dokončení této změny už nám do finále chybělo jen kousek.

V rychlosti si pojďme zopakovat přehled hlavních typů subdomén Heureky:

  • Základní a systémové (www, blog, info) ~20 subdomén.
  • Mobilní subdoména (m) 1 subdoména.
  • Subdomény kategorií (notebooky, mobilni-telefony, elektronika) ~2500 subdomén.
  • Brandové subdomény (sony, nikon, apple) ~60.000 subdomén.
  • Parametrické subdomény (herni-notebookandroid-telefonyxbox-360) ~1000 subdomén.

Tento text se věnuje subdoménám kategorií, kterých ke dni vydání tohoto textu stále existuje přibližně 3500–4000. Proč zatím změna neproběhla a kdy k ní dojde se dozvíte níže. 

Stromy života

Strom života patří mezi základní archetypy mnoha mytologií a náboženství po celém světě.1 Vzpomenout můžeme například na Strom poznání v biblické zahradě Eden2, severský Yggdrasil3 či kabbalistický strom života zobrazující deset sefirot.4 Tyto posvátné stromy reprezentují koncepty poznání, plodnosti, nesmrtelnosti a cesty k aspektům božství.


(Kabbalistický strom života. Zdroj obrázku: https://commons.wikimedia.org/wiki/File:Sefiroticky_strom.jpg).

Weby mají také svůj strom života. Říkáme mu strom kategorií. Manifestuje se v různých podobách a taxonomických5 informačních strukturách. Nejčastěji jako navigační menu, drobečková navigace nebo jako XML či JSON feedy.

Větve tohoto stromu mají jasně danou podobu (URI6), respektive polohu (URL7). Ta by v optimálním případě měla být neměnná. S větvemi je sice možné omezeně pohybovat v rámci hierarchie. Ale je velmi důležité, aby si zachovávaly svoje lokační identifikátory. Jinak řečeno, URL důležitých stránek je lepší neměnit v zájmu zachování stability webu. 

Mýty a legendy starověkých webů

Heureka byla založena v roce 2007. Už od začátku využívala různé subdomény. Mnoho jich stále existuje na stejných URL i po více než patnácti letech provozu. Například mobilni-telefony.heureka.cz, notebooky.heureka.cz nebo digitalni-fotoaparaty.heureka.cz. V roce 2022 se počet subdomén kategorií pohyboval mezi 3500–4000. Drtivá většina z nich tak má opravdu dlouholetou historii.

Podobně jako v předchozích případech jsme i u kategorií bojovali s řadou věcí. V první řadě to byly nečekaně subdomény. Komplikovaly nám především testování, vyhodnocování a rozvoj webu. Pokrývání nových oblastí a zakládání dalších podkategorií znamenalo vytvářet neustále nové subdomény a prohlubovat s tím spojené problémy. Například jsme tak byli nuceni vytvářet duplicity produktů. 

Produktové detaily jsou totiž na Heurece přímo navázané na URL kategorie. Jeden produkt tak může existovat na několika URL. Například klasická papírová kniha (https://knihy.heureka.cz/konec-prokrastinace-jak-prestat-odkladat-a-zacit-zit-naplno-petr-ludwig/), e‑book (https://e-book-elektronicke-knihy.heureka.cz/konec-prokrastinace/) a audiokniha (https://audioknihy.heureka.cz/konec-prokrastinace-petr-ludwig/) jsou tři URL pro prakticky stejný produkt.8 

Nejproblematičtější technikálie, které nás potrápily v kategoriích, byly spider traps. I v kategoriích se totiž vyskytovaly chyby s duplikací lomítek https://nike.heureka.cz/batohy/?o=4//// a filtry mohly tvořit variace.9

Jeden z posledních problémů bylo nasazení mega menu10, které ukázalo křehkost subdoménového systému. Google totiž vnímá subdomény jako samostatné weby.11 Každá subdoména má tím pádem svůj ranking a svůj odkazový profil. Po nasazení megamenu došlo zjednodušeně k tomu, že slabší subdomény odsály ranking těm silnějším, ale logicky nebyly schopné totéž vrátit zpět. Takže silné kategorie oslabily a ty slabé si v zásadě nijak nepomohly.

K podobnému efektu by nejspíše došlo i kdyby všechny kategorie byly na jedné (sub)doméně. Ale efekt by nebyl až tak výrazný. Díky sdílení odkazů v rámci jedné (sub)domény by sice pořád došlo k rozředění rankingu, ale také k jeho vhodnějšímu rozložení. Nicméně to spíše jen trochu předpokládáme, protože reálně nevíme, jak přesně Google odkazy mezi subdoménami počítá a jakou váhu různým typům odkazů skutečně dává.

Po drobných úpravách se povedlo efekt nasazení megamenu relativně stabilizovat. Ale signál, že se subdoménami nemůžeme pokračovat to byl dostatečně silný. 

Strom smrti

Nebudeme lhát. Do přesměrování kategorií se nám vůbec nechtělo, i přestože to bylo nutné. Na všechny změny webu je potřeba pohlížet byznysově. Parametrické sekce a brandové koutky byly celkem sranda. Relativně nízká návštěvnost, málo konverzí, skoro žádné zpětné odkazy. Potenciální chyby tady mohou trochu bolet, ale dá se do toho sáhnout relativně s klidem. 

Ovšem změnit URL všech roky budovaných kategorií, filtrů a produktů, kam proudí drtivá většina návštěvnosti. To už není legrace. Málokdo by chtěl takovému riziku dobrovolně vystavit web, který má na starosti. Nehledě na problémy a neudržitelnost systému. Představa, že na tuto změnu nebude vyhledávač reagovat pozitivně nás poněkud děsila. 

Veškeré práce jsme i navzdory obavám naplánovali a připravili. Původně měly spadat přibližně do roků 2020–2022. Nakonec okolnosti rozhodly za nás. V rámci přechodu na One Platform12 se totiž začal připravovat také jeden strom kategorií pro weby ve všech zemích Heureka Group a také nové jednotné URL. 

To by znamenalo, že bychom museli v krátkém čase kategorie redirectovat dvakrát. Poprvé na aktuální platformě. A za 2–3 roky znovu na nové URL odpovídají potřebám nové platformy. Podstupovat stejné riziko zbytečně několikrát nedávalo smysl a původní plány jsme zahodili. 

Jeden strom

Pro One Platform nejsou subdomény přijatelné a nadále se s nimi nepočítá. Weby budou sjednoceny na jasně definovaných URL. Například produkty budou typově na URL jako https://www.heureka.cz/p/apple-iphone-13-128gb/. Kategorie na https://www.heureka.cz/c/mobilni-telefony-c1234/. V URL budou nově slugy a identifikátory, které umožní jednodušší procesování a vyhodnocování dat napříč všemi zeměmi.13 Takže se Heureka nakonec téměř všech subdomén zbaví.

Není jisté, kdy přesně k tomu dojde. Postupný rollout One Platform a jednotného stromu do zemí Heureka Group bude trvat několik měsíců. Možná let. Do našeho původního subdoménového SEO tažení už to zcela nespadá, takže tento text vydáváme čistě jako vysvětlení aktuálního stavu.14 

Odvrácená strana 

Co se dá po replatformizaci očekávat? Čistě z pohledu SEO. Představte si skutečný strom. Vytrhneme ho ze země. Rozřežeme kmen, větve a výhonky. Otrháme listy. Vytřídíme na hromádky. A na stejném místě (top level doméně) kmen (top level kategorie) a větve (podkategorie) slepíme plus mínus podobně. Obměníme výhonky (=filtry). Listy (=produktové detaily) necháme na hromdáce bokem. Zakoření strom znovu a bude prosperovat? 

Konkrétně se bavíme o přesunu cca 3500 kategorií ze subdomén na nové adresy. Úpravy logiky některých filtrů. A vyčlenění cca 29.000.000 produktů mimo kategorie na nové URL. A to se zatím bavíme jen o českém webu. Je k tomu nutné připočítat i miliony produktů a tisíce kategorií na webech v dalších osmi zemích Heureka Group. 

Čistě po technické stránce tato změna neměla být ničím jiná a výjimečná oproti všem předchozím aktivitám, které dopadly dobře. Hromada přesměrování s relativně jednoduše identifikovatelnými vzorci. To umíme dělat velmi dobře díky nástroji Redirect Tool, který vyvíjíme interně.

Ale jak jsme již nastínili. Je to opravdu extrémní zásah do absolutně nejniternější struktury webu v mnoha oblastech zároveň. Krom toho bude nutné upravit ještě veškerá historická redirectovací pravidla, aby nedocházelo k dlouhému řetězení přesměrování nebo smyčkám. A bude probíhat i nějaké překlenovací období, podobně jako jsme popisovali v předchozím článku o mobilní verzi. Takže dočasně poběží nová i stará verze zároveň a nic nesmí utéct ven. Moc manévrovacího prostoru pro chyby není. 

Architekti osudu

Je libo vyvěštit osud webu? Tarotové karty a křišťálové koule na chvíli odložme bokem. Webařina je, nebo by alespoň měla být, pragmatická15 disciplína podložená daty a silným technickým základem. Například strukturu (respektive informační architekturu) webu tvoříme na základě analýzy klíčových slov, což je primárně datová disciplína. 

Většina lidí si pod pojmem „informační architektura“ představí jen taxonomii kategorií a menu. Ale jedná se o mnohem širší pojem, který pojímá obecně veškeré prezentované informace lidem i vyhledávačům. Od zmíněné hierarchie kategorií, přes uspořádání obsahu na stránkách a interní odkazy, až po strukturovaná data, meta data, stavové kódy, robots.txt, sitemapy, canonical a jiné. Být v jakémkoliv ohledu informačních architektem webu je poměrně zodpovědná práce.

Některé vyjmenované složky se dají měnit a upravovat celkem bez problémů a postihů. Změny v obsahu nebo strukturovaných datech nebývají nijak zvlášť rizikové. Oproti tomu sahat do zavedené hierarchie webu nebo, v našem případě, ji kompletně rozbourat, už musí probíhat s velkým rozmyslem.

Potíž je, že v SEO jsme jen pouhými architekty. V lepším případě i stavbyvedoucími. Nicméně skutečným strůjcem osudu je v konečném důsledku mocná Kyber Trojice, kterou představují Spider Crawlování, Databáze (Re)Indexace a Algoritmy Rankingu. 

(Svatá trojice. Zdroj původního obrázku: https://commons.wikimedia.org/wiki/File:Shield-Trinity-Scutum-Fidei-English.svg)


Jak budou na tak masivní změnu reagovat vyhledávače ani trochu netušíme a není to tak úplně v našich rukou. Jsme realisté a musíme proto napsat, že k nějakému propadu nejspíše dojde. Ale cokoliv dalšího nebo přesnějšího by šlo bohužel predikovat maximálně z křišťálové koule.

Závěrem

Subdomény kategorií s námi ještě chvíli budou a co přinese budoucnost neví nikdo. Přípravy nepodceňujeme a zůstáváme optimističtí, že to nakonec dopadne dobře stejně jako doposud. Držte nám palce. 

Jsme těsně před koncem. V příštím článku si dáme rychlou rekapitulaci a probereme, zda jsou subdomény dobré nebo špatné. 


Seriál o SEO a subdoménách


Disclaimer

K textu přistupujte obezřetně. Tento článek a celý seriál neslouží jako návod. Texty neobsahují žádné „univerzální“ pravdy. Každý web představuje unikátní systém s různými výchozími podmínkami. Je nutný individuální přístup a perfektní znalost konkrétního webu i dané problematiky.

Článek popisuje náš web. Nijak nehodnotíme obecnou efektivitu subdomén či adresářů. Ani nedoporučujeme žádné konkrétní řešení. Opět se jedná o silně individuální záležitost, kterou ovlivňuje mnoho faktorů.

Strategie a detailní plány pro některé zde popsané aktivity vznikaly více než rok. Vše bylo mnohokrát diskutováno, průběžně testováno a validováno. Myslete na to, prosím, až budete podobné aktivity sami dělat.

Některá uvedená data mohou být nepřesná a účelově zkreslená. Konkrétní čísla, jako jsou například statistiky organické návštěvnosti, revenue, konverze a podobně, nemáme z pochopitelných důvodů v plánu vypustit ven. Klíčové informace, jako jsou počty subdomén, URL a naše postupy, jsou však uvedeny pravdivě bez přikrášlení.

Texty mohou obsahovat pokročilé koncepty a modely, které nejsou v oblasti SEO úplně standardní. Články je proto doplněny o poznámky pod čarou se zdroji, kde je vše detailně vysvětlené.


Poznámky:

  1. Strom života https://en.wikipedia.org/wiki/Tree_of_life

  2. Eden https://en.wikipedia.org/wiki/Garden_of_Eden

  3. Yggdrasil https://en.wikipedia.org/wiki/Yggdrasil

  4. Sefirot https://en.wikipedia.org/wiki/Sefirot

  5. Taxonomie https://en.wikipedia.org/wiki/Taxonomy

  6. URI https://en.wikipedia.org/wiki/Uniform_Resource_Identifier

  7. URL https://en.wikipedia.org/wiki/URL

  8. Přesněji se jedná se o varianty produktu. 

  9. Detailněji je popsáno ve článku https://www.heurekadevs.cz/satan-seo-subdomeny-iii-seocida

  10. Mega menu https://www.ilincev.com/mega-menu

  11. Nebo ne? Více se dozvíte v následujícím článku Jezdci SEOkalypsy. 

  12. OnePlatform https://www.heurekadevs.cz/menimeheureku-chystame-mezinarodni-oneplatform

  13. Uvedené URL jsou jen ukázkové, nemusí se jednat o finální podobu. 

  14. Další informace budou publikovány nejdříve po kompletním dokončení a vyhodnocení replatformizace. Ale slíbit to nemůžeme. 

  15. Pragmatismus https://en.wikipedia.org/wiki/Pragmatism

Autor článku

Zdeněk přišel do Heureky v roce 2018 jako externí SEO specialista na pár hodin týdně. Nakonec tu zaktovil skoro na full-time. Věnuje se pokročilému technickému SEO a analýzám dat. Baví ho psát články, učit se Python a vyvíjet jednoduché nástroje, které pomáhají automatizovat rutinní úkony.

Podobné články

Příběhy webmasterů: Ruský spam, subdomain hijack, nástroje hromadného ničení a SEO pro Jekyll

Příběhy webmasterů: Ruský spam, subdomain hijack, nástroje hromadného ničení a SEO pro Jekyll

Běžná revize webu se občas může docela nepříjemně protáhnout. Zvlášť když zjistíte, že vám ruský…

Jak moc nás v Heurece (ne)trápí subdomény a jak bojujeme s kyberchaosem? Pozvánka na první SEO livestream

Jak moc nás v Heurece (ne)trápí subdomény a jak bojujeme s kyberchaosem? Pozvánka na první SEO livestream

První webinář a livestream Heureky o SEO proběhl 4. 6. 2020 od 10:15 na Twitchi. Podělili jsme se s…

Satan, SEO a Subdomény – VOL I. – Chaos přichází plíživě

Satan, SEO a Subdomény – VOL I. – Chaos přichází plíživě

Využití subdomén jako základního strukturálního elementu není žádná velká novinka. Heureka díky…

Zaber si svou židli!

<Nejsme asociálové/>

<Témata/>

Zajímá tě naše práce, technologie, tým nebo cokoliv jiného?
Napiš šéfovi vývoje Lukášovi Putnovi.

lukas.putna@heureka.cz