Vyhledávače zboží na maximum: Dokonalý XML feed, aneb jak předat vyhledávači zboží maximum informací o svých produktech? (2. díl)

Ve druhém dílu našeho seriálu o efektivním využití vyhledávačů zboží se podíváme na to, jakým způsobem vyhledávačům zboží předat všechny potřebné informace o produktech, které v e-shopu nabízíme.

Jak na zbozove vyhledavace - SHOPERO

Co je to XML feed?

XML feed je datový soubor, který obsahuje export všech produktů z databáze vašeho internetového obchodu, včetně detailních informací o těchto produktech (popis, cena, skladová dostupnost, odkaz na obrázek, apod.). Zpravidla bývá dostupný přes URL v adresním řádku a generuje se z databáze e-shopu ve chvíli načtení této URL, tzn. informace v něm obsažené by se vždy měly shodovat s aktuálními informacemi v e-shopu.

Adresa XML feedu může vypadat například následovně: www.demo.shopero.cz/export/?type=heureka-cz

Obsah souboru jako takového pak například:

<SHOPITEM>
<PRODUCT>Světélkující podložka pod myš</PRODUCT>
<DESCRIPTION>Fosforeskující okraj, nevyžaduje baterie.</DESCRIPTION>
<URL>http://obchod.cz/podlozky-pod-mys/fosfor</URL>
<DELIVERY_DATE>1</DELIVERY_DATE>
<IMGURL>http://obchod.cz/obrazky/podlozky-pod-mys/fosfor.jpg</IMGURL><PRICE>620</PRICE>
<PRICE_VAT>756</PRICE_VAT>
</SHOPITEM>

Výhodou e-shopu postaveného na systému Shopero je to, že už obsahuje předpřiravené feedy pro všechny hlavní vyhledávače zboží, včetně XML feedu pro slovenskou Heureku. Pokud svůj e-shop u nás nemáte, je potřeba, aby XML feedy připravil váš webový vývojář.

Jak je XML feed s vyhledávačem zboží propojen?

Ve chvíli, kdy máme tento export se svými produkty připraven, vložíme jeho adresu v administraci příslušného vyhledávače zboží, který si v pravidelných intervalech bude stahovat jeho obsah do své databáze. K tomu dochází zpravidla jednou denně, v Google Merchant je možné dokonce čas nastavit.

Z toho vyplývá, že ač jsou informace o našich produktech v XML feedu vždy aktuální (shodné s těmi, které máme v databázi e-shopu), ve vyhledávači zboží se mohou změny projevit až za 24 hodin.

Dříve bylo běžnou praxí, že internetový obchod používal shodný XML feed pro více vyhledávačů zboží. Specifikace se příliš nelišila, a pokud feed obsahoval tu navíc značku pro Heuréku a tu zase navíc jinou pro Zbozi.cz, v zásadě to ničemu nevadilo a oba vyhledávače byly schopny data z feedu číst (značek, které danému vyhledávači nepříslušely, si jednoduše program zpracující XML feed nevšímal).

S rozvojem těchto platforem však došlo natolik k diverzifikaci, že v dnešní době je kvůli datové velikosti rozumné vytvořit pro každý “zbožák” separátní XML feed.

Jak vytvořit dokonalý XML feed?

A nyní už k samotným doporučením pro dokonalý XML feed. Detailně se budeme zabývat pouze těmi vyhledávači zboží, které má smysl v dnešní době využívat, tedy Zbozi.cz, Heureka.cz a Google Merchant. Nemá smysl v článku rozepisovat detailní specifikaci XML feedů jednotlivých vyhledávačů. Ty najdeme v příslušných nápovědách:

Prostor tak věnujeme především častým chybám a tomu, jakým způsobem je možné základní XML feed s povinnými značkami vylepšit a zvýšit tak výkonnost svých kampaní. Obecně se v praxi setkávám se třemi typy problémů, kterými XML feedy trpí:

  1. Obsahují chyby, které znemožňují nebo komplikují čtení souboru vyhledávačem
  2. Špatný formát obsahu jednotlivých značek
  3. Nevyužité nepovinné značky, které by mohly prezentaci obchodu a produktů vylepšit

Každé této skupině problémů se budeme věnovat zvlášť.

1.) Chyby, které znemožňují nebo komplikují čtení souboru vyhledávačem

První skupina problémů je vždy stejná, bez ohledu na konkrétní vyhledávač. Tyto chyby se neobjevují příliš často, je ale dobré o nich vědět a mrknout, jestli se nás náhodou také netýkají. Mezi nejčastější chyby z této skupiny patří:

A) Nenahrazení některých znaků entitami

Některé speciální znaky obsažené v názvech, popiscích nebo parametrech našich produktů se mohou shodovat se znaky, které programátor používá při psaní kódu samotného XML feedu. Jedná se například o znaky jako & nebo > a <. Příklad:

<MANUFACTURER>Black & Decker</MANUFACTURER>

Řešením je tyto znaky nahradit ve feedu tzv. HTML entitami, které se pro zápis těchto speciálních znaků ve zdrojovém kódu používají. Pokud přepíšeme s HTML entitou příklad výše, vypadalo by to ve feedu nějak takto:

<MANUFACTURER>Black &amp; Decker</MANUFACTURER>

Konkrétní HTML entity pro jednotlivé znaky by už měl váš vývojář webu znát.

B) Neuzavřené XML značky

Další chybou, ač nepříliš častou, může být neuzavření XML značky ve feedu. Většina značek v XML feedech je tzv. párových, to znamená, že obsahují počáteční element, následuje obsah značky a koncový element. Ten právě v některých případech může chybou zdrojového kódu chybět. Příklad:

<PRICE>620

Správný zips:

<PRICE>620</PRICE>

To jsou nejčastější chyby, které se v první skupině objevují. Mohou se vyskytnout i další nedostatky (zkomolení názvu značky, překřížení XML značek a jiné), v praxi se s těmito chybami ale nesetkávám. Pojďme na druhou skupinu.

2.) Špatný formát obsahu jednotlivých značek

Skupina chyb, která se vyskytuje oproti prvnímu případu poměrně často. Jedná se o chyby, kdy ve feedu danou značku sice máme, její obsah je pro vyhledávač čitelný, ale není ve formátu, v jakém si jej vyhledávač představoval, tudíž se mu s hodnotou následně špatně pracuje. Pojďme opět postupně.

A) Špatné využití značek pro uvedení názvu produktů

Velmi častá chyba, která komplikuje párování vašich nabídek s nabídkami konkurentů, v důsledku čehož se vaše produkty nemusejí vůbec zobrazovat.

Pro základní název produktu má Zbozi.cz i Heuréka značku <PRODCTNAME>. A teď pozor, specifikace obsahu této značky se pro oba vyhledávače liší.

Zboží.cz: Značka <PRODUCTNAME>

  • Značka by měla obsahovat základní název produktu, tedy výrobce, produktovou řadu a produktové číslo / označení
  • Značka nesmí obsahovat přívlastky jako například barvu, velikost a jiné rozlišující údaje
  • Značka by neměla obsahovat bonusy specifické pro daný obchod, tedy například “+ dárek zdarma” a jiné
  • Příklad: <PRODUCTNAME>Canon PowerShot SX100</PRODUCTNAME>

Heuréka.cz: Značka <PRODUCTNAME>

  • Obsah značky se liší dle kategorie, do které produkt spadá, konkrétní specifikaci jednotlivých kategorií lze najít v nápovědě Heuréky
  • V případě některých kategorií tedy značka může obsahovat například barvu nebo velikost a jiné parametry
  • Značka by stejně jako na zboží neměla obsahovat bonusy specifické pro daný obchod, tedy například “+ dárek zdarma” a jiné
  • Příklad: <PRODUCTNAME>Canon PowerShot SX100 červený</PRODUCTNAME>

Že je to složité? Pojďme to zamotat ještě víc. Dále totiž oba vyhledávače nabízejí ještě značku pro rozšíření produktového jména. Název i specifikace obsahu se opět liší:

Zboží.cz: Značka <PRODUCTNAMEEXT>

  • Značka by měla obsahovat přívlastky k produktu (bez samotného názvu produktu), tedy například barvu nebo velikost
  • Značka by neměla obsahovat bonusy typu “+ doprava zdarma” nebo “+ dárek zdarma”, pro tyto účely má Zbozi.cz separátní značku, které se budeme věnovat dále v článku
  • Příklad: <PRODUCTNAMEEXT>Black</PRODUCTNAMEEXT>

Heuréka.cz: Značka <PRODUCT>

  • Značka by měla obsahovat bonusy k produktu specifické pro daný obchod, například “+ doprava zdarma” nebo “+ dárek zdarma”
  • Na rozdíl od Zbozi.cz by měl být obsahem i celý název produktu
  • Příklad: <PRODUCT>Nokia 5800 XpressMusic + pouzdro zdarma</PRODUCT>

B) Špatný obsah značky <CATEGORYTEXT>

Další velmi častý problém, který komplikuje párování produktů. Značka <CATEGORYTEXT> by měla obsahovat kategorii produktu, včetně celé cesty k této kategorii. V praxi se velmi často setkávám se dvěma typy chyb:

  • Značka neobsahuje celou cestu do kategorie, ale pouze koncový název kategorie (např.: “Mobilní telefony”, správně by mělo být “Elektronika | Mobilní telefony”)

Značka obsahuje kategorii produktu z vašeho e-shopu, což je správně na Zbozi.cz, kde nemáme jinou možnost, nikoliv však na Heuréce, která nabízí stromový seznam svých kategorií.

Tip: Shopero vám v případě párování kategorií s vyhledávačem Heureka.cz podstatně zjednoduší práci. Dokáže tento specifický “strom kategorií” napárovat na kategorie ve vašem e-shopu a následně do XML feedu propisovat kategorie z Heuréky bez nutnosti zásahu programátora.

Stejný problém bývá velmi častý v případě Google Merchant, kde jsou značky pro vypsání kategorie hned dvě – <google_product_category> a <product_type>. První z nich opět slouží pro vypsání kategorie dle stromu kategoríí Google. Druhá potom pro vypsání kategorie z e-shopu.

Některé e-shopové systémy, jako je například SHOPERO, automaticky umožňují výběr vhodné kategorie ze zbožového vyhledávače pro kategorii, která se nachází ve vašem e-shopu.

C) Využití zastaralé značky <AVAILABILITY> na Zbozi.cz

Ač je to s podivem a značka <AVAILABILITY> už na Zbozi.cz není několik let platná, stále se s tímto “dinosaurem” občas setkávám. Nově by dostupnost měla být uváděna ve značce <DELIVERY_DATE>.

D) Špatný formát ceny

Další běžnou chybou bývají nedostatky ve formátu uváděné ceny. Některé z vyhledávačů jsou k formátu ceny značně benevolentní. Například Zbozi.cz ale vyžaduje cenu ve formátu:

<PRICE> 12345.50 </PRICE>

Formáty uvedené níže jsou nepřípustné:

  • <PRICE>12345.50 Kč</PRICE>
  • <PRICE>12 345.50</PRICE>
  • <PRICE>-12345.50</PRICE>
  • <PRICE>0</PRICE>

Heuréka dokáže zpracovat mezery v cenách nebo čárku pro oddělení desetinných míst namísto tečky, s měnou si však neporadí. Naopak v případě Google Merchant by cena měla být uvedena včetně měny, tedy například <g:price>150.00 Kč</g:price>.

3.) Nevyužité nepovinné značky, které by mohly prezentaci obchodu a produktů vylepšit

Třetí skupina patří mezi nejběžnější problémy, které se v XML feedu mohou vyskytovat. Téměř nikdy se mi v praxi nestalo, že bych pod ruku dostal ke kontrole XML feed, který by obsahoval všechny značky, které by bylo možné v daném případě využít. Protože se možnosti nepovinných elementů dle jednotlivých vyhledávačů zboží liší, vezmeme to pěkně postupně. U každého vyhledávače uvedu ty značky, které ve feedu nejčastěji scházejí.

A) Zbozi.cz: Nejčastěji scházející nepovinné XML značky

  • <SHOP_DEPOTS> – Identifikátor kamenné prodejny, kde je zboží k dispozici k okamžitému odběru. O přidělení identifikátoru ke každé kamenné pobočce je potřeba požádat na e-mailové adrese zbozi@firma.seznam.cz. V e-mailu uveďte IČ, název společnosti a adresu kamenné prodejny či výdejního místa. Odkaz na specifikaci v nápovědě.
  • <EAN> – Velmi důležitá značka pro správné párování produktů s nabídkami konkurentů, přesto se dnes a denně setkávám s tím, že ji e-shopy ve feedu nemají, nebo značku uvádějí prázdnou, bez vyplněné hodnoty. Doporučuji důsledně od dodavatelů vyžadovat EAN kód zboží a ve feedu je uvádět. Odkaz na specifikaci v nápovědě.
  • <EXTRA_MESSAGE> – Jak bylo zmíněno výše v článku, značka pro název produktu by na Zbozi.cz neměla obsahovat bonusy specifické pro daný obchod, tedy například “+ doprava zdarma” nebo “+ dárek zdarma”. Pro tyto účely tady máme značku EXTRA_MESSAGE, do které je možné jednotlivé bonusy uvést. Co je nevýhodou, u každého produktu je možné tuto značku uvést pouze jednou. Pokud tedy nabízíme bonusů více, například dopravu zdarma + příslušenství, není cesta jak toto na Zbozi.cz ve feedu uvést. Odkaz na specifikaci v nápovědě.

B) Heureka.cz: Nejčastěji scházející nepovinné XML značky

  • <VIDEO_URL> – Značka pro odkaz na video recenzi produktu na serveru YouTube. Video recenze se zobrazí u produktu na záložce “Recenze”, čímž získáme odkaz na svůj YouTube kanál, odkud můžeme pomocí odkazu v popisku vodit návštěvníky dále na náš web – zdarma. Odkaz na specifikaci v nápovědě.
  • <EAN> – Stejné jako v případě Zbozi.cz. Na Heuréce dokonce povinná položka pro kategorii knihy. Opět důrazně doporučuji tuto značku nevynechávat. Odkaz na specifikaci v nápovědě.
  • <DELIVERY> – Značka pro možnosti dopravy konkrétního produktu. Obsahuje vnořené značky DELIVERY_ID, DELIVERY_PRICE a DELIVERY_PRICE_COD pro další detaily o dopravě. Lze opakovat tolikrát, kolik způsobů dopravy lze pro daný produkt využít. Odkaz na specifikaci v nápovědě.
  • <PARAM> – Značka pro uvedení konkrétních parametrů jednotlivých produktů. Velmi důležitá značka, protože bez uvedených parametrů se produkty obchodu nebudou zobrazovat v konkrétním filtrování. Protože se jedná o komplexní problematiku a parametrů je mnoho, existují k této značce v nápovědě Heuréky dvě kapitoly – Jak správně zadat parametry do XML souboru a seznam povinných parametrů.
  • <ACCESSORY> – Značka pro uvedení ITEM_ID produktu ve feedu, který je příslušenstvím k danému zboží. Odkaz na specifikaci v nápovědě.

C) Google Merchant: Nejčastěji scházející nepovinné XML značky

  • <g:sale_price> – Cena produktu v akci. Obsahuje vnořenou značku <g:sale_price_effective_date>, která by měla nést časové období platnosti akční ceny. Odkaz na specifikaci v nápovědě.

Co dalšího bych měl vědět?

Pár dalších důležitých věcí na závěr, které nám mohou pomoci XML feedy využít na maximum.

První důležitá věc, která v článku nezazněla, je ta, že v ideálním případě bychom pro Heuréku měli mít XML feedy dva – jeden s produkty jako takovými a druhý se skladovou dostupností. A proč Heuréka data takto rozdělila? Jednoduše proto, aby mohla dostupnostní XML feed, jak se datovému souboru s informacemi o dostupnosti říká, stahovat každých 10 minut, což by v případě stahování celého hlavního feedu zbytečně zatěžovalo server. Specifikace tohoto dostupnostního XML feedu najdeme opět v nápovědě Heuréky. Jeho adresu lze u obchodu doplnit v administraci (Přehled ->Upravit obchod).

A druhá poznámka na konec – jak Zbozi.cz, tak Heureka nabízejí možnost určit ve feedu varianty produktů, tzn. například barevné kombinace, velikost, apod. Z praxe mám však vyzkoušeno, že je lepší prozatím tyto značky nepoužívat. Jednotlivé varianty produktu (ve chvíli, kdy nejsou značky pro variantu použity a varianta je ve feedu jako samostatný produkt), mohou hezky tapetovat výsledky hledání.

Seriál Vyhledávače zboží:

1. díl seriálu – Vyhledávače zboží na maximum: Co jsou to zbožáky a jak fungují? (1. díl)
2. díl seriálu – Právě jste dočetli.

V příštím díle článku se podíváme na to, jakým způsobem efektivně pracovat s PPC systémy, které Zbozi.cz a Heureka.cz nabízejí.

Nevíte si s vyhledávači zboží rady? Napište mi, rád vám s registrací, nastavením i průběžnou správou kampaní pomůžu.

The following two tabs change content below.
Jakub Velička
Jakub se věnuje internetovému marketingu již sedmým rokem. Do oblasti online komunikace se dostal přes programování a design webových stránek, coby koníček na střední škole. Zkušenosti čerpal 5 let v H1.cz a nyní pracuje pro agenturu Jakmy, kde pomáhá klientům prostřednictvím výkonové reklamy zvyšovat zisk.

Přihlašte se

Dostávejte aktuální informace ze Shopera

Vyhněte se 13 nejčastějším chybám e‑shopů!

Vaši zákazníci čekají…

... na přehlednou a intuitivní nabídku Vašich produktů.

Shopero je moderní e-shop dodávaný formou služby pro každého, kdo chce prodávat jako profesionál.

Vyzkoušejte na 30 dní zdarma

Tento web používá k poskytování služeb, personalizaci reklam a analýze návštěvnosti soubory cookie. Používáním tohoto webu s tím souhlasíte. Více informací

Abychom Vám mohli umožnit nejlepší procházení webových stránek je nastavení cookies na této webové stránce povoleno. Pokračováním v používání tohoto webu beze změny nastavení souborů cookies v prohlížeči nebo kliknutím na tlačítko "Souhlasím" vyjadřujete svůj souhlas s používáním cookies.

Zavřít