Cu harta si consola ne optimizam site-ul25 MAY
2006
Publicat in Blog Optimizare Web
Definitia, cred universal acceptata, a unui site map (harta a site-ului) este aceea de model vizual ierahizat al unui site web. Hartile unui site ajuta vizitatorii sa navigheze printr-un web site care are mai mult decat o singura pagina prin indicarea diagramei intregului continut al site-ului dupa modelul cuprinsului unei carti. In cadrul acestui sistem, fiecare sectiune a site map-ului reprezinta un link direct spre pagina corespunzatoare din cadrul site-ului. .
Din punctul de vedere al optimizarii pentru motoarele de cautare, realizarea unui site map este deosebit de utila in special atunci cand este vorba despre site-uri cu un numar mare de pagini, despre cele dinamice insa nu numai. Motoarele de cautare, fara exceptie, utilizeaza programe (spider) pentru a cauta si indexa site-urile noi. O data gasit site-ul, aceste programe urmeaza link-urile pentru a aduna informatii despre el si despre continutul sau. Prin utilizarea unui site map, motoarele de cautare vor reusi sa indexeze mai repede, mai bine si mai complet site-ul d-voastra. Trebuie mentionat ca acesti spideri viziteaza site-urile cu o oarecare regularitate pentru a vedea modificarile de continut care li se aduc. (Cu cat mai des robotii motoarelor de cautare considera ca trebuie sa revina la un site, cu atat acesta va fi mai bine cotat). De asemenea, pentru Google si Yahoo cel putin, utilizarea de site map este una dintre modalitatile prin care se poate face submission. Cu toate acestea, vechile metode de indexare nu au fost abandonate, respectivul protocol avand exculsiv scopul de a oferi informatii suplimentare motorului de cautare.
Importanta acestul subiect se modifica atunci cand vorbim despre site-uri cu caracter dinamic care, trebuie spus, sunt mai greu indexate. In acest caz particular, site map-ul este singura modalitate de a va asigura de o indexare completa, de faptul ca motoarele de cautare vor fi la curent cu modificarile aduse.
Exista doua tipuri principale de site map:
Google sitemaps
Site map-urile general acceptate de catre Google pentru a ajuta la procesul de indexare al paginilor sunt realizate in format XML. Acest tip de protocol de realizare a site map-urilor consta din tag-uri XML:
Explicitarea tag-urilor:
Se recomanda de asemenea folosirea de cod in locul anumitor caractere speciale dupa cum urmeaza:
In cazul site-urilor cu mai mult de 50000 de pagini, datorita restrictiilor impuse de Google, trebuie realizate harti multiple. Este acceptata si arhivarea acestora in format .gz insa, dezarhivate nu trebuie sa depaseasca 10 MB fiecare. Aceste multiple sitemaps vor fi stocate intr-un fisier numit Sitemap index. Formatul unui asemenea fisier, XML, nu difera cu mult de cel al unui site map cerut de Google iar tag-urile utilizate sunt :loc, lastmod, sitemap, sitemapindex.
Exemplu:
Yahoo site maps
Urmand acelasi principiu ca si Google, motorul de cautare Yahoo pune si el la dispozitie o modalitate de indexare prin site map submission. Spre deosebire insa de Google, Yahoo accepta si harti de tip RSS de forma:
Tipuri de site maps oferite de webmasteri
Pentru o mai usoara navigare in cadrul unui site, webmasterul poate (si este indicat sa o faca) pune la dispozitia vizitatorilor un cuprins al site-ului respective. Dupa cum am afirmat si mai sus, acesta trebuie sa contina link-uri valide pentru fiecare sectiune in parte si, optional, un scurt text descriptiv cu privire la functiile acesteia. Daca sectiunile sunt la randul lor divizate, este indicat ca subdiviziunile sa fie plasate astfel incat relationarea sa fie corect reprezentata. In aceasta categorie intra si site map-urile de tip HTML si cele de tip TEXT. Site map-urile de tip HTML ofera link-uri vizibile vizitatorilor, descriptive si care pot fi indexate de o categorie de motoare de cautare. Site map-urile de tip TEXT reprezinta un format alternativ care este recunoscut doar de anumite motoare de cautare. Vom exemplifica prin modele fiecare tip in parte.
Site map de tip HTML:
In continuare va punem la dispozitie o lista de scripturi, aplicatii si unelte on line pe care le puteti utiliza in scopul unei mai bune exemplificari ale celor afirmate mai sus.
Va rugam sa cititi cu atentie instructiunile de instalare inainte de a rula aplicatiile de mai sus, pentru a va asigura ca sistemul dvs. este compatibil cu aplicatia, si ca indeplineste toate cerintele de executie a aplicatiei.
Din punctul de vedere al optimizarii pentru motoarele de cautare, realizarea unui site map este deosebit de utila in special atunci cand este vorba despre site-uri cu un numar mare de pagini, despre cele dinamice insa nu numai. Motoarele de cautare, fara exceptie, utilizeaza programe (spider) pentru a cauta si indexa site-urile noi. O data gasit site-ul, aceste programe urmeaza link-urile pentru a aduna informatii despre el si despre continutul sau. Prin utilizarea unui site map, motoarele de cautare vor reusi sa indexeze mai repede, mai bine si mai complet site-ul d-voastra. Trebuie mentionat ca acesti spideri viziteaza site-urile cu o oarecare regularitate pentru a vedea modificarile de continut care li se aduc. (Cu cat mai des robotii motoarelor de cautare considera ca trebuie sa revina la un site, cu atat acesta va fi mai bine cotat). De asemenea, pentru Google si Yahoo cel putin, utilizarea de site map este una dintre modalitatile prin care se poate face submission. Cu toate acestea, vechile metode de indexare nu au fost abandonate, respectivul protocol avand exculsiv scopul de a oferi informatii suplimentare motorului de cautare.
Importanta acestul subiect se modifica atunci cand vorbim despre site-uri cu caracter dinamic care, trebuie spus, sunt mai greu indexate. In acest caz particular, site map-ul este singura modalitate de a va asigura de o indexare completa, de faptul ca motoarele de cautare vor fi la curent cu modificarile aduse.
Exista doua tipuri principale de site map:
- cel cerut de motoarele de cautare, care implementeaza fiecare propriul protocol de sitemap (Google, Yahoo)
- cel oferit de webmaster, cu utilizari distincte insa avand aproximativ acelasi scop.
Google sitemaps
Site map-urile general acceptate de catre Google pentru a ajuta la procesul de indexare al paginilor sunt realizate in format XML. Acest tip de protocol de realizare a site map-urilor consta din tag-uri XML:
- trebuie sa inceapa si sa se incheie cu tag-ul urlset
- trebuie sa contina tag-ul url pentru fiecare URL in parte ca tag parinte XML
- trebuie sa contina un tag loc ca si child entry pentru fiecare url tag parinte.
- optional, pot fi adaugate tag-urile lastmod, changefreq, priority
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.exemplu.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/catalog?item=12&desc=vacanta_hawaii</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.exemplu.com/catalog?item=73&desc=vacanta_noua_zeelanda</loc>
<lastmod>2004-12-23</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.exemplu.com/catalog?item=74&desc=vacanta_newfoundland</loc>
<lastmod>2004-12-23T18:00:15+00:00</lastmod>
<priority>0.3</priority>
</url>
<url>
<loc>http://www.exemplu.com/catalog?item=83&desc=vacanta_sua</loc>
<lastmod>2004-11-23</lastmod>
</url>
</urlset>
(sursa)
Explicitarea tag-urilor:
- urlset - incadreaza fisierul si face referire la standardul de protocol current (este obligatoriu)
- url - Parent tag pentru fiecare URL (obligatoriu)
- loc - URL-ul paginii. Trebuie sa inceapa cu un protocol (http) si sa se incheie cu un slash (/) (obligatoriu)
- lastmod - ultima data la care a fost modificat, ar trebui sa fie data oficiala W3C (optional)
- changefreq - frecventa cu care se va schimba site map-ul. Reprezinta un indicator pentru spiderii motoarelor de cautare privind frecventa cu care trebuie sa revina la un anume site. Cu toate acestea nu este garantat ca ea va fi respectata. (optional)
- priority - prioritatea acestui URL in raport cu alte URL-uri ale aceluiasi site. Valori valide sunt intre 0.0 si 1.0. Valoarea stabilita prin default este de 0.5. Trebuie spus ca aceasta mentiune nu influenteaza pozitia URL-ului in SERP ci foloseste doar la stabilirea importantei fiecarei pagini in parte din cadrul unui site. (optional).
Se recomanda de asemenea folosirea de cod in locul anumitor caractere speciale dupa cum urmeaza:
- & - &
- ' - '
- " - "
- > - &qt;
- < - <.
In cazul site-urilor cu mai mult de 50000 de pagini, datorita restrictiilor impuse de Google, trebuie realizate harti multiple. Este acceptata si arhivarea acestora in format .gz insa, dezarhivate nu trebuie sa depaseasca 10 MB fiecare. Aceste multiple sitemaps vor fi stocate intr-un fisier numit Sitemap index. Formatul unui asemenea fisier, XML, nu difera cu mult de cel al unui site map cerut de Google iar tag-urile utilizate sunt :loc, lastmod, sitemap, sitemapindex.
Exemplu:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
<sitemap>
<loc>http://www.exemplu.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.exemplu.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>
Yahoo site maps
Urmand acelasi principiu ca si Google, motorul de cautare Yahoo pune si el la dispozitie o modalitate de indexare prin site map submission. Spre deosebire insa de Google, Yahoo accepta si harti de tip RSS de forma:
<rss version="2.0"> -<channel> <title>Site Map www.exemplu.com</title> <link>www.exemplu.com</link> <description>Site map pentru www.exemplu.com</description> <lastBuildDate>Mon, 22 May 2006 07:01:46 +0000</lastBuildDate> <generator>SiteMap XML www.exemplu.com</generator> <item> <title>Exemplu de site map rss</title> <link>http://www.exemplu.com/</link> <description>Exemplu- Descrierea exemplului.</description> </item> </channel> </rss>
Tipuri de site maps oferite de webmasteri
Pentru o mai usoara navigare in cadrul unui site, webmasterul poate (si este indicat sa o faca) pune la dispozitia vizitatorilor un cuprins al site-ului respective. Dupa cum am afirmat si mai sus, acesta trebuie sa contina link-uri valide pentru fiecare sectiune in parte si, optional, un scurt text descriptiv cu privire la functiile acesteia. Daca sectiunile sunt la randul lor divizate, este indicat ca subdiviziunile sa fie plasate astfel incat relationarea sa fie corect reprezentata. In aceasta categorie intra si site map-urile de tip HTML si cele de tip TEXT. Site map-urile de tip HTML ofera link-uri vizibile vizitatorilor, descriptive si care pot fi indexate de o categorie de motoare de cautare. Site map-urile de tip TEXT reprezinta un format alternativ care este recunoscut doar de anumite motoare de cautare. Vom exemplifica prin modele fiecare tip in parte.
Site map de tip HTML:
- 1. Exemplu-site
http://www.exemplu.com - 2. Contact-site
http://www.exemplu.com/contact - 3. Servicii-site
http://www.exemplu.com/servicii
- 1. Exemplu-site
http://www.exemplu.com - 2. Contact-site
http://www.exemplu.com/contact - 3. Servicii-site
http://www.exemplu.com/servicii
In continuare va punem la dispozitie o lista de scripturi, aplicatii si unelte on line pe care le puteti utiliza in scopul unei mai bune exemplificari ale celor afirmate mai sus.
Aplicatii , scripturi si unelte pentru generarea sitemap-urilor pentru Google
- Script-uri
- Softwot
Genereaza sitemap-uri statice si dinamice de tip XML, RSS, HTML, TEXT. Se ofera o perioada de evaluare de 7 zile. Costul generatorului este de 19.95$.
- Nextgd
Script php care genereaza si cu ajutorul caruia se pot realiza actualizari ale sitemap-urilor. Pentru utilizarea sa sunt necesare cunostine de PHP MySQL deoarece URL-urile sunt realizate cu ajutorul unor mysql queries dupa care sunt stocate in fisiere de tip XML. Permite deasemenea realizarea de sitemap-uri multiple si de sitemap index. Nu consuma banda cum o fac aplicatiile bazate pe crawleri. Codul este disponibil in varianta Beta la sursa mai sus mentionata. Informatii suplimentare despre acesta: Google Groups .
- Newtonsoft
Generator de sitemap in format XML pentru site-uri de tip ASP.NET. Sursa este disponibila la adresa mai sus mentionata.
- Softwot
Genereaza sitemap-uri statice si dinamice de tip XML, RSS, HTML, TEXT. Se ofera o perioada de evaluare de 7 zile. Costul generatorului este de 19.95$.
-
Aplicatii
- Gsite Crawler
Gsite Crawler: - software generator de sitemaps cu optiune de upload automat pe server. Exclusiv pentru Windows. Freeware.
- Endsheet
Endsheet - software care indexeaza paginile din cadrul unui site prezentand avantajul ca fisierul creat sa fie salvat in format XML (Google sitemap) sau CSV. Aplicatie Windows, freeware.
- Vigos
Generator google sitemap, spider, posibilitate de upload pe ftp, de notificare Google, salvare a fisierelor in format XML dar si compresie .gz. Aplicatie pentru windows, freeware.
- Gsite Crawler
Gsite Crawler: - software generator de sitemaps cu optiune de upload automat pe server. Exclusiv pentru Windows. Freeware.
- Unelte on line
- Sitemapspal
Tool on line care genereaza sitemap in format xml cu posibilitatea de download a fisierului generat.
- Googen
Crawler on line care genereaza sitemap in format XML cu posibilitatea de download a fisierului generat.
- Enarion
Crawler generator de sitemap in format XML.
- Sitemapspal
Tool on line care genereaza sitemap in format xml cu posibilitatea de download a fisierului generat.
Va rugam sa cititi cu atentie instructiunile de instalare inainte de a rula aplicatiile de mai sus, pentru a va asigura ca sistemul dvs. este compatibil cu aplicatia, si ca indeplineste toate cerintele de executie a aplicatiei.



Sitemaps - 3 posts
Optimizare site - 9 posts