Crearea sitemap xml php

Ești doar un cretin dacă nu i-ai acordat hărții site-ului atenția potrivită la momentul respectiv. Este suficient să înțelegeți problema o dată și să o evitați în viitor. cantitati mari greșeli, așa că hai să o facem acum.

Umilul tău slujitor a fost, de asemenea, un cretin în tinerețe, când tocmai a început să promoveze site-uri web într-un singur birou. La acea vreme am dat peste un site de promovare, care, ar trebui spus, era doar o prostie. Și rahatul ăsta a avut probleme cu indexarea. Desigur, dacă site-ul ar fi de o calitate suficientă, ambele motoare de căutare l-ar indexa indiferent de probleme, dar proprietarii s-au bazat pe un designer, layout designer și programator normal, iar în acest caz specialistul SEO nu poate decât, ca să spunem așa, deschide sticla cu foarfecele. Am încercat totul pe ea - ultima setare modificată, accelerând indexarea folosind fastbot-ul care era la modă în acel moment și cumpărând link-uri. Și abia atunci s-a dovedit că problema era că harta site-ului nu a fost actualizată automat! Când l-am actualizat, toate paginile au zburat în index.

Ce este un sitemap și de ce este necesar?

Ce este un sitemap? Acesta este un fișier cu informații despre paginile site-ului care trebuie indexate. De obicei, o hartă a site-ului este creată pentru ca Yandex și Google să le notifice roboți de căutare despre paginile care trebuie adăugate la index. Folosind o hartă a site-ului, puteți verifica, de asemenea, cât de des au loc actualizările și ce documente web sunt cele mai importante de indexat. În general, au vorbit foarte bine despre asta la Yandex Webmaster:

[yt=INGCBkR26eo] [yt=INGCBkR26eo]

A avea un sitemap afectează promovarea?

Dacă nu aveți o hartă a site-ului, aceasta nu înseamnă că motoarele de căutare nu vor indexa resursa. Roboții de căutare scanează adesea site-urile destul de bine fără acest lucru și le includ în căutare. Dar uneori pot apărea erori, din cauza cărora uneori nu este posibil să găsiți toate documentele web. Principalele motive sunt:

  1. Secțiuni ale site-ului la care se poate ajunge doar făcând un lanț lung de tranziții;
  2. Adrese URL dinamice.

Deci, crearea sitemap.xml ajută la rezolvarea acestei probleme în multe feluri. Acest fișier afectează SEO doar în măsura în care facilitează/accelerează indexarea paginilor. De asemenea, crește șansa ca paginile web să fie indexate înainte ca concurenții să poată copia conținutul și să-l publice pe site-ul lor.

În ce alt format vine un sitemap și de ce este realizat în format XML?

De ce aveți nevoie de o hartă a site-ului, ne-am dat seama. Acum să vedem în ce formate se poate face:

  1. În format html. Este creat sub forma unei pagini obișnuite cu adrese care duc la secțiunile principale ale resursei. Acest tip de hartă vă ajută să vă găsiți rapid drumul și este conceput mai mult pentru oameni decât pentru roboții de căutare. În sitemap HTML puteți plasa număr limitat link-uri (nu mai mult de 100), deoarece dacă sunt mai multe, nu toate vor fi incluse în index. Sau roboții de căutare pot exclude complet o astfel de pagină din căutarea unui număr excesiv de adrese URL, chiar și interne.
  2. Crearea unui fișier xml sitemap. Nu există restricții prea critice privind numărul de link-uri, iar motoarele de căutare îl indexează mai bine, deoarece fișierul xml sitemap conține informatii completeîntr-o formă pe înțelesul robotului. Este deosebit de important pentru proiectele în care există sute și mii de documente de importanță egală, iar plasarea tuturor legăturilor către acestea este necesară. Acest tip de hartă site are capacitatea de a plasa până la 50 de mii de URL-uri și în plus, puteți seta frecvența actualizărilor și prioritatea (prioritatea) aproximativă, ceea ce nu se poate spune despre o hartă în format HTML. Din aceste motive, un sitemap este aproape întotdeauna creat în xml.

Iată mai multe informații despre acest fișier:

[yt=ti3NKPknHDA] [yt=ti3NKPknHDA]

Cum să faci sitemap-ul potrivit

Să ne uităm la cum să facem o hartă xml adecvată. Trebuie îndeplinite următoarele cerințe:

  1. Dimensiunea fișierului nu trebuie să depășească 10 MB;
  2. Harta nu trebuie să conțină mai mult de 50.000 de link-uri. În cazurile în care există mai multe legături, puteți crea mai multe hărți și le puteți include în harta xml principală;
  3. Adresa sitemap-ului trebuie introdusă în robots.txt;
  4. De asemenea, încărcați harta site-ului în Yandex și Google (cum se adaugă un fișier este descris mai jos);
  5. Motoarele de căutare trebuie să aibă acces la hartă. Este necesar să folosiți etichete speciale care să lase motoarele de căutare să înțeleagă că aceasta este o hartă și nu altceva;
  6. Harta site-ului trebuie să aibă codificare UTF-8.

Permiteți-mi să vă dau un exemplu simplu de hartă:

http://site.ru/ 2016-11-20T19:45:08+03:00 always 0,9 http://site.ru/category/ 2016-11-20T19:46:38+03:00 monthly 0,6 http://site.ru/page/ 2016-11-20T19:48:41+03:00 yearly 0.4

< url >

< loc >http://site.ru/

< lastmod >2016 - 11 - 20T19: 45: 08 + 03: 00< / lastmod >

< changefreq >mereu< / changefreq >

< priority > 0 , 9 < / priority >

< / url >

< url >

< loc >http://site.ru/category/

< lastmod >2016 - 11 - 20T19: 46:38 + 03:00< / lastmod >

< changefreq >lunar< / changefreq >

< priority > 0 , 6 < / priority >

< / url >

< url >

< loc >http://site.ru/page/

< lastmod >2016 - 11 - 20T19: 48: 41 + 03: 00< / lastmod >

< changefreq >anual< / changefreq >

< priority > 0.4 < / priority >

< / url >

Etichetele URL și loc sunt necesare. Prima conține toate informațiile despre o anumită adresă URL. Al doilea conține adresa în sine.

Etichetele lastmod, changefreq, priority nu sunt obligatorii, dar este totuși recomandat să le folosiți.

Lastmod din harta site-ului este responsabil pentru data ultimei actualizări.

Changefreq indică frecvența modificărilor paginii. Valorile pot fi după cum urmează:

  1. Orar – actualizările din oră;
  2. Întotdeauna – mereu actualizat;
  3. Săptămânal – actualizat o dată pe săptămână;
  4. Zilnic – actualizările au loc zilnic;
  5. Lunar – actualizările au loc o dată pe lună;
  6. Anual – o dată pe an;
  7. Niciodată – neactualizat (este mai bine să nu folosiți această valoare).

Prioritatea le spune motoarelor de căutare cât de importantă este o pagină în comparație cu altele. Prioritatea poate fi setată de la 0,1 (mică) la 1 (mare).

Aceasta a fost doar un exemplu de hartă, nu trebuie să specificați aceste valori exacte. În general, se recomandă setarea priorității după cum urmează: maxim pentru pagina principala(1), pentru rubrici media (0,6), iar pentru intrări - minim (0,4).

Acum să ne uităm la un exemplu în care există mai mult de 50 de mii de link-uri. În acest caz, fișierul include și alte hărți:

http://site.ru/sitemaps/sitemap01.xml 2016-11-20T21:37:28+03:00 http://site.ru/sitemaps/sitemap02.xml 2016-11-20T21:37:29+03:00

< sitemap >

< loc >http: //site.ru/sitemaps/sitemap01.xml

< lastmod >2016 - 11 - 20T21: 37: 28 + 03: 00< / lastmod >

< / sitemap >

< sitemap >

< loc >http: //site.ru/sitemaps/sitemap02.xml

< lastmod >2016 - 11 - 20T21: 37:29 + 03:00< / lastmod >

< / sitemap >

Cum se creează un sitemap

Există mai multe moduri de a crea o hartă xml, să le vedem:

  1. Descărcați harta folosind generator online dintr-o altă resursă;
  2. Generați folosind program special. Dar merită luat în considerare că programele acest tip deîn mare parte plătite. Un exemplu de astfel de generator: Wonder WebWare SiteMap Generator. Screaming Frog are și această caracteristică;
  3. Creați un sitemap manual;
  4. Creați automat o hartă folosind un CMS (de exemplu, o astfel de funcție este disponibilă pe WordPress).

Iată o opțiune despre cum să faci un sitemap fără ajutorul pluginurilor:

[yt=Tnfy601BUZc] [yt=Tnfy601BUZc]

Plugin-uri pentru crearea sitemap-urilor pe WordPress

Puteți crea un sitemap în WordPress folosind un plugin special numit Google XML Sitemaps. Totul este simplu aici: descărcați pluginul, instalați-l, apoi începeți să creați fișierul. Pentru a face acest lucru, deschideți Console-Settings și selectați XML-sitemap. Apoi setăm setările. Lăsăm prioritatea implicită.

Mulți constructori de site nu acordă suficientă atenție hărții site-ului - și degeaba vă spun. Sitemap.xml este una dintre sursele principale din care robotul află despre paginile care există sub îndrumarea dumneavoastră strictă. Vă recomand cu căldură să îl obțineți dacă nu aveți deja acest instrument.

Ce este- harta site-ului?

Asta este normal fisier textîn format .xml, mai rar în .html, care stochează linkuri către paginile site-ului, datele de creare a acestora, datele aproximative de actualizare și prioritatea paginii. Toate aceste informații - data creării, prioritatea, frecvența de actualizare - sunt informații condiționate, roboții de căutare nu îi acordă prea multă importanță pentru ei înșiși, pentru o indexare mai ușoară și mai rapidă;

Cum se creează sitemap.xml?

Există o mulțime de servicii pentru crearea unui sitemap. Nu le voi enumera: atingeți degetele pe tastatură și, într-o secundă, unchiul vostru amabil Gosha sau Yasha vă vor oferi o duzină de servicii. Dar există dezavantaje aici: de obicei, aceste servicii fac o hartă de cel mult 500 de pagini, mai rar - 1000, și ce se întâmplă dacă site-ul tău conține mai multe? Atunci dă-mi niște bani. Dar nu ne vom despărți de banii noștri pentru „a trăi bine”! Mai mult, mai există un inconvenient: va trebui să mergi de fiecare dată la acest serviciu, să creezi o hartă, să o descarci singur... Oribil, pe scurt.

Există o altă cale: există o mulțime de programe pentru crearea unui sitemap, totusi, pentru o astfel de utilitate va trebui sa platesti vreo 20 de ruble americane, ceea ce nici personal nu mi se potriveste. Știi deja, dragă cititor, că sunt cea mai leneșă făptură din această lume și, din moment ce citești toate acestea și încă nu ai întors pagina, înseamnă că suntem apropiați în spirit. Prin urmare, am ales calea cea mai ușoară, pe care o voi împărtăși cu voi. Vom crea doar fișier php care va lua totul informatie necesara din baze de date MySQL, și scoate-l. Și să-l mințim pe robot că este un fișier .xml, ce diferență are pentru el... Deci, să mergem. Creați un fișier sitemap.php cu aproximativ următorul conținut:

  1. require_once "db.php";
  2. antet(„Tipul conținut: aplicație/xml”) ;
  3. ecou "nn";
  4. ecou " n";
  5. $urladdr = "http://" . $_SERVER [ „HTTP_HOST” ] . „/” ;
  6. $rezultat = mysql_query(„SELECT * FROM video ORDER BY video_id DESC”, $db )
  7. sau mori ( mysql_error() ) ;
  8. $rânduri = mysql_num_rows($rezultat);
  9. dacă ($rânduri > 0 ) (
  10. în timp ce ($date = mysql_fetch_array($rezultat) ) (
  11. ecou "tn" ;
  12. echo "tthttps://danykom.ru/ro/" . $urladdr . "video.php?act=video&video_id=" . $data [ "video_id" ] . " n" ;
  13. $date = date ("Y-m-d" , $data [ "video_data" ] ) ;
  14. echo "tt" . $date . " n" ;
  15. echo "ttdaily n" ;
  16. echo "tt0.7 n" ;
  17. echo "t rn";
  18. ecou" n";

Sper că puteți schimba numele tabelelor și câmpurilor pe care trebuie să le accesăm, precum și adresa afișată. Această operațiune Puteți repeta de câte ori doriți, doar schimbați numele tabelelor și adreselor. În continuare, îl înșelam pe robot: să creadă că vede un fișier .xml, nu un fișier .php, deși el, în general, este violet: va mânca și va pufă. Deschideți (sau creați în mod simplu editor de text, dacă nu există încă). .htaccess, și adăugați următoarele rânduri la acesta:

RewriteEngine activat

RewriteRule ^sitemap.xml$ sitemap.php [L]

Gata, robotul a fost înșelat flagrant de noi și acum vede fișierul sitemap.xml în loc de sitemap.php, pe care, apropo, nu uitați să îl puneți în rădăcina site-ului. El vede asa ceva:

Cod: XML

http://www.your_site.ru/video.php?act=video&video_id=5

2013-01-01

zilnic

0.7

Și din moment ce îl avem pornit buclă while, atunci scriptul va afișa toate linkurile care au un id.

Ei bine, atingerea finală este să anunțăm păianjenii că avem în sfârșit această carte. Deschidere robots.txt(dacă nu există încă, creați-l) și adăugați linia

Cod: ROBOTI

Gazdă: www.your_site.ru

Harta site-ului: http://www.your_site.ru/sitemap.xml

Asta, în general, este tot, dragă cititor. Nu uitați că un sitemap nu poate avea o dimensiune mai mare de 10 MB sau 50.000 de link-uri. Dacă aveți mai multe dintre ele, va trebui să împărțiți harta site-ului în mai multe părți, dar mai multe despre asta altădată. Vă mulțumesc pentru atenție.

Utilizați generatorul nostru de hărți de site pentru a crea fișiere în format XML, care poate fi trimis la Google, Yandex, Bing, Yahoo și la alte motoare de căutare pentru a le ajuta să indexeze site-ul dvs.

Fă-o în trei pași simpli:

  • Introduceți adresa URL completă a site-ului web în formular.
  • Faceți clic pe butonul „Start” și așteptați până când site-ul este accesat complet cu crawlere. În același timp, veți vedea numărul complet de link-uri funcționale și rupte.
  • Făcând clic pe butonul „Sitemap.xml”, salvați fișierul într-o locație convenabilă.

  • Harta site-ului este o hartă a site-ului în format XML, care în 2005 motor de căutare Google a început să fie folosit pentru indexarea paginilor site-ului web. Un fișier de hartă site este o modalitate de a organiza un site web, identificând adresa și datele pentru fiecare secțiune. Anterior, sitemap-urile erau destinate în primul rând utilizatorilor site-ului. Formatul XML a fost dezvoltat pentru motoarele de căutare, permițându-le să găsească date mai rapid și mai eficient.

    Noul protocol Sitemap a fost dezvoltat ca răspuns la creșterea dimensiunii și complexității site-urilor web. Site-urile web de afaceri conțin adesea mii de produse în cataloagele lor, popularitatea blogurilor, forumurilor și forumurilor îi obligă pe webmasteri să-și actualizeze materialele; macar o data pe zi. Devine din ce în ce mai dificil pentru motoarele de căutare să urmărească tot materialul. Prin protocolul XML motoare de căutare pot urmări adresele mai eficient, optimizând căutarea acestora prin plasarea tuturor informațiilor pe o singură pagină. XML arată, de asemenea, cât de des este actualizat și înregistrează un anumit site web ultimele modificari. Hărți XML nu sunt un instrument pentru Optimizare motor de căutare. Acest lucru nu afectează clasamentele, dar permite motoarelor de căutare să facă mai mult evaluări preciseȘi interogări de căutare. Acest lucru se întâmplă prin furnizarea de date ușor de citit pentru motoarele de căutare.

    Acceptarea generală a protocolului XML înseamnă că dezvoltatorii de site-uri web nu mai trebuie să creeze Tipuri variate hărți de site pentru diverse motoare de căutare. Ei pot crea un fișier pentru vizualizare și apoi îl pot actualiza atunci când fac modificări site-ului. Simplifică întregul proces reglaj finși extensii de site-uri web. Webmasterii înșiși au început să vadă beneficiile utilizării acestui format. Motoarele de căutare clasifică paginile în funcție de relevanța conținutului specific Cuvinte cheie, dar înainte de formatul XML, adesea conținutul paginilor nu era reprezentat corect. Acest lucru este adesea frustrant pentru webmasteri care realizează că eforturile lor de a crea un site web au trecut neobservate. bloguri, pagini suplimentare, adăugând fisiere multimedia durează câteva ore. Prin fișier XML aceste ore nu vor fi irosite, vor fi văzute de toate motoarele de căutare celebre.

    Pentru a vă crea Sitemap în format XML și pentru a menține motoarele de căutare actualizate cu toate modificările site-ului dvs., încercați generator gratuit hărți de site.

    01 februarie 2012/ Daria Rybaltovici

    În acest articol voi încerca să vă spun cum să simplificați crearea și actualizarea fișierului sitemap.xml folosind un mic script PHP. Condiție obligatorie Pentru ca acest script sa functioneze este necesar sa ai pe site o baza de date in format MySQL. Dacă site-ul dvs. este scris fără a utiliza baze de date, atunci, în teorie, puteți modifica acest script pentru a traversa arborele de foldere, dar acest lucru va fi mult mai multă muncă, așa că voi lăsa la latitudinea fanilor să decidă.

    Ce este un sitemap.xml sitemap?

    Cu siguranță, în vizită diverse internet resurse, ați întâlnit elementul de meniu „Harta site-ului” sau această pictogramă - . Deci, toate acestea sunt necesare și bune, dar acest lucru este pentru utilizatori. Și sarcina noastră este să facem același lucru, dar pentru roboții de căutare. Fișierul sitemap.xml nu este vizibil pentru utilizatori și efectuează sarcini pur tehnice.

    Harta site-ului este o structură specială de date în format XML (Yandex acceptă și format text), care conține linkuri către toate paginile site-ului dvs. pe o singură pagină. Cu ajutorul acestuia, puteți forța motorul de căutare să indexeze toate paginile site-ului dvs. cât mai repede posibil. În plus, vei putea indica care pagini de pe site sunt mai importante acordându-le prioritate.

    Crearea sitemap.xml manual

    Puteți crea o hartă a site-ului în orice editor de text, pe baza cunostinte de baza Standard XML.

    Mai jos este un exemplu Fișier Sitemap, care conține o singură adresă URL și utilizează toate etichetele opționale. Etichetele opționale sunt cu caractere cursive.

    Mai întâi, să descriem anteturile fișierelor și directorul rădăcină:

    $zag = "\n \n\t\t 0.8\n\t\n"; $end = ""; //creăm o conexiune la baza de date și selectăm înregistrările de care avem nevoie din tabelul require_once("constants.inc.php"); //conectați fișierul cu constantele de conectare mysql_connect(DB_HOST, DB_USERNAME, DB_PASSWORD) sau die(" Nu pot crea o conexiune " ); mysql_select_db(DB_NAME) sau die(mysql_error()); $result = mysql_query ("SELECT url, priority, modify FROM `info` WHERE `priority`<>"0" ") sau die (mysql_error()); //selectați toate înregistrările din tabel în timp ce ($row = mysql_fetch_assoc($result)) ( $str1 = "\t\n\t\thttps://danykom.ru/ro/".$url.$row.".html\n"; //адрес страницы, если есть страницы во вложенных папках, которые надо проиндексировать, то перед переменной $url можно добавить переменную с категорией $str2 = "\t\t".$row["priority"]."\n"; //приоритетность $str3 = "\t\t".$row["modify"]."\n"; //дата изменения страницы $str4 = "\t\n"; $str = $str.$str1.$str2.$str3.$str4; //colectați șirul final. ) $str = $zag.$str0.$str.$end;

    Acum să adăugăm un handler de fișiere:

    $fișier = "./sitemap.xml"; //adresa unde vom scrie fișierul (scriu la rădăcină) if(!$handle = fopen($fișier, "w"))( echo "Nu se poate deschide fișierul ($fișier)"; ieșire; ) if (fwrite ($handle , $str) === FALSE) ( echo „Nu se poate scrie în fișier ($fișier)”; ieșire; ) echo „Succes”; fclose($handle);

    Ca rezultat, fișierul nostru va arăta astfel:

    \n \n\t\t 0.8\n\t\n"; $end = ""; require_once("constants.inc.php"); mysql_connect(DB_HOST, DB_USERNAME, DB_PASSWORD) sau die("Nu se poate crea o conexiune "); mysql_select_db(DB_NAME) sau die(mysql_error()); $result = mysql_query (" SELECT URL, prioritate, modificați FROM `info` WHERE `priority`<>„0” „) sau die (mysql_error()); în timp ce ($row = mysql_fetch_assoc($result)) ( $str1 = „\t\n\t\thttps://danykom.ru/ro/".$url.$row["from"].".html\n"; $str2 = "\t\t".$row["priority"]."\n"; $str3 = "\t\t".$row["modify"]."\n"; $str4 = "\t\n"; $str = $str.$str1.$str2.$str3.$str4; ) $str = $zag.$str0.$str.$end; $fișier = "./sitemap.xml"; dacă (!$handle = fopen($fișier, „w”))( echo „Nu se poate deschide fișierul ($fișier)”; ieșire; ) if(fwrite($handle, $str) === FALSE) ( echo „Nu se poate scrie la fișier ($fișier)"; ieșire; ) echo "Succes"; fclose($handle); ?>

    Încărcați fișierul pe server și rulați-l din browser. Dacă totul este făcut corect, primim mesajul „Succes” și ne bucurăm de rezultat.

    Unde să informați motoarele de căutare despre sitemap.xml

    De obicei, fișierul sitemap.xml este încărcat în folderul rădăcină al site-ului. Dar, dacă se dorește, poate fi încărcat în orice folder de site accesibil prin browser. Apoi, trebuie să specificați calea către fișierul sitemap.xml din fișierul robots.txt.

    Dacă site-ul dvs. nu are încă un fișier robots.txt, atunci trebuie să creați o versiune minimă a acestuia, care să permită tuturor motoarelor de căutare să acceseze cu crawlere întregul site. Pentru a face acest lucru, trebuie să creați un fișier de doar două linii:

    Agent utilizator: * Permite: /

    Odată ce avem la dispoziție un fișier robots.txt gata de lucru, trebuie să adăugăm doar o linie.

    Harta site-ului: http://site/sitemap.xml

    În acest caz, fișierul sitemap.xml se află la rădăcina site-ului și este accesibil roboților de căutare.

    Etichete: SEO, construirea site-ului web

    • Serghei Savenkov

      un fel de recenzie „scurtă”... de parcă s-ar grăbi undeva