File xml peta situs. File xml peta situs - arahan yang tersedia. Menggunakan banyak kartu

File sitemap.xml adalah alat yang memungkinkan webmaster memberi tahu mesin pencari tentang halaman di situs mereka yang tersedia untuk diindeks. Selain itu, di peta XML Anda dapat menentukan parameter halaman tambahan: tanggal pembaruan terakhir, perbarui frekuensi dan prioritas relatif terhadap halaman lain. Informasi di sitemap.xml dapat memengaruhi perilaku crawler pencarian dan, secara umum, proses pengindeksan dokumen baru. Peta situs berisi arahan untuk memasukkan halaman ke dalam antrian untuk dirayapi dan melengkapi robots.txt, yang berisi arahan untuk mengecualikan halaman.

Dalam panduan ini Anda akan menemukan jawaban atas semua pertanyaan mengenai penggunaan sitemap.xml.

Apakah saya memerlukan peta situs.xml

Mesin pencari menggunakan peta situs untuk menemukan dokumen baru di situs (bisa berupa dokumen html atau konten media) yang tidak dapat diakses melalui navigasi, namun perlu dirayapi. Memiliki tautan ke dokumen di peta situs.xml tidak menjamin bahwa dokumen tersebut akan dirayapi atau diindeks, tetapi sering kali file tersebut akan membantu situs besar diindeks dengan lebih baik. Selain itu, data dari peta XML digunakan untuk menentukan halaman kanonik, kecuali dinyatakan secara spesifik dalam tag rel=canonical.

Sitemap.xml penting untuk situs di mana:

  • Beberapa bagian tidak dapat diakses melalui menu navigasi.
  • Ada banyak halaman yang terisolasi atau halaman yang tidak terhubung dengan baik.
  • Teknologi yang digunakan kurang didukung oleh mesin pencari (misalnya, Ajax, Flash, atau Silverlight).
  • Ada banyak halaman dan ada kemungkinan crawler pencarian melewatkan konten baru.

Jika ini bukan kasus Anda, kemungkinan besar Anda tidak memerlukan peta situs.xml. Untuk situs di mana setiap halaman penting untuk pengindeksan tersedia dalam 2 klik, di mana teknologi JavaScript atau Flash tidak digunakan untuk menampilkan konten, di mana tag kanonik dan regional digunakan, jika perlu, dan konten segar muncul tidak lebih sering daripada robot mengunjungi situs; tidak diperlukan file peta situs.xml.

Untuk proyek-proyek kecil Jika ada masalah hanya dengan dokumen bertumpuk dalam jumlah besar, maka masalah tersebut dapat diselesaikan dengan mudah menggunakan HTML peta situs tanpa menggunakan menggunakan XML kartu. Namun jika Anda memutuskan masih memerlukan sitemap.xml, bacalah panduan ini secara keseluruhan.

Informasi teknis

  • Sitemap.xml adalah file teks dalam format XML. Namun, mesin pencari juga mendukung format teks(lihat bagian berikutnya).
  • Setiap peta situs dapat berisi maksimal 50.000 alamat dan tidak menimbang lagi 50MB(10 MB untuk Yandex).
  • Anda dapat menggunakan kompresi gzip untuk memperkecil ukuran file peta situs.xml dan meningkatkan kecepatan transfernya. Dalam hal ini, gunakan ekstensi gz (peta situs.xml.gz). Pada saat yang sama, batasan bobot tetap berlaku untuk peta situs yang tidak terkompresi.
  • Lokasi Peta Situs menentukan kumpulan URL yang dapat dimasukkan ke dalam Peta Situs. Peta yang berisi alamat halaman seluruh situs harus ditempatkan di root. Jika peta situs terletak di dalam folder, maka semua URL di peta situs ini harus ditempatkan di folder ini atau lebih dalam ().
  • Alamat di sitemap.xml harus mutlak.
  • Panjang URL maksimum adalah 2048 karakter (1024 karakter untuk Yandex).
  • Karakter khusus di URL (seperti ampersand "&" atau tanda kutip) harus disamarkan dalam entitas HTML.
  • Halaman yang ditentukan dalam peta harus menampilkan kode status 200 http.
  • Alamat yang tercantum di peta tidak boleh ditutup di file robots.txt atau di meta-robots.
  • Peta situs tidak boleh ditutup di robots.txt, jika tidak, mesin pencari tidak akan merayapinya. File itu sendiri mungkin ada di indeks, ini normal.

Format peta XML

Mesin pencari mendukung format peta situs teks sederhana, yang hanya mencantumkan URL halaman tanpa parameter tambahan. Dalam hal ini, file harus dikodekan UTF-8 dan memiliki ekstensi .txt.

Mesin pencari juga mendukung protokol XML standar. Google juga mendukung peta situs untuk gambar, video, dan berita.

Contoh peta situs yang hanya berisi satu alamat.

https://сайт/ 2018-06-14 daily 0.9

tag XML
kumpulan url
url(wajib) - Tag induk untuk setiap URL.
lokasi(wajib) - URL dokumen, harus mutlak.
mod terakhir- tanggal perubahan terakhir dokumen dalam format Datetime.
frekuensi perubahan- frekuensi perubahan halaman (selalu, setiap jam, harian, mingguan, bulanan, tahunan, tidak pernah). Arti dari tag ini adalah rekomendasi mesin pencari, bukan sebagai sebuah tim.
prioritas- Prioritas URL relatif terhadap alamat lain (dari 0 hingga 1) untuk urutan pemindaian. Jika tidak ditentukan, defaultnya adalah 0,5.

Peta XML untuk gambar

Beberapa pengoptimal menyisipkan tautan ke gambar ke peta situs.xml dengan cara yang sama seperti tautan ke dokumen HTML. Hal ini bisa dilakukan, namun lebih baik Google menggunakan ekstensi protokol standar dan kirimkan beserta URL-nya informasi tambahan tentang gambar. Membuat peta gambar XML berguna jika gambar perlu dipindai dan diindeks, dan pada saat yang sama, gambar tersebut tidak dapat diakses langsung oleh bot (misalnya, JavaScript digunakan).

Contoh peta situs yang berisi satu halaman dan gambar terkait

http://example.com/primer.html http://example.com/kartinka.jpg http://example.com/photo.jpg Вид на Балаклаву Севастополь, Крым http://creativecommons.org/licenses/by-nd/3.0/legalcode

tag XML
gambar:gambar(wajib) - informasi tentang satu gambar. Maksimal 1000 gambar dapat digunakan.
gambar: lokasi(wajib) - jalur ke file gambar. Jika CDN digunakan, maka diperbolehkan untuk menautkan ke domain lain jika sudah diverifikasi di panel webmaster.
gambar: keterangan- keterangan gambar (mungkin berisi teks panjang).
gambar: judul- judul gambar (biasanya teks pendek).
gambar:geo_lokasi- lokasi pengambilan gambar.
gambar:lisensi- URL lisensi gambar. Digunakan untuk pencarian gambar tingkat lanjut.

Peta XML untuk video

Mirip dengan peta gambar, Google juga memiliki ekstensi peta situs video yang dapat Anda tentukan informasi rinci tentang konten video, yang memengaruhi tampilan dalam penelusuran video. Peta situs video diperlukan ketika situs menggunakan video yang dihosting secara lokal, dan ketika mengindeks video ini sulit dilakukan karena teknologi yang digunakan. Jika Anda menyematkan video dari YouTube di situs web Anda, maka peta situs video tidak diperlukan di sini.

Peta Situs Berita

Jika Anda memiliki konten berita di situs Anda dan berpartisipasi dalam Google Berita, ada gunanya menggunakan Peta Situs untuk berita, sehingga Google akan menemukan konten Anda lebih cepat bahan segar dan mengindeks semua artikel berita. Dalam hal ini, Peta Situs hanya boleh berisi alamat halaman yang dipublikasikan dalam 2 hari terakhir dan berisi tidak lebih dari 1000 URL.

Menggunakan banyak kartu

Jika perlu, Anda dapat menggunakan beberapa peta situs, menggabungkannya menjadi satu peta situs indeks. Beberapa sitemap.xml digunakan jika:

  • Situs ini menggunakan beberapa mesin (CMS).
  • Situs ini memiliki lebih dari 50.000 halaman.
  • Perlu dikonfigurasi pelacakan yang nyaman kesalahan di beberapa bagian.

DI DALAM kasus terakhir setiap bagian besar situs memiliki sitemap.xml sendiri dan semuanya ditambahkan ke panel untuk webmaster, sehingga akan lebih mudah untuk melihat bagian mana yang memiliki kesalahan paling banyak (lihat bagian untuk menemukan kesalahan di peta situs).

Jika Anda memiliki 2 atau lebih peta situs, peta situs tersebut harus digabungkan menjadi peta situs indeks, yang terlihat sama dengan peta situs biasa (kecuali adanya tag peta situs dan peta situs, bukan urlset dan url), memiliki batasan serupa dan hanya dapat ditautkan ke peta XML biasa (bukan peta indeks).

Contoh Indeks Peta Situs:

http://www.example.com/sitemap-blog.xml.gz 01-10-2004T18:23:17+00:00 http://www.example.com/sitemap-webinars.xml.gz 2005-01-01

indeks peta situs(wajib) - menentukan standar protokol saat ini.
peta situs(wajib) - berisi informasi tentang peta situs terpisah.
lokasi(wajib) - lokasi peta situs (dalam format xml, txt atau rss untuk Google).
mod terakhir- waktu perubahan peta situs. Memungkinkan mesin pencari menemukan URL baru dengan cepat di situs besar.

Cara membuat peta situs.xml

Metode pembuatan XML Peta Situs:

  • Alat CMS internal. Banyak CMS yang sudah mendukung pembuatan peta situs. Untuk mengetahuinya, baca dokumentasi CMS Anda, lihat item menu di panel admin, atau hubungi dukungan teknis mesin. Unggah file https://situsanda.com/sitemap.xml di situs Anda; file tersebut mungkin sudah ada dan dibuat secara dinamis.
  • Plugin eksternal. Jika CMS tidak memiliki fungsi untuk menghasilkan peta situs, dan mendukung plugin, Google plugin mana yang mencakup pertanyaan sitemap.xml untuk mesin Anda dan menginstalnya. Dalam beberapa kasus, Anda perlu menghubungi pemrogram untuk menulis plugin serupa untuk Anda.
  • Pisahkan skrip di situs. Mengetahui protokol kartu XML dan keterbatasan teknis, Anda dapat membuat peta situs.xml sendiri dengan menambahkan skrip pembuatan ke CRON. Jika Anda bukan seorang programmer, gunakan item lain dalam daftar ini.
  • Generator peta situs. Ada banyak generator sitemap.xml yang memindai situs Anda dan memungkinkan Anda mengunduh peta siap. Kerugiannya di sini adalah setiap kali situs diperbarui, Anda perlu membuat peta situs secara manual.
  • Parser. Program desktop yang dirancang untuk analisis teknis situs web biasanya memberikan kesempatan untuk mengunduh sitemap.xml, yang dihasilkan berdasarkan halaman yang dirayapi. Bekerja serupa generator peta situs, hanya berjalan secara lokal di mesin Anda.

Generator peta situs online populer

XML-Peta Situs.com

Memungkinkan Anda mendapatkan peta situs.xml dalam beberapa klik. Mendukung format XML, HTML, TXT dan GZ. Nyaman digunakan untuk situs kecil (hingga 500 halaman).

Generator serupa, tetapi memiliki sedikit pengaturan lainnya dan memungkinkan Anda membuat peta hingga 2000 halaman secara gratis.

Memiliki banyak pengaturan, memungkinkan Anda mengimpor URL dari file CSV. Memindai hingga 500 URL secara gratis.

Tidak ada batasan jumlah halaman yang akan dipindai. Namun untuk situs besar, proses pembuatannya mungkin terhenti selama beberapa puluh menit.

Program lokal untuk menghasilkan Peta Situs XML

Generator Peta Situs G-Mapper

Versi desktop gratis dari generator peta situs untuk Windows.

Laba-laba SEO Katak Berteriak

Alat pembuatan peta situs yang fleksibel dengan banyak pengaturan. Nyaman jika Anda sudah menggunakan screamin Frog untuk tugas SEO lainnya. Setelah memindai situs, gunakan item menu Peta Situs -> Buat Peta Situs XML.

Laba-laba Netpeak

Solusi yang kurang fleksibel, tetapi juga nyaman untuk generasi cepat peta situs.xml. Setelah memindai situs, Anda perlu menggunakan item menu Alat -> Hasilkan Peta Situs.

Saat berkenalan dengan proyek, spesialis pengoptimalan harus memperkenalkannya bilah alamat setelah nama situs frasa “sitemap.xml”. Analisis peta situs memungkinkan Anda mengetahui mengapa konten tertentu tidak diindeks. Saya akan memberi tahu Anda cara membuat dan mengimplementasikan sitemap.xml yang kompeten di edisi berikutnya.

Apa itu peta XML

Peta situs XML adalah file dengan informasi untuk mesin pencari tentang halaman yang perlu diindeks. Dengan kata lain, peta situs adalah daftar semua halaman di dalamnya format XML, tersedia untuk dirayapi oleh robot pencari. Perlu membedakan peta XML dari peta situs biasa, yang terletak di http://situs.com/sitemap/.

Dengan menggunakan peta XML, Anda dapat menentukan:

  • lokasi halaman situs;
  • waktu pembaruan terakhir setiap halaman;
  • frekuensi (frekuensi) pembaruan dan kepentingan relatif terhadap halaman lain di situs;
  • kepentingan (prioritas) halaman dalam struktur.

Elemen apa yang terdiri dari peta XML?

Baris pertama dokumen menunjukkan versi xml dan pengkodeannya - UTF-8.

Tag XML khusus juga digunakan:

  • sitemapindex - tag induk di awal dan akhir file;
  • peta situs adalah tag induk untuk setiap peta situs yang ditentukan dalam file. Pada saat yang sama tanda ini— anak relatif terhadap indeks peta situs;
  • url - blok yang berisi nilai URL itu sendiri dan elemen lainnya;
  • loc - langsung URL halaman;
  • changefreq - seberapa sering halaman ini mungkin berubah. Nilai yang mungkin: selalu, setiap jam, setiap hari, setiap minggu, setiap bulan, setiap tahun, tidak pernah;
  • prioritas - prioritas elemen struktural, membantu menentukan laman mana yang memiliki prioritas lebih tinggi untuk dirayapi. Itu diberi nilai hingga satu, misalnya: 0,5.
  • lastmod — waktu pembaruan konten halaman terakhir, parameter opsional. Untuk situs dengan konten statis cukup menggunakan changfreq.

Contoh struktur file dengan peta situs XML:

http://example.com/ 2017-02-05 monthly 0.8

Untuk situs besar, lebih baik membuat beberapa peta XML. Misalnya, indeks XML ini menyertakan dua file peta situs:

http://www.example.com/sitemap1.xml http://www.example.com/sitemap2.xml.

Peta situs XML untuk gambar

Peta XML terpisah sering kali dibuat untuk pengindeksan gambar. Mereka hanya relevan untuk Google Yandex tidak mengenali tag gambar:

Data peta XML dapat membantu mesin pencari menemukan konten yang mungkin tidak dapat ditemukan (misalnya, jika konten tersebut dimuat dari menggunakan JavaScript), dan tentukan gambar yang akan dipindai dan diindeks.

Tag yang digunakan untuk peta gambar adalah:

Selain itu, Anda dapat menggunakan tag opsional:

Contoh peta XML untuk gambar:

http://example.com/page.html http://example.com/pic1.jpg http://example.com/pic1.jpg

Jika situs Anda berisi konten video unik, Anda juga dapat membuat peta XML terpisah untuknya.

Menariknya, di peta ini, URL video bisa dibuka untuk pencarian di bagian tersebut Google Video. Hasilnya akan menampilkan ikon video, yang dapat disesuaikan, serta informasi lain yang ditentukan dalam kartu. Misalnya saja judulnya.

Hasil:

Informasi video apa yang dapat dikirim ke Google menggunakan peta situs:

  • Nama;
  • keterangan,
  • lamanya;
  • miniatur dan sebagainya.

Tag yang diperlukan:

  • https://danykom.ru/id/— halaman tempat video berada;
  • — judul video, maksimal 100 karakter;
  • — lokasi pemutar video;
  • — lokasi video tertentu;
  • — pratinjau (thumbnail) video, tidak kurang dari 120x90 piksel;
  • — wadah untuk deskripsi video;
  • — deskripsi video, hingga 2000 karakter.

Selain itu, Anda dapat menggunakan tag lain yang bersifat opsional dan direkomendasikan:

  • — durasi video, hingga 8 jam, ditulis dalam hitungan detik;
  • — kategori video, misalnya teknologi;
  • — nama orang (perusahaan) yang menambahkan video tersebut. Anda dapat menentukan satu nama file;
  • — menunjukkan apakah diperlukan langganan untuk menonton video. Baik berbayar maupun gratis, dengan nilai yang tersedia: ya, tidak;
  • — tanggal publikasi, dalam format YYYY-MM-DD atau YYYY-MM-DDThh:mm:ss+TZD;
  • — ini menunjukkan apakah video tersebut dapat diakses oleh pencarian yang aman atau tidak;
  • — daftar negara tempat video dapat diputar atau tidak. Nilai yang valid adalah kode negara di dalamnya format ISO 3166. Hanya satu tag yang dapat ditampilkan untuk setiap video. . Jika ditandai tidak ada, video tersebut diasumsikan dapat diputar di semua wilayah;
  • — tautan ke galeri;
  • — tanggal dan waktu ketika video menjadi tidak relevan;
  • — mata uang yang menunjukkan biaya dalam format ISO 4217;
  • — tag video;
  • — jumlah penayangan video;
  • — peringkat video (dari 0 hingga 5);
  • — daftar platform tempat video dapat dan tidak dapat diputar. Nilai yang tersedia: web, seluler, tv. Jika tidak ada tag, video dianggap dapat diputar di semua platform;
  • — menunjukkan apakah video tersebut merupakan siaran langsung. Nilai yang tersedia: ya, tidak.

http://www.example.com/videos/video_1.html!} http://www.example.com/thumbs/video_1.jpg Обзор смартфона Xiaomi Redmi 3 Note Pro Подробный обзор внешнего вида и функций смартфона Xiaomi Redmi 3 Note Pro от интернет-магазина Example. http://www.example.com/video123.flv http://www.example.com/videoplayer.swf?video=123 600 4.3 1223 2017-01-05T19:20:30+03:00 yes no

Google "mendukung" format berikut:

  • .mpg, .mpeg, .mp4, .m4v;
  • .wmv;
  • .asf, .avi;
  • .ra, .ram, .rm;
  • .mov;
  • .flv.

Peta XML untuk Google Berita

Untuk situs berita, Anda dapat membuat peta situs terpisah dengan pembuatan dinamis dan pembaruan harian. File-file ini hanya akan berfungsi untuk sumber daya yang termasuk dalam daftar Google Berita. Jika situs tersebut tidak ada dalam daftar, Anda dapat mengajukan permintaan untuk menambahkannya.

File peta situs hanya boleh berisi URL artikel yang diterbitkan dalam dua hari terakhir. Artikel yang diterbitkan lebih dari dua hari yang lalu dapat dihapus dari file, namun tetap ada indeks Google Berita selama 30 hari.

Peta situs ini dapat berisi maksimal 1000 URL. Jika situs Anda memiliki lebih banyak konten dalam dua hari, Anda dapat membuat file indeks peta situs untuk beberapa peta.

Tag yang diperlukan:

  • — tag umum yang menunjukkan publikasi. Dia memiliki dua wajib tanda anak:
    • — judul publikasi;
    • — bahasa dalam format ISO 639;
    — tanggal publikasi dalam format W3C yang menunjukkan tanggal lengkap. Mesin pencari Robot Google memahami tanggal hingga sepersekian detik, misalnya:
YYYY-MM-DDTHh:mm:cc.s±hh:mm (2017-05-10T19:20:30.45+01:00)
  • — Judul artikel mirip dengan judul di website.

Selain itu, ada tag opsional:

  • — properti artikel. Nilai yang valid:
    • Siaran Pers— siaran pers resmi;
    • Sindiran- artikel yang menyajikan pokok bahasan dalam bentuk komik.
    • blog- artikel apa pun yang dipublikasikan di blog atau dalam format blog.
    • OpEd- artikel apa pun yang mengungkapkan pendapat pribadi dan diposting di kolom editor.
    • Pendapat- artikel apa pun yang mengungkapkan pendapat pribadi dan tidak dimasukkan dalam kolom editor. Ini mencakup ulasan kolumnis dan wawancara.
    • Buatan Pengguna- materi yang dibuat oleh pengguna dan menjalani penyuntingan editorial resmi.
  • kata kunci tentang topik artikel;
  • — daftar simbol saham/keuangan (tidak lebih dari lima, dipisahkan dengan koma). Cocok untuk artikel tentang bisnis. Setiap simbol harus diawali dengan nama bursa relevan yang cocok dengan entri Google Finance, seperti NASDAQ:AMAT atau BOM:500325.

Contoh peta situs untuk Google Berita:

http://example.ua/news/wow55.html Новости ru Blog 2017-05-10 Рацион питания среднестатистического студента студенты, еда, мивина, пельмени, revo

Cara membuat peta XML untuk situs multibahasa

File peta situs dapat digunakan untuk meneruskan atribut ke Google rel="alternatif" hreflang="x". Berkat ini, pengguna diperlihatkan halamannya bahasa yang dibutuhkan dan dengan URL dengan wilayah yang benar.

Namespace XHTML harus ditentukan seperti ini:

Xmlns:xhtml="http://www.w3.org/1999/xhtml"

Anda juga perlu membuat elemen terpisah URL untuk setiap alamat. Pada gilirannya, setiap elemen harus mencakup:

  1. Tag loc, yang menunjuk ke URL;
  2. Subelemen xhtml:link rel="alternate" hreflang="XX" untuk masing-masing versi alternatif halaman, tentu termasuk versi saat ini.

Misalnya, situs tersebut memiliki bagian dalam bahasa Rusia, ditujukan untuk pengguna dari seluruh dunia. Selain itu, ada dua versi halaman ini: dalam bahasa Ukraina dan Inggris.

Kumpulan lengkap URL terlihat seperti ini:

  • contoh.com/ua/
  • contoh.com/ru/
  • contoh.com/en/

File peta situs yang ditunjukkan pada contoh di bawah ini memberi tahu Google bahwa halaman example.com/ru/ memiliki versi yang sesuai dalam bahasa Ukraina dan bahasa Inggris:

http://example.com/ru/ http://www.example.com/deutsch/ http://www.example.com/en/

Yandex mendukung dua format file peta situs:

  • XML (disarankan);
  • berkas teks.

Persyaratan untuk kartu Yandex:

  • ukuran yang tidak terkompresi tidak boleh melebihi 10 MB;
  • Yandex mengenali Punycode baik dalam bentuk kode maupun aslinya.

Pada dasarnya:

  • hingga 50.000 tautan ke file peta situs;
  • ukuran total hingga 50 MB (tidak terkompresi).

Format yang didukung Google sebagai peta situs:

  • XML - file standar;
  • RSS, media RSS dan Atom 1.0 - cocok untuk blog dengan Umpan RSS atau Atom;
  • Situs Google. Jika situs Anda dibuat dan diverifikasi menggunakan Google Sites, file peta situs akan dibuat secara otomatis. Anda tidak dapat mengubahnya, namun Anda dapat mengirimkannya ke Google untuk mendapatkan informasi pelaporan. Jika terdapat lebih dari 1000 halaman dalam satu subdirektori, peta situs mungkin tidak ditampilkan dengan benar.
  • File teks.txt.

Persyaratan dasar untuk file teks:

  • Pengkodean UTF-8;
  • file tidak boleh berisi apa pun selain daftar URL;
  • file teks dapat diberi nama apa saja, tetapi hanya dengan ekstensi .txt (misalnya, peta situs.txt).

Cara menyematkan peta XML

  1. File peta situs XML harus ditempatkan di arahan root situs: http://<адрес сайта>/peta situs.xml.
  2. Jika ada beberapa peta situs, Anda perlu membuat indeks peta, yang akan mencantumkan tautan ke semua file XML. generator yang direkomendasikan.

    Cara menemukan kesalahan dalam peta XML

    Cara menganalisis peta situs di Yandex.Webmaster

    Di Yandex.Webmaster, untuk bekerja dengan peta XML, ikuti jalur "Pengindeksan" - "File peta situs".

    Secara terpisah, di bagian Alat, terdapat “Penganalisis File Peta Situs”, tempat Anda dapat mengirim teks, URL, atau melampirkan file itu sendiri untuk verifikasi. Ketika dicentang, ini menunjukkan jenis dan ukuran file, jumlah tautan dan kesalahan.

    Di panel webmaster Google di bagian "Perayapan" ada item "File peta situs".

    Di sini Anda dapat:

    • menambah atau memeriksa file peta situs;
    • melacak jumlah halaman dari berbagai jenis yang dikirim dan diindeks;
    • melihat kesalahan dan masalah di peta situs;
    • mengirim peta XML lagi atau hapus.

    Kesimpulan

    Peta situs XML diperlukan oleh robot pencari untuk menemukan semua halaman Anda. Ini berisi URL halaman di situs, serta data yang terkait dengannya, seperti kapan terakhir diperbarui, seberapa sering diperbarui, dan kepentingannya dibandingkan halaman lain di situs. Kartu terpisah dapat dibuat untuk gambar, video, XML dapat diberi markup untuk Google Berita.

    Tidak perlu membuat peta secara manual - gunakan generator gratis atau program khusus. Anda dapat memeriksa kesalahan pada peta di panel webmaster Yandex dan Google.

    Apakah Anda memiliki pertanyaan? Saya akan dengan senang hati menjawab di komentar.

Salam kenal teman!

Kami terus mempersiapkan situs kami untuk promosi. Dalam pelajaran terakhir kita membuat sebuah file, dan hari ini tujuan kita adalah membuat file peta situs, atau dikenal sebagai “peta situs”.

Sitemap.xml adalah file yang menentukan halaman yang akan diindeks dengan prioritas tertentu.

Dari satu sudut pandang, sitemap.xml tidak diperlukan sama sekali: robot itu sendiri melakukan tugasnya dengan sangat baik. Namun jika dilihat dari sisi lain, sitemap memang sangat dibutuhkan. Masalahnya adalah beberapa halaman jauh lebih penting daripada halaman lainnya. Dan pertama-tama, robot harus mengindeks halaman-halaman penting, dan kemudian halaman lainnya.

File Sitemap.xml memungkinkan Anda memberi tahu robot halaman mana yang harus diindeks terlebih dahulu dan halaman mana berikutnya. Dari sudut pandang ini, peta situs diperlukan. Itu sebabnya pelajaran ini keluar.

Dengan baik? Ayo pergi!

Bagaimana situs diindeks?

Untuk memahami sepenuhnya mengapa peta diperlukan, mari kita bahas. Jika kita berbicara dalam bentuk yang sederhana dan dapat dimengerti semua orang, prosesnya terlihat seperti ini:

Bayangkan situasi ini: Anda perlu menemukan sesuatu di buku fisika dan Anda pergi ke perpustakaan untuk menemukan buku itu di sana. Mereka datang dan menemukannya dan membukanya. Setelah ini, Anda mulai mencari informasi yang Anda butuhkan tanpa orientasi apa pun. Jadi, dengan membolak-balik buku ini, Anda mulai memahami semua informasi yang ada di sana, yaitu mengindeksnya.

Seperti inilah proses pengindeksannya. Anda, seperti robot, mulai melihat-lihat semua yang ada di dalam buku dan mengingatnya, meskipun sebagian besar isinya tidak terlalu penting. Untuk menavigasi buku dengan cepat, disediakan daftar isi: halaman dengan judul bab dan nomor halaman (link). Bagaimanapun, file Sitemap.xml adalah sejenis konten, tetapi hanya untuk robot pencari.

Bagaimana cara membuat file peta situs.xml?

Anda dapat membuat peta situs menggunakan generator online khusus, yang jumlahnya banyak sekali di Internet. Dan bagi yang situsnya menggunakan CMS, bisa menggunakan plugin (blognya menggunakan WordPress, saya pakai Plugin Yoast seo).

Ada juga yang ingin menulis Sitemap.xml sendiri, pelajaran selanjutnya hanya untuk Anda. Namun pertama-tama saya ingin Anda mendownload editor Notepad++, di editor ini Anda dapat menyimpan file dalam format .xml:

Sekarang mari kita lihat lebih dekat nilai pada tag:

  • — Обязательный тег, в котором указывается ссылка на страницу;
  • — Дата обновления страницы;
  • — Указывается частота обновления страницы, имеет следующие значения:

    • hourly — ежечасно;
    • daily — ежедневно;
    • weekly — еженедельно;
    • mouthly — ежемесячно;
    • yearly — ежегодно;
    • never — никогда.
  • — приоритет индексирования страницы. Имеет значения от 0.1 — 1;

Остановимся на приоритете подробнее. Не нужно указывать высокий приоритет для каждой страницы в sitemap.xml. Он указывается исключительно относительно страниц, указанных в файле. То есть, если в карте сайте страница site.ru/1.html имеет приоритет 1 (высокий), а страница site.ru/2.html имеет приоритет 0.5, то site.ru/1.html будет проиндексирована первой, а вторая страница, соответственно, второй. Таким образом, тег — это некий порядок индексирования.

Вывод : для продвигаемых страниц ставьте приоритет 1, для других, менее важных, значения ниже.

Залить sitemap.xml нужно в корень папки сайта!

Карта сайта должна быть доступна по адресу: http://site.ru/sitemap.xml

Если по этому адресу карта не доступна, то вы залили ее не туда!

Ограничения для sitemap.xml

С тем, как создать файл sitemap.xml мы разобрались, теперь поговорим об ограничениях в файле:

  1. Ссылки должны вести на один и тот же сайт;
  2. Длина ссылка не должна превышать 2048 символов;
  3. Максимальное количество ссылок 50 000;
  4. Размер файла не больше 10 Мб.

Иногда случается так, что в один файл не вмещается вся информация, в этом случае поможет индексный файл.

Индексный файл — это тот же sitemap.xml, в котором указываются ссылки на карты сайта, которые мы создавали чуть выше.

В этом путеводителе мы рассмотрим следующие вопросы:

Что такое Sitemap ?

Это файл, который содержит в себе перечень ссылок на все важные страницы сайта. То есть, этот документ направляет поисковые системы на основной контент на сайте.

Для чего нужна карта сайта

Сайтмап нужен, если у сайта есть проблемы с индексацией, которые вызваны:
1) большим количеством страниц;
2) отсутствием ссылок (внутренних или внешних) на страницы;
3) глубокой вложенностью на сайте (запутанной структурой).

HTML vs XML-карта сайта

Карты сайта бывают следующих типов:

  • HTML;

Самое простое объяснение разницы между этими форматами в том, что XML-карта в первую очередь предназначена для поисковых систем, а HTML – для пользователей.

HTML-карта – это всего лишь общий обзор сайта, содержит только информацию и страницы, которые нужно видеть пользователям. Если вы находитесь на сайте и ищете определённый раздел, при переходе на Sitemap HTML легко его найдёте. Несмотря на то, что такой тип карт сайта ориентирован на пользователя, он также может помочь вашему ранжированию в поисковых системах. Это одно из свидетельств того, что вы заботитесь об удобстве сайта для пользователя.

При составлении HTML-карты сайта важно учитывать:

1. Структурированное содержание.

Карта сайта должна быть понятна и удобна для восприятия пользователя. Желательно, чтобы она включала в себя разделы, категории, подкатегории и т. д.

2. Анкоры ссылок.

Протокол XML-карты сайта предназначен для поисковых роботов. XML-файл содержит в себе информацию о том, когда последний раз обновлялся URL-адрес, насколько это важно и как часто происходят изменения.

Обычно Sitemap состоит из следующих XML-тегов:

Обязательные:
– определяет стандарт протокола и инкапсулирует этот файл.
– содержит в себе информацию о URL-адресе (является родительским тегом).
https://danykom.ru/id/ – содержит абсолютный URL-адрес.

Необязательные:
– указывает дату последнего изменения файла.
– указывает частоту смены файла.
– указывает на значимость документа на сайте. Диапазон значений: от 0,1 до 1,0 (по умолчанию 0,5).

Не устанавливайте для каждого URL-адреса слишком частую смену файла и максимальный приоритет. Если метки частоты и приоритета не отражают реальность, вероятнее всего, поисковые системы будут более склонны игнорировать всю карту XML.

Другие форматы Sitemap

Помимо вышеперечисленных карт сайта, поисковые системы также поддерживают следующие форматы:

Для Google:
— RSS, mRSS и Atom 1.0;
RSS / Atom фиды должны содержать последние обновления вашего сайта. Обычно они небольшие и часто обновляются (что является плюсом).
— Сайты Google.
Для сайтов, созданных на платформе Google Сайты, Sitemap создаётся автоматически, и внести какие-то изменения невозможно.

Для Google и Яндекс:
— текстовый формат (TXT).
Файл должен быть в кодировке UTF-8 и состоять только из URL-адресов.

Требования Google и Яндекса к файлам Sitemap

1. Используйте кодировку UTF-8.
2. Максимальное количество URL – 50 000.
3. Ссылки в сайтмапе должны быть на том же домене, что и файл.

4. Если файл слишком большой, разделите его на несколько и укажите их в файле индекса Sitemap.
5. Ответ сервера при обращении к файлу должен быть 200 ОК.
6. Указывайте только канонические адреса страниц (без GET-параметров и идентификаторов сессий).

1. Максимальный размер – 10 МБ.
2. Поддерживает кириллические URL.

1. Максимальный размер – 50 МБ.
2. Поддерживает только цифры и латинские буквы.

Распространённая ошибка: чтобы уменьшить требования к пропускной способности канала, используют архиватор gzip. Размер сайтмапа должен быть 50 МБ (10 МБ) до сжатия, а не после.

Совет: русские доменные имена можно преобразовать с помощью кодировки Punycode.

Как создать XML Sitemap

1. Чтобы создать карту сайта, в первую очередь нужно определить канонические адреса, которые будут добавлены в файл.

2. Определить, какой формат файла будете использовать.

3. Создать файл можно вручную или, воспользовавшись генератором Sitemap.

Google в своей справке подготовил список онлайн и десктопных, платных и бесплатных генераторов карт сайта. Ознакомиться со всем списком можно, перейдя по ссылке .

Сгенерировать Sitemap проще, чем кажется. Разберём, как сгенерировать сайтмап, на примере деcктопного приложения Majento:

1. Парсим сайт.

2. Переходим в раздел «Сайты» => «Генерировать Sitemap».

3. Сохраняем в нужном нам формате.

4. Карта сайта готова.

Из online-генераторов XML-карты сайта заслуживает внимания XML Sitemap Generator .

Расширенные возможности этого сервера позволяют установить определённые XML-теги, включить/исключить нужные документы.

Исключить ненужные страницы можно и с помощью регулярных выражений.

Google поддерживает расширенный синтаксис для изображений. Для этого вы можете создать отдельную карту сайта для изображений или добавить синтаксис в существующую. Использование расширенного синтаксиса в Sitemap предоставляет поисковой системе дополнительную информацию об изображениях на сайте. Также это может помочь Google обнаружить и проиндексировать изображения, которые он не может найти при сканировании сайта.

Как и в обычной карте сайта, есть обязательные и необязательные XML-теги.

Обязательные:
– аналогично тегу содержит в себе URL изображения и дополнительную информацию.
– URL изображения.

Необязательные:
– подпись к изображению.
– место съёмки фотографии.
– название изображения.
– URL-лицензии изображения.

Ещё один расширенный синтаксис, который поддерживает Google, – XML-карта для видео.

Плюсы добавления XML-тегов для видео:

1) даёт понять Google, какой контент на сайте;
2) даёт возможность предоставить детальное описание к файлу;
3) станет доступным для поиска в Google Видео;
4) в поисковой выдаче будет отображаться заставка видео (может повысить количество переходов из поисковой выдачи).

Карта сайта для видеофайлов состоит из следующих обязательных элементов:

– содержит URL-адрес страницы, на которой размещено видео; если на одной странице размещено более одного видео, не нужно каждый раз создавать тег , достаточно в одном теге несколько раз прописать для каждого видео на странице.
– включает в себя всю информацию о видео.
– URL к миниатюрному изображению (заставке) к видео. Рекомендованные размеры: от 160×90 пикселей до 1920×1080. Форматы изображения: .jpg, .png, or. gif
– заголовок, который должен совпадать с названием страницы, на которой отображается видео.
– описание видео. Должно соответствовать с метаописаниями страницы. Максимальное количество символов – 2048.

Заголовок и описание видео должны быть экранированы или упакованы в блок CDATA.

Со всеми XML-тегами карты сайта для видео можно ознакомиться в справке Google .

Где разместить карту сайта

Распространённые заблуждения о Sitemap

Так как у многих этот файл вызывает трудности и является «тёмным лесом», возникают определённые мифы в отношении карт сайта. Рассмотрим некоторые из них:

– «Включение URL-адреса в файл Sitemap для XML гарантирует, что он будет проиндексирован».
Нет. Важно отметить, что XML-файлы Sitemap – это только рекомендации. Карта сайта XML не гарантирует индексацию поисковыми системами страниц, указанных в файле.

– «Если я удалю URL из XML-карты, он будет удалён из индекса».
Нет. Карта сайта XML не исключает индексацию страниц, не включённых в карту сайта XML.

– «XML-файлы Sitemap трудно создавать и поддерживать»
Нет. Небольшие сайты могут легко создавать и размещать собственные XML-файлы вручную, используя приведённые выше примеры в качестве руководства по форматированию. Для более крупных сайтов и сайтов, которые изменяются чаще, плагины или модули, доступные для большинства CMS, могут автоматизировать обновление XML-файлов.

Заключение

Файл Sitemap – полезный инструмент для передачи поисковым роботам информации о структуре сайта. Используйте это руководство, чтобы понять, как работает карта сайта, как она устроена, как сгенерировать, разместить и проверить файл.

Наличие этого файла подсказывает поисковым роботам, как именно организована структура сайта. Соответственно, Яндекс, Google, Bing и другие поисковики получают возможность более качественно индексировать Интернет-проект.

Зачем нужен файл Sitemap?

В большинстве случаев грамотной внешней и внутренней перелинковки страниц достаточно, чтобы поисковые роботы узнали о всем содержимом сайта. Вместе с тем использование Карты сайта может заметно ускорить процесс полной индексации, особенно если:

  • Интернет-ресурс создан относительно недавно и пока не может похвастаться богатым профилем внешних ссылок;
  • в структуре сайта присутствуют многочисленные архивы веб-документов, не связанных между собой;
  • проект располагает большим количеством страниц, разделов, подразделов;
  • в структуре ресурса преобладают динамические страницы.

Во всех этих случаях всеобъемлющая индексация сайта поисковыми системами может оказаться под вопросом, если своевременно не позаботиться о файле Sitemap.

Базовые критерии создания файла Sitemap

К созданию Карты сайта выдвигается несколько основных требований, о которых веб-мастер должен всегда помнить.

Во-первых , количество URL-адресов в файле Sitemap не должно превышать 50 тысяч единиц. Если их больше, то необходимо создать несколько отдельных Карт сайта, которые прописываются в файле индекса Sitemap .

Во-вторых , максимальный размер файла – 10 Мб. Если несжатый файл превышает этот размер, его можно уменьшить при помощи архиватора gzip .

В-третьих , файл Sitemap должен находиться на том же домене, что и веб-сайт, для которого он создан.

В-четвертых , составление Карты сайта предполагает использование кодировки UTF-8, а также латинских букв и цифр.

В-пятых , ответом сервера на обращение к файлу Sitemap должен быть HTTP-статус с кодом 200 OK.

Допустимые форматы Карты сайта

Особое требование предъявляется к формату файла Sitemap. Так, Карта сайта может быть создана в виде XML-файла, текстового файла или посредством RSS, mRSS и Atom 1.0. При этом наиболее распространенным форматом, который распознают все поисковые системы, считается XML-файл. С его помощью поисковикам можно сообщить не только о правильном местоположение страницы в иерархии сайта, но и:

  • о частоте обновления веб-документа в принципе (атрибут – changefreq );
  • о дате последнего обновления на странице (атрибут – lastmod );
  • о разной важности тех или иных страниц ресурса (атрибут – priority ).

Пример Карты сайта в формате XML для сайт, если бы он состоял из одной страницы и содержал упомянутые теги, мог бы выглядеть так:

http://www.сайт/!} 2016-03-21 daily 0.8

Bagaimana cara membuat dan di mana menempatkan file Peta Situs?

Jika mau, Anda dapat membuat Peta Situs sendiri (secara manual), yang, bagaimanapun, terlihat seperti pekerjaan yang sangat memakan waktu. Oleh karena itu, lebih baik membuat file Peta Situs secara otomatis dengan beralih ke layanan layanan daring gratis seperti yang ini atau yang ini.

Setelah Peta Situs siap, file harus ditempatkan di direktori root. Dalam hal ini, tautan yang menunjukkan jalur ke file Peta Situs ke mesin pencari bisa jadi seperti berikut: http://www..xml

Menambahkan Peta Situs ke Mesin Pencari

Agar robot pencari dapat mempelajari file Peta Situs baru secepat mungkin, webmaster perlu melakukan perubahan, menambahkan arahan khusus yang menunjukkan rute yang tepat ke Peta Situs:

Peta Situs: http://www..xml

Selain itu, file Peta Situs yang sudah selesai diperiksa kesalahannya dan ditambahkan ke Yandex atau Google menggunakan Yandex.Webmaster atau Konsol Pencarian Google.

Untuk meringkas, perlu dicatat bahwa keberadaan Peta Situs yang dikompilasi dengan benar untuk sumber daya web bukanlah jaminan 100% bahwa semua halamannya akan diindeks. berkas ini- hanya petunjuk serius bagi mesin telusur tentang cara memindai situs Anda dengan lebih cermat.

  • Sergei Savenkov

    semacam ulasan "pendek"... seolah-olah mereka sedang terburu-buru di suatu tempat