Panduan terperinci untuk file Peta Situs. Peta Situs XML: Panduan Lengkap Penggunaan

Dengan menggunakan generator peta situs kami, buat file XML yang dapat dikirimkan ke Google, Yandex, Bing, Yahoo, dan mesin pencari lainnya untuk membantu mereka mengindeks situs Anda.

Lakukan dalam tiga langkah sederhana:

  • Masukkan URL situs web lengkap ke dalam formulir.
  • Klik tombol "Mulai" dan tunggu hingga situs dirayapi sepenuhnya. Pada saat yang sama, Anda akan melihat jumlah lengkap tautan yang berfungsi dan rusak.
  • Dengan mengklik tombol "Peta Situs.xml", simpan file di lokasi yang nyaman.

  • Sitemap adalah peta situs dalam format XML, yang pada tahun 2005 mulai digunakan mesin pencari Google untuk mengindeks halaman website. File peta situs adalah cara mengatur situs web, mengidentifikasi alamat dan data untuk setiap bagian. Sebelumnya, peta situs ditujukan terutama untuk pengguna situs. Format XML dikembangkan untuk mesin pencari, memungkinkan mereka menemukan data lebih cepat dan efisien.

    Protokol Peta Situs baru dikembangkan sebagai respons terhadap meningkatnya ukuran dan kompleksitas situs web. Situs web bisnis sering kali berisi ribuan produk dalam katalognya, dan popularitas blog, forum, dan papan pesan memaksa webmaster memperbarui materi mereka setidaknya sekali sehari. Semakin sulit bagi mesin pencari untuk melacak semua materi. Melalui protokol XML, mesin pencari dapat melacak alamat dengan lebih efisien, mengoptimalkan pencariannya dengan menempatkan semua informasi dalam satu halaman. XML juga menunjukkan seberapa sering situs web tertentu diperbarui dan mencatat perubahan terkini. Peta XML bukanlah alat optimasi mesin pencari. Hal ini tidak mempengaruhi peringkat, namun memungkinkan mesin pencari membuat peringkat dan permintaan pencarian yang lebih akurat. Hal ini terjadi dengan menyediakan data yang mudah dibaca oleh mesin pencari.

    Penerimaan umum atas protokol XML berarti bahwa pengembang situs web tidak perlu lagi membuat berbagai jenis peta situs untuk mesin pencari yang berbeda. Mereka dapat membuat satu file untuk tampilan dan kemudian memperbaruinya ketika mereka membuat perubahan pada situs. Ini menyederhanakan seluruh proses penyempurnaan dan perluasan situs web Anda. Webmaster sendiri mulai melihat manfaat menggunakan format ini. Mesin pencari memberi peringkat halaman berdasarkan relevansi konten kata kunci tertentu, namun sebelum format XML, seringkali konten halaman tidak terwakili dengan benar. Hal ini sering kali membuat frustasi para webmaster yang menyadari bahwa upaya mereka untuk membuat situs web luput dari perhatian. Blog, halaman tambahan, penambahan file multimedia membutuhkan waktu beberapa jam. Melalui file XML, jam-jam tersebut tidak akan terbuang percuma, akan terlihat oleh semua mesin pencari yang dikenal.

    Untuk membuat Peta Situs XML dan terus memperbarui mesin pencari dengan perubahan apa pun pada situs Anda, cobalah generator peta situs gratis kami.

    File sitemap.xml, seperti peta situs biasa, adalah sekumpulan halaman yang diformat dalam tag XML. Dengan menggunakan file ini, mesin pencari memahami halaman mana di situs Anda yang harus diindeks terlebih dahulu.

    Peta Situs dalam format XML:

    Setiap opsi memiliki pro dan kontra. Keuntungan utama peta situs dalam format XML adalah menghilangkan kemungkinan mengaburkan bobot statis halaman dalam situs.

    Pada artikel ini saya akan memberi tahu Anda cara membuat file Sitemap.xml yang benar.

    Jika Anda sudah mengetahui segalanya tentang membuat Peta Situs, langsung saja ke bab terakhir yang berjudul “Trik”.

    1. Arahan file peta situs.xml

    Ada 3 arahan wajib yang harus diisi dalam hal apapun, ini adalah tag:

    Dan juga 3 tag opsional:

    Berikut ini pengingat untuk mendekode setiap tag dari situs resmi http://www.sitemaps.org/ru/protocol.html:

    Atribut

    Status

    Keterangan

    diperlukan

    Meringkas file ini dan menentukan standar protokol saat ini.

    diperlukan

    Tag induk untuk setiap URL. Tag lain berada di bawah tag ini.

    diperlukan

    URL halaman itu sendiri. Selalu dimulai dengan awalan (misalnya HTTP) dan diakhiri dengan garis miring (jika server situs Anda memerlukannya).

    Harap diperhatikan: Panjang URL tidak boleh melebihi 2.048 karakter.

    opsional

    Tanggal file terakhir diubah. Ditentukan secara ketat dalam format Tanggal Waktu W3C. Hal ini memungkinkan, jika perlu, untuk mengabaikan segmen waktu dan menggunakan format YYYY-MM-DD.

    opsional

    Memungkinkan Anda menentukan seberapa sering informasi pada halaman berubah.

    Nilai ini merupakan perkiraan.

    Nilai yang valid:

    • selalu
    • per jam
    • sehari-hari
    • mingguan
    • bulanan
    • tahunan
    • tidak pernah

    Jika halaman berubah setiap kali dibuka, gunakan nilai “selalu”. Jika ini adalah halaman arsip, jangan pernah mencantumkannya.

    Harap dicatat bahwa atribut ini berfungsi sebagai petunjuk bagi robot pencari, bukan aturan. Oleh karena itu, hubungan antara frekuensi tersebut dan frekuensi sebenarnya kunjungan halaman oleh robot pencari adalah nonlinier.

    opsional

    Memungkinkan Anda menentukan prioritas beberapa halaman situs Anda dibandingkan halaman lainnya.

    Kisaran nilainya adalah dari 0,0 hingga 1,0.

    Secara default, setiap halaman diberi prioritas 0,5.

    Nilai atribut berfungsi untuk membandingkan prioritas halaman dalam situs Anda saja. Artinya, tidak mempengaruhi perbandingan situs Anda dengan situs pesaing di jaringan pencarian. Selain itu, menyetel semua halaman ke prioritas maksimum juga tidak ada gunanya. Karena dengan demikian nilainya untuk robot akan sama dan atributnya tidak akan berfungsi. Jadi jangan mencari celah, tetapi tunjukkan prioritas obyektif untuk halaman tersebut.

    Simpan pengingat ini. Ini pasti akan berguna bagi Anda pada awalnya. Perlu diperhatikan keuntungan lain dari peta situs XML - fleksibel. Fleksibilitas terletak pada kombinasi arahan opsional yang berbeda.

    Sekarang setelah Anda memahami apa itu peta situs XML dan mengetahui arahan dasar file ini, Anda dapat melanjutkan ke kompilasi.

    2. Kompilasi file peta situs.xml

    Ada 3 cara untuk membuat peta situs:

    • Secara manual;
    • Secara otomatis, menggunakan layanan khusus;
    • Secara otomatis, menggunakan solusi siap pakai berupa plugin untuk CMS, dll.

    Proses pembuatan peta situs adalah sebagai berikut:

    • Kami membuat peta situs menggunakan salah satu metode yang tercantum di atas;
    • Kami memeriksa validitasnya menggunakan layanan mesin pencari (https://webmaster.yandex.ru/sitemaptest.xml);
    • Kami menempatkan file di situs web;
    • Kami menunjukkan jalur ke peta situs untuk robot pencari di file robots.txt (Omong-omong, ada artikel terpisah tentang itu);
    • Kami menunjukkan Peta Situs di panel webmaster Yandex dan Google.

    Jadi bagaimana cara membuat file peta situs?

    Mari kita lihat contoh kompilasi file secara manual. Jika Anda ingin menambahkan 5 halaman situs Anda ke peta situs:

    Seperti inilah tampilan peta situs dalam format XML:

    Kode di atas menunjukkan kepada mesin pencari bahwa halaman tersebut adalah http://site.ru/

    terakhir diubah 1 Januari 2005. Diperbarui sebulan sekali. Dan prioritas halaman ini adalah 0,8 (maksimal mungkin 1).

    Fungsionalitas menyorot tag berpasangan sangatlah nyaman.

    Layanan untuk menghasilkan Peta Situs

    Jika situs Anda memiliki banyak halaman berguna dan Anda tidak ingin membuang waktu untuk menyusun file secara manual, layanan berikut akan membantu Anda:

    Ada banyak layanan seperti itu. Saya menggunakan https://www.xml-sitemaps.com/.

    Izinkan saya menjelaskan secara singkat semua pengaturan:

    Mesin pencari Google merekomendasikan penggunaan https://code.google.com/archive/p/sitemap-generators/wikis/SitemapGenerators.wiki

    Plugin untuk CMS

    Ada banyak sekali plugin dan solusi siap pakai untuk sistem manajemen situs web. Misalnya:

    Pengaya

    Keabsahan

    Setelah membuat peta situs, Anda perlu memeriksa kesalahannya. Untuk memeriksanya, gunakan layanan https://webmaster.yandex.ru/sitemaptest.xml

    Setelah verifikasi berhasil, kami mengunggah file kami ke situs.

    Lokasi berkas

    Berbeda dengan file robots.txt, file sitemap.xml dapat ditempatkan di mana saja di situs Anda. Misalnya, di folder root situs, file akan tersedia di alamat berikut:

    Jika Anda meletakkan file di folder /files/, file tersebut akan tersedia di alamat ini:

    Setelah berhasil mengunduh file, pastikan untuk memberi tahu robot pencari cara menemukan file ini. Hal ini dilakukan dengan sangat sederhana. Dalam file robots.txt() di direktif Peta Situs, tulis alamat lengkap file tersebut. Misalnya, file robots.txt mungkin terlihat seperti ini:

    Penting! Berbeda dengan robots.txt, terdapat beberapa file Peta Situs. Dalam hal ini, Anda harus menunjukkan alamat lengkap semua file Peta Situs di robot dan webmaster.

    Search Console dan panel Yandex.Webmaster

    Masih ada tahap terakhir. Tentukan jalur ke peta situs di panel webmaster mesin pencari.

    • Menyiapkan pengindeksan
    • Peta Situs
    • "Periksa" dan "Tambahkan"

    Perlu diperhatikan batasan dalam peta situs XML:

    • Anda dapat menentukan maksimal 50.000 URL dalam satu file
    • Berat file tidak lebih dari 10 megabyte (mesin pencari tidak mengindeks dokumen yang lebih besar dari 10 megabyte). Jika perlu, file dapat dikompresi menggunakan pengarsip .gzip.
    • Pengodean file hanya UTF-8

    Pada titik ini tahapan utama telah selesai. Ikuti semua aturan sederhana yang dijelaskan dan Anda tidak akan melakukan kesalahan. Bagian kedua artikel ini dikhususkan untuk pengaturan yang lebih rinci, seluk-beluk dan fitur sitemap.xml; Anda memerlukan pengetahuan ini untuk membuat peta situs profesional untuk toko online.

    3. Mengelompokkan Peta Situs

    Jika Anda melebihi batas 50.000 URL, Anda perlu menggunakan struktur bersarang dan membuat grup yang terdiri dari beberapa Peta Situs. Artinya, buat peta situs di dalam peta situs!

    Untuk situs web biasa (bukan portal besar atau toko online), volume halaman seperti itu jarang terjadi, sehingga sebagian besar pakar SEO menggunakan pengelompokan Peta Situs untuk kenyamanan, misalnya, untuk mengelompokkan halaman atau bagian produk.

    Sintaksnya adalah sebagai berikut:

    http://site.ru/sitemap1.xml.gz

    01-10-2004T18:23:17+00:00

    http://site.ru/sitemap2.xml.gz

    Definisi tag XML:

    Atribut


    Keterangan

    diperlukan

    Meringkas informasi tentang semua Peta Situs dalam file ini.

    diperlukan

    Meringkas informasi tentang satu file Peta Situs.

    diperlukan

    Menentukan lokasi file Peta Situs.

    opsional

    Menunjukkan waktu modifikasi file Peta Situs terkait. Robot menggunakan informasi ini untuk memahami file Peta Situs mana yang telah diubah. Secara tidak langsung, tag ini memungkinkan robot menemukan halaman baru di situs dengan cepat.

    Ini membuat peta situs yang dikelompokkan. Semua prosedur lainnya sama seperti yang dijelaskan di atas. Jangan lupa untuk menunjukkan tautan yang benar ke file Anda di file robots.txt, di arahan Peta Situs.

    4. Penelitian

    Di penghujung tahun 2014, saya melakukan penelitian kecil-kecilan untuk menganalisis efektivitas memiliki file sitemap.xml di sebuah website.

    Ada masalah saat mengindeks grup produk di situs toko online (sekitar 10.000 produk). Pada saat yang sama, tidak ada yang menghalangi pengindeksan mereka. File peta situs telah dikompilasi, hanya terdiri dari tautan ke produk situs. Peta situs diperbarui secara otomatis. Dalam 2 bulan, lebih dari 70% URL dimasukkan dalam database indeks mesin pencari Yandex. Sebagian besar halaman yang termasuk dalam indeks adalah halaman dari peta situs. Saya ingin mencatat bahwa selama periode ini tidak ada tindakan lain yang diambil untuk mempercepat pengindeksan situs (misalnya, menambahkan tautan).

    Berikut hasilnya sendiri:

    Kesimpulan: Peta situs masih mempengaruhi pengindeksan situs Anda. File ini perlu diperbarui dan diperbarui secara berkala.

    5. Keripik

    Agar artikel ini tidak membosankan bagi pakar SEO berpengalaman, saya sarankan Anda membiasakan diri dengan “trik” berikut.

    Peta situs gambar

    Untuk menarik lalu lintas tambahan dari mesin telusur (mungkin tidak seluruhnya lalu lintas konversi), Anda dapat membuat Peta Situs tambahan untuk gambar.

    Sintaks untuk peta situs gambar terlihat seperti ini:

    xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">

    http://example.com/primer.html

    http://example.com/kartinka.jpg

    http://example.com/photo.jpg

    Pengingat tentang tag XML:

    Perlu?

    Keterangan

    Berisi semua informasi tentang satu gambar. Setiap URL (tag) dapat berisi hingga 1000 tag.

    URL gambar.

    Dalam beberapa kasus, domain URL gambar mungkin berbeda dengan domain yang digunakan situs utama. Jika kedua domain tersebut terverifikasi di Search Console, tidak akan ada masalah. Namun jika gambar Anda dihosting menggunakan sistem pengelolaan konten seperti Google Sites, Anda harus memverifikasi situs hosting Anda di Search Console. Selain itu, file robots.txt tidak boleh mencegah perayapan konten yang perlu diindeks.

    Keterangan gambar.

    Lokasi syuting. Misalnya, Poronaysk, tentang. Sakhalin.

    Judul gambar.

    URL lisensi gambar.

    Peretasan hidup bagi mereka yang selesai membaca

    Banyak pakar SEO membuat file Peta Situs satu kali pada awal proyek. Kemudian mereka melupakan peta situsnya. Halaman-halamannya diindeks - bagus. Tidak - tapi apa yang bisa kamu lakukan?! Mereka biasanya lupa menambahkan halaman baru ke peta situs.

    Selama penelitian saya, saya menemukan bahwa cara paling mudah untuk mengatasi masalah ini adalah file sitemap.xml terpisah, yang hanya akan berisi halaman-halaman situs yang belum diindeks.

    Dan inilah yang memungkinkan lebih dari 70% URL baru dimasukkan ke dalam indeks Yandex.

    Dalam panduan ini kami akan membahas pertanyaan-pertanyaan berikut:

    Apa itu Peta Situs?

    Ini adalah file yang berisi daftar link ke semua halaman penting situs. Artinya, dokumen ini mengarahkan mesin pencari ke konten utama di situs.

    Mengapa Anda memerlukan peta situs?

    Peta situs diperlukan jika situs mengalami masalah pengindeksan yang disebabkan oleh:
    1) jumlah halaman yang banyak;
    2) kurangnya link (internal atau eksternal) ke halaman;
    3) sarang yang dalam di lokasi (struktur yang membingungkan).

    Peta situs HTML vs XML

    Peta Situs tersedia dalam jenis berikut:

    • HTML;

    Penjelasan paling sederhana tentang perbedaan antara format-format ini adalah bahwa peta XML terutama ditujukan untuk mesin pencari, sedangkan HTML ditujukan terutama untuk pengguna.

    peta HTML– Ini hanyalah gambaran umum situs, hanya berisi informasi dan halaman yang perlu dilihat pengguna. Jika Anda berada di sebuah situs web dan mencari bagian tertentu, Anda dapat dengan mudah menemukannya saat membuka Peta Situs HTML. Meskipun jenis peta situs ini berfokus pada pengguna, peta situs ini juga dapat membantu peringkat mesin pencari Anda. Ini adalah salah satu bukti bahwa Anda peduli dengan pengalaman pengguna situs tersebut.

    Saat membuat peta situs HTML, penting untuk mempertimbangkan:

    1. Konten terstruktur.

    Peta situs harus jelas dan mudah dipahami pengguna. Diinginkan bahwa itu mencakup bagian, kategori, subkategori, dll.

    2. Tautan jangkar.

    Protokol kartu XML Situs ini ditujukan untuk robot pencari. File XML berisi informasi tentang kapan URL terakhir diperbarui, seberapa penting URL tersebut, dan seberapa sering perubahan terjadi.

    Biasanya Peta Situs terdiri dari tag XML berikut:

    Diperlukan:
    – mendefinisikan standar protokol dan merangkum file ini.
    – содержит в себе информацию о URL-адресе (является родительским тегом).
    https://danykom.ru/id/ – содержит абсолютный URL-адрес.

    Необязательные:
    – указывает дату последнего изменения файла.
    – указывает частоту смены файла.
    – указывает на значимость документа на сайте. Диапазон значений: от 0,1 до 1,0 (по умолчанию 0,5).

    Не устанавливайте для каждого URL-адреса слишком частую смену файла и максимальный приоритет. Если метки частоты и приоритета не отражают реальность, вероятнее всего, поисковые системы будут более склонны игнорировать всю карту XML.

    Другие форматы Sitemap

    Помимо вышеперечисленных карт сайта, поисковые системы также поддерживают следующие форматы:

    Для Google:
    — RSS, mRSS и Atom 1.0;
    RSS / Atom фиды должны содержать последние обновления вашего сайта. Обычно они небольшие и часто обновляются (что является плюсом).
    — Сайты Google.
    Для сайтов, созданных на платформе Google Сайты, Sitemap создаётся автоматически, и внести какие-то изменения невозможно.

    Для Google и Яндекс:
    — текстовый формат (TXT).
    Файл должен быть в кодировке UTF-8 и состоять только из URL-адресов.

    Требования Google и Яндекса к файлам Sitemap

    1. Используйте кодировку UTF-8.
    2. Максимальное количество URL – 50 000.
    3. Ссылки в сайтмапе должны быть на том же домене, что и файл.

    4. Если файл слишком большой, разделите его на несколько и укажите их в файле индекса Sitemap.
    5. Ответ сервера при обращении к файлу должен быть 200 ОК.
    6. Указывайте только канонические адреса страниц (без GET-параметров и идентификаторов сессий).

    1. Максимальный размер – 10 МБ.
    2. Поддерживает кириллические URL.

    1. Максимальный размер – 50 МБ.
    2. Поддерживает только цифры и латинские буквы.

    Распространённая ошибка: чтобы уменьшить требования к пропускной способности канала, используют архиватор gzip. Размер сайтмапа должен быть 50 МБ (10 МБ) до сжатия, а не после.

    Совет: русские доменные имена можно преобразовать с помощью кодировки Punycode.

    Как создать XML Sitemap

    1. Чтобы создать карту сайта, в первую очередь нужно определить канонические адреса, которые будут добавлены в файл.

    2. Определить, какой формат файла будете использовать.

    3. Создать файл можно вручную или, воспользовавшись генератором Sitemap.

    Google в своей справке подготовил список онлайн и десктопных, платных и бесплатных генераторов карт сайта. Ознакомиться со всем списком можно, перейдя по ссылке .

    Сгенерировать Sitemap проще, чем кажется. Разберём, как сгенерировать сайтмап, на примере деcктопного приложения Majento:

    1. Парсим сайт.

    2. Переходим в раздел «Сайты» => «Генерировать Sitemap».

    3. Сохраняем в нужном нам формате.

    4. Карта сайта готова.

    Из online-генераторов XML-карты сайта заслуживает внимания XML Sitemap Generator .

    Расширенные возможности этого сервера позволяют установить определённые XML-теги, включить/исключить нужные документы.

    Исключить ненужные страницы можно и с помощью регулярных выражений.

    Google поддерживает расширенный синтаксис для изображений. Для этого вы можете создать отдельную карту сайта для изображений или добавить синтаксис в существующую. Использование расширенного синтаксиса в Sitemap предоставляет поисковой системе дополнительную информацию об изображениях на сайте. Также это может помочь Google обнаружить и проиндексировать изображения, которые он не может найти при сканировании сайта.

    Как и в обычной карте сайта, есть обязательные и необязательные XML-теги.

    Обязательные:
    – аналогично тегу содержит в себе URL изображения и дополнительную информацию.
    – URL изображения.

    Необязательные:
    – подпись к изображению.
    – место съёмки фотографии.
    – название изображения.
    – URL-лицензии изображения.

    Ещё один расширенный синтаксис, который поддерживает Google, – XML-карта для видео.

    Плюсы добавления XML-тегов для видео:

    1) даёт понять Google, какой контент на сайте;
    2) даёт возможность предоставить детальное описание к файлу;
    3) станет доступным для поиска в Google Видео;
    4) в поисковой выдаче будет отображаться заставка видео (может повысить количество переходов из поисковой выдачи).

    Карта сайта для видеофайлов состоит из следующих обязательных элементов:

    – содержит URL-адрес страницы, на которой размещено видео; если на одной странице размещено более одного видео, не нужно каждый раз создавать тег , достаточно в одном теге несколько раз прописать для каждого видео на странице.
    – включает в себя всю информацию о видео.
    – URL к миниатюрному изображению (заставке) к видео. Рекомендованные размеры: от 160×90 пикселей до 1920×1080. Форматы изображения: .jpg, .png, or. gif
    – заголовок, который должен совпадать с названием страницы, на которой отображается видео.
    – описание видео. Должно соответствовать с метаописаниями страницы. Максимальное количество символов – 2048.

    Заголовок и описание видео должны быть экранированы или упакованы в блок CDATA.

    Со всеми XML-тегами карты сайта для видео можно ознакомиться в справке Google .

    Где разместить карту сайта

    Распространённые заблуждения о Sitemap

    Так как у многих этот файл вызывает трудности и является «тёмным лесом», возникают определённые мифы в отношении карт сайта. Рассмотрим некоторые из них:

    – «Включение URL-адреса в файл Sitemap для XML гарантирует, что он будет проиндексирован».
    Нет. Важно отметить, что XML-файлы Sitemap – это только рекомендации. Карта сайта XML не гарантирует индексацию поисковыми системами страниц, указанных в файле.

    – «Если я удалю URL из XML-карты, он будет удалён из индекса».
    Нет. Карта сайта XML не исключает индексацию страниц, не включённых в карту сайта XML.

    – «XML-файлы Sitemap трудно создавать и поддерживать»
    Нет. Небольшие сайты могут легко создавать и размещать собственные XML-файлы вручную, используя приведённые выше примеры в качестве руководства по форматированию. Для более крупных сайтов и сайтов, которые изменяются чаще, плагины или модули, доступные для большинства CMS, могут автоматизировать обновление XML-файлов.

    Заключение

    Файл Sitemap – полезный инструмент для передачи поисковым роботам информации о структуре сайта. Используйте это руководство, чтобы понять, как работает карта сайта, как она устроена, как сгенерировать, разместить и проверить файл.

    Файл sitemap.xml - это инструмент, который позволяет вебмастерам информировать поисковые системы о страницах сайта, доступных к индексации. Также, в XML карте можно указывать дополнительные параметры страниц: дата последнего обновления, частота обновлений и приоритет относительно других страниц. Информация в sitemap.xml может влиять на поведение поискового краулера и, в целом, на процесс индексации новых документов. Sitemap содержит в себе директивы включения страниц в очередь на обход и дополняет robots.txt, содержащий директивы исключения страниц.

    В этом руководстве вы найдете ответы на все вопросы, касающиеся использования sitemap.xml.

    Нужен ли мне sitemap.xml

    Поисковые системы используют sitemap для поиска новых документов на сайте (это могут быть html-документы или медиа-контент), которые недоступны через навигацию, но их необходимо просканировать. Наличие ссылки на документ в sitemap.xml не гарантирует его сканирование или индексацию, но чаще всего файл помогает большим сайтам индексироваться лучше. К тому же, данные из XML карты используются при определении канонических страниц, если это специально не указано в теге rel=canonical.

    Sitemap.xml важен для сайтов, где:

    • Некоторые разделы недоступны через навигационное меню.
    • Имеется множество изолированных страниц или плохо связанных между собой.
    • Используются технологии, слабо поддерживаемые поисковыми системами (например, Ajax, Flash или Silverlight).
    • Присутствует очень много страниц и есть вероятность, что поисковый краулер пропустит новый контент.

    Если это не ваши случаи, то скорей всего sitemap.xml вам не нужен. Для сайтов, где каждая важная для индексации страница доступна в пределах 2х кликов, где для отображения контента не используются технологии JavaScript или Flash, где при необходимости используются канонические и региональные теги, и свежий контент появляется не чаще, чем на сайт заходит робот, в файле sitemap.xml нет необходимости.

    Для небольших проектов при наличии проблемы лишь большого уровня вложенности документов, ее легко решить с помощью HTML карты сайта, не прибегая к использованию XML карты. Но если вы решили, что sitemap.xml вам все-таки нужен, то прочитайте это руководство полностью.

    Техническая информация

    • Sitemap.xml является текстовым файлом формата XML . Однако, поисковые системы также поддерживают текстовый формат (см. следующий раздел).
    • Каждый сайтмап может содержать максимум 50 000 адресов и весить не более 50Мб (10Мб для Яндекса).
    • Можно использовать gzip-сжатие для уменьшения размера файла sitemap.xml и увеличения скорости его передачи. В таком случае используйте расширение gz (sitemap.xml.gz). При этом, ограничения по весу остаются для несжатых сайтмапов.
    • Местоположение файла Sitemap определяет набор URL-адресов, которые можно включить в этот Sitemap. Карта, содержащая адреса страниц всего сайта, должна располагаться в корне. Если сайтмап располагается в папке, то и все URL в этом сайтмапе должны располагаться в этой папке или глубже ().
    • Адреса в sitemap.xml должны быть абсолютными.
    • Максимальная длина URL - 2048 символов (1024 символа для Яндекса).
    • Спецсимволы в URL (типа амперсанда "&" или кавычек) должны маскироваться в HTML-сущности.
    • Указанные в карте страницы должны отдавать 200 http-код статуса.
    • Перечисленные в карте адреса не должны быть закрыты в файле robots.txt или в meta-robots.
    • Sitemap не должен быть закрыт в robots.txt, иначе поисковая система его не просканирует. Сам файл может находиться в индексе, это нормально.

    Форматы XML карт

    Поисковые системы поддерживают простой текстовый формат карты сайта, где просто списком перечислены URL-адреса страниц без дополнительных параметров. В таком случае файл должен иметь кодировку UTF-8 и иметь расширение .txt .

    Также поисковиками поддерживается стандартный XML-протокол . Google дополнительно поддерживает сайтмапы для изображений, видео и новостей.

    Пример файла Sitemap, содержащий только один адрес.

    https://сайт/ 2018-06-14 daily 0.9

    tag XML
    kumpulan url
    url(wajib) - Tag induk untuk setiap URL.
    lokasi(wajib) - URL dokumen, harus mutlak.
    mod terakhir- tanggal modifikasi terakhir dokumen dalam format Datetime.
    frekuensi perubahan- frekuensi perubahan halaman (selalu, setiap jam, harian, mingguan, bulanan, tahunan, tidak pernah). Arti tag ini adalah rekomendasi kepada mesin pencari, bukan perintah.
    prioritas- Prioritas URL relatif terhadap alamat lain (dari 0 hingga 1) untuk urutan pemindaian. Jika tidak ditentukan, defaultnya adalah 0,5.

    Peta XML untuk gambar

    Beberapa pengoptimal menyisipkan tautan ke gambar ke peta situs.xml dengan cara yang sama seperti tautan ke dokumen HTML. Hal ini dapat dilakukan, tetapi lebih baik Google menggunakan ekstensi protokol standar dan mengirimkan informasi tambahan tentang gambar beserta URL-nya. Membuat peta gambar XML berguna jika gambar perlu dipindai dan diindeks, dan pada saat yang sama, gambar tersebut tidak dapat diakses langsung oleh bot (misalnya, JavaScript digunakan).

    Contoh peta situs yang berisi satu halaman dan gambar terkait

    http://example.com/primer.html http://example.com/kartinka.jpg http://example.com/photo.jpg Вид на Балаклаву Севастополь, Крым http://creativecommons.org/licenses/by-nd/3.0/legalcode

    tag XML
    gambar:gambar(wajib) - informasi tentang satu gambar. Maksimal 1000 gambar dapat digunakan.
    gambar: lokasi(wajib) - jalur ke file gambar. Jika CDN digunakan, maka diperbolehkan untuk menautkan ke domain lain jika sudah diverifikasi di panel webmaster.
    gambar: keterangan- keterangan gambar (mungkin berisi teks panjang).
    gambar: judul- judul gambar (biasanya teks pendek).
    gambar:geo_location- lokasi pengambilan gambar.
    gambar:lisensi- URL lisensi gambar. Digunakan untuk pencarian gambar tingkat lanjut.

    Peta XML untuk video

    Mirip dengan peta gambar, Google juga memiliki ekstensi protokol peta situs video tempat Anda dapat menentukan informasi mendetail tentang konten video yang memengaruhi tampilannya dalam penelusuran video. Peta situs video diperlukan ketika situs menggunakan video yang dihosting secara lokal, dan ketika mengindeks video ini sulit dilakukan karena teknologi yang digunakan. Jika Anda menyematkan video dari YouTube di situs web Anda, maka peta situs video tidak diperlukan di sini.

    Peta Situs Berita

    Jika Anda memiliki konten berita di situs Anda dan berpartisipasi dalam Google Berita, ada gunanya menggunakan Peta Situs untuk berita, sehingga Google akan segera menemukan materi terbaru Anda dan mengindeks semua artikel berita. Dalam hal ini, Peta Situs hanya boleh berisi alamat halaman yang diterbitkan dalam 2 hari terakhir dan berisi tidak lebih dari 1000 URL.

    Menggunakan banyak kartu

    Jika perlu, Anda dapat menggunakan beberapa peta situs, menggabungkannya menjadi satu peta situs indeks. Beberapa sitemap.xml digunakan jika:

    • Situs ini menggunakan beberapa mesin (CMS).
    • Situs ini memiliki lebih dari 50.000 halaman.
    • Penting untuk mengatur pelacakan kesalahan yang mudah di beberapa bagian.

    Dalam kasus terakhir, setiap bagian besar situs memiliki sitemap.xml sendiri dan semuanya ditambahkan ke panel untuk webmaster, sehingga akan lebih mudah untuk melihat bagian mana yang memiliki kesalahan paling banyak (lihat bagian tentang menemukan kesalahan di peta situs).

    Jika Anda memiliki 2 atau lebih peta situs, peta situs tersebut harus digabungkan menjadi peta situs indeks, yang terlihat sama dengan peta situs biasa (kecuali adanya tag peta situs dan peta situs, bukan urlset dan url), memiliki batasan serupa dan hanya dapat ditautkan ke peta XML biasa (bukan peta indeks).

    Contoh Indeks Peta Situs:

    http://www.example.com/sitemap-blog.xml.gz 01-10-2004T18:23:17+00:00 http://www.example.com/sitemap-webinars.xml.gz 2005-01-01

    indeks peta situs(wajib) - menentukan standar protokol saat ini.
    peta situs(wajib) - berisi informasi tentang peta situs terpisah.
    lokasi(wajib) - lokasi peta situs (dalam format xml, txt atau rss untuk Google).
    mod terakhir- waktu perubahan peta situs. Memungkinkan mesin pencari menemukan URL baru dengan cepat di situs besar.

    Cara membuat peta situs.xml

    Metode untuk membuat Peta Situs XML:

    • Alat CMS internal. Banyak CMS yang sudah mendukung pembuatan peta situs. Untuk mengetahuinya, baca dokumentasi CMS Anda, lihat item menu di panel admin, atau hubungi dukungan teknis mesin. Unggah file https://situsanda.com/sitemap.xml di situs Anda; file tersebut mungkin sudah ada dan dibuat secara dinamis.
    • Plugin eksternal. Jika CMS tidak memiliki fungsionalitas pembuatan peta situs dan mendukung plugin, cari plugin mana yang mencakup pertanyaan peta situs.xml untuk mesin Anda dan instal. Dalam beberapa kasus, Anda perlu menghubungi pemrogram untuk menulis plugin serupa untuk Anda.
    • Pisahkan skrip di situs. Mengetahui protokol peta XML dan batasan teknisnya, Anda dapat membuat sitemap.xml sendiri dengan menambahkan skrip pembuatan ke CRON. Jika Anda bukan seorang programmer, gunakan item lain dalam daftar ini.
    • Generator peta situs. Ada banyak generator sitemap.xml yang memindai situs Anda dan memberi Anda peta siap pakai untuk diunduh. Kerugiannya di sini adalah setiap kali situs diperbarui, Anda perlu membuat peta situs secara manual.
    • Parser. Program desktop yang dirancang untuk analisis teknis situs web biasanya memberikan kesempatan untuk mengunduh sitemap.xml, yang dihasilkan berdasarkan halaman yang dirayapi. Cara kerjanya mirip dengan generator peta situs, hanya saja ia berjalan secara lokal di mesin Anda.

    Generator peta situs online populer

    XML-Peta Situs.com

    Memungkinkan Anda mendapatkan sitemap.xml dalam beberapa klik. Mendukung format XML, HTML, TXT dan GZ. Nyaman digunakan untuk situs kecil (hingga 500 halaman).

    Generator serupa, tetapi memiliki pengaturan lebih banyak dan memungkinkan Anda membuat peta hingga 2000 halaman secara gratis.

    Memiliki banyak pengaturan, memungkinkan Anda mengimpor URL dari file CSV. Memindai hingga 500 URL secara gratis.

    Tidak ada batasan jumlah halaman yang akan dipindai. Namun untuk situs besar, proses pembuatannya mungkin terhenti selama beberapa puluh menit.

    Program lokal untuk menghasilkan Peta Situs XML

    Generator Peta Situs G-Mapper

    Versi desktop gratis dari generator peta situs untuk Windows.

    Laba-laba SEO Katak Berteriak

    Alat pembuatan peta situs yang fleksibel dengan banyak pengaturan. Nyaman jika Anda sudah menggunakan screamin Frog untuk tugas SEO lainnya. Setelah memindai situs, gunakan item menu Peta Situs -> Buat Peta Situs XML.

    Laba-laba Netpeak

    Solusi yang kurang fleksibel namun juga nyaman untuk membuat peta situs.xml dengan cepat. Setelah memindai situs, Anda perlu menggunakan item menu Alat -> Hasilkan Peta Situs.

    Dengan menggunakan generator peta situs kami, buat file XML yang dapat dikirimkan ke Google, Yandex, Bing, Yahoo, dan mesin pencari lainnya untuk membantu mereka mengindeks situs Anda.

    Lakukan dalam tiga langkah sederhana:

  • Masukkan URL situs web lengkap ke dalam formulir.
  • Klik tombol "Mulai" dan tunggu hingga situs dirayapi sepenuhnya. Pada saat yang sama, Anda akan melihat jumlah lengkap tautan yang berfungsi dan rusak.
  • Dengan mengklik tombol "Peta Situs.xml", simpan file di lokasi yang nyaman.

  • Sitemap adalah peta situs dalam format XML, yang pada tahun 2005 mulai digunakan mesin pencari Google untuk mengindeks halaman website. File peta situs adalah cara mengatur situs web, mengidentifikasi alamat dan data untuk setiap bagian. Sebelumnya, peta situs ditujukan terutama untuk pengguna situs. Format XML dikembangkan untuk mesin pencari, memungkinkan mereka menemukan data lebih cepat dan efisien.

    Protokol Peta Situs baru dikembangkan sebagai respons terhadap meningkatnya ukuran dan kompleksitas situs web. Situs web bisnis sering kali berisi ribuan produk dalam katalognya, dan popularitas blog, forum, dan papan pesan memaksa webmaster memperbarui materi mereka setidaknya sekali sehari. Semakin sulit bagi mesin pencari untuk melacak semua materi. Melalui protokol XML, mesin pencari dapat melacak alamat dengan lebih efisien, mengoptimalkan pencariannya dengan menempatkan semua informasi dalam satu halaman. XML juga menunjukkan seberapa sering situs web tertentu diperbarui dan mencatat perubahan terkini. Peta XML bukanlah alat optimasi mesin pencari. Hal ini tidak mempengaruhi peringkat, namun memungkinkan mesin pencari membuat peringkat dan permintaan pencarian yang lebih akurat. Hal ini terjadi dengan menyediakan data yang mudah dibaca oleh mesin pencari.

    Penerimaan umum atas protokol XML berarti bahwa pengembang situs web tidak perlu lagi membuat berbagai jenis peta situs untuk mesin pencari yang berbeda. Mereka dapat membuat satu file untuk tampilan dan kemudian memperbaruinya ketika mereka membuat perubahan pada situs. Ini menyederhanakan seluruh proses penyempurnaan dan perluasan situs web Anda. Webmaster sendiri mulai melihat manfaat menggunakan format ini. Mesin pencari memberi peringkat halaman berdasarkan relevansi konten kata kunci tertentu, namun sebelum format XML, seringkali konten halaman tidak terwakili dengan benar. Hal ini sering kali membuat frustasi para webmaster yang menyadari bahwa upaya mereka untuk membuat situs web luput dari perhatian. Blog, halaman tambahan, penambahan file multimedia membutuhkan waktu beberapa jam. Melalui file XML, jam-jam tersebut tidak akan terbuang percuma, akan terlihat oleh semua mesin pencari yang dikenal.

    Untuk membuat Peta Situs XML dan terus memperbarui mesin pencari dengan perubahan apa pun pada situs Anda, cobalah generator peta situs gratis kami.

    • Sergei Savenkov

      semacam ulasan "pendek"... seolah-olah mereka sedang terburu-buru di suatu tempat