Як новачкові створити (Sitemap.xml)

Перший крок при ознайомленні з інтернет-проектом – SEO-фахівець робить, коли "забиває" sitemap.xml в адресний рядок. Він це робить для того, щоб проаналізувати, чому контент погано індексується і зовсім не індексується. Як грамотно створити sitemap.xml, щоб індексація контенту була максимальною?

Як новачкові створити (Sitemap.xml)
Переглядів 641
Час читання: 5 минут

XML-картка – що це таке?

XML-карта – что это?

Карта сайту (Sitemap.xml), яка у форматі XML містить список усіх сторінок ресурсу, необхідна, щоб боти пошукових систем швидко їх знаходили, а пошукові системи ефективно індексували.

Існує два типи Sitemap.xml: звичайна та індексна

Вага звичайної XML-карти не перевищує 50 Мб та охоплює 50 тисяч сторінок, не більше.

Індексна Sitemap поєднує кілька звичайних XML-карток і створюється для великих мультимовних сайтів. Місткість таких файлів не перевищує 50 тисяч URL-адрес.

Як знайти XML-Sitemap

Как найти XML-Sitemap

Декілька способів перегляду карти сайту:

1. У файлі robots.txt вкажіть адресний рядок: https:/site.com/robots.txt. Сам файл може містити підказку XML-Sitemap у наступному форматі: Карта сайту: HTTPS:/site.com/sitemap/sitemaxml

2. Якщо ви не можете знайти посилання на файл у robots.txt, введіть наступний запит у адресному рядку: https://site.com/sitemap.xml

Якщо формат URL файлу robots.txt строго вимагається /robots.txt, то URL файлу sitemap.xml може бути будь-яким.

/sitemap.xml - це просто популярніше ім'я XML-карти, але воно може бути іншим, наприклад, /sitemap-categories.xml, /sitemap-en.xml і так далі.

З. Ви також можете шукати у пошуковій системі за допомогою пошукових систем. Вам потрібно використовувати два оператори:

  • Сайт: Шукайте точну адресу.
  • FileType: пошук потрібного файлу.

Для пошуку XML-файлу необхідно створити пошуковий запит:

  • Сайт: сайт.сом FileType:xml
  • Елементи XML-карти_сайту

Нам вже відомо, карта сайту (sitemap) може бути як звичайною, так і індексною. Ось обов'язкові та не дуже елементи для кожного типу.

Карта сайту звичайна: елементи

Карта сайта обычная: элементы

Обов'язково потрібні:

  • XML-версія вказується в першому рядку плюс UTF-8_кодування;
  • Tag: urlset - батьківський для тегів, що ми вкажемо нижче, Це стандарт для поточного протоколу;
  • Tag: url - використовується при кожному введенні URL-адреси. Він – батьківський для тегів нижче та дочірній для tag: urlset;
  • Tag: loc - вказує, що адреса сторінки (URL) точна. Він дочірній tag: url.

Потрібні, але не обов'язково:

  • Tag: lastmod – показує, коли сторінка оновлювалася останній раз. Це дочірній tag для url тега. Google пошуковик звертає увагу на нього при збігу термінів оновлення сторінки останній раз. Тут використовується W3C Datetime формат при вказівці дати, яку потрібно прописувати в такому вигляді і тільки: YYYY-MM-DDThh:mm:ss+TZD. Наприклад: 2023-03-16T20:25:40+02:00;
  • Tag: changefreq - показує, як часто оновлюється сторінка в діапазоні значень від always до never;
  • Tag: priority- як випливає з назви показує, що та чи інша сторінка є пріоритетною. Діапазон цього значення 0,0 – 1,0.

"Свіжа" інформації Google Пошуку - система перестала враховувати значущість tags: changefreq priority.

Карта сайту індексна: елементи

Карта сайта индексная: элементы

Обов'язково потрібні:

  • У першому рядку вказується версія XML та обов'язкове для файлів картки сайту кодування - UTF-8;
  • Tag: sitemapindex - батьківський, обов'язковий для всіх tags нижче. Це стандарт;
  • Tag; sitemap - без нього не можна обійтися, тому що в ньому вся інформація про кожен файл. Дочірній для tag: sitemapindeх;
  • Tag: loc – це координати файлу з системою. Дочірній для tag: sitemap.

Потрібні, але не обов'язково:

  • Tag: lastmod - прописується для уточнення, коли останнє оновлення файлу карти. Важливо! Йдеться загалом sitemap_файлі. Дочірній для tag: sitemap.

Способи створення Sitemap

Способы создания Sitemap

Існує 4 способи створення Sitemap. Розповімо про них коротко.

  1. З допомогою CMS. Системи керування контентом WordPress та Wix автоматично генерують Sitemap.
  2. Самостійно (вручну). Це не складно, коли у вас сайт-односторінник або не дуже великий ресурс. Потрібен текстовий редактор та ваша грамотність, включно синтаксична.
  3. Сторонні сервіси-генератори. Наприклад: mysitemapgenerator.com; smallseotools.com (є безкоштовна версія); xml-sitemaps.com.
  4. Netpeak Spider. Для роботи на цьому ресурсі потрібно чітко дотримуватись правил і встановленого алгоритму: відсканувати URL (скільки потрібно) - запустити автомат generatorSitemap - налаштувати параметри - натиснути "кнопку" "згенерувати" - зберегти.

Sitemap: Google рекомендує

Найбільша пошукова система рекомендує дотримуватися наступних принципів, щоб ваш сайт максимально індексувався:

  • Точність та правильність написання URL-адрес.
  • URL-адреси повинні належати виключно до вказаного домену (!).
  • Sitemap важливо помістити в корінь (кореневий каталог) сайту.
  • Використовувати тільки кодування UTF-8. Всі інші символи екранувати (якщо пишіть картку вручну.)
  • Пошуковик не сканує кожну вашу URL-адресу в Sitemap і ігнорує порядок їх розташування.
  • Щоб адреси були проіндексовані, вони повинні містити mega_tag NOINDEX.
  • Sitemap має регулярно оновлюватися в автоматичному режимі, коли додаються/видаляються/відкриваються/закриваються для індексації запитаних сторінок.

Sitemap: Bing рекомендує

Рекомендації Bing практично ідентичні Google, лише дещо перефразовані.

Sitemap для мультимовних сайтів

Щоб пошуковик не вважав мовні версії сайту дублями, існує 3 способи:

  1. Прописати в коді сторінці атрибут rel="alternate" hreflang="x" (це найпоширеніший і найзручніший).
  2. За допомогою XML-Sitemap (якщо сайт великий).
  3. За допомогою заголовків HTTP.

Sitemap для стаціонарних зображень

Іноді пошукова система не може відсканувати на сайті картинки. Часто це буває, коли зображення завантажується JavaScript.

Для вирішення проблеми існує два способи: посилання вказати у звичайній Sitemap або створити окрему Sitemap для зображень.

Обидва випадки передбачають обов'язкове створення простору xml-імен, де будуть прописані теги для картинок: image:image та image:loc.

Наступні теги також можна використовувати, але вони не є обов'язковими (пошуковик їх не враховує). Наприклад: image:caption, image:geo_location, image:title, image:license.

Важливо! Sitemap для зображень повинен використовувати тільки UTF-8_кодування, і для кожної URL-адреси може бути не більше 1 тис картинок. Регулярне оновлення є обов'язковим!

Sitemap для відеозображень

Підхід і вимоги при створенні Sitemap для відеоконтенту подібний до вищевказаного для картинок. Створюючи карту сайту, ми повідомляємо пошуковику, що на нашому ресурсі є відео. Це важливо, особливо тоді, коли відео розміщено нещодавно.

Google дає рекомендації щодо створення Sitemap для відеозображень. Ось головні з них:

  1. Обов'язкове UTF-8_кодування.
  2. Обсяг Sitemap для відео – не більше 50 мегабайт та 50 тисяч відео одиниць. Все, що більше цього вимагає створення індексного відеофайлу Sitemap.
  3. Sitemap для відеоконтенту не гарантує його індексацію.
  4. Усі сторінки повинні давати код у відповідь 200.
  5. Посилання обов'язково розміщується на robots.txt.
  6. Потрібне регулярне автоматичне оновлення.

Перше, що потрібно зробити під час створення Sitemap для відеозображень – визначити простір для tags.

А потім прописати і самі тэги. Індексованих понад двадцять.

Три батьківські: urlset, url (є дочірнім для urlset) і video:video;

Інші відносяться до посилальної маси та опису: video:thumbnail_loc, video:title, video:description, video:content_loc, video:player_loc.

Вітаються пошуковими системами і наступні теги: video:duration та video:expiration_date.

Інші теги, що вказують на рейтинг, перегляди, заборону/доступ та інші дані – не є обов'язковими.

Sitemap для сайту новин

В ідеалі новинні сайти вимагають створення окремої sitemap, яка автоматично оновлюватиметься щодня. Це потрібно для включення ресурсу до каталогу Google Новин.

Місткість такої sitemap – 1 тисяча url-адрес. Google настійно радить робити регулярне оновлення картки, особливо якщо протягом дня публікується кілька десятків новин. Sitemap новинного ресурсу потрібно розміщувати або в тематичній категорії «Новини» або «Лента новостей» або в корені сайту.

Важливо! У файл повинні заносити лише дані статей за останні дві доби, решту потрібно видаляти. У Google Новинах вони індексуватимуться ще 30 днів..

Ось теги, які є обов'язковими для sitemap новин: Основні елементи sitemap для новин:

Два батьківські теги: news:news та news:publication , у якого два дочірні теги: news:name та news:language (формат ISO 639-1 ).

Важливі також теги news:publication_date и news:title .

Способи впровадження Sitemap

Щоб пошукач знайшов XML-Sitemap, можна використовувати кілька способів:

  • за допомогою Google Search Console;
  • через ping, відправивши GET-запит і вказавши url-адресу вашої Sitemap;
  • url-адресу sitemap вашого сайту розмістити у robots.txt.

XML-Sitemap аналізується лише при першому виявленні, а не при кожному скануванні сайту. Якщо ви змінили файл, повідомте про це пошукову систему за допомогою запиту ping.

Sitemap: як виявити помилки

Якщо ви зробили все правильно (за вказівкою), то великих помилок не повинно бути. Перевірити на наявність помилок допоможуть наступні ресуси:

  • Google Search Console, пункт "Файли Sitemap".
  • Netpeak Spider. "Інструменти" - "Волідатор" працює в автоматичному режимі.

Порада! Якщо ваш сайт, незважаючи на точне дотримання інструкцій та відсутність помилок, погано індексується, то можна розбити sitemap вашого сайту на складові дрібні частини та відправити на індексацію. Але не перестарайтеся. Дробити занадто дрібно, це може призвести до іншої проблеми - неотримання даних з GSC.

У вас є діловий запит?

Давайте обговоримо!

Залишіть свої контакти,
ми зв'яжемося з вами найближчим часом.

Сайт jetbit.pro використовує файли cookie для зберігання даних. Продовжуючи використання сайту, Ви даєте згоду працювати з цими файлами. Детальніше