Збір семантичного ядра: найповніший чек-лист 2025

Автор: Віталій Каспрук
керівник агентства семантики

Складено на наших помилках та досвіді.
З 2013 року агентство зібрало: 7200 семантичних ядер для seo-просування сайтів та контекстної реклами.
Розмір чек-листа: 12 етапів, 86 пунктів.

Завантажити чек-листи в 2 форматах: Excel + Pdf

Хочете прокачати сайт? Знайти "легкі" ключі для SEO-просування? Дізнатися сильні та слабкі сторони конкурентів?
Довірте семантику нам! Ціна збору семантичного ядра

✘

1. Узгодження завдання

1.1. Чітке розуміння цілей складання семантики, аналіз бізнесу.

Проводимо збір даних. Вивчаємо завдання через розширений бриф (19 пунктів): перейти
◉ В середньому ми обговорюємо проект від 30 до 120 хвилин.

1.2. Помилка в завданні: "Занадто широка" або "Вузька" тематика.

Приклад 1. Занадто широке завдання: зібрати ядро на тему "шкіргалантерея". Ми зібрали 14000 ключів. При затвердженні пошукових запитів, завдання змінилося на "чоловічі шкіряні гаманці", а це лише 200 ключів.
Приклад 2. Занадто вузьке завдання: зібрати всі послуги з "прибирання квартир".

В результаті втрачено низку послуг, по яким конкуренти отримують трафік та замовлення ("прибирання будинків і котеджів", "прибирання офісів", "прибирання дач", ...).

1.3. Розуміння реального бюджету і термінів на збір.

Приклад: неможливо зібрати за 10 днів і з бюджетом у 2000$ > ПОВНУ семантику для інтернет-магазину побутової техніки, якщо збирати всі бренди та номенклатуру побутової техніки.

1.4. Обговорення нижнього порогу частотності для ключових слів.

Приклад: для вузької, але високомаржинальної тематики "елітна нерухомість" оптимальний поріг = 1, для широкої "продаж побутової техніки" від 2-5.
Якщо значно підняти поріг частотності запитів, видалиться великий % низькоконкурентних (низькочастотних) запитів у "нульовки" + можемо видалити нові запити, які тільки набирають популярність.

1.5. Визначення сезонності попиту.

◉ Для сезонних тематик ключі краще збирати наприкінці сезону - це дасть змогу знайти до 99% поточного попиту.

Милиця: під час збирання не в сезон парсимо річну частотність і за нею чистимо «нульовки».
Приклад: «зимові шини» найкраще збирати наприкінці грудня - на початку січня.

1.6. Цільова аудиторія.

Чітке розуміння, на кого розрахований наш блог, товар або послуга, дасть змогу підібрати найрелевантніші ключові слова.
Приклад: якщо компанія продає товари гуртом, тоді в ядрі ми орієнтуємося на b2b сегмент. Якщо в пошуковій видачі тільки роздрібні сайти, це не наше ключове слово.

4. Збір (парсинг) ключових слів

◉ Збираємо ключові слова під пошукову оптимізацію сторінок і контекст за раніше складеними маркерами та відібраними доменами.
◉ Виставляємо максимальну глибину парсингу.
◉ Чим більше ключів зберемо на цьому етапі, тим більше цільових (релевантних) запитів залишиться після чистки.

4.1. Парсимо ключі з безкоштовних сервісів аналітики.

Використовуємо: "Google Keyword Planner", "Trends.google.com", "Keywordtool.io", "Wordstat", …

4.2. Парсимо по маркерам платні сервіси аналітики.

Розпарсимо раніше підготовлені маркери.
Використовуємо: "Serpstat", "SEMrush", "Ahrefs", "Similarweb", "Keys.so", …

4.3.Своя закрита база ключових слів.

Парсимо за маркерами. Розмір бази: +7200 зібраних семантичних ядер, +22 000 000 ключів.

◉ Наша база поповнюється з 2013 року запитами після всіх етапів очищення від сміття.

4.4. Видимість нашого сайту з кабінету Вебмайстра.

Актуально, якщо наш сайт існує певний час і на ньому присутній трафік.
Використовуємо: "Google Search Console", "Webmaster.yandex.com".
* У пункті 2.3 чек-листа ми відбирали лише початкові маркери з високочастотних та середньочастотних запитів для парсингу "хвостів".
На даному етапі ми збираємо всю видимість нашого сайту в пошуку.

4.5. Видимість близьких конкурентів.

Для складання правильного та повного семантичного ядра обов'язково беремо запити конкурентів з безкоштовних, частково безкоштовних та платних сервісів.
Використовуємо: "Serpstat", "SEMrush", "Ahrefs", "Similarweb", "Keys.so", "Ads.google.com", …

4.6. Пошукові підказки.

Для парсингу пошукових підказок використовуємо SEO-інструменти: "A-parser.com", "Key-collector", власну серверну систему, ...

4.7. Схожі запити, блок "Люди шукають".

Для парсингу використовуємо: "A-parser.com", "Key-collector", власну серверну систему, …

4.8. Цільові ГЕО запити.

При зборі семантики для локального бізнесу (локального SEO) опрацьовуємо фрази з топонімами (штат, район, місто, вулиця, метро).
Приклади тематик, де важливо опрацювати геолокації: "продаж нерухомості", "доставка їжі", "послуги з ремонту техніки", "медичні послуги", "послуги сантехніка", "послуги прибирання"...

4.9. Збір популярних запитань по темі.

Актуально для інформаційних сайтів або блогів.
Приклад: "Alsoasked.com", "Quora.com", …

6. Збір параметрів і сторінок конкурентів

◉ Дані використовуємо для:

Очищення від сміття.
Автоматичної кластеризації запитів по ТОПам.
Ручного доведення семантичного ядра до робочого стану.
Формування різних звітів...

6.1. Парсинг ТОП 20 URLів пошукової видачі.

Один із головних етапів парсингу.
Контролюємо, щоб видача була зібрана для кожного пошукового запиту.

6.2. Заголовки та тексти сніпетів.

Зібрані дані використовуємо для:

Пошуку кластерів для об'єднання за інтентами.
Формування LSI-слів та фраз.
Складання власних варіантів title та description, ...

6.3. Вміст всіх сторінок конкурентів.

Зібрані дані використовуємо для:

Всіх цілей з попереднього пункту.
Текстового аналізу та формування ТЗ для копірайтера.

6.4. Парсинг частотностей запитів.

Збираємо середню, точну, базову, річну частотність (за необхідності) у потрібному регіоні.

◉ В гуглі через Google Ads можна зібрати тільки середню. В Яндекс Вордстат можна зібрати точну з урахуванням порядку слів, точну, фразову та базову (в залежності від операторів).

6.5. Сезонність.

Збираємо частотність запитів за 12/24 місяці для визначення сезонного попиту. Формуємо окремий звіт.

6.6. Розрахунок виду запиту (коефіцієнт комерційності).

Для розрахунку використовуємо словники ознак:

Інформаційний (як, яка, де, коли, wiki, info, article, …).
Комерційний (купити, ціна, замовити, buy, …).

Аналізуємо ознаки в: "URL", "сніпетах", "мета тегах", "тексті сторінки", …

6.7. Збір параметрів і розрахунок коефіцієнта складності просування.

Назва параметра у звітах: "складність ТОПу", "Rank домену".
Чим більший коефіцієнт, тим складніше потрапити до ТОП 10 за запитом або тематикою в цілому.
Значення 0 - легко, 10 - дуже складно.
Rank розраховуємо за 22 параметрами з +10 сервісів: "вік домену", "трафік на домен", "кількість зворотних посилань та доменів", "кількість сторінок та згадок домену", …

◉ Не плутати з параметром Keyword Difficulty (KD) від Ahrefs, який розраховується виключно на зворотних лінках.

6.8. Аналіз рівня вкладеності сторінок.

Аналізуємо тип сторінки: головна, внутрішня.
Приклад: якщо в ТОПі 9 головних сторінок, нам буде складно просунутися з внутрішньою сторінкою.

7. Підготовка до чистки ключових слів від сміття, етап 2

7.1. Формування списку "мінус доменів".

Аналізуємо ТОП 100 найбільш видимих доменів за ключами, які залишилися після 1 етапу.
До списку "мінус доменів" переносимо ті, які ТОЧНО нам не підходять.
Приклад: якщо у нас невеликий інтернет-магазин взуття, до мінус доменів потраплять агрегатори, маркетплейси, великі мультитоварні інтернет-магазини, вікіпедія, блоги, форуми,...

7.2. Формування списку "плюс доменів".

За аналогією з попереднім пунктом формуємо список "плюс доменів".
До списку додаємо лише дуже схожі за тематикою, номенклатурою чи послугами сайти.
Якщо у ТОПі пошукової видачі є певна кількість "плюс доменів", тоді з великою ймовірністю це наш товар чи послуга.

9. Авто кластеризація (групування) ключових слів по ТОПам

◉ Кластеризація по ТОПами не працює або працює дуже погано для нових, вузьких, низькоконкурентних тематик.
Для таких тематик дуже погано сформована видача, пошук підмішує різні типи сторінок.

Розподіл часу робіт на 9 та 10 етапі:

1 етап. Основне автоматичне групування по ТОПам (Hard, Soft, Middle) – лише 5% часу.
2 етап. Додаткове авто догрупування / дорозкидування по ТОПам – до 10% часу.
3 етап. Ручне доопрацювання результатів автомата семантистом – до 60% часу.
4 етап. Ручна перевірка результатів відділом якості - до 25% всього часу.

9.1. Головний етап кластеризації, варіанти: "Hard", "Middle", "Soft".

Кластеризація запитів проводиться у нашій серверній системі.

Hard - для комерційних проектів.
Soft - для інформаційних проектів.

9.2. Об'єднання по релевантним URLами кластера.

Для кожного кластера формуємо ТОП 10 спільних релевантних URLів з урахуванням:

Частотності запиту.
Позиції URLів в ТОПі.
Кількості запитів з кластера, за якими даний URL у ТОПі.

9.3. Об'єднання за векторною схожістю.

Для кластеризації використовуємо різні формули косинусної схожості (cosine similarity).
Аналізуємо набори популярних слів для кожного запиту, кластера.
◉ Список популярних слів формуємо з: слів запиту, сніпетів, текстів на сторінках конкурентів.

9.4. Об'єднання за головною фразою в кластері.

При формуванні списку кластерів на об'єднання аналізуємо загальні URLи у ТОПі тільки для головної (найчастотнішої) фрази в кластері.

10. Ручне доопрацювання і перевірка семантичного ядра

◉ Всі роботи проводимо в нашій серверній системі.
◉ Використовуємо різні спеціалізовані seo інструменти і модулі для прискорення ручної праці.

10.1. Винесення "зайвого" з кластера.

Пошукова видача не ідеальна. У тематиках, де вебмайстри ще не створили посадкові під всі інтенти користувачів, в один кластер можуть потрапити зовсім різні запити.

Приклад 1: "мікропозики онлайн", "... без першого траншу", "... цілодобово", "... швидко".
Приклад 2: "купити светр з оленями", "червоний светр з оленями", "синій светр з оленями".
Приклад 3: "лего ніндзяго 11 сезон набори", "лего ніндзяго 9 сезон набори".

При автоматичній кластеризації все потрапило в один кластер, і ми вручну все розносимо.

10.2. Об'єднання кластерів.

У тематиках з великою конкуренцією, де вебмайстри орієнтуються виключно на видачу, а не на інтенти, можуть бути різні сторінки, що відповідають на одну потребу користувача.
Приклад: "купити взуття куома", "купити чоботи куома", "купити валянки куома".
Усі ці кластери можна об'єднати в одну групу.
У теорії це різні товари (чоботи, валянки), але фактично у цього бренду це один товар.
Усі ці товари у виробника зведені на 1 спільну сторінку, на 1 лістинг + візуально це той самий товар.

10.3. Об'єднання підтем в одну потужну тему.

Для підвищення рентабельності написання статті допускається об'єднання кількох схожих НЧ (низькочастотних) підтем в одну велику ВЧ (СЧ) тему. Перед початком об'єднання обов'язково аналізуємо:

Сумарну частотність таких кластерів.
Чи створили конкуренти окремі сторінки по підтемах чи ні, скільки таких статей.

◉ Зручно аналізувати за наявністю головного ключа в назвах документів.
Приклад: "як вибрати котел" + "як вибрати газовий котел" + "як вибрати електрокотел" + "як вибрати твердопаливний котел".

10.4. Недописані запити користувача.

У товарній семантиці користувачі дуже часто не дописують повну назву.
Приклад запитів для одного й того ж товару:

"Aro team twinat duo" = "Aro team twinat duo 3 в 1".
"Britax advansafix 3" = "Britax roemer advansafix iii sict".

10.5. Об'єднання спільних запитів.

Якщо розробка (формування) семантичного ядра сайту проводиться лише для жіночого одягу, тоді можна об'єднувати в один кластер:

"Купити джинси" та "Купити джинси для жінок".
"Купити куртку" та "Купити куртку для жінок".

◉ У загальних запитах нижча конверсія та продажі (входить попит на чоловічий та дитячий одяг) + складніше просунутися.

10.6. Об'єднання за рідкісними словами.

Актуально для інформаційних проектів. Наприклад, у ядрі є всього 3 кластери:

Як почистити килим пароочисником.
Як почистити м'які меблі пароочисником.
Як почистити подушку пароочисником.

Зв'язків у ТОПі немає, але кластери невеликі і їх можна об'єднати спільною проблемою: "як почистити пароочисником".

10.7. Дорозкидка нових запитів.

Переносимо зі списку "Залишились не кластеризовані" запити в кластер з таким самим інтентом, але за якими ще немає зв'язків у ТОПі.
Причина: вебмайстри ще не встигли знайти нові запити та додати їх на сторінку (провести пошукову оптимізацію).
Ми знаходимо такі зв'язки за:

Схожими наборами слів у сніпетах.
Векторною схожістю в текстах...

10.8. Під час ухвалення рішень враховувати тип сторінок.

Типи: головна, категорія (розділ, лістинг, тегова сторінка), картка товару, стаття, відгуки, калькулятор…

11. Вивантаження і формування всіх звітів семантичного ядра

11.1. Дозбір і розрахунок усіх необхідних параметрів.

Приклад:

% Видимості релевантного URL конкурента за певним кластером у пошуку.
Підбір та розрахунок рівня зв'язків схожих кластерів.
Перетин запитів ядра конкурента з нашим...

11.2. Загальний список стоп (мінус) слів.

Візуально перевіряємо список "Сміття" та видаляємо цільові маркери.
У ньому не повинно бути слів, які входять до фінального списку цільових (релевантних) запитів.
Список відмінно підходить для початкового налаштування контекстної реклами.
Приклад: для тематики "послуги клінінгової компанії" у списку НЕ повинно бути слів "прибирання", "клінінг", "ціна", "послуга", "замовити", "миття", "чистка", "клінінгова", ...

11.3. Формування всіх звітів семантичного ядра.

Наші звіти допоможуть вам ефективно провести пошукову оптимізацію сторінок вашого сайту, налаштувати контекстну рекламу, перевірити релевантність створеного контенту.
Приклад: "Основний звіт", "Сезонність", "Схожі кластери", "Структура", "ТОП доменів", "Найбільш видимі конкуренти кластера", "ТЗ для копірайтера", …

12. Здача семантичного ядра

12.1. Здача проекту.

Передача всіх звітів.
Zip архів доступний для завантаження в особистому кабінеті.

12.2. Безкоштовна консультація.

Проводимо Zoom-консультацію від 60 до 90 хвилин з ефективного впровадження семантики та використання звітів для SEO-просування сайту (пошукової оптимізації сторінок сайту).
Відгук 1 | Відгук 2 | Відгук 3

Висновки та рекомендації

  
    1.
    
Використовуючи чек-лист для формування чіткого плану робіт зі збору семантичного ядра. Ви не пропустите жоден важливий етап.
  
    2.
    
Перед початком ви маєте чітко розуміти, що ви маєте отримати в результаті, що шукаємо, а що видаляємо. Використовуємо анкетування.
  
    3.
    Формуємо список початкових маркерів (базисів, масок) для парсингу.
  
    4.
    Підбираємо і детально вивчаємо близьких конкурентів. Головне: близьких!
  
    5.
    Налаштовуємо всі інструменти.
  
    6.
    Використовуємо платні та безкоштовні джерела ключових слів.
  
    7.
    Збираємо, парсимо, збираємо, парсимо.
  
    8.
    Чистимо, уважно чистимо, фільтруємо сміття.
  
    9.
    Використовуємо автокластеризацію по ТОПам і допрацьовуємо вручну. Враховуємо інтент запиту і специфіку бізнесу.

    10.
    Формуємо зручний і візуально зрозумілий формат звітів.
  
    11.
    Актуалізація. Дослідження ключових слів має бути безперервним процесом. Потреби користувачів постійно змінюються.

Куди відправити?

Чек-листи в 2 форматах

Оновлення: 20.11.24.

Крок за кроком за чек-листом, зберіть нове або перевірте наявне семантичне ядро сайту.