НАПИСАТИ НАМ
Вебархів для збереження історії вашого сайту: що це, навіщо потрібен та як користуватисьВебархів для збереження історії вашого сайту: що це, навіщо потрібен та як користуватись
12
.
11
.
2024

Вебархів для збереження історії вашого сайту: що це, навіщо потрібен та як користуватись

ЗМІСТ

Збереження історії сайту за допомогою вебархіву не лише захищає від непередбачуваних втрат сторінок вебсайту чи контенту, але й допомагає аналізувати розвиток та зміни ресурсу, а також, за потреби, обрати ім'я домену з позитивною репутацією.  

Що таке Web Archive

Вебархів — це онлайн-сервіс, який зберігає копії вебсторінок (код, зображення та інші елементи) у різні проміжки часу. 

Webarchive зберігають «зліпки» величезної кількості сторінок різних сайтів. Спеціальні вебсканери, періодично відвідують сайти та зберігають копії їх сторінок. Ці копії включають HTML-код, зображення, стилі та інші елементи, що дозволяє відтворити сайт у тому вигляді, в якому він був на момент сканування.

Владислав Трішкін
SEO Team Lead в Promodo

Вебсторінки можна архівувати як автоматично за допомогою спеціальних програм — вебкраулерів, так і вручну, коли користувачі самостійно зберігають копії сторінок.

Вебкраулери починають з одного сайту і рухаються інтернетом, переходячи за його посиланнями на інші сайти. Вони можуть мати географічні обмеження (наприклад, збирати лише сайти з доменом .ua) або переходити лише за певною кількістю посилань з кожної стартової сторінки. Це призводить до того, що різні сторінки сайту можуть бути заархівовані в різні дні, а іноді навіть різні компоненти однієї сторінки — у різний час

Навіщо потрібен Web Archive

Згідно з дослідженням Pew Research Center, приблизно 25% вебсторінок, які існували між 2013 та 2023 роками, наразі недоступні. 38% сторінок з 2013 року більше не функціонують, а близько 8% сторінок, опублікованих у 2023 році, зникли до жовтня того ж року.

Однак завдяки роботі Інтернет-архіву не всі ці ресурси втрачені безповоротно. 

Одним із найвідоміших сервісів збереження історії сайту є Wayback Machine, частина проєкту Internet Archive. Цей сервіс зберігає мільярди вебсторінок та дозволяє користувачам переглядати історію вебсайту у різний час 

Wayback Machine протягом десятиліть архівує функціональні копії вебсайтів, роблячи їх безкоштовно доступними для громадськості. Коли дослідники проаналізували, скільки з цих URL-адрес доступні в Wayback Machine, виявилося, що дві третини з них можна знайти. Таким чином, Інтернет-архів успішно виконує свою місію — зберігає записи інтернет-спільноти для майбутніх поколінь.

Що більше трафіку на сторінку та домен, то ймовірніше, що вона матиме свій унікальний «зліпок» і тим частіше цей зліпок оновлюватиметься.

Владислав Трішкін
SEO Team Lead в Promodo

Відновлення втраченого контенту

Вебархів дозволяє відстежувати, як змінювалася сторінка або її код протягом певного часу й у випадку втрати даних або технічних збоїв, збережені знімки можуть допомогти відновити важливу інформацію.

Перевірка домену перед покупкою

sho take domen

Якщо ви плануєте придбати домен, особливо дроп-домен*, варто перевірити його історію у вебархіві. Це допоможе уникнути придбання доменів з небажаною історією або зміною тематики.

*Дроп-домен — це домен, який раніше використовувався, але не був продовжений власником та став вільним для повторної реєстрації. Такий домен може мати історію, наявність у пошукових індексах і зворотні посилання. Дроп-домени з «сильною» історією часто використовуються SEO-фахівцями для покращення видимості нових сайтів у пошукових системах.

Наприклад, ви шукаєте домен у ніші продажі смартфонів. Вам підходять інформаційні сайти або e-commerce тієї ж тематики. Важливо переконатися, що раніше на цьому домені не розміщувався gambling-контент або 18+. І це все можна перевірити через вебархів.

Владислав Трішкін
SEO Team Lead в Promodo
Примітка: при побудові посилального профілю (якщо плануєте придбати посилання з певного домену) перевірте цей домен через вебархів, щоб з'ясувати, чи не був сайт створений виключно для продажу посилань і чи не є він «лінкопомийкою».

Аналіз змін та конкурентів

Збережена історія вебсайту дозволяє аналізувати зміни в контент і зміну тематики, дизайну та структури ресурсу. Це особливо корисно для SEO-спеціалістів та маркетологів, які  вивчають як розвивався сайт протягом певного часу.

Також вебархів можна використовувати для аналізу дій конкурентів, щоб подивитися, як змінювалася їхня сторінка у різні періоди.

Владислав Трішкін
SEO Team Lead в Promodo

Підвищення довіри користувачів та SEO

Пошукові системи, такі як Google, цінують стабільність та надійність сайтів. Збереження історії сайту сприяє підвищенню рейтингу в пошукових системах та свідчить про постійну присутність та активність ресурсу.

Наслідки ігнорування вебархіву: нехтування перевіркою відновленого дропу-домену через вебархів може призвести до того, що ви почнете працювати з сайтом, який раніше використовували для небажаних тематик, як от казино або контент для дорослих. Це може викликати проблеми з просуванням та негативно вплинути на рейтинги в пошукових системах

Моніторинг змін на власному сайті

Використовуйте вебархів для відстеження змін на вашому сайті та аналізу його розвитку. Це допоможе зрозуміти, як зміни впливають на користувацький досвід та SEO.

Як і в пошукових системах, вебкраулери зазвичай частіше архівують популярні сайти, оскільки на них веде більше число зовнішніх посилань. Отже, корпоративні та новинні сайти мають більше шансів бути добре задокументованими порівняно з ресурсами з низьким трафіком, які лише зрідка архівуються або не архівуються взагалі

ЯКИМ МАЄ БУТИ ЛІНКБІЛДІНГ, ЩОБ ПРАЦЮВАТИ
ТОП-15 ЗАПИТАНЬ
Читати статтю

Як користуватись вебархівом

Перегляд заархівованих версій сайтів

  • Введіть URL сайту в головному полі пошуку. Якщо ви не знаєте точної адреси, введіть назву сайту або кілька ключових слів, що його описують.
  • Вибір року та дати: 
web archive calendar yak koristuvatis

На графіку вгорі сторінки оберіть рік, який вас цікавить. Чорні смужки показують, скільки разів сторінка була заархівована протягом цього року.

Примітка: якщо у вибраному році немає чорних смужок, це означає, що за цей рік не було знімків сайту

Оберіть дату на календарі. Зелені або сині кола навколо дат вказують на наявність знімків сайту на цю дату. При наведенні ви побачите спливаюче вікно з точним часом архівації. Якщо на дату припадає кілька знімків, будуть вказані всі доступні часи. Натиснувши на дату, ви відкриєте заархівовану версію сайту.

web archive calendar

Кожен колір відповідає статусу відповіді сервера, який отримав вебсканер під час архівації:

  1. Синій: означає успішний результат з кодом 2xx — сторінка була доступною, і її вдалося зберегти без проблем.
  2. Зелений: означає перенаправлення з кодом 3xx — вебсканер був перенаправлений на іншу адресу.
  3. Помаранчевий: вказує на помилку клієнта з кодом 4xx — можливо, сторінка не була знайдена або доступ до неї був обмежений.
  4. Червоний: вказує на помилку сервера з кодом 5xx — сервер був недоступний або відмовив у наданні сторінки.

Зазвичай для перегляду потрібної версії сайту краще обирати сині точки або посилання, оскільки це свідчить про повноцінне збереження контенту.

Поради при використанні календаря:

  • Перевіряйте кілька дат: якщо ви не знайшли потрібну інформацію на поточній даті, спробуйте переглянути знімки на кілька днів раніше або пізніше.
  • Звертайте увагу на протокол: якщо сайт мав важливі зміни в безпеці, вибирайте знімки із зеленими позначками (HTTPS).
  • Враховуйте часовий пояс: час архівації вказується в UTC, тому можливі розбіжності з вашим локальним часом.

Як відновити сайт з Web Archive

Щоб відновити сайт або сторінку:

  1. Перейдіть на сайт Web Archive (Wayback Machine). 
  2. Введіть URL сайту, який ви хочете відновити, у головне поле пошуку.
  3. Оберіть потрібну дату. 
Web Archive зберігає знімки сайту за різними датами, тому на графіку зверху виберіть той рік і місяць, коли сайт мав потрібну вам версію. Можна ще додати блок з повного відновлення сайту, а не лише однієї сторінки. Наприклад, використовуючи софт
  1. Завантажте збережений знімок. 
  2. Після вибору дати система відкриє збережену версію сайту. Ви можете скопіювати контент, HTML-код, зображення та інші елементи, які вам потрібні для відновлення.

Цей спосіб дозволяє відтворити контент у такому ж вигляді, у якому він був на обрану дату.

Збереження сайту вручну

Щоб вручну зберегти потрібний контент/сторінку сайту в архіві, введіть його URL у поле «Save Page Now».

how to save page from web archive

Якщо після вибору дати ви бачите помилку, це може означати, що сайт налаштований ігнорувати вебсканер Wayback Machine або був недоступний на той момент.

Окрім власних вебсканерів, Internet Archive пропонує сервіс Archive-It на основі підписки. Він дозволяє організаціям створювати тематичні колекції заархівованих вебсайтів. Ці сайти додаються до Wayback Machine, а колекції є також доступними на сторінці Archive-It.

Як заборонити додавання сайту в вебархів

Якщо вам потрібно запобігти архівації вашого сайту у Web Archive, можна встановити обмеження у файлі robots.txt. Цей файл використовують для надання інструкцій пошуковим роботам, що індексують сайт. Щоб заборонити доступ до вашого сайту конкретно для вебархіву, додайте наступні рядки до robots.txt:

User-agent: ia_archiver  
Disallow: /

Цей код повідомляє роботу ia_archiver (який використовує сервіс Web Archive) про те, що він не має права отримувати доступ до вашого сайту та зберігати його знімки. 

Важливо пам’ятати, що ця заборона діє лише на Web Archive та інших службах, які дотримуються стандартів robots.txt. Однак, деякі архіви можуть ігнорувати цей файл, і тоді потрібно зв'язатися з адміністрацією вебархіву безпосередньо для видалення контенту. 

Для повного видалення сайту з Wayback Machine потрібно надіслати запит на електронну адресу [email protected], вказавши доменне ім’я у повідомленні

Висновок

Вебархівування є незамінним інструментом для збереження та аналізу історії вашого сайту. Воно допомагає уникнути потенційних ризиків, пов'язаних із втратою даних або негативною історією домену.

Основні переваги Web Archive:

  • Відновлення втраченого контенту
  • Аналіз змін та розвиток сайту
  • Перевірка історії домену перед його придбанням 
  • Моніторинг дій конкурентів
  • Оцінка доменів для придбання посилань

Використання вебархіву підвищує безпеку, прозорість і довіру до сайту, що сприяє його успішності в пошукових рейтингах.

Підпишіться
на розсилку
Дякуємо за підписку!
Упс! Щось пішло не так. Спробуйте ще раз
В закладки

АГЕНЦІЯ PROMODO ВЖЕ 20 РОКІВ ЗАЙМАЄТЬСЯ SEO-ОПТИМІЗАЦІЄЮ. ДОВІРТЕ ВАШ САЙТ НАДІЙНИМ ПАРТНЕРАМ — ОТРИМУЙТЕ БІЛЬШЕ ТРАФІКУ ТА ТОП-ПОЗИЦІЇ У ВИДАЧІ. НАДСИЛАЙТЕ ЗАЯВКУ ВЖЕ ЗАРАЗ

Захочете отримати юзабіліті-аудит і персональні рекомендації для свого інтернет-магазину — напишіть нам.

Обговоримо ваш проєкт?
Надіслати заявку
Ваше повідомлення відправлено
Наш менеджер зв‘яжеться з вами найближчим часом.
Назад
Упс! Щось пішло не так. Спробуйте ще раз
ДОЛУЧАЙСЯ ДО КОМАНДИ PROMODO ❤️
Надіслати заявку
Ваша заявка відправлена
Наші рекрутери звʼяжуться з вами найближчим часом!
Назад
Упс! Щось пішло не так. Спробуйте ще раз