Webarchive: як користуватися вебархівом, як відновити сайт і дізнатися, як він виглядав раніше

Історія створення Internet Archive
Все про archive.org: як користуватися сервісом і як дістати сайт з веб-архіву
Як на archive.org подивитися історію сайту
Як недіючий сайт відновити з веб-архіву
Як знайти контент з веб-архіву
Як зробити так, щоб сайт не потрапив в бібліотеку веб-архіву

Ми збільшуємо відвідуваність і позиції у видачі. Ви отримуєте продажу і платите тільки за реальний результат, тільки за цільові переходи з пошукових систем

Ви отримуєте продажу і платите тільки за реальний результат, тільки за цільові переходи з пошукових систем

Веб-архів (Webarchive) - це безкоштовна платформа, де зібрані всі сайти, створені коли-небудь, і на які не накладено заборону для їх збереження.

Більше відео на нашому каналі - вивчайте інтернет-маркетинг з SEMANTICA

Це справжня бібліотека, в якій кожен бажаючий може відкрити цікавить його веб-ресурс, і подивитися на його вміст, на ту дату, в яку вебархів відвідав сайт і зберіг копію.

Знайомство з archive org або як Валерій знайшов старі тексти з веб-архіву
У 2010-му році, Валерій створив сайт, в якому він писав статті про інтернет-маркетинг. Одну з них він написав про рекламу в Гугл (AdWords) у вигляді стислого конспекту. Через кілька років йому знадобилася ця інформація. Але сторінка з текстами, деякий час назад, була їм помилково видалено. З ким не буває.

Однак, Валерій знав, як вийти із ситуації. Він впевнено відкрив сервіс веб-архіву, і в пошуковому рядку ввів потрібний йому адресу. Через кілька миттєвостей, він вже читав потрібний йому матеріал і ще трохи пізніше відновив тексти на своєму сайті.

Історія створення Internet Archive

У 1996 році Брюстер Кайл, американський програміст, створив Архів Інтернету, де він почав збирати копії веб-сайтів, з усією знаходиться в них інформацією. Це були повністю збережені в реальному вигляді сторінки, як якщо б ви відкрили необхідний сайт в браузері.

Даними веб-архіву може скористатися кожен бажаючий абсолютно безкоштовно. Створюючи його, у Брюстера Кайла була основна мета - зберегти культурно-історичні цінності інтернет-простору і створити велику електронну бібліотеку.

У 2001 році був створений основний сервіс Internet Archive Wayback Machine, який і сьогодні можна знайти за адресою https://archive.org. Саме тут знаходяться копії всіх веб-сервісів у вільному доступі для перегляду.

Щоб не обмежуватися колекцією сайтів, в 1999 році почали архівувати тексти, зображення, звукозаписи, відео та програмні забезпечення.

У березні 2010 року, на щорічній премії Free Software Awards, Архів Інтернету був удостоєний звання переможця в номінації Project of Social Benefit.

З кожним роком бібліотека розростається, і вже в серпні 2016 року обсяг Webarchive склав 502 мільярда копій веб-сторінок. Всі вони зберігаються на дуже великих серверах в Сан-Франциско, Нової Олександрії та Амстердамі.

Все про archive.org: як користуватися сервісом і як дістати сайт з веб-архіву

Брюстер Кайл створив сервіс Internet Archive Wayback Machine, без якого неможливо уявити роботу сучасного інтернет-маркетингу. Подивитися історію будь-якого порталу, побачити, як виглядали певні сторінки раніше, відновити свій старий веб-ресурс або знайти потрібний і цікавий контент - все це можна зробити за допомогою Webarchive.

Як на archive.org подивитися історію сайту

завдяки веб-сканеру , В бібліотеці веб-архіву, зберігається велика частина інтернет-майданчиків з усіма їх сторінками. Також, він зберігає всі його зміни. Таким чином, можна переглянути історію будь-якого веб-ресурсу, навіть якщо його вже давно не існує.

Для цього, необхідно зайти на https://web.archive.org/ і в пошуковому рядку ввести адресу веб-ресурсу.

Після, деякого часу, веб-архів видасть календар з датами змін даної сторінки та інформацію про його створення і кількості змін за весь період.

Згідно з отриманою інформацією, можна дізнатися, що головна сторінка нашого сайту була вперше знайдена сервісом 24 травня 2014 року. І, з цього часу, по сьогоднішній день, її копія зберігалася 38 разів. Дати змін на сторінці відзначені на календарі блакитним кольором. Для того, щоб подивитися історію змін і побачити як виглядав певну ділянку веб-ресурсу в Вас день, слід вибрати потрібний період в стрічці з попередніми роками, і дату в календарі з тих, що пропонує сервіс.

Через мить, веб-архів відкриє запитувану версію на своїй платформі, де можна побачити як виглядав наш сайт в самому початковому вигляді.

Далі, за допомогою календаря зі стрілками, в самому верху екрана, можна перегортати сторінки, по хронології їх змін, щоб відстежити, як змінювався зовнішній вигляд і їх зміст.

Таким чином, можна пірнути в минуле і побачити все його зміни, які з ним відбувалися за весь час його існування.

Чому ви можете не впізнати на Webarchive, як виглядав сайт раніше
Трапляється таке, що веб-майданчик не може бути знайдений за допомогою сервісу Internet Archive Wayback Machine. І відбувається це з кількох причин:

правовласник вирішив видалити всі копії;
веб-ресурс закрили, відповідно до закону про захист інтелектуальної власності;
в кореневу директорію інтернет-майданчики, внесений заборона через файл robots.txt

Для того, щоб сайт в будь-який момент був у веб-архіві, рекомендується вживати заходів обережності і самостійно зберігати його в бібліотеці Webarchive. Для цього в розділі Save Page Now введіть адресу веб-ресурсу, який потрібно заархівувати, натисніть кнопку Save Page.

Таким чином, для безпеки і збереження всієї інформації, необхідно таку процедуру повторювати з кожною зміною. Це дасть 100% гарантію збереження ваших сторінок на довгий час.

Як недіючий сайт відновити з веб-архіву

Бувають різні ситуації, коли браузер видає, що такого-то веб-сервісу більше немає. Але дані потрібно витягнути. Допоможе Webarchive.

І для цього існує два варіанти. Перший підходить для старих майданчиків невеликого розміру і добре проіндексованих. Просто витягніть дані потрібної версії. Далі проглядається код сторінки і дошліфовуємо вручну посилання. Процес кілька трудомісткий за часом і діям. Тому існує інший, більш оптимальний спосіб.

Другий варіант ідеальний для тих, хто хоче заощадити час і вирішити питання скачування, максимально швидко і легко. Для цього потрібно відкрити сервіс відновлення сайту з Webarchive - RoboTools. Ввести доменне ім'я цікавить порталу та вказати дату збереженою його версії. Через деякий час, завдання буде виконано в повному обсязі, з наповненням всіх сторінок.

Як знайти контент з веб-архіву

Webarchive є чудовим джерелом для наповнення повноцінними текстами веб-ресурсів. Є безліч майданчиків, які по ряду причин припинили своє існування, але містять в собі корисну і потрібну інформацію. Яка не потрапляє в індекси пошукових систем, і по суті є повторюваною.

Так, існує вільні домени, які зберігають багато цікавого матеріалу. Все що потрібно, це знайти підходяще зміст, і перевірити його унікальність. Це дуже вигідно, як фінансово - адже не потрібно буде оплачувати роботу авторів, так і за часом - адже весь контент вже написаний.

Як зробити так, щоб сайт не потрапив в бібліотеку веб-архіву

Трапляються такі ситуації, коли власник інтернет-майданчики дорожить інформацією, розміщеною на його порталі, і він не хоче, щоб вона стала доступною широкому колу. У таких ситуаціях є один простий вихід - у файлі robots.txt, прописати заборонену директиву для Webarchive. Після цього зміни в налаштуваннях, веб-машина більше не буде створювати копії такого веб-ресурсу.