Четверг, 5 декабря, 2024

Церковь, приютившая интернет-прошлое: Интернет-архив хранит 700 млрд веб-страниц

Самые первые сайты из интернета начала 1990 г. -х уже не существует, но и недавние веб-страницы постоянно исчезают. Только благодаря старинной церкви, ставшей местом для Интернет-архива, существует возможность увидеть страницы, которые существовали еще неделю или месяц назад.

Архив Wayback Machine находится в стенах красивейшей бывшей церкви в районе Ричмонда в Сан-Франциско. Там шумят и мигают от активности стойки компьютерных серверов. Они содержат вчерашний интернет, по крайней мере, значительную его часть.

Некоммерческая организация Internet Archive собирает веб-страницы с 1996 для своего знаменитого сервиса Wayback Machine. В 1997 году сборник составил 2 терабайта данных. Колоссальный в то время объем, который сейчас можно уместить на флешку за 50 долларов.

Основатель архива Брюстер Кале говорит, что сегодня объем проекта превышает 100 петабайт. Это примерно в 50000 раз больше, чем в 1997 году. Архив содержит более 700 миллиардов веб-страниц.

Миссия Интернет-архива – предоставить универсальный доступ ко всем знаниям. Работа не становится легче, ведь современные веб-сайты очень динамичны, меняются с каждым обновлением.

Огражденные сады, такие как Facebook, являются источником большого разочарования для Кале. Он беспокоится, что значительная часть политической деятельности, которая происходила на платформе, может быть потеряна в истории, если ее не зафиксировать должным образом. Facebook и другие усложняют сканирование своих платформ.

Платные сайты СМИ также «проблематические», говорит Кале. Ранее к архивированию новостей относились очень серьезно, но изменения в собственности или просто редизайн сайта могут привести к исчезновению записей.

Технологический журналист Кара Свишер недавно пожаловалась, что некоторые из ее ранних работ в The Wall Street Journal пропали после того, как несколько лет назад газета отказалась продать ей материал.

Поскольку мы начинаем исследовать возможности метамира, работа Интернет-архива станет еще более сложной. Его миссия состоит в том, чтобы «предоставить универсальный доступ ко всем знаниям», архивируя аудио, видео, видеоигры, книги, журналы и программное обеспечение.

Сейчас сервис работает над сохранением работы независимых информационных организаций в Иране и сохраняет выпуски российских теленовостей. Иногда сохранность вещей онлайн может являться актом справедливости, протеста или ответственности.

И все же правообладатели не хотят предоставлять свободный доступ к контенту, и поэтому они активно убеждают, что Интернет-архив не имеет права предоставлять материалы. Пока несколько крупных книжных издателей подают в суд через платформу выдачи электронных книг «OpenLibrary», которая позволяет пользователям занимать ограниченное количество электронных книг на срок до 14 дней. Издатели утверждают, что это вредит доходам.

Кале говорит, что это смешно. Он любит описывать задачу архива как не отличающуюся от традиционной библиотеки. Но хотя книга не исчезает с полки, если издатель прекращает работу, цифровой контент более уязвим. Вы не можете иметь шоу Netflix. Новейшие статьи есть только до тех пор, пока издатели этого желают. Даже песни, загрузки которых мы платим, редко наши, они просто лицензированы.

Настроен таким образом, что он не полагается ни на кого другого. Internet Archive создал собственную серверную инфраструктуру, большая часть которой размещена в церкви, а не использует посторонние хосты, такие как Amazon или Google. Все это стоит 25 миллионов долларов в год. Это выгодное соглашение, говорит Кейл, отмечая, что только система публичных библиотек Сан-Франциско стоит 171 миллион долларов.

Если мы не считаем, что сегодняшний первый проект истории не стоит сохранения, исчезновение Интернета должно беспокоить всех нас. Подумайте, как пусто было бы освещение смерти королевы Елизаветы, если бы оно не было проиллюстрировано глубокими архивными материалами.

Можем ли мы с уверенностью сказать, что журналистика, созданная вокруг ее смерти, будет столь же доступна даже через 20 лет? А что из всех публикаций в социальных сетях, которые производят обычные люди? Мы пожалеем, что не сохранили грамотно «повседневную» жизнь в Интернете.

Кстати, когда началась война в Украине, несколько сотен библиотекарей. поняли, что нужно спасать от войны украинскую культуру. Волонтеры из других стран пытаются спасти хотя бы цифровые копии артефактов украинской культуры.

Например, сайт Украинского государственного архива Харькова — это более 100 гигабайт информации, включая записи переписи населения района, уголовные дела и списки людей, подвергшихся преследованиям в регионе. После создания его копии через несколько часов веб-сайт исчез.

По материалам: Financial Times

Євген
Євген
Евгений пишет для TechToday с 2012 года. По образованию инженер,. Увлекается реставрацией старых автомобилей.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися