В поисках утраченного веба (перевод)

atlantic

Raiders of the Lost Web, Адриенн Лафранс (Adrienne Lafrance), перевод Ольги Добровидовой

Интернет в любой отдельно взятый момент — это фантасмагория. Его нельзя назвать местом ни в каком серьёзном смысле этого слова. Это не репозиторий и не библиотека, это постоянно меняющаяся мозаика из вечного «сейчас».

На интернет нельзя положиться, ясно? Он нестабилен. Это нужно знать.

У цифровой информации множество разных преимуществ. Её могут читать машины, её можно сортировать и анализировать в больших объёмах и мгновенно распространять. «Но вот только когда она исчезает, она действительно исчезает. Она совсем пропадает. Лист бумаги может обгореть, но с него всё равно можно что-то получить. В случае с жёстким диском или URL, если что-то пропало, то выхода нет», — говорит архивист и историк Internet Archive Джейсон Скотт (Jason Scott).

Есть и исключения. Проект Internet Archive под названием Wayback Machine — это кладезь кэшированных веб-страниц с 1996 года. Скотт и его коллеги сохраняют десятки петабайт (1 петабайт равен 1024 терабайтам — прим. пер.) данных в погоне за идеалом, который по совместительству служит им слоганом: общий доступ ко всем знаниям. Коллекция, которую они собрали, необычайна, но далеко не полна. Сегодняшний интернет динамичнее, чем когда-либо, а, значит, и более уязвим, чем иногда кажется.

На кону не только доступ к знанию, но и само знание. Тысячи лет назад Александрийская библиотека была, как писал астрофизик Карл Саган, «мозгом и сердцем древнего мира». Семь веков она хранила сотни тысяч свитков; великие работы по философии, литературе, технологиям, математике и медицине. Большая часть её коллекции оказалась уничтожена примерно через столько же времени.

Интернет обещает воскрешение Александрийской библиотеки в современном мире. Но великая библиотека сегодняшнего дня разрушается и строится одновременно. Этот парадокс может быть трудно понять, пока не потеряешь в интернете что-то большое, что-то по-настоящему ценное.

* * *

До появления интернета, если вы хотели посмотреть старую газетную статью, обычно её надо было искать в архиве. Именно для этого однажды в 1985 году Кевин Вон (Kevin Vaughan) сгорбился над аппаратом для чтения микрофильмов, просматривая заголовки газеты Denver Post зимы 1961 года. Вон, который тогда изучал журналистику в Метрополитен-Стейт-Колледж в Денвере, хотел прочитать рассказ одного из своих любимых преподавателей о трущобах (Skid Row, район ночлежек, притонов, бездомных — прим. пер.) в Рождество.

«Я пробегал глазами декабрь и вдруг увидел заголовок: 20 детей погибли в столкновении автобуса и поезда. Я помню, как просто смотрел на экран и думал: я почти всю свою жизнь прожил в Колорадо, как так вышло, что я никогда об этом не слышал?», — сказал Вон.

После окончания колледжа Вон стал журналистом. Когда он писал об особенно жутком происшествии на железнодорожном перекрёстке для газеты Fort Collins Coloradoan, он мысленно вернулся к столкновению 1961 года.

На дворе был уже 1992 год. До появления одного из первых веб-браузеров, Netscape Navigator, оставалось ещё два года. Газета New York Times запустит свой сайт только через четыре года. Google запустится через шесть лет. Так что Вон сделал то, что авторы журналистских расследований делали годами. Он спросил у знакомого полицейского, нет ли способа найти человека, который не хотел, чтобы его нашли — водителя того самого автобуса. «У [полицейского] на переднем сиденье машины была какая-то компьютерная система. Он нашёл там водителя автобуса, записал на листочке его дату рождения и адрес и дал мне. Я потом годами носил с собой этот листочек», — рассказал Вон.

Пятнадцать лет, если точнее. В 2006 году, будучи журналистом газеты Rocky Mountain News, Вон получил добро от своих редакторов на расследование того, что произошло с семьями пострадавших в трагедии 1961 года — в серии материалов, которые они назовут «Переезд».

То столкновение звучало по-новому в районе, который всё ещё не оправился от массового убийства в школе «Колумбайн» в 1999 году, унёсшего жизни 12 школьников и одного учителя. «Серия «Переезд» как бы выросла из истории в школе. Мы поняли, что как газета не сможем рассказать местному сообществу, какими будут долгосрочные последствия — для всех людей, которые были в школе или были с ней связаны. Потому что для этого должно было пройти время. Но [авария 1961 года] дала нам возможность показать, как один момент может повлиять на всю жизнь человека», — сказал тогдашний редактор и издатель газеты Джон Темпл (John Temple).

Вон потратил на эту историю большую часть года. И команда веб-дизайнеров, фотографов, видеографов и инженеров работала с ним над подачей материала в интернете — это был первый проект такого масштаба для газеты. «С точки зрения производства это был логистический монстр», — вспоминал интерактивный редактор серии Майк Ноу (Mike Noe).

Оно того стоило. История Вона об аварии 1961 года, серия из 34 материалов, растянувшаяся более чем на месяц, в начале 2007 года, стала сенсацией. «Не хочу преувеличивать, но мне кажется, для людей, которые прошли через ту трагедию, это стало поворотным опытом. Например, люди говорили мне, что серия высвободила все эмоции, которые у них накопились, у большинства за всю их жизнь», — сказал Вон. Читатели писали ему, что сидели перед компьютерами в полночь, обновляя страницу, пока не появлялась новая часть серии. «У неё был колоссальный эффект, — сказал Темпл, вспоминая собрание местных жителей по поводу публикаций, на которое пришло 800 человек. — Это было важным событием».

«Мы провели несколько таких собраний, — сказал Вон. — На одном из них кто-то спросил Джона Темпла, как долго серия пробудет в интернете, и Джон сказал — вечно».

В 2008 году с этой серией Вон стал финалистом Пулитцеровской премии за очерк. Через год газета Rocky Mountain News закрылась, в следующие несколько месяцев её сайт постепенно разваливался. И вот однажды, без предупреждения, «Переезд» исчез из интернета.

* * *

То, что случилось с людьми из Грили, штат Колорадо, 14 декабря 1961 года, пропало во времени дважды. Чтобы рассказать историю «Переезда», Вон раскопал важное событие — а теперь раскапывать пришлось и его историю. До того, как «Переезд» пропал, до того, как Вон написал его, журналисту пришлось отследить кружево событий вплоть до одного жуткого зимнего утра давным-давно. О происшествии почти забыли.

«Странно понимать, что событие, убившее 20 человек, так ненадолго задержалось в общественном сознании», — сказал Вон. Газеты 1961 года писали о происшествии, но в заметках вопросов было столько же, сколько ответов. Там были ссылки на официальные документы, которые Вон должен был найти — материалы, которые, вполне возможно, были давно уничтожены. Кое-где ему повезло. Например, он искал стенограммы заседания суда над водителем автобуса, 23-летним мужчиной, у которого на момент аварии была новорождённая дочь. Вон хотел прочитать текст его заявления, который старые газетные заметки называли длинным и драматичным, но никогда не приводили полностью. Судебный секретарь из округа, где произошла авария, согласился вместе с Воном поехать за город в заброшенную ракетную шахту, которую переделали в архив.

«Я иногда думаю об этом. В моей голове это почти как сон, сюрреалистично: ты входишь через дверь в холме и неожиданно попадаешь в этот огромный подземный комплекс, построенный так, чтобы он мог выдержать ядерную войну», — сказал Вон. Комната размером с баскетбольную площадку была заполнена рядами коробок в 20 футов (шесть метров — прим. пер.) и выше. Вокруг был по большей части просто бардак, не было никакой понятной системы организации записей. Так что Вон по чистой случайности заметил коробку далеко на полке, до которой было не дотянуться — на боку у неё была нацарапана фамилия гособвинителя, который вёл это дело. Секретарь забрался на лестницу и достал коробку.

«Во-первых, комната была похожа на сцену из фильма «Индиана Джонс: В поисках утраченного ковчега». Клянусь, я снял крышки с коробки и, кажется, почувствовал, как с небес пролился свет. Я видел большие жёлто-коричневые конверты с именем водителя автобуса. Несколько десятков чёрно-белых фотографий, сделанных по ходу расследования, которые я никогда не видел, стенограмма заседания суда в день аварии, письма, которые обвинение получало со всей страны. Это было просто поразительно», — сказал Вон.

После того, как Вон просмотрел материалы и сделал копии для своего репортажа, судебный секретарь позвонила в офис окружного прокурора и спросила, что делать с коробкой. «Они сказали — выбросить. Она положила трубку, посмотрела на меня и сказала — нет, мы это не выбрасываем», — сказал журналист.

Многие из этих найденных Кевином Воном документов и фотографий, которые до этого никогда не публиковались, стали ключевыми элементами онлайн-версии серии — они появились только в сети, но не в печатной версии истории. Это были не просто дополнительные иллюстрации, а важные главы цифровой истории. И когда после закрытия газеты сайт перестал работать, они не попали в какую-то старую коробку на недоступной полке; они исчезли.

«Ежедневная поддержка сайта перестала работать, и довольно быстро страницы стали исчезать», — сказал Вон.

Он стал думать, как можно спасти серию материалов. И можно ли вообще? «Я хотел сохранить её по многим причинам, но прежде всего я так и слышал в голове голос [редактора газеты] Джона: она будет в сети навечно», — сказал журналист.

Если даже огромная история, номинированная на Пулитцер, в одной из старейших газет страны может пропасть из интернета, не вечно ничто. «Сейчас нет никакого пассивного способа сохранения цифровой информации», — объясняет писательница и историк Эбби Рамзи (Abby Rumsey). Иными словами, если вы хотите сохранить что-то в сети, вы должны решить сохранить это. Эфемерность встроена в саму архитектуру сети, которая задумывалась как система обмена сообщениями, а не библиотека.

Однако с культурной точки зрения функции интернета изменились. Сейчас он считается великим оракулом, местом, где живёт информация и «сшивается» знание. И тем не менее, у библиотек и музеев нет надёжных механизмов приобретения, а значит, и сохранения, цифровых коллекций. Библиотека Конгресса, самая большая библиотека в мире, сейчас в процессе переработки самой системы каталогов — в попытке соединить существующие системы с новой, более динамичной средой данных. Но эта работа только начинается.

Печатному миру потребовались века, чтобы разобраться, что стоит хранить, как и кто должен это делать. Потеря большей части трудов Аристотеля лишила человечество стиля письма, который Цицерон сравнивал с «бегущей рекой золота». То, что выжило, было не прозой, а, скорее, записями лекций.

В других форматах уничтоженными оказались целые эпохи значимых произведений. Большинство американских фильмов 1912-1929 годов утеряны. «И не потому, что мы не знали, как их сохранить — просто мы не считали их ценными. За первые 50-100 лет после изобретения печатного станка почти всё, что издавалось, было утеряно… Люди пренебрежительно относились к книгам в том числе потому, что они могли настолько быстро их печатать и ещё быстрее распространять, что книги казались эфемерными», — сказала Рамзи.

В своем «младенчестве» книги считались банальностью так же, как сегодняшний интернет. Телеграф тоже назывался «поверхностным, внезапным, нефильтрованным, слишком быстрым для правды» — так написал о нём в 1858 году критик New York Times. Революционные технологии в любую эпоху сначала встречают скептицизмом, и он часто питает безразличие к усилиям по сохранению материалов. Историки и активисты сохранения цифровых материалов согласны, что ранний интернет — сегодняшний интернет — по большей части исчезнет.

По большей части, но не полностью. Проект Internet Archive Wayback Machine — архив, заполненный «снимками» страниц, какими они были в прошлом, эдакими цифровыми ископаемыми. Это ближайший аналог ракетной шахты, где страницы могут пылиться до тех пор, пока за ними не придёт нужный человек. «Есть такая школа мышления, согласно которой если ты не можешь сделать что-то правильно, лучше вообще не делать, — говорит Скотт, который начал работать с архивом в 2011 году. — Но наш подход другой: давайте сделаем то, что можем».

Жизненный цикл большинства веб-страниц исчисляется месяцами. В 1997 году среднее время жизни страницы составляло 44 дня; в 2003 году — 100 дней. Ссылки разрываются ещё быстрее. В 2008 году исследование гиперссылок на 2,7 тысячи ресурсов — у большинства из которых нет аналоговой копии — показало, что через год перестало работать 8% ссылок. К 2011 году, спустя три года, не работало уже 30% ссылок.

Недавно один из специалистов Internet Archive начал анализ материалов Wayback Machine, чтобы понять, что и как выживает в сети. «Вряд ли я кого-то удивлю, если скажу, что по предварительным данным, страницы живут недолго и постоянно меняются, прежде чем совсем исчезнуть», — сказал мне Скотт. Как написала в начале этого года Джилл Лепор (Jill Lepore) в своем эссе для журнала New Yorker, это «всё равно что пытаться устоять на зыбучем песке».

Internet Archive становится более эффективным. Он может сохранять терабайты данных быстрее, чем когда-либо — настолько быстро, что некоторые серверы специально отключаются, чтобы избежать попадания в архив. Интернет 1990-х годов в любом случае уже мёртв. Время от времени Скотт узнаёт о сайте, появившемся в районе 1997 года, который вот-вот перестанет работать. «На самом деле это трагедии, потому что почти все такие сайты уже исчезли», — сказал он.

И всё же сегодняшний интернет ещё более уязвим, чем предыдущие итерации сети. Серверная среда сегодня сложнее, а объём данных поражает воображение. В 1994 году в сети было менее 3 тысяч сайтов. К 2014 году их число превысило 1 миллиард.

«Интересно, что в то время, в 1990-е годы, архивировать сеть было проще, потому что кругом были только статические страницы. Так что если ты что-то сохранил, шансы увидеть это потом и воспользоваться этим были бы несоизмеримо больше, чем для страницы, потерянной сегодня, со всеми этими CMS вроде Drupal, Ruby или Django. Такие страницы — не совсем страницы», — говорит Александр Роуз (Alexander Rose), исполнительный директор фонда Long Now Foundation, организации, которая работает над подходами к долгосрочному мышлению, на горизонте в 10 тысяч лет.

Сохранить что-то в сети, как на опыте своей работы убедился Кевин Вон — значит не только сохранить сайт, но и поддерживать среду, в которой он появился, среду, которая часто выходит из строя даже при активной поддержке. Роуз, глядя на сотни поколений вперёд, подозревает, что в полезном виде не удастся сохранить «почти ничего». «Если наша технологическая цивилизация будет непрерывной, то я думаю, большое количество сырых данных останется доступным для поиска и индексирования. Но почти ничего из форматов, в которых были представлены эти данные, останется распознаваемым», — сказал он.

К счастью, Вон сохранил большую часть «Переезда» на DVD, который он носил с собой на выступления перед студентами. «После того, как газета закрылась, я отправил этот диск в Denver Post и спросил, есть ли на нём всё, что нужно для того, чтобы снова разместить историю в сети. Человек на другом конце провода посмотрел на диск и сказал — да, всё на месте», — сказал Вон.

* * *

Учёные считают, что примерно 300 лет до нашей эры в Александрийской библиотеке хранилось три четверти всех текстов, созданных человечеством. Сегодня три четверти книг человечества заброшены, вышли из печати и хранятся только в библиотеках — если вообще хранятся. Наличие ресурса, к несчастью, мало связано с доступом к нему. Это верно и для сегодняшних библиотек. Городская библиотека Денвера приобрела все печатные архивы газеты Rocky Mountain News, когда та закрылась, но только у Вона был исходный материал, необходимый для того, чтобы воссоздать «Переезд».

И в 2009 году, когда газета закрылась, Вон впервые обратился за разрешениями — библиотеки и компании E.W. Scripps, которой принадлежало издание — воскресить серию материалов. Спустя четыре года переписки, в 2013 году, обе организации разрешили Вону заново опубликовать материалы в сети. «Я наконец-то получил добро и только тогда подумал — и что теперь? Я совершенно ничего не знаю о том, как делают сайты», — рассказывает Вон.

Но кое-что об этом знал его сын. Позапрошлым летом, когда Сойер Вон вернулся домой после первого курса Олин-Колледж, отец и сын стали обсуждать, что нужно для того, чтобы создать точную копию исходной серии. «Сойер сказал — покажи мне свой диск. И потом добавил — у нас получится», — вспоминает Вон-старший.

Для Сойера большая часть работы заключалась в разбирании старого кода и адаптировании его для сегодняшнего интернета. В «доайфонном» 2007 году «Переезд» делался для просмотра со стационарных компьютеров. В нём также активно использовался Flash — когда-то очень распространённая технология, которая сегодня скорее мертва, чем жива. «Моя задача заключалась в том, чтобы починить все элементы сайта, которые не работали из-за изменений в веб-стандартах и смены хоста, — говорит Сойер, ныне третьекурсник, изучающий электротехнику и IT. — Самой классной частью сайта был весь тот дополнительный контент, связанный с историями. Проблема только в том, что весь он был доступен пользователю через Flash».

Вон хотел, чтобы его серия выглядела точно так же, как на момент публикации, то есть ему всё равно понадобился Flash. И ещё необходимо было внимание к мелким, но критически важным деталям. С помощью Темпла, бывшего редактора газеты, Вон получил у дизайнера Роджера Блэка разрешение использовать Rocky, фирменный шрифт газеты.

В прошлом месяце, через восемь лет после исходной публикации, «Переезд» вернулся в интернет. Для Вона, как и для любого читателя, это история успеха. Но это ещё и аномалия.

«У нас есть место для хранения всех книг, всех фильмов, всей музыки, всех программ, всех страниц, да вообще всего на свете, — говорил в 2004 году основатель Internet Archive Брюстер Кейл (Brewster Kahle). — Всё, всё творческое наследие человечества теперь можно оцифровать. А интернет позволит любому, у кого есть в него доступ, получить все эти материалы».

Это ведь и есть, если на то пошло, великое обещание интернета: все знания для всего человечества. Из смеси легенд и истории мы знаем, что Александрийская библиотека в своё время почти что выполнила его. «Чтобы снова реализовать эту идею, нам потребовались другие технологии», — сказал Кейл.

Но умолчание, которое даже оптимиста заставит усомниться в обещании сети, — в том, что древняя библиотека в итоге была разрушена. Не технологиями или их недостатком, но людьми. Спасти нечто и предотвратить уничтожение этого — не вполне одно и то же.

«На сегодняшний день веб, каким его изобрёл Тим Бернерс-Ли, не существует, — сказал Скотт. — Его на самом деле нет. СМИ удаляют старые материалы, с YouTube исчезают старые видео. И хотя Архив и прочие проекты сохраняют — сохраняют — сайты, они всё равно переходят на новые адреса. Они не останутся на том же месте, их надо будет искать… Есть позитивные примеры, но в то же время безмолвно исчезают тысячи полезных вещей. Время идёт, и у меня всё меньше и меньше надежды на то, что сеть будет жить долго».