Любая газета — это ценный исторический документ, который многое может рассказать о своей эпохе. В этом легче всего убедиться, если приложить это утверждение к такому культовому изданию, как The NY Times. Благодаря проекту TimesMachine, на котором выложено более 13 миллионов статей, опубликованных с 1851 года по настоящее время, каждый может осуществить небольшое путешествие во времени.
Масштабная работа по оцифровке архивов газеты началась ещё в 2001 году. Постепенно материалы выкладывались в сеть, но были доступны только в виде PDF-документов. В 2014 году наконец удалось запустить сайт с удобной навигацией и поиском по тексту или изображению.
В 2016 году архив газеты пополнился на более чем 8 тыс. номеров (или 1,4 млн статей), опубликованных с 1980 года по настоящее время. К сожалению, далеко не ко всем номерам, опубликованным между 1923 и 1980 годом, можно получить доступ без подписки. Но остальные материалы можно просматривать совершенно свободно.
На основе TimesMachine в 2014 году был запущен краудсорсинговый проект Madison, который предлагает читателям просматривать номера газеты и указывать, какой из участков полосы является рекламой, а также расшифровать увиденный текст. По такому же принципу работает технология reCaptcha, с которой сегодня наверняка сталкивался каждый. Она берёт куски текста из оцифрованных книг и других печатных изданий, с расшифровкой которых компьютер не справился. Вбивая капчу, пользователь не только проходит тест Тьюринга, но и помогает работе цифровых архивов.
Комментарии:
Авторизуйтесь, чтобы оставить отзыв