Архив газеты "The New York Times" выложен в открытый доступ

0   2910   0

July 23, 2016 09:00


Открытый цифровой архив известнейшей американской газеты с огромным количеством материалов и удобным поиском.

Поделиться c друзьями:  


5793176c5f1be73a84dfd1ed

Любая газета — это ценный исторический документ, который многое может рассказать о своей эпохе. В этом легче всего убедиться, если приложить это утверждение к такому культовому изданию, как The NY Times. Благодаря проекту TimesMachine, на котором выложено более 13 миллионов статей, опубликованных с 1851 года по настоящее время, каждый может осуществить небольшое путешествие во времени.

Масштабная работа по оцифровке архивов газеты началась ещё в 2001 году. Постепенно материалы выкладывались в сеть, но были доступны только в виде PDF-документов. В 2014 году наконец удалось запустить сайт с удобной навигацией и поиском по тексту или изображению.

В 2016 году архив газеты пополнился на более чем 8 тыс. номеров (или 1,4 млн статей), опубликованных с 1980 года по настоящее время. К сожалению, далеко не ко всем номерам, опубликованным между 1923 и 1980 годом, можно получить доступ без подписки. Но остальные материалы можно просматривать совершенно свободно.

На основе TimesMachine в 2014 году был запущен краудсорсинговый проект Madison, который предлагает читателям просматривать номера газеты и указывать, какой из участков полосы является рекламой, а также расшифровать увиденный текст. По такому же принципу работает технология reCaptcha, с которой сегодня наверняка сталкивался каждый. Она берёт куски текста из оцифрованных книг и других печатных изданий, с расшифровкой которых компьютер не справился. Вбивая капчу, пользователь не только проходит тест Тьюринга, но и помогает работе цифровых архивов.


Автор: Николай Подосокорский ( philologist), Олег Бочарников

  0  

Источник: philologist.livejournal.com, newtonew.com

Поделиться c друзьями: