Потемкинские библиотеки

0   848   0

August 07, 2018 09:00


Почему оцифровка зачастую не решает проблемы доступности общественного достояния

Поделиться c друзьями:  


5b69769d8b8a87048558da9d

Казалось бы, в XXI веке любую информацию можно найти в открытом доступе. Однако на самом деле даже многие из произведений, перешедших в общественное достояние, недоступны пользователю сети. Разбираемся, какие проблемы чаще всего встречаются на интернет-порталах крупнейших электронных библиотек России.

В России осуществить оцифровку книги не так-то просто – согласно ГК РФ, отсканировать и выложить материалы без авторского согласия можно только в том случае, если имущественные права на них истекли или произведения относятся к категории образовательной литературы, которая не переиздавалась более 10 лет.

Доступ к произведениям науки и литературы затрудняется и самими библиотеками. Большинство книг на порталах даже крупнейших электронных ресурсов не распознаны, а качество сканов оставляет желать лучшего. Неудобные программы для чтения, древние сайты, водяные знаки на копиях страниц, ошибки в текстах – все это затрудняет доступ к произведениям и заставляет пользователей искать литературу на сторонних – часто пиратских – порталах.

Нераспознанный текст, плохое качество копий и водяные знаки

РГБ – крупнейшая публичная библиотека мира. В ней находится уникальное собрание отечественных и зарубежных документов на 367 языках мира. Объем фондов превышает 45 миллионов единиц хранения. Свои фонды библиотека раскрывает с помощью постоянно пополняющегося электронного каталога, доступ к которому можно получить как в браузере, так и через мобильное приложение eRSL.

Однако на сайте Российской государственной библиотеки многие тексты представлены в плохом качестве, часть из них не распознаны (то есть показана картинка, а скопировать текст с неё, как в обычной электронной книге, нельзя). Что хорошо – водяных знаков на сканах нет.

Сайт библиотеки РГБ

РНБ – одна из крупнейших библиотек мира и вторая по величине фондов в Российской Федерации. В ней хранится около 38 миллионов экземпляров книг и иных материалов, в том числе и на электронных носителях. Электронная библиотека (согласно отчету 2016 года, она включает почти 600 тысяч изданий ) обеспечивает удаленный доступ к ресурсам. Многие книги на портале не распознаны (скорее всего, в силу их старости). Связано это с тем, что машина зачастую переводит картинку в текст с ошибками, исправлять которые – отдельный ручной труд.

Качество и количество книг в открытом доступе на сайте РНБ также оставляет желать лучшего. На каждой странице – водяные знаки.

Сайт библиотеки РНБ

Сайт библиотеки РНБ

Та же самая проблема и у Национальной электронной библиотеки : текст не распознан, соответственно, работать с книгой становится тяжелее.

Сайт библиотеки НЭБ

Сайт библиотеки НЭБ

Самое бедственное положение у электронных фондов Президентской библиотеки : качество книг, находящихся в открытом доступе, плохое – определённые книги доступны для скачивания только в крайне низком расширении (читать их очень трудно даже на сайте) и только в формате JPG. Большинство книг доступно только в электронном читальном зале.

Сайт Президентской библиотеки

Российская государственная детская библиотека хоть и не такая большая, как все вышеперечисленные (фонд – 540 тысяч книг, газет, журналов, нотных изданий, кино-, фото-, фономатериалов), но также имеет электронную библиотеку, содержащую 8 тысяч оцифрованных объектов. В Национальной электронной детской библиотеке, как ни парадоксально, находится 49 книг Пушкина в открытом доступе, практически все они на современном русском языке, хоть и достаточно древние (в сравнении с РГБ – там в открытом доступе на современном русском только «Евгений Онегин»). Текст распознан, водяных знаков на копиях них нет.

Сайт РГДБ

Государственная публичная историческая библиотека России является государственным хранилищем литературы по истории, историческим наукам и смежным дисциплинам. Фонд библиотеки (c апреля 2014 года) — около 6 миллионов экземпляров. Она хранит в основном известные газеты, журналы и отдельные статьи. Читателям предоставлена открытая электронная библиотека, которая содержит во многом уникальное собрание газет и журналов XIX и XX веков. Однако материалы в таком качестве, как будто их не сканировали, а просто сфотографировали.

Сайт ГПИБ

Водяных знаков нет. Но работать с такими документами всё равно очень трудно, так как осуществить поиск по ключевым словам невозможно, скачать файлы можно только в формате JPG. Некоторые копии в очень плохом состоянии.

Сайт ГПИБ

Если говорить об архивах, то Государственный архив Российской Федерации, например, предоставляет возможность скачивания документов и других материалов, но на каждой странице, которую можно, опять же, сохранить только в формате JPG в низком разрешении, есть водяные знаки.

Сайт ГАРФ

Российский государственный архив литературы и искусства открыл доступ к некоторым виртуальным архивам, но все документы с водяными знаками и в очень низком разрешении.

Сайт РГАЛИ

Мало книг, перешедших в общественное достояние, на современном русском

Так как НЭБ представляет собой собрание электронных материалов с многих библиотек, в том числе РГБ и РНБ, а у Президентской библиотеки достаточно узкая направленность (история российской государственности и права, русский язык как государственный, российский народ и территория России), достаточно будет проанализировать РГБ и РНБ, чтобы убедиться, что книги из общественного достояния на современном русском языке – это редкость.

На сайте Российской государственной библиотеки большинство книг Пушкина, Лермонтова и других популярных авторов написаны на дореволюционном языке – например, такой книги Лермонтова в открытом доступе вообще нет (самое раннее издание – 1915 года).

Сайт РГБ

Сайт РГБ

Та же проблема и у Российской национальной библиотеки. Самое раннее издание Пушкина, которое возможно скачать, – 1950 года, Бунина – 1920 (на фото). Большинство книг, находящихся в общественном достоянии лишь «рекомендованы к оцифровке».

Сайт РНБ

В Национальной электронной детской библиотеке дела обстоят лучше. Помимо Пушкина там можно найти достаточное количество книг Лермонтова, Гоголя, но, например, Бунина, Достоевского и Толстого – нет. Возможно, это связано со спецификой фондов библиотеки.

Закон об авторском праве

Неприятный факт о сайте РНБ – чтобы открыть, например, собрание сочинений Лермонтова 1983 года, которое оцифровано, нужно авторизоваться, так как «документ охраняется законом об авторском праве». То есть для чтения нужно иметь читательский билет РНБ, и то посматривать книги будет возможно только в залах библиотеки.

Сайт РНБ

Такая ситуация практически со всеми книгами и учебниками. В результате длительных поисков, все-таки получилось скачать Маяковского , некоторые слова даже определяются (то есть скопировать текст получится, но его придётся много редактировать вручную), но всё опять портят водяные знаки.

На официальном сайте НЭБ сразу предупреждают, что «просмотр изданий, охраняемых авторским правом, осуществляется только из электронных читальных залов НЭБ». То есть даже если книга отсканирована, читать её все равно придется в стенах библиотеки.

Сайт НЭБ

Большинство книг охраняются авторским правом. Зато можно скачать довольно редкие файлы (портреты, картинки, диссертации), но текст в них чаще всего не распознан (например, материал представлен в формате JPG).

Российская государственная детская библиотека предоставляет возможность скачивать материалы в открытом доступе, но те, что защищены авторским правом, можно только пролистывать. Помимо этого, есть и такая категория, как «материал с жестким ограничением доступа», который можно смотреть «в пределах 5% изображений страниц» . Следует сказать, что, в сравнении с другими, более крупными библиотеками, литературы из общественного достояния здесь все же больше.

Полностью работает по принципу открытого доступа Государственная публичная историческая библиотека. Однако её электронные материалы формируются за счет фондов самой ГПИБ, так что найти там книги из общественного достояния нельзя в силу специфики библиотеки.

На сайте Российского государственного архива литературы и искусства скачать файлы вообще не получится: все материалы представлены на сайте исключительно для визуального просмотра. С большинством архивов можно ознакомиться только в библиотеке.

В Российском государственном историческом архиве доступ к электронному каталогу научно-справочной библиотеки открылся лишь 30 августа 2017 года, и заказать интересующие издания можно пока только в самой библиотеке.

Неудобство сайта

Сайт РГБ сравнительно понятный. В метаданных указано всё необходимое (есть описание книги, автор, год создания; правовой режим указан символом). Однако онлайн-консультанта, как, например, в электронной библиотеке РНБ, нет.

Программа для чтения удобная, все страницы загружаются быстро и без проблем. Парадокс – можно скачать переведённые на английский и другие языки произведения нашей классики (например, «Герой нашего времени»). На русском они недоступны.

Читать оцифрованные книги на сайте РНБ можно с помощью программы Вивальди . Через нее можно скачать определённые страницы в формате PDF, однако целая книга доступна лишь в непонятном формате mcr. К программе придётся первое время привыкнуть: в ней доступен только постраничный просмотр, страницы в низком расширении, информация загружается долго.

Одно из заявленных достоинств сайта – наличие онлайн-консультанта. Нужно только поймать время, когда он будет онлайн, тогда связь с ним произойдёт быстрее. Время нашего общения консультант сообщил, что книги в PDF формате все-таки есть, «нужно смотреть конкретное издание». Скопировать книгу целиком в формате PDF можно только в том случае, если она доступна для 100% копирования, однако таких изданий очень мало (большинство изданий можно скачать только в размере 25%).

Что касается удобства самого сайта – работать с ним очень сложно. Чтобы разобраться с тонкостями расширенного поиска, понадобится большое количество времени. Проще ввести всё в строке поиска.

Метаданные указаны все (есть даже рубрики и ключевые слова, по котором в теории можно поискать необходимое издание, но очень часто при нажатии на определённое ключевое слово сайт ничего не находит). Но что интересно: «Пушкин, А. С (1799-1837)», «Пушкин, А.С (1799-1837)», «Пушкин, А.С», «Пушкин, А. С (1799 - 1837)» – разные авторы, по мнению поисковика сайта. Если вы хотите получить списком сразу все произведения Пушкина, у вас это не получится, так как придётся просматривать все возможные обозначения одного и того же автора.

Сайт РНБ

Чтобы наиболее эффективно работать с Национальной электронной библиотекой (иметь возможность копировать текст, добавлять его в закладки) нужно авторизоваться. Программа, которую издатели сайта предлагают скачать , работать без регистрации не будет вообще, хотя войти в неё анонимно можно. Помимо того, некоторые метаданные не указаны (например, здесь нет автора), что усложняет поиск.

Программа для чтения на сайте Президентской библиотеки (она встроена в сам сайт) неудобная. Например, изменить масштаб можно, только указав значение для масштабирования (от 0 до 4). Сделать шрифт произведения больше или меньше этого диапазона нельзя.

На сайте Национальной электронной детской библиотеки удобнее всего искать произведения с помощью расширенного поиска. В целом, сайт достаточно удобный, однако с программой для чтения нужно все же еще поработать: плавно масштабировать нельзя, страницы порой грузятся очень долго. К тому же, чтобы полноценно работать с сайтом и с книгами, придётся зарегистрироваться, иначе вы не будете иметь возможность скачать книги.

Для работы с цифровыми копиями печатных изданий Государственной публичной исторической библиотеки не нужна дополнительная регистрация. Но на данный момент целиком скачать издание нельзя. Можно скачать отдельную страницу, выбрав (при постраничном просмотре) кнопку «загрузить» и крупный или средний размер изображения. Файлы сохраняются только в формате JPG, что затрудняет работу с материалами.

А вот Российский государственный архив социально-политической истории довольно неплох: в нём представлены материалы в хорошем качестве формата PDF (если это книга) и JPG (если это выписка или документ). Но некоторые архивы на официальном сайте недоступны (при проходе по ссылке «страница не найдена»). Например, это касается выставки «Н.С. Хрущёв: к 120-летию со дня рождения».

Какой же вывод?

В России очень плохо развита инфраструктура онлайн-библиотек. Помимо того, нет определенной программы по устранению недостатков в этой сфере, не предоставлено ни одной стратегии развития, нет единого стандарта оцифровки. Кроме того, огромный проблемой остаётся недостаточное финансирование, а порой и вовсе его отсутствие. Темпы оцифровки, по сравнению с крупнейшими национальными порталами Европы и Америки, крайне низкие. При этом причины стагнации лежат не только в финансовом поле, но и в правовом (невозможность оцифровать издание без согласия автора).

Для решения насущных проблем в первую очередь необходимо скорректировать оцифрованные фонды и пополнить их произведениями на современном русском языке, потому что сейчас получается так, что в погоне за сохранением старых изданий библиотеки в большей степени думают о себе, нежели о своем читателе. Вот почему читать на подобных порталах очень часто оказывается нечего.

При этом нужно сосредоточиться не на количестве оцифрованных экземпляров, а на качестве: поставить цель не только представить издания в цифровом формате, но и распознать текст и удалить все водяные знаки, которые иногда мешают пользователям ознакомиться с тем или иным шедевром литературы или искусства.

Еще одна проблема, которая требует решения, - плохая инфраструктура самих сайтов и программ для чтения произведений. Найти что-то на большинстве порталов сложно, поскольку поисковые системы далеки от совершенства, а читать книги неудобно – в одних библиотеках программу для чтения придется скачивать на рабочий стол, в других они неповоротливы и сложны для использования. Это создает еще одну сложность при чтении произведений. Для решения этой проблемы, возможно, необходимо учитывать опыт успешных европейских и американских библиотек (Библиотека Конгресса США, Британская библиотека, Национальная библиотека Норвегии), а также крупнейших интернет-проектов в этой сфере, например, Google Books или Europeana. Обмен технологиями, возможно, позволит создать адекватные условия для развития этой отрасли.

Статья опубликована в рамках проекта Ресурсный центр «Открытая библиотека», который реализуется НП «Викимедиа РУ» с использованием гранта Президента Российской Федерации на развитие гражданского общества, предоставленного Фондом президентских грантов.


Автор: Наталья Глухова

  0  

Источник: chaskor.ru

Поделиться c друзьями: