СМИ о ФЭБ

Фундаментальная электронная библиотека
«Русская литература и фольклор»:
Первые итоги. Задачи. Перспективы

К.В. Вигурский, Е.А. Горный, И.А. Пильщиков

Фундаментальная электронная библиотека «Русская литература и фольклор» (ФЭБ) открылась для пользователей 1 июля 2002 г. (адрес ресурса в Интернете: feb-web.ru). Презентация библиотеки состоялась на расширенном Ученом совете Института мировой литературы им. А.М. Горького.

ФЭБ — многолетний совместный проект ИМЛИ РАН и НТЦ «Информрегистр» Министерства РФ по связи и информатизации. В глобальной компьютерной сети это первая крупномасштабная библиотека академического типа, специализирующаяся по русской литературе XI—XX веков и русскому фольклору. В разное время к работе над проектом привлекались Российская государственная библиотека, Бюро интернет-технологий (БИТ), компания «Яндекс» и другие организации и учреждения. С 2001 г. в число основных участников ФЭБ входит Петрозаводский государственный университет. Проект осуществляется при финансовой поддержке Российского гуманитарного научного фонда и Российского фонда фундаментальных исследований.

1. Основные характеристики ФЭБ

ФЭБ — сетевая многофункциональная информационная система, которая позволяет собирать, обрабатывать, хранить и распространять информацию различных видов (прежде всего текстовую) в области русской литературы и фольклора.

Создание ФЭБ преследует три основных цели:

  • сохранение памятников русской словесности и результатов соответствующих научных исследований (эта задача полностью соответствует положениям проекта Хартии ЮНЕСКО о сохранение мирового культурного наследия в электронной форме, обнародованного в Париже в апреле 2002 г.);
  • предоставление специалистам гуманитарного профиля, преподавателям, студентам всех уровней и всем заинтересованным лицам в России и за рубежом свободного сетевого доступа к системно формируемым информационным фондам по русской словесности;
  • внедрение современных информационных технологий в гуманитарную сферу.

Главными принципами формирования библиотеки ее разработчики считают

  • установку на полноту представления информации, необходимой и достаточной для научных исследований;
  • соответствие отбираемых материалов современному академическому уровню; точность электронного воспроизведения печатных источников;
  • обязательное наличие библиографической идентификации всех произведений;
  • обеспечение пользователя программными средствами, рассчитанными на филологическую работу с текстами.

Библиотека состоит из нескольких разделов — тематических, содержащих основную информацию, и вспомогательных, облегчающих взаимодействие пользователей с ФЭБ. В основе тематических разделов ФЭБ, посвященных четырем хронологическим периодам русской литературы и фольклору, лежат электронные научные издания (ЭНИ). Каждое ЭНИ посвящено какой-либо одной теме: для фольклора это определенный жанр, для древнерусской литературы — конкретный памятник словесности, для литературы нового времени — творчество отдельного писателя. Например, раздел «Литература XIX века» включает ЭНИ «Пушкин», «Батюшков», «Жуковский», «Грибоедов», «Боратынский», «Лермонтов», «Гоголь», «Толстой» и «Достоевский».

Электронные научные издания фактически являются самостоятельными информационно-программными продуктами. Их структуры в достаточной степени унифицированы: в каждом ЭНИ есть рубрики, в которых размещаются

  • энциклопедические сведения;
  • тексты произведений;
  • исследовательская и мемуарная литература;
  • летописи жизни и творчества;
  • библиография;
  • именные и прочие указатели.

В свою очередь, ЭНИ формируются на основе различных информационных объектов (текстов литературных произведений и исследований, изображений, библиографических списков и др. материалов). Эти объекты организованы в иерархическую структуру, которая не только отражает концепцию данного ЭНИ, но и детально воспроизводит структуру входящих в него оригинальных (печатных) изданий. Все тексты представляются в алфавитно-цифровой форме с использованием языка разметки XHTML.

В разделе «Наука о литературе и фольклоре» представлены материалы по истории и текущему состоянию гуманитарных наук в России: хронология важнейших событий, personalia ведущих ученых-гуманитариев (биографические справки и личные библиографии), словарь специальных терминов, информация о научной периодике, сериальных изданиях, научных и образовательных учреждениях гуманитарной сферы. Информация данного раздела имеет самостоятельное значение и не дублируется в других разделах. Вместе с тем в совокупности с библиографией, исследовательскими и справочными материалами, представленными в других тематических разделах ФЭБ, она позволяет сформировать целостную картину научно-гуманитарной деятельности в России XVIII—XX веков и получить сведения о ее основных результатах.

Среди вспомогательных разделов особое место занимает Каталог сетевых ресурсов, содержащий около 300 ссылок на отечественные и зарубежные электронные библиотеки русской литературы и на сетевые информационные ресурсы по русской филологии и фольклору. Раздел содержит, в том числе, более 50 ссылок на персональные (мемориальные) web-страницы, посвященные жизни и творчеству русских писателей. Вся информация, включаемая в Каталог, тщательно отбирается и проверяется. Каталог регулярно пополняется; периодически проводится актуализация всех ссылок.

ФЭБ — развивающаяся система. На момент сдачи библиотеки в эксплуатацию реализована ее первая очередь, которая включает полную структуру библиотеки и все вспомогательные разделы, а также ЭНИ, посвященные Пушкину, Грибоедову, Лермонтову, Боратынскому, и подраздел personalia тематического раздела «Наука», содержащий биографические справки о русских филологах и фольклористах. В библиотеке пользователю предоставлено около 30 тыс. страниц текстовой информации, в том числе около 5 тыс. полных текстов произведений русских классиков, более 2 тыс. полных текстов научных исследований и около 10 тыс. библиографических описаний.

Принципиально важный момент в работах первого этапа ФЭБ — отладка технологического процесса массовой подготовки полнотекстовой информации в электронной форме. Эта технология имеет ключевое значение: без нее подобный проект был бы утопией.

2. Что дает ФЭБ пользователям?

Для многих специалистов и учащихся Интернет является одним из основных источников информации: далеко не всегда необходимые материалы имеются в домашней или близлежащей библиотеке, не у всех есть возможность работать в центральных книгохранилищах. Информации по русской классической литературе становится ощутимо больше с появлением ФЭБ: в общем-то, любое ЭНИ могло бы стать самостоятельным web-сайтом. При этом в отличие от большинства литературных сайтов русского сектора Всемирной сети ФЭБ комплектуется системно и планомерно: в каждом ЭНИ обязательно помещаются наиболее авторитетные издания классических произведений, базовая филологическая и историко-биографическая литература, а также по возможности исчерпывающая библиография.

Вряд ли нужно доказывать, что в научных и в образовательных целях должна использоваться филологически корректная информация. Для электронной библиотеки требование филологической корректности означает, прежде всего, идентифицируемость информационных объектов (наличие точных библиографических описаний всех текстов, включенных в библиотеку — любого издания, любого фрагмента издания, любого произведения). Кроме того, при создании электронных версий печатных текстов должны выдерживаться принципы филологической акрибии (точности воспроизведения оригиналов). В ФЭБ воспроизводится

  • структура и пагинация оригинальных изданий;
  • правописание и пунктуация источника (это относится, в том числе, к изданиям в дореформенной орфографии);
  • расположение текста на странице;
  • особенности шрифтов (номенклатура гарнитур, размер, начертание).

При этом все издания воспроизводятся целиком, от титульных листов и фронтисписов до технической концевой страницы.

Программное обеспечение ФЭБ открывает для исследователей новые возможности и перспективы. В основе многих филологических методик лежит поиск релевантных в том или ином отношении фрагментов и сравнение их между собой. Инструментарий ФЭБ создается прежде всего для этих целей. Так, с помощью полнотекстового поиска можно легко найти все документы, содержащие определенное слово, словосочетание или отдельную словоформу. Найденные слова маркируются, и к ним обеспечивается прямой доступ. Благодаря этим средствам предельно ускоряется поиск нужных цитат, легко получить статистику словоупотребления. По точности и глубине поиска этот эффективный инструмент превосходит все существующие печатные словари и конкордансы.

Практически то же самое можно сказать о поиске отдельных произведений или их совокупностей по формальным признакам (автор, заглавие произведения, дата публикации). Пользователю предоставлены и другие функциональные возможности:

  • комбинированный поиск;
  • сортировка результатов поиска;
  • переход на заданную страницу;
  • гипертекстовые связи произведений с комментариями, примечаниями и другими сопроводительными текстами;
  • параллельный просмотр нескольких источников;
  • экспорт информации (ученый освобождается от необходимости вручную копировать нужные фрагменты).

Все эти операции облегчают и упрощают работу с текстом. Филологический труд становится более продуктивным: скорость выполнения рутинных процедур повышается в десятки раз и в результате высвобождается время для активной творческой работы. При этом речь идет об автоматизации стандартных массовых операций, выполняемых вручную любым исследователем. (Не секрет, что специалисты-филологи и студенты-гуманитарии значительную часть своего времени тратят на поиск необходимых изданий, а в них необходимой информации, на составление и проверку библиографических описаний, многократное переписывание нужных фрагментов текстов, всевозможные сортировки и т.д.) Это значит, что программно-информационная составляющая ФЭБ создается и развивается в соответствии с реальными потребностями филологической практики.

Многочисленные положительные отзывы о ФЭБ вселяют в разработчиков уверенность, что проект является важным шагом на пути использования современных информационных технологий в академических и образовательных целях. Не можем отказать себе в удовольствии процитировать краткое выступление на открытии ФЭБ генерального директора компании «Яндекс» А.Ю. Воложа: «Существует вульгарное представление об Интернете как большой помойке. На самом деле Интернет — это место, где все мы время от времени живем. Это большой город. Наконец в этом городе появилась библиотека, и я нас всех с этим поздравляю. В мире не так много вещей, воспоминание о которых доставляет радость, но мне и через тридцать лет будет приятно вспомнить, что мы участвовали в этом деле».

3. Место ФЭБ среди других сетевых ресурсов

Сопоставление ФЭБ с другими интернет-ресурсами позволит, с одной стороны, показать сходство ФЭБ с электронными библиотеками, а с другой — выявить специфику и уникальность проекта. Электронные библиотеки (ЭБ) различаются по целому ряду параметров.

Работы по созданию и поддержке ЭБ могут вести

  • любители-энтузиасты;
  • академические, образовательные и научно-исследовательские организации;
  • музеи и библиотеки;
  • общественные организации;
  • частные коммерческие компании; и т. д.

ФЭБ относится к разряду ЭБ, создаваемых на базе академических и научно-исследовательских организаций.

Информационные фонды ЭБ могут формироваться

  • стихийно (таковы «Project Gutenberg» на Западе и «Библиотека Мошкова», в России: оба проекта развиваются благодаря деятельности добровольцев, которые бесплатно набирают или сканируют тексты и присылают их «библиотекарям»);
  • в соответствии с личными вкусами и пристрастиями составителей (большинство любительских ЭБ);
  • планомерно, на основе продуманной концепции отбора текстов и в соответствии с программой публикаций (пример: Русская виртуальная библиотека).

ФЭБ принадлежит к последнему типу: формирование ее фондов носит системный и планомерный характер.

По содержанию ЭБ можно разделить на универсальные и тематические. ФЭБ является тематическим собранием (тема оговорена в названии проекта: «Русская литература и фольклор»).

В зависимости от характера вводимой информации принято выделять библиотеки

  • популярные (разрозненные материалы по теме);
  • учебные (основные материалы по теме, включая образовательные и учебно-методические пособия);
  • научные (по возможности исчерпывающее собрание материалов по теме, дающее возможность полноценной научной работы без обращения к другим источникам информации)

ФЭБ относится к категории научных библиотек: она содержит широкий спектр материалов по выбранной теме, дающих возможность полноценной исследовательской работы без необходимости регулярного обращения к другим источникам информации.

Сетевые библиотеки отличаются друг от друга по степени надежности предоставляемых ими текстов. Исследования, проведенные в прошлом году в НТЦ «Информрегистр», показали, что большинство ЭБ, публикующих произведения русской литературы, отличаются крайне низким качеством филологической подготовки текстов, которые часто даются без указания источника или по случайным, неавторитетным источникам и содержат многочисленные искажения и лакуны. (Это в первую очередь характерно для любительских электронных библиотек.) Такие тексты могут, наверное, использоваться для предварительного ознакомления с материалом или для непрофессионального чтения, однако применять их в образовательных и научных целях невозможно. ФЭБ предоставляет надежные, аутентичные, выверенные тексты, прошедшие научно-издательскую обработку и имеющие четкую библиографическую идентификацию. Это, разумеется, не значит, что тексты, публикуемые в ФЭБ, полностью избавлены от опечаток, но количество допускаемых ошибок крайне незначительно.

В сетевых библиотеках наиболее распространены следующие форматы представления электронной информации:

  • «text only» или простой HTML — «бедная» разметка, передающая отдельные особенности форматирования текста, но не затрагивающая его логическую структуру (используется в большинстве любительских библиотек);
  • факсимильное воспроизведение — PDF или графические форматы (TIFF, GIF, JPEG), которые обеспечивают точную передачу внешнего вида документа, но не позволяют производить посимвольную обработку текста (преобладает в большинстве западных ЭБ);
  • «богатая» SGML/XML-подобная разметка, допускающая работу с текстами на уровне отдельных символов и одновременно позволяющая оптимально представлять внешний вид текста и его логическую структуру. ФЭБ осуществляет «богатую» разметку текстов, используя технологию и программное обеспечение, разработанные в НТЦ «Информрегистр».

Существует три основных типа доступа пользователей к коллекциям ЭБ:

  • свободный (любой пользователь Интернета может бесплатно пользоваться материалами и сервисами ЭБ);
  • ограниченный (например, только с компьютеров конкретного учреждения);
  • платный.

ФЭБ предоставляет свободный бесплатный доступ ко всем своим материалам и сервисам. Дальнейшее развитие проекта может сопровождаться появлением коммерческих сервисов при безусловном сохранении свободного доступа к основным собраниям и программным средствам.

Важным критерием оценки информационных ресурсов является источник их финансирования. В числе возможных источников:

  • самофинансирование;
  • инвестиции коммерческих организаций;
  • государственные и международные программы;
  • благотворительные фонды;
  • пожертвования организаций и частных лиц.

Создание фундаментальных научных ЭБ — сложный и дорогостоящий процесс. Финансирование проектов национальной значимости, как правило, носит смешанный характер. Так, бюджет Национальной цифровой библиотеки США за 1996—2000 гг. составил 60 млн. USD (среди спонсоров проекта — Конгресс США, а также многочисленные коммерческие компании и благотворительные фонды). Общий бюджет немецкой ЭБ «Global-Info», открывшейся в 1998 году, составил 60 млн. DM (проект осуществляется под эгидой федерального министерства образования, науки и технологии, которое оплачивает 60% стоимости работ). Число этих примеров можно увеличить — практически такие же размеры финансирования имеют и другие зарубежные проекты крупных научных ЭБ.

Бюджет ФЭБ также носит смешанный характер. На протяжении 6—7 лет, в течение которых шли работы по проекту (включавшие, помимо подготовки информационного наполнения, проведение филологических и библиографических исследований, технических экспериментов, разработку концепции и архитектуры библиотеки, создание программно-технологических средств и т.д.) проект получал финансирование от различных фондов, от государства и из иных источников. Следует, однако, отметить, что совокупный бюджет ФЭБ составляет менее одного процента от затрат на средний аналогичный западный проект. Хочется надеяться, что необходимость развития электронных библиотек как одного из наиболее эффективных способов сохранения национального культурного достояния будет постепенно осознана в качестве приоритетной государственной задачи, что повлечет за собой изменения в финансировании такого рода проектов.

4. Итоги трех месяцев работы. Задачи. Перспективы

Об итогах трех первых месяцев работы ФЭБ участники проекта рассказали на научном заседании, состоявшемся 8 октября 2002 г. в Государственном музее Пушкина.

На момент сдачи ФЭБ в эксплуатацию (01.08.2002) пользователям была представлена лишь небольшая часть подготовленной информации. Достаточно сказать, что в рамках проекта уже переведена в электронную форму вся пушкинская библиография, опубликованная в России с 1886 по 1999 г. (более 50 тыс. описаний), оцифровано несколько сотен научных трудов (монографий, сборников и отдельных статей), сотни изображений. Загрузка этих материалов в ФЭБ и предоставление доступа к ним — всего лишь вопрос времени (необходимо справиться с некоторыми техническими и технологическими ограничениями).

При всем том за прошедшие три месяца объем информации в ФЭБ возрос примерно в полтора раза и составляет сейчас около 50 тыс. печатных страниц. Пополнение фонда библиотеки осуществляется постоянно и регулярно (два-три раза в месяц). Сведения обо всех новых поступлениях публикуются в разделе «Новости» и доступны через список рассылки новостей ФЭБ. За три месяца работы библиотеку посетили более 35 тыс. пользователей, просмотревшие в общей сложности более 250 тыс. документов.

Помимо работы с имеющимся запасом информации сотрудники ФЭБ продолжают вести плановую подготовку новых материалов. До конца этого года должны быть открыты два новых ЭНИ — «Батюшков» и «Есенин», а в 2003 г. появится ЭНИ, посвященное «Слову о полку Игореве».

Важным шагом в развитии ФЭБ станет наполнение раздела «Сериальные издания» ЭНИ «Пушкин», где будут представлены в полном объеме все выпуски первого пушкиноведческого сериального издания «Пушкин и его современники», все выпуски обоих «Временников Пушкинской комиссии» (довоенного и послевоенного) и все тома издания «Пушкин: исследования и материалы». Кажется, трудно переоценить значение, какое приобретает свободный доступ к такому массиву информации. Обработка указанных материалов находится в завершающей стадии; они будут предоставлены пользователям в первой половине 2003 г.

Еще одно перспективное направление развития ФЭБ связано с участием в проекте Петрозаводского государственного университета — одного из самых компьютеризированных университетов страны. На кафедре русской литературы ПетрГУ ведется серьезная работа по текстологии Достоевского, и предполагается, что ЭНИ «Достоевский» будет полностью создаваться там. Осуществление этого плана позволит на практике реализовать идею распределенности электронных библиотек.

Вместе с тем перед участниками проекта стоит ряд задач, связанных с концепцией библиотеки, технологией ее формирования и ведения, программным обеспечением. Достаточно назвать только две: формирование единого библиографического массива, который должен интегрировать десятки тысяч библиографических описаний, подготовленных более чем за сто лет; разработка единых методов и средств автоматизированной подготовки сводных указателей (личных имен, произведений, иллюстраций и т.д.) как тематических разделов, так и всей библиотеки.

Справедливые нарекания вызвал слабо проработанный дизайн ФЭБ. Накопленные замечания и выявленные недостатки внимательно анализируются. Мы рассчитываем, что в течение следующего года дизайн ФЭБ будет кардинально изменен. Уже сейчас ведутся работы по предоставлению пользователям упрощенного доступа к конкретным материалам — иными словами, наряду с действующей (и безусловно необходимой) иерархической структурой создается более легкая система навигации. Участники проекта будут благодарны всем, кто выскажет свое мнение о ФЭБ, поделится конструктивными замечаниями и пожеланиями или предложит сотрудничество.


Источник: ФЭБ: Первые итоги. Задачи. Перспективы // "Электронные библиотеки - 2002 - Том 5 - Выпуск 5" , 14.10.2002.