СМИ о ФЭБ

ХРОНИКА

ПРЕЗЕНТАЦИЯ ФУНДАМЕНТАЛЬНОЙ ЭЛЕКТРОННОЙ БИБЛИОТЕКИ В ИМЛИ РАН

1 июля 2002 г. на расширенном Ученом совете Института мировой литературы им. А. М. Горького состоялась презентация Фундаментальной электронной библиотеки (ФЭБ) “Русская литература и фольклор”. ФЭБ — многолетний совместный проект ИМЛИ РАН и НТЦ “Информрегистр” Министерства РФ по связи и информатизации (адрес ресурса в Интернете: http://feb-web.ru). В глобальной компьютерной сети это первая крупномасштабная библиотека академического типа, специализирующаяся по русской литературе XI—XX веков и русскому фольклору. В разное время к работе над проектом привлекались Российская государственная библиотека, Бюро интернет-технологий (БИТ), компания “Яндекс” и другие организации и учреждения. С 2001 г. в число основных участников ФЭБ входит Петрозаводский государственный университет. Проект осуществляется при финансовой поддержке РФФИ и РГНФ.

В своем вступительном слове руководитель проекта — директор ИМЛИ, член-корр. РАН Ф. Ф. Кузнецов назвал ФЭБ “интересным, амбициозным, принципиально новым для филологии предприятием” и настоятельно подчеркнул необходимость внедрения новейших компьютерных технологий в сферу гуманитарных наук.

Создатели библиотеки выступили с развернутыми докладами о целях и задачах ФЭБ, о ее структуре, составе и ее специфике в ряду других информационных ресурсов.

Директор ФЭБ, канд. техн. наук К. В. Вигурский определил ФЭБ как сетевую многофункциональную информационно-поисковую систему, обеспечивающую сбор, хранение и распространение произведений русской словесности и результатов научных исследований в области русской литературы и фольклора. (Задача сохранения памятников науки и культуры полностью соответствует положениям проекта Хартии ЮНЕСКО о сохранении мирового культурного наследия в электронной форме, обнародованного в апреле 2002 г.) Основная цель ФЭБ — предоставить всем заинтересованным лицам в России и за рубежом свободный доступ к системно формируемым сетевым филологическим фондам и создать программно-информационную среду для активной творческой работы исследователей русской культуры. Библиотека предназначена для отечественных и зарубежных специалистов гуманитарного профиля — ученых, преподавателей, студентов, издателей, редакторов, библиотекарей, музейных работников.

Главными принципами формирования библиотеки ее разработчики считают установку на полноту представления информации, необходимой и достаточной для научных исследований; соответствие отбираемых материалов современному академическому уровню; точность электронного воспроизведения печатных источников; обязательное наличие библиографической идентификации всех произведений; обеспечение пользователя программными средствами, рассчитанными на филологическую работу с текстами.

Библиотека состоит из нескольких разделов — тематических, содержащих основную информацию, и вспомогательных, облегчающих взаимодействие пользователей с ФЭБ. В основе тематических разделов ФЭБ, посвященных четырем хронологическим периодам русской литературы и фольклору, лежат электронные научные издания (ЭНИ). Каждое ЭНИ посвящено какой-либо одной теме: для фольклора это определенный жанр, для древнерусской литературы — конкретный памятник словесности, для литературы нового времени — творчество отдельного писателя. Например, раздел “Литература XIX века” включает ЭНИ “Пушкин”, “Батюшков”, “Жуковский”, “Грибоедов”, “Боратынский”, “Лермонтов”, “Гоголь”, “Толстой” и “Достоевский”.

Электронные научные издания являются самостоятельными информационно-программными продуктами. Их структуры в достаточной степени унифицированы: в каждом ЭНИ есть рубрики, в которых размещаются энциклопедические сведения, тексты произведений, исследовательская литература, летописи жизни и творчества, библиография, именные и прочие указатели.

ФЭБ — развивающаяся система. На момент сдачи библиотеки в эксплуатацию реализована ее первая очередь (“ФЭБ-I”), которая включает полную структуру библиотеки и все вспомогательные разделы, а также ЭНИ, посвященные Пушкину, Грибоедову, Лермонтову, Боратынскому, и подраздел personalia тематического раздела “Наука”, содержащий биографические справки о русских филологах и фольклористах. В ФЭБ-I пользователю предоставлено около 30 тыс. страниц текстовой информации, в том числе около 5 тыс. полных текстов произведений русских классиков, более 2 тыс. полных текстов научных исследований и около 10 тыс. библиографических описаний. К концу следующего года эти цифры будут утроены. Докладчик отметил, что указанные объемы составляют только часть уже подготовленной информации

(так, в рамках проекта оцифрована вся опубликованная пушкинская библиография).

К началу 2003 г. предполагается открыть ЭНИ, посвященные Батюшкову и Есенину. Еще одно перспективное направление развития ФЭБ связано с участием ПетрГУ — одного из самых компьютеризированных университетов страны, в котором ведется серьезная работа по текстологии Достоевского. Предполагается, что ЭНИ “Достоевский” будет полностью создаваться там. Осуществление этого плана позволит на практике реализовать идею распределенности электронных библиотек.

Принципиально важный момент в работах первого этапа ФЭБ — отладка технологического процесса массовой подготовки полнотекстовой информации в электронной форме. Эта технология имеет ключевое значение: без нее подобный проект был бы утопией.

Что же призвана дать филологам Фундаментальная электронная библиотека? Ответу на этот вопрос было посвящено выступление главного редактора ФЭБ, канд. филол. наук И. А. Пильщикова.

Для многих специалистов и учащихся Интернет является одним из основных источников информации: далеко не всегда необходимые материалы имеются в домашней или близлежащей библиотеке, не у всех есть возможность работать в центральных книгохранилищах. Информации по русской классической литературе становится ощутимо больше с появлением ФЭБ: в общем-то, любое ЭНИ могло бы стать самостоятельным web-сайтом. При этом в отличие от большинства литературных сайтов русского сектора Всемирной сети ФЭБ комплектуется системно и планомерно: в каждом ЭНИ обязательно помещаются наиболее авторитетные издания классических произведений, базовая филологическая и историко-биографическая литература, а также по возможности исчерпывающая библиография.

Вряд ли нужно доказывать, что в научных и в образовательных целях должна использоваться филологически корректная информация. Для электронной библиотеки требование филологической корректности означает прежде всего идентифицируемость информационных объектов (наличие точных библиографических описаний всех текстов, включенных в библиотеку — любого издания, любого фрагмента издания, любого произведения). Кроме того, при создании электронных версий печатных текстов должны выдерживаться принципы филологической акрибии (точности воспроизведения оригиналов). В ФЭБ воспроизводится структура и пагинация оригинальных изданий, правописание и пунктуация источника (это относится, в том числе, к изданиям в дореформенной орфографии), расположение текста на странице, особенности шрифтов (номенклатура гарнитур, размер, начертание). При этом все издания воспроизводятся целиком, от титульных листов и фронтисписов до технической концевой страницы.

Программное обеспечение ФЭБ открывает для исследователей новые возможности и перспективы. В основе многих филологических методик лежит поиск релевантных в том или ином отношении фрагментов и сравнение их между собой. Инструментарий ФЭБ создается прежде всего для этих целей. Так, с помощью полнотекстового поиска можно легко найти все документы, содержащие определенное слово, словосочетание или отдельную словоформу. Найденные слова маркируются, и к ним обеспечивается прямой доступ. Благодаря этим средствам предельно ускоряется поиск нужных цитат, легко получить статистику словоупотребления. По точности и глубине поиска этот эффективный инструмент превосходит все существующие печатные словари и конкордансы.

Mutatis mutandis то же самое можно сказать о поиске отдельных произведений или их совокупностей по формальным признакам (автор, заглавие произведения, дата публикации). Пользователю предоставлены и другие функциональные возможности: комбинированный поиск; сортировка результатов поиска; переход на заданную страницу; гипертекстовые связи произведений с комментариями, примечаниями и другими сопроводительными текстами; параллельный просмотр нескольких источников; экспорт информации (ученый освобождается от необходимости вручную копировать нужные фрагменты).

Все эти операции облегчают и упрощают работу с текстом. Филологический труд становится более продуктивным: скорость выполнения рутинных процедур повышается в десятки раз и в результате высвобождается время для активной творческой работы. Докладчик подчеркнул, что речь идет об автоматизации стандартных процессов, выполняемых вручную любым исследователем. Это значит, что программно-информационная составляющая ФЭБ создается и развивается в соответствии с реальными потребностями филологической практики.

В Интернете существует довольно много сайтов, посвященных русской литературе. Хотя принципы их формирования не всегда соответствуют принципам ФЭБ, библиотека учитывает их информацию: в разделе ссылок помещен один из самых больших каталогов сетевых ресурсов по русской филологии. Каталог постоянно обновляется; в настоящее время в нем зафиксировано более 180 ресурсов. Таким образом, ФЭБ — не только электронная библиотека, но и портал в строгом терминологическом смысле: это место, откуда гуманитарию удобно начинать работу в Сети и где имеются web-сервисы и ссылки, которые помогают организовать эту работу.

Электронные библиотеки (ЭБ) различаются по целому ряду параметров. Подробнее о месте ФЭБ среди других сетевых библиотек рассказал директор проекта по внешним связям Е. А. Горный.

Работы по созданию и поддержке ЭБ могут вести любители-энтузиасты, академические, образовательные

и научно-исследовательские организации, музеи и библиотеки, общественные организации, частные коммерческие компании и т. д. ФЭБ относится к разряду ЭБ, создаваемых на базе академических и научно-исследовательских организаций.

Информационные фонды ЭБ могут формироваться либо стихийно (таковы “Project Gutenberg” на Западе и “Библиотека Мошкова” в России: оба проекта развиваются благодаря деятельности добровольцев, которые бесплатно набирают или сканируют тексты и присылают их “библиотекарям”), либо в соответствии с личными вкусами и пристрастиями составителей (большинство любительских ЭБ), либо планомерно, на основе продуманной концепции отбора текстов и в соответствии с программой публикаций (пример: Русская виртуальная библиотека). ФЭБ принадлежит к последнему типу: формирование ее фондов носит системный и планомерный характер.

По содержанию ЭБ можно разделить на универсальные и тематические. ФЭБ является тематическим собранием (тема оговорена в названии проекта: “Русская литература и фольклор”). В зависимости от характера вводимой информации принято выделять библиотеки популярные, учебные и научные. ФЭБ относится к категории научных библиотек: она содержит широкий спектр материалов по выбранной теме, дающих возможность полноценной исследовательской работы без необходимости регулярного обращения к другим источникам информации.

В сетевых библиотеках наиболее распространены следующие форматы представления электронной информации: а) “text only” (“только текст”) или простой HTML — “бедная” разметка, передающая отдельные особенности форматирования текста, но не затрагивающая его логическую структуру (используется в большинстве любительских библиотек); б) факсимильное воспроизведение — PDF или графические форматы (TIFF, GIF, JPEG), которые обеспечивают точную передачу внешнего вида документа, но не позволяют производить посимвольную обработку текста (преобладает в большинстве западных ЭБ); в) “богатая” SGML/XML-подобная разметка, допускающая работу с текстами на уровне отдельных символов и одновременно позволяющая оптимально представлять внешний вид текста и его логическую структуру. ФЭБ осуществляет “богатую” разметку текстов, используя технологию и программное обеспечение, разработанные в НТЦ “Информрегистр”.

Существует три основных типа доступа пользователей к коллекциям ЭБ: свободный, ограниченный (например, только с компьютеров конкретного учреждения) и платный. ФЭБ предоставляет свободный бесплатный доступ ко всем своим материалам и сервисам. (Дальнейшее развитие проекта может сопровождаться появлением коммерческих сервисов при безусловном сохранении свободного доступа к основным собраниям и программным средствам.)

Важным критерием оценки информационных ресурсов является источник их финансирования. В числе возможных источников — самофинансирование, инвестиции коммерческих организаций, государственные и международные программы, благотворительные фонды, пожертвования организаций и частных лиц. Создание фундаментальных научных ЭБ — сложный и дорогостоящий процесс. Финансирование проектов национальной значимости, как правило, носит смешанный характер.

Так, бюджет Национальной цифровой библиотеки США за 1996—2000 гг. составил 60 млн. USD (среди спонсоров проекта — Конгресс США, а также многочисленные коммерческие компании и благотворительные фонды). Общий бюджет немецкой ЭБ “Global-Info”, открывшейся в 1998 г., составил 60 млн. DM (проект осуществляется под эгидой федерального министерства образования, науки и технологии, которое оплачивает 60% стоимости работ). Стоимость работ по созданию Электронной библиотеки Японии приблизительно оценивается в 500 млн. USD (библиотека частично финансируется из государственного бюджета; кроме того, проект спонсируют девять крупных фирм, в том числе NEC, Mitsubishi, Fujitsu).

Бюджет ФЭБ также носит смешанный характер. На протяжении 6—7 лет, в течение которых шли работы по проекту (включавшие, помимо подготовки информационного наполнения, проведение филологических и библиографических исследований, технических экспериментов, разработку концепции и архитектуры библиотеки, создание программно-технологических средств и т. д.) проект получал финансирование от различных фондов, от государства и из иных источников. Следует, однако, отметить, что совокупный бюджет ФЭБ составляет менее одного процента от затрат на средний аналогичный западный проект. Хочется надеяться, заключил докладчик, что необходимость развития электронных библиотек как одного из наиболее эффективных способов сохранения национального культурного достояния будет постепенно осознана в качестве приоритетной государственной задачи, что повлечет за собой изменения в финансировании такого рода проектов.

В обсуждении докладов приняли участие члены Ученого совета ИМЛИ, представители академических институтов, научных фондов, коммерческих компаний и ряда других организаций и учреждений.

Член-корр. РАН А. Д. Михайлов (ИМЛИ) задал несколько принципиальных вопросов, в том числе: какое потребуется время, чтобы полностью сформировать то или иное ЭНИ, и попадают ли в ФЭБ первоиздания классиков и факсимиле их рукописей. Докладчики указали, что комплектование фондов электронных библиотек (так же, как и библиотек традиционных) — процесс, не ограниченный во времени. Более того, практически установка

на полноту означает постоянное и регулярное пополнение ЭНИ новыми текстами. Отвечая на вопрос о программе публикаций, создатели ФЭБ разъяснили, что планируется включать все основные издания, но в соответствии с принципом очередности: от академических собраний и комментированных критических изданий к изданиям-“предшественникам” и далее к первопубликациям (предпочтение отдается репринтам первоизданий, снабженным критическим аппаратом). Участники проекта сообщили, что довольно существенная часть рукописей Пушкина, Достоевского, Шолохова уже переведена в электронную форму и через какое-то время будет доступна пользователям ФЭБ. Кроме того, ведется подготовка разделов ЭНИ “Лермонтов”, посвященных рукописям поэта, его картинам и рисункам.

Доктор филол. наук Ю. Б. Борев (ИМЛИ) дал высокую оценку проекту, но посетовал, что сегодня далеко не каждый российский ученый имеет возможность пользоваться Интернетом.

Директор НТЦ “Информрегистр”, член-корр. РАЕН А. Б. Антопольский подчеркнул, что некоммерческие информационные ресурсы в области науки, культуры и образования должны пользоваться поддержкой со стороны государства. Он пообещал приложить все усилия, чтобы ФЭБ заняла достойное место в федеральной целевой программе “Электронная Россия”.

Выступление генерального директора компании “Яндекс” А. Ю. Воложа было предельно кратким: “Существует вульгарное представление об Интернете как большой помойке. На самом деле Интернет — это место, где все мы время от времени живем. Это большой город. Наконец в этом городе появилась библиотека, и я нас всех с этим поздравляю. В мире не так много вещей, воспоминание о которых доставляет радость, но мне и через тридцать лет будет приятно вспомнить, что мы участвовали в этом деле”.

Член-корр. РАН В. М. Гацак (ИМЛИ) поддержал определение ФЭБ как динамической системы: нельзя создать библиотеку, которая претендует на соответствие научному и технологическому уровню (не только сегодня, но и завтра, и послезавтра) и при этом не развивается. В выступлении прозвучало пожелание, чтобы гипертекстовый способ подачи информации в библиотеке постепенно перерастал в гипермедийный. По мере развития ФЭБ должна повышаться роль “звукоприложений” и видеоприложений — речь идет о мультимедийном воспроизведении фольклора, а также о записях авторского и актерского чтения.

Доктор филол. наук В. Н. Захаров, выступавший от имени ПетрГУ и РГНФ, выразил надежду, что проект вызовет интерес не только в Академии наук, но и в Министерстве образования: информация, подготовленная для ФЭБ, будет востребована в высшей и средней школе. Он высоко оценил представленные результаты: “Это настоящий подарок России и русской культуре”.

По словам О. А. Плечовой, представлявшей РФФИ, фонд поддерживает развитие технологических аспектов ФЭБ и считает, что задачи, решаемые в этом проекте, представляют серьезный вклад в фундаментальную науку. Работы по созданию научных электронных библиотек, в том числе гуманитарных, начаты во многих российских городах, и фонд призывает авторов подобных проектов к кооперации.

По мнению профессора Р. Виттакера (CUNY, Нью-Йорк, США), авторам проекта удалось создать уникальную по своей структуре, масштабу и тематике электронную библиотеку, не имеющую аналогов ни в Западной Европе, ни в США.

М. В. Акимова

Источник: ИЗВЕСТИЯ АН. СЕРИЯ ЛИТЕРАТУРЫ И ЯЗЫКА, 2002, том 61, № 6, с. 72–75