Главная > Документ


А.И. Земсков

Г.А. Евстигнеева

Государственная публичная
научно-техническая библиотека России,
Москва, Россия

Электронный архив русских публикаций по математике: Российско-германский проект RusDML (Российская электронная математическая библиотека)

В докладе представлен российско-германский проект создания электронного архива русских публикаций по математике – Российской электронной математической библиотеки (РусЭМБ). Российским партнером проекта является ГПНТБ России. Российская Академия наук осуществляет поддержку лицензирования журналов, издаваемых РАН. Германская сторона представлена Государственной и университетской библиотекой Геттингена (SUB, Геттинген), Технической информационной библиотекой Ганновера (TIB, Ганновер) и Техническим университетом Берлина (ТU, Берлин). Проект поддержан РФФИ и DFG и соответствует мировым тенденциям создания электронных коллекций научной информации (в частности публикаций по математике) для предоставления к ним всемирного доступа по сети из распределенных архивов. РусЭМБ представляет собой часть создаваемой всемирной цифровой математической библиотеки. Электронная библиотека создается путем сканирования доступных ранее только в печатном виде публикаций и является существенным дополнением к имеющимся актуальным электронным публикациям, охватывающим незначительный период времени. Создаваемый электронный архив должен быть легко доступен во всем мире. Для этого обеспечивается соответствие международным стандартам структуры РусЭМБ. Каждая из трех библиотек – партнеров должна заботиться о надежной сохранности своей части коллекции и вести работу, направленную на улучшение доступа пользователей к электронному архиву. У всех партнеров должны быть организованы “зеркала” к коллекциям участников проекта.

Исходя из примерно 120 русских журналов, которые обрабатываются в Zentralblatt MATH и в Математическом ежегоднике, должно быть отсканировано примерно 2 млн страниц.

При этом особое внимание должно уделяться соблюдению единых форматов и принятию общих решений по другим вопросам. РусЭМБ будет содержать метаданные на английском и на русском языках.

Целью проекта является оцифровка основного фонда русскоязычных периодических изданий по математике, существующих только в печатном виде, для обеспечения больших возможностей доступа к ним во всем мире. В ходе работы должна быть создана основа для последующей оцифровки всех российских публикаций по математике, включая монографии, в том числе выпущенные в Советском Союзе.

Актуальность и своевременность проекта подтверждается тем, что он целиком соответствует мировым тенденциям создания электронных коллекций научной информации (в частности публикаций по математике) для предоставления к ним всемирного доступа по сети из распределенных архивов. Помимо упрощения доступа к информации, электронный математический архив выполняет функцию электронного депозитария, облегчающего решение вопросов, связанных с сохранностью фонда. Это – рациональное использование площадей книгохранилищ, создание необходимых условий для хранения изданий, особенно, если издание напечатано на бумаге плохого качества. В этих случаях создание электронной версии является лучшим способом обеспечения надежной сохранности документов.

В математике публикации за старые годы не менее важны, чем современные издания, так как результаты математического исследования имеют, как правило, неограниченную во времени силу и остаются актуальными. Поэтому всемирная доступность к публикациям является наиболее важной именно для математики.

Уже в течение нескольких лет в мире ведутся научные и практические разработки в области создания полнотекстовых тематических коллекций научной литературы. Созданием электронных коллекций научной литературы и разработкой систем доступа занимаются ведущие научные издательства (проект Backfiles for Future), научные общества (Европейское математическое общество – проекты EMANI, ERAM) издательства и научные общества в кооперации с университетами (проект JSTOR).

Наиболее крупные разработки в области создания математических электронных коллекций ведутся в Северной Америке и Европе. В США созданы рабочие группы, финансируемые Национальным научным фондом США, занимающиеся созданием Цифровой библиотеки по математике. Европейское математическое общество поддерживает проекты EMANI и ERAM, направленные на создание электронных библиотек по математике. Проекты по созданию математических архивов ведутся также в Китае (университет Цинхуа) и в Колумбии. Все эти проекты можно рассматривать как начальный этап создания глобальной всемирной цифровой библиотеки по математике (ЦБМ). По предварительной оценке, сделанной по заказу Национального научного фонда США, стоимость этого глобального проекта может составить около 100 млн долларов США.

РусЭМБ представляет собой часть создаваемой всемирной цифровой математической библиотеки. Актуальность и своевременность проекта подтверждается тем, что он целиком соответствует мировым тенденциям создания электронных коллекций научной информации (в частности публикаций по математике) для предоставления к ним всемирного доступа по сети из распределенных архивов.

Создание цифровых версий публикаций по математике способствует увеличению числа научных журналов, предлагаемых в электронном доступе. Они без существенных издержек могут быть получены по сети прямо на рабочем месте, что оказывает необходимую помощь ученому-математику. Последующее оцифровывание доступных ранее только в печатном виде публикаций, является существенным дополнением к имеющимся актуальным электронным публикациям, охватывающим незначительный период времени.

Выполнение проекта осуществляется на основе Российско-Германской кооперации.

Российскими партнерами являются ГПНТБ России и Отделение математики РАН.

Германская сторона представлена Государственной и университетской библиотекой Геттингена (SUB, Геттинген), Технической информационной библиотекой Ганновера (TIB, Ганновер) и Техническим университетом Берлина (ТU, Берлин).

Библиотеки участники проекта имеют возможность сотрудничества, так как они обладают наиболее полными фондами литературы по математике. В фондах немецких библиотек – партнеров математика занимает одно из главных мест. Причем TIB (Ганновер) с недавних пор поддерживает переводческим сервисом доступ к русской математической литературе. Оцифровывание печатных фондов русской математической литературы направлено на расширение и улучшение качества услуг, предоставляемых тремя библиотеками – участницами проекта.

ГПНТБ России является крупнейшей научно-технической библиотекой России. Ее фонд составляет более 8 миллионов единиц российской и зарубежной научной и технической литературы. ГПНТБ России является получателем Обязательного бесплатного экземпляра отечественной литературы. Поэтому имеет наиболее полные фонды. Все журналы, отобранные для реализации данного проекта имеются в фонде ГПНТБ России, начиная с первого года издания. ГПНТБ России занимает передовое место среди библиотек России в развитии компьютерных информационных технологий.

Электронный каталог ГПНТБ, который ведется с 1990 года, насчитывает свыше 300 тысяч записей. В ГПНТБ России поддерживается также Сводный каталог библиотек России и стран СНГ, существующий с 1987 года и насчитывающий около 500 тыс. записей.

Доступом к электронным информационным ресурсам через ГПНТБ России пользуются 250 тысяч зарегистрированных пользователей. Ежегодное обращение к электронным информационным источникам составляет примерно 3,4 млн. Общее число компьютеров в ГПНТБ России – 380 единиц. Читателям предоставляется 135 рабочих мест. Вебсервер ГПНТБ России регистрирует ежедневно 20 тысяч посещений.

ГПНТБ России имеет серьезный опыт работы в корпоративных библиотечных проектах – проекты LIBNET, LIBWEB. Библиотечно-информационная система ИРБИС, разработанная специалистами ГПНТБ России и внедренная в Библиотеке, пользуется спросом других библиотек. Предварительная экспертиза немецких специалистов показала, что ИРБИС хорошо совместим с зарубежными системами и может быть использован при разработке данного совместного проекта.

Российская Академия Наук всесторонне поддерживает данную инициативу и оказывает необходимую помощь в получении лицензий на сканирование от издателей. РАН издает ряд математических журналов, имеющих большую научную ценность и представляющих первоочередной интерес для создаваемого электронного архива.

Технический университет Берлина и журнал Zentralblatt Math, представляемые профессором Б. Вегнером, предоставляют для данного проекта библиографические данные и рефераты на английском языке, то есть снабжает проект необходимыми метаданными и позволяет, при формировании необходимых структур, обеспечить оперативный доступ к полнотекстовым публикациям. В дальнейшем возможно расширение масштабов проекта, так как профессор Вегнер является членом Комитета, занимающегося подготовкой проекта Глобальной Цифровой математической библиотеки.

Государственная и университетская библиотека Геттингена (SUB, Геттинген) располагает хорошо оснащенным центром оцифровывания, имеющим большой опыт работы. В частности SUB принимает участие в проектах DIEPER (Digitized European Periodicals) и ERAM. Библиотека имеет большую коллекцию математических изданий в области теоретических исследований, что позволяет библиотеке вести работу в области создания математической электронной коллекции. При разработке проекта может быть использован богатый опыт SUB в инсталляции и предоставлении в пользование цифровых библиотек.

Технической информационной библиотекой Ганновера (TIB, Ганновер) обращает особое внимание на формирование коллекции по прикладной математике и технике и имеет необходимые для оцифровывания фонды. TIB в течение многих лет отбирает и приобретает литературу стран Восточной Европы и снабжает пользователей не только копиями статей, а в случае необходимости также с переводами с русского языка. Здесь имеются высококвалифицированные специалисты для обработки русской литературы.

Принципиальные требования к проекту

Создаваемый цифровой архив должен быть легко доступен во всем мире. Каждая из трех библиотек – партнеров должна заботиться о надежной сохранности своей части коллекции и вести работу, направленную на улучшение доступа пользователей к электронному архиву. У всех партнеров должны быть организованы “зеркала” к коллекциям участников проекта.

Библиотеки-партнеры гарантируют, соответствие международным стандартам структуры РусЭМБ. Проект открыт для кооперации с аналогичными проектами и допускать расширение списка оцифрованных российских изданий по математике за счет получения электронных версий от других организаций. Для улучшения сервиса предоставления информации должны быть разработаны возможности поиска по тексту и связи от реферата к полному тексту.

Содержание проекта

Количество математических публикаций на русском языке велико. Поэтому они не могут быть охвачены в полном объеме в первом проекте. На первых этапах предлагается начать обработку журналов (около 120 наименований журналов), имеющихся в реферативных базах данных Zentralblatt Math и Математическом ежегоднике, содержащих сведения о наиболее значимых математических публикациях.

Основной список может корректироваться. Так, в фонде ГПНТБ России имеется ряд математических журналов, весьма полезных для архива, неотраженных в БД Zentralblatt Math. Они вошли в дополнительный список. Пополнение списка будет вестись в течение всего периода работы над проектом. При этом будут учитываться различные факторы:

То, что могут возникнуть разные интерпретации в определении вида издания, то есть, какие периодические публикации рассматриваются в качестве журнала.

Наличие журналов, начавших выпускаться в Советском Союзе, и являющихся теперь журналами новых независимых государств.

Наличие серий, которые в свое время издавались, затем прекращались и возобновлялись снова.

Рабочий объем и разделение обязанностей

Исходя из примерно 120 русских журналов, которые обрабатываются в Zentralblatt MATH и в Математическом ежегоднике, ГПНТБ и SUB сделали оценку общего количества страниц этих журналов. Это примерно 2 млн страниц. На основе имеющейся инфраструктуры сканирование статей должно проводиться равными частями в ГПНТБ и SUB. Объем сканирования для ГПНТБ составит примерно половину объема, то есть около 1 млн страниц. При этом особое внимание должно уделяться соблюдению единых форматов и принятию общих решений по другим вопросам. Для организации доступа статьи должны быть снабжены метаданными. Предоставление сведений на русском языке лежит на ГПНТБ, на английском языке – на SUB и TIB. Для организации структуры метаданных все 3 библиотеки должны прийти к общему соглашению.

Предоставление метаданных возложено на Технический Университет Берлина. Предоставление метаданных библиотекам-участницам проекта находится в компетенции главного редактора Zentralblatt Math и банка данных Математического ежегодника. Эти данные являются составной частью проекта и могут быть использованы еще до сканирования журнала. Для пользователей ядерного архива, которые читают русские тексты с трудом или совсем не могут пользоваться ими (что является особенностью для русского архива), предоставляются также рефераты на английском языке. Далее, для быстрого доступа, должны быть организованы “линки” к цифровым статьям из обоих банков данных. Каждая из библиотек – участниц проекта имеет возможность пополнять свою часть архива и предлагать свою часть архива самостоятельно.

На первом этапе окончательно формируется список журналов электронного математического архива. Список составляется в результате переговоров с издательствами и редакциями о возможностях предоставления лицензий на создание электронной версии журнала. Массивы сканирования распределяются между библиотеками-участницами проекта в ходе рабочих встреч и совещаний. При этом учитывается оснащенность техникой, наличие квалифицированных специалистов, а также наличие первоисточников в фондах библиотек. В результате этих встреч также разрабатываются планы сканирования на последующие годы. Для выработки единой технологии формирования и использования электронного математического архива и вырабатывается общая технология для организации архивной базы данных, связи с реферативными БД Zentralblatt Math и Математического ежегодника с целью обеспечения доступа к полнотекстовой информации.

Также проведена экспертная оценка совместимости программного технологического обеспечения. Проведена оцифровка экспериментального массива документов, в ближайшее время будет организован экспериментальный доступ к ним.

89




Скачать документ

Похожие документы:

  1. Исходя из примерно 120 русских журналов

    Документ
    ... зеркала” к коллекциям участников проекта. Исходяизпримерно120русскихжурналов, которые обрабатываются в Zentralblatt MATH ... Рабочий объем и разделение обязанностей Исходяизпримерно120русскихжурналов, которые обрабатываются в Zentralblatt MATH ...
  2. Русская философия Словарь / Под общ

    Документ
    ... работали всего 4 штатных научных сотрудника изпримерно 40 членов секции. В 1929 г. их ... рус. философии Якове-нко исходилиз тезиса, что "русский дух не жил еще ... и др.'В журнале был хорошо поставлен критико-библиографический отдел (ок. 120 рецензий как ...
  3. Русская философия Словарь / Под общ

    Документ
    ... работали всего 4 штатных научных сотрудника изпримерно 40 членов секции. В 1929 г. их ... рус. философии Якове-нко исходилиз тезиса, что "русский дух не жил еще ... и др.'В журнале был хорошо поставлен критико-библиографический отдел (ок. 120 рецензий как ...
  4. Олег Платонов ТЕРНОВЫЙ ВЕНЕЦ РОССИИ История русского народа в XX веке Том 1 (гл (2)

    Книга
    ... исходитьиз самой ткани русской души и русской истории, из ... русских. Всего было убито до 120 тыс. мирных русских ... потенциала крестьянского населения снизился примерно в 4 раза по ... Андропова. Репрессивные меры против русскихжурналов "Молодая гвардия" и ...
  5. Олег Платонов ТЕРНОВЫЙ ВЕНЕЦ РОССИИ История русского народа в XX веке Том 1 (гл (3)

    Книга
    ... исходитьиз самой ткани русской души и русской истории, из ... русских. Всего было убито до 120 тыс. мирных русских ... потенциала крестьянского населения снизился примерно в 4 раза по ... Андропова. Репрессивные меры против русскихжурналов "Молодая гвардия" и ...

Другие похожие документы..