Наиболее распространенными программными платформами архивов служат EPrints (EPrints Free Software), DSpace (DSpace Foundation), Fedora (Fedora Commons), Greenstone (New Zealand Digital Library Project), ETD-db (Virginia Tech University Libraries), CONTENTdm (OCLC) и другие.
Репозиторий проекта DSpace получил широкое освещение в новостях и литературе. Веб-страницы DSpace описывает проект как "новаторский цифровой институциональный репозиторий, который перераспределяет результаты интеллектуальных научных исследований факультетов университета в цифровом формате". DSpace разработана с открытым исходным кодом с грантом от HewlettPackard и созданной Федерацией университетов по совместной работе над проектом. В Федерацию входят Кембриджский университет, Колумбия, Корнелл, Массачусетский технологический институт, штата Огайо, Университет Рочестера, Университет Торонто и Университета штата Вашингтон. Научно-исследовательские учреждения по всему миру могут приобрести программное обеспечение DSpace бесплатно и любое учреждение может адаптировать ее к своим собственным потребностям.
Университет eScholarship репозиторий Калифорнии, часть Калифорнийской цифровой библиотеки, представляет факультеты (10 кампусов) с централизованным управлением и сдачей на хранение результатов исследований или научной продукции. Индивидуальные исследовательские центры и отделы определяют политику для принятия контента. Определение допустимого содержания находится в руках исследователей и преподавателей. Система использует ПО Berkeley Electronic Press с лицензией Калифорнийского университета.
В Великобритании, Консорциум научных библиотек университета (CURL) и Объединенной комитет по информационным системам (КНСО) создали проект SHERPA, чтобы создавать институциональные репозитории в исследовательских университетах Великобритании. Миссия университета Керла заключается в повышении способности исследовательских университетов делиться исследованиями на благо научных сообществ. КНСО направлен на поддержку преподавания, обучения, научных исследований и управления в высшем образовании за счет использования информационных и коммуникационных технологий. Хранилище данного проекта поддерживает цели обеих организаций.
На сегодняшний день, проанализировать ситуацию на мировом рынке институциональных репозиториев можно с помощью реестров репозиториев - глобальных сборщиков метаданных.
Некоторые крупные реестры OAI-совместимых (Open Archives Initiative) репозиториев:
1. Реестр открытых архивов: http://www.openarchives.org/
Register/BrowseSites.
2. Реестр репозиториев открытого доступа: http://roar.eprints.org/.
3. Каталог открытых репозиторив OpenDOAR / Directory of Open Access Repositories http://www.opendoar.org/.
4. Европейский реестр OAI-PMH совместимых репозиториев: http://www.openarchives.eu/home/home.aspx.
Практически все сотрудники высших учебных заведений занимаются научной работой. ВУЗы производят тысячи неопубликованных документов, множество технических отчетов, официальных и прочих материалов во всех без исключения областях науки и техники.
Учебные заведения дополнительно производят большое количество первичных цифровых материалов исследований в виде наборов данных (статистических, картографических и т.д.), мультимедийных данных, источниками которых могут быть радары, телескопы, спутники или даже фото- и видеохроника. Так же в учебных заведениях производится и распространяется программное обеспечение для моделирования, визуализации и другие механизмы выполнения или распространении научных исследований и их результатов.
Изучив и проанализировав наиболее популярные платформы для создания институционального репозитория, было принято решение о реализации университетского репозитория на платформе DSpace.
Система DSpace является результатом совместной разработки библиотеки Массачусетского технологического института и HewlettPackard Laboratories. Первоначальной целью разработчиков было построение открытого институционального архива для поддержки исследований Массачусетского технологического института.
DSpace располагает инструментами для загрузки, управления, распространения и описания цифровых материалов.
Эти инструменты включают в себя интегрированные подсистемы для различных представлений цифрового материала и связанных с ними метаданных, гибкие схемы метаданных, систему индексирования и поиска, систему архивного управления пакетами, инструмент для создания политик доступа и управления, систему генерации постоянных идентификаторов, и пр.
Для хранителей знаний, программное обеспечение с открытым исходным кодом имеет ряд важных преимуществ по сравнению с проприетарным программным обеспечением. Продукты с открытым исходным кодом разрабатываются на основе принципов свободного обмена идеями и ресурсами между участниками процесса разработки. Сообщества DSpace и Fedora использовали этот процесс для создания программной платформы, которая используется в более чем тысяче учреждений в ста странах мира.
В число учреждений, использующих систему DSpace входят как зарубежные (Мичиганский университет, Колумбийский университет, Массачусетский технологический институт, Северо-Западный университет Чикаго и пр.), так и отечественные высшие учебные заведения (Сибирский федеральный университет, Тверской государственный университет, Уральский федеральный университет, Белгородский государственный университет, Уральский государственный лесотехнический университет, Удмуртский государственный университет, Южно-Уральский государственный университет, Ярославский государственный университет и пр.).
Несмотря на техническую сложность, система DSpace прозрачна и понятна. Для хранения данных используется свободная СУБД PostgreSQL, ядро системы написано на языке Java и для его сборки и запуска используются свободные инструменты Java Development Kit, Apache ANT, Apache Maven и Apache Tomcat. DSpace работает со всеми стандартными для библиотечной сферы протоколами, такими, как стек протоколов Z39.50. Система может работать практически под любой операционной системой, в том числе и под открытыми системами UNIX и GNU/Linux.
Система DSpace обладает рядом уникальных, отсутствующих в альтернативных системах функций.
Первая особенность - полнотекстовый поиск. Система поддерживает извлечение данных из большого количества форматов файлов. Как правило, система работает с файлами PDF и после проведения процедуры индексации, позволяет производить поиск строки не только по метаданным, но и по данным - по содержимому файлов, прикрепленных к записям в электронном архиве.
Вторая особенность - открытость системы, и как следствие - расширяемость. Допустим, данные, загружаемые в систему имеют текстовое наполнение, но не имеют распознанного слоя (фотографии архива газет, карты, PDF файлы с изображениями). Не составляет большого труда модифицировать систему индексации текстового содержания, описанную выше, так, чтобы она использовала систему оптического распознавания символов (OCR), функционирующую на кластере. Таким образом, можно автоматически распознать надписи на картах, в нотных тетрадях, газетный текст и пр. информацию, по которой впоследствии можно будет производить поиск в электронном архиве.
Третья особенность - возможность обмена коллекциями между разными электронными архивами. Подобный функционал делает коммуникации в академической среде еще более быстрыми и удобными, стирая границы, а использование стандартных протоколов, позволяет строить большие гетерогенные архивы из систем DSpace и альтернативных решений.
Четвертая особенность - возможность регистрации пользователей с разными правами для доступа к разным типам данных. Подобный функционал очень полезен для обеспечения доступа определенного круга лиц к закрытой в силу специфики исследования информации, информации, защищенной авторским правом и пр.
Согласно проведенному анализу различных систем, для организации институционального репозитория была выбрана система DSpace. На рисунке 5 изображены процессы, обеспечивающие функционирование системы.
Веб-интерфейс позволяет автору легко добавлять файлы на хранение в репозиторий. В архиве могут быть размещены файлы любого формата (текстовые документы, базы данных, видео и т.д.). Сгруппированные файлы, связанные содержанием и описанием (метаданными), образуют Элемент архива. Метаданные Элемента архива индексируется для поиска и просмотра. Элементы архива организованы в коллекции логически связанных материалов. Объединение коллекций является самым высоким уровнем иерархии содержимого DSpace. Они соответствуют подразделениям университета, таким как отделы, кафедры, лаборатории, исследовательские центры.
Модульная архитектура архива позволяет создавать большие мультидисциплинарные хранилища, а интерфейс конечного пользователя поддерживает просмотр и поиск в архивах. Файлы, представленные веб-формате могут отображаться в веб-браузере в то время как другие форматы могут быть загружены и открыты подходящими прикладными программами.
Рисунок 5 - Диаграмма процессов DSpace
В продолжение работы планируется:
? выполнить описание структурных компонентов репозитория;
? определить технические требования к аппаратной части системы;
? определить необходимый набор программного обеспечения для сборки и запуска системы;
? определить набор реквизитов к каждому формату документа для хранения, индексации и обеспечения быстрого поиска документа в репозитории.
Список литературы
1. Федеральный закон от 20 июля 2004 г. N 72-ФЗ "О внесении изменений в Закон Российской Федерации "Об авторском праве и смежных правах".
2. Будапештская инициатива "Открытый доступ" / Budapest Open Access Initiative. [Электронный ресурс]. URL: http://www.budapestopenaccessinitiative.org/ (дата обращения: 13.09.2013).
3. Берлинская Декларация об открытом доступе к научному и гуманитарному знанию / Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities. [Электронный ресурс]. URL: http://www.zim.mpg.de/openaccess-berlin/berlin_declaration.pdf (дата обращения: 13.09.2013).
4. Волкова Л.М., Креймер А.С. Институциональный репозиторий: автоматизация исследовательской деятельности университета // Инновации в науке /Сб. ст. по материалам XХX межднар. науч.-практ. конф. № 2 (27). Часть I. Новосибирск: Изд. "СибАК", 2014. с. 82-89.
5. Зайцева Т.Н. Институциональный репозиторий университета "Хазар": открытый доступ к научным публикациям. [Электронный ресурс]. URL: http://www.gpntb.ru/libcom10/disk/9.pdf (дата обращения: 13.09.2013).
6. Земсков А.И., Шрайберг Я.Л. Системы открытого доступа к информации: причины и история возникновения // Научные и технические библиотеки. - 2008. - №8.
7. Международная Федерация библиотечных ассоциаций и учреждений / International Federation of Library Associations and Institutions (IFLA). [Электронный ресурс]. URL: http://www.ifla.org/ (дата обращения: 15.09.2013).
8. Новицкий А.В., Резниченко В.А., Проскудина Г.Ю. Создание научных архивов с помощью системы EPrints // Российский научный электронный журнал "Электронные библиотеки". [Электронный ресурс]. URL: http://www.elbib.ru/index.phtml?page=elbib/rus/journal (дата обращения: 15.09.2013).
9. Шрайберг Я.Л., Земсков А.И. Модели открытого доступа: история, виды, особенности, терминология // Научные и технические библиотеки. - 2008. - №5.
10. Abadal E. and others. The Situation of Institutional Repositories in Spain. [Электронный ресурс]. URL: http://www.accesoabierto.net/sites/accesoabierto.net/files/abadal_edrene2010.pdf (дата обращения: 15.09.2013).
11. Branin, Joseph, "Institutional Repositories". Encyclopedia of Library and Information Science, Forthcoming May, 2004. [Электронный ресурс]. URL: http://www.dekker.com (дата обращения: 15.09.2013).
12. Campaign for Free Access // RTD Info (Magazine on European Research). - 2005. - November (Special issue). - P. 11-12.
13. Crow, Raym, The Case for Institutional Repositories: A SPARC Position Paper // Scholarly Publishing and Academic Resources Coalition, 2002. [Электронный ресурс]. URL: http://www.arl.org/SPARC/IR/ir.html (дата обращения: 15.09.2013).
14. Digital Curation Centre. "What is Digital Curation?" [Электронный ресурс]. URL: http://www.dcc.ac.uk/about/what/ (дата обращения: 15.09.2013).
15. DuraSpace. [Электронный ресурс]. URL: http://en.wikipedia.org/wiki/DuraSpace (дата обращения: 15.09.2013).
16. Fedora Commons and DSpace Foundation Join Together to Create DuraSpace™ Organization. [Электронный ресурс]. URL: http://duraspace.org/node/710 (дата обращения: 15.09.2013).
17. Higgins S. The DCC Curation Lifecycle Model // The International Journal of Digital Curation. - 2008. - Issue 1. - Vol. 3. - P. 138.
18. HP and MIT Create Non-profit Organization to Support Growing Community of DSpace Users. [Электронный ресурс]. URL: http://www.hp.com/hpinfo/newsroom/press/2007/070717a.html (дата обращения: 15.09.2013).
19. Johnson, Richard, "Institutional Repositories: Partnering with Faculty to Enhance Scholarly Communication." D-Lib Magazine, November, 2002. [Электронный ресурс]. URL: http://www.dlib.org/november02/johnson/11johnson.html (дата обращения: 15.09.2013).
20. Li Rui. Correlation of Impact Measures of Institutional Repositories and PBRF Ranking. [Электронный ресурс]. URL: http://hdl.handle.net/10063/1648 (дата обращения: 15.09.2013).
21. Lynch, Clifford, "Institutional Repositories: Essential Infrastructure for Scholarship in the Digital Age" ARL Bimonthly Report 226, February 2003 // Association of Research Libraries. [Электронный ресурс]. URL: http://www.arl.org/newslet/226/ir.html (дата обращения: 15.09.2013).
22. Marginson S. Nation-Building Universities in a Global Environment: The Case of Australia // Higher Education. - 2002. - No 43 (3). - P. 409-428.
23. Nixon W.J. DAEDALUS, Initial experiences with EPrints and DSpace at the University of Glasgow. [Электронный ресурс]. URL: https://dspace.gla.ac.uk/bitstream/1905/197/1/initial_experiences_eprints_dspace.pdf (дата обращения: 15.09.2013).
24. Noorhidawati A.A., Kiran K. Global Visibility of Asian Universities' Open Access Institutional Repositories // Malaysian Journal of Library & Information Science. - 2010. - Vol. 15. - No 3. - P. 53-73.
25. Pomerantz J., etc. Comparing Curricula for Digital Library and Digital Curation Education // Digital Curation: Practice, promise & prospects: Proceedings of DiCCurr2009 / Helen R. Tibbo, Carolyn Hank, Christopher A. Lee, Rachael Clemens. - April 1-3, 2009. -University of North Caroline at Chapel Hill, NC USA.- P. 2-3.
26. Smith M. DSpace: An Institutional Repository from the MIT Libraries and Hewlett Packard Laboratories / M. Smith // Lecture Notes in Computer Science. [Электронный ресурс] URL: http://dspace.mit.edu/bitstream/handle/1721.1/26706/Smith_2002_DSpace.pdf?sequence=1 (дата обращения: 15.09.2013).
27. Why Open Source? [Электронный ресурс]. URL: http://duraspace.org/why_open_source (дата обращения: 15.09.2013).
References
1. Federal'nyj zakon ot 20 ijulja 2004 g. N 72-FZ "O vnesenii izmenenij v Zakon Rossijskoj Federacii "Ob avtorskom prave i smezhnyh pravah".
2. Budapeshtskaja iniciativa "Otkrytyj dostup" / Budapest Open Access Initiative. [Jelektronnyj resurs]. URL: http://www.budapestopenaccessinitiative.org/ (data obrashhenija: 13.09.2013).
3. Berlinskaja Deklaracija ob otkrytom dostupe k nauchnomu i gumanitarnomu znaniju / Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities. [Jelektronnyj resurs]. URL: http://www.zim.mpg.de/openaccess-berlin/berlin_declaration.pdf (data obrashhenija: 13.09.2013).