Академический сервис
Академический (научный) сервис
Компьютерные технологии открывают новые возможности для
общественных наук, стимулируют развитие новых направлений, прежде всего –
прикладных исследований в области экономики, социологии, политологии,
международных отношений. Системный анализ экономических, социальных,
политических процессов в стране и на фоне мировых тенденций, мониторинг и
сравнительный анализ регионов, муниципалитетов, домохозяйств представляют не
только научный, но и возрастающий общественный интерес. Подобные исследования
требуют формирования современной информационной базы, создание которой
стало одной из задач научного сообщества.
Учитывая, что поддержание полноценной информационной
базы для гуманитарных исследований - долговременный, трудоемкий и
дорогостоящий процесс, мировая практика выработала новую форму организации
информационной поддержки научной деятельности - создание коллективной
информационной инфраструктуры для национального научного сообщества, где
каждый участник специализируется по выбранному направлению и формирует
тематический ресурс с учетом потребностей целевой аудитории. Одновременно в
рамках коллективных структур выполняется комплекс работ по предварительной
технической и содержательной предобработке документов и данных,
переводу в форматы, удобные для анализа. Этот комплекс работ обеспечивает
дополнительную функциональность ресурсов – академический сервис – и
экономит время исследователя на этапе поиска, обработки, организации
информации и предварительного анализа, ибо растущие объемы информации
привели к тому, что, по данным нескольких обследований, более половины
времени исследователя уходит на поиск и предварительный просмотр
документов.
Как правило, коллективные структуры создаются на базе
крупных университетов как специальное подразделение из квалифицированных
специалистов. Тенденция последнего времени – включение в работы небольших
научных коллективов, поддерживающих качественные информационные ресурсы по
своей тематике. Основные направления деятельности коллективных структур - а) целенаправленное формирование ресурса - определение информационных потребностей целевой аудитории, изучение и подбор источников, заключение соглашений с правообладателями, получение и хранение электронных коллекций; б) техническая предобработка данных и документов, перевод коллекций в форматы, удобные для исследований; в) содержательная предобработка документов с использованием тематических классификаторов, тезаурусов и других инструментов.
Университетская информационная система РОССИЯ –
коллективный ресурс для исследовательских проектов и образовательных
программ в области экономики, социологии, права, филологии, журналистики,
международных отношений и других общественных наук.
В системе представлено более 60 источников, базовый список которых был
составлен экспертами – экономистами и социологами. Все коллекции получены
бесплатно на основе Соглашений о сотрудничестве с правообладателями.
Круг дополнительных информационных массивов определяется с учетом предложений
пользователей ресурса, анкетирование которых проводится ежегодно.
В текущей версии УИС РОССИЯ содержит около
700.000 документов. Общий объем базы превышает 16 Гбайт при среднем
уровне ежедневного обновления 1,5 Мбайт. Система поддерживается как
интегрированный ресурс с развитым поисковым механизмом. В дополнение к
традиционным средствам предоставляется возможность тематического поиска
документов:
- по нескольким рубрикаторам;
- по Тезаурусу по общественно-политической тематике, в том числе с
функцией навигации по связям Тезауруса для уточнения запроса;
- сквозной поиск по всем коллекциям.
Для каждой коллекции предусмотрена функция поиска с
использованием специфических атрибутов документов
(например, для коллекции “Стенограммы заседаний Государственной Думы” – по
фамилии депутата и по вопросу повестки дня).
В рамках проекта осуществляется поддержание и развитие
предметно-ориентированных ресурсов – баз данных “Статистика России” и
“Бюджетная система РФ”, интегрированных в УИС РОССИЯ.
Порядок включения дополнительных коллекций, а также
направления разработки и развития предметно-ориентированных ресурсов
определяется Экспертным советом проекта. Решения принимаются с учетом
возможностей коллектива.
Дополнительные элементы пользовательского сервиса,
предоставляемые в рамках УИС РОССИЯ, включают в себя:
- просмотр аннотаций на документы;
- функцию импорта статистических таблиц, в том числе содержащихся в
аналитических докладах и научных изданиях, в формате Microsoft Excel;
- гиперссылочный доступ из текста статистических и аналитических
материалов к соответствующим методологическим пояснениям (в полном и
сокращенном варианте), а также терминам Глоссария;
- визуализацию статистических данных;
- представление данных региональной электоральной статистики на
интерактивной карте-схеме;
- обновление типовых пользовательских запросов в автоматическом режиме.
Дополнительная функциональность УИС РОССИЯ обеспечивается
за счет технической и содержательной предобработки электронных версий
документов на входе в систему. Для автоматизации процедур разработан
комплекс программ-конверторов, обеспечивающих:
- перевод данных, поступающих их разных источников, в единообразный формат
хранения;
- библиографическую обработку источников (краткая форма);
- библиографическую обработку документов и статистических таблиц, приписывание библиографического описания источника к каждому документу.
На следующем этапе обработки производится содержательный
анализ документов и данных на базе комплекса лингвистических процессоров
(технология АЛОТ). В автоматическом режиме производится:
- систематизация/классификация документов по Тезаурусу и нескольким
рубрикаторам;
- рубрицирование статей научных изданий дополнительно по рубрикаторам ГРНТИ (Государственный рубрикатор научно-технической информации) и JEL (Journal of Economic Literature);
- аннотирование полнотекстовых документов;
- терминологический анализ и индексирование по Тезаурусу заголовков
статистических таблиц и названий показателей.
Специальный комплекс работ выполняется для статистических
коллекций. В автоматизированном режиме при участии оператора осуществляется
конвертация табличных данных в формат MS Excel, сопоставление документам
соответствующих разделов Методологических пояснений и Глоссария, привязка
электоральной статистики к карте выборов.
В течение 2003 года ежегодные статистические публикации
Госкомстата России “Регионы России” (март-апрель) и “Демографический
ежегодник России” (апрель-май) будут переведены в формат
реляционной базы данных, обеспечивающей дополнительные аналитические
возможности - формирование сводных таблиц на основе пользовательского
запроса и визуализацию показателей во временном и территориальном разрезе.
Предполагается также создать комплекс он-лайновых сервисов, в том числе
визуальный анализ данных, расчет вторичных переменных с использованием
встроенных функций, сценариев и открытой пользовательской формы, а также
отображение данных на карте-схеме в разрезе субъектов Российской Федерации
и федеральных округов.