Навигация
   БИБЛИОСФЕРА. 2012. СПЕЦВЫПУСК (МАТЕРИАЛЫ КОНФЕРЕНЦИИ). С.20-23
 
Журнал Библиосфера
УДК 02:004-028.22
ББК 78.023+78.349.3
 
ОСНОВЫ РАЗРАБОТКИ СИСТЕМЫ ПОКАЗАТЕЛЕЙ
ДЕЯТЕЛЬНОСТИ БИБЛИОТЕЧНОГО ВЕБ-САЙТА
 
© С. К. Канн, 2012
 
Государственная публичная научно-техническая библиотека
Сибирского отделения Российской академии наук
630200, г. Новосибирск, ул. Восход, 15
 
Обсуждаются подходы к формированию системы статистических показателей библиотечного сайта, позволяющих отследить его внутреннюю динамику и сопоставить с показателями других сайтов. Предлагаются меры по развитию библиотечной веб-аналитики и комплексной оценке деятельности библиотечных сайтов.
 
Ключевые слова: электронные библиотеки, библиотечный сайт, статистический мониторинг, веб-аналитика.
 
The report discusses approaches to creating the system of statistical indecators for a library website to track their inner dynamics and to compare it with indicators of other sites. Measures are suggested to develop library web-analytics and to make a comprehensive assessment of library sites.
 
Key words: electronic libraries, library site, statistical monitoring, web-analytics.
 

Современную ситуацию в библиотечном деле называют по-разному - кризисной, переломной, революционной... Все чаще библиотекарям приходится отвечать на трудные вопросы о будущем традиционных библиотек: Что с нами происходит? Что и, главное, как делать? Как это ни трудно, приходится быстро меняться, меняя вместе с этим и окружающий мир.

Интернет ежедневно берет на себя все новые и новые функции, еще недавно принадлежавшие исключительно библиотекам. Все инновации последнего времени: модные «библиобусы» и мобильные КИБО* (комплексы информационно-библиотечного обслуживания), модернизация традиционно-предметной деятельности библиотек - не могут отменить наступление виртуальной эры электронного чтения и электронного знания.

Создание библиотечных сайтов - лишь первый и, в значительной степени, стихийный шаг на пути в цифровое будущее, не только неведомое, но и непредсказуемое. Хочется надеяться, что стремительному движению вперед будут приданы максимально сознательные формы, например, в сфере библиотечного сайтостроения.

Обзор большого количества библиотечных сайтов, а также публикаций в профессиональной печати убеждает в том, что библиотечной веб-статистике и аналитике, без которых сознательное сайтостроение попросту невозможно, уделяется недостаточное внимание. В лучшем случае этим занимаются технические специалисты, обслуживающие «железо» и заинтересованные в определении критической нагрузки на сервер.

Что касается информационных работников (контент-менеджеров, а также собственно библиотечных специалистов), то большинство из них все еще далеки от названной темы. Относительные успехи веб-аналитиков в области интернет-маркетинга и рекламы обусловлены жесткими реалиями экономического выживания и необходимостью оптимизировать каналы извлечения прибыли.

«Веб-аналитика - молодая отрасль не только в странах СНГ, но и в мире в целом» [1]. Тем не менее уже существует ряд международных организаций, активно формирующих стандарты исследований и развивающих проблематику веб-анализа, например, DAA - Digital Analytics Association (бывшая Web Analytics Association). Осенью 2008 г. DAA предложила официальное определение понятия «веб-аналитики» как отрасли по «измерению, сбору, анализу и представлению интернет-данных в целях понимания и оптимизации использования Интернета» [2]. Именно в таком виде формулировка вошла в англоязычное издание Википедии, но в отечественной Википедии слова «в целях понимания... (for purposes of understanding...) заменили на фразу «с целью улучшения», существенно исказив смысл нормативной формулировки DAA.

В действительности, существующие статистические средства и подходы к изучению веб-среды только на то и направлены, чтобы хоть как-то разобраться в сложнейших метаморфозах «всемирной паутины» (при этом, конечно, никто не против внедрения всяческих «улучшений»). Но без серьезного понимания эволюционных процессов, происходящих в Сети, дальнейшее развитие знания невозможно. Следовательно, веб-аналитика, опирающаяся на широкое применение статистических методов, становится чрезвычайно важной как для современной информационной науки, так и для библиотековедения как ее части.

Отсутствие единства понимания статистики не сближает, а отдаляет библиотечные сайты друг от друга. На наш взгляд, потребности сопоставления данных, учета текущего прогресса или регресса сайтов, регулярной отчетности учреждений в рамках управленческих взаимодействий, а также многие другие обстоятельства неизбежно ведут к:

  • унификации используемой терминологии,
  • применению единообразных средств веб-статистики,
  • однозначной трактовке показателей (так называемых е-метрик).

Согласованная терминология, общие критерии сбора веб-статистики и унифицированные инструменты веб-анализа повысят эффективность управления библиотечными сайтами, укрепят взаимодействие в рамках единой информационной сети и создадут условия для совершенствования глобального разделения труда в сфере новых информационных технологий.

Формирование системы показателей библиотечных сайтов, позволяющей отследить их внутреннюю динамику и сопоставить разные веб-метрики предлагается начать с установления более или менее единообразной терминологии. Решение этой задачи имеет особую актуальность в связи с повсеместным развитием электронных библиотек.

Несмотря на относительно протяженный период существования библиотечного Интернета, до сих пор существует путаница в понимании понятий «сервер» и «сайт», «хит» и «страница», «доступ» и «посещение», «просмотр» и «визит». Немаловажно, что по своей технической структуре, организации контента и прочим исторически сложившимся характеристикам сайты весьма индивидуальны, и это также не может не отражаться на терминологии, применяемой при описании их деятельности. Сблизить понимание предмета могут профессиональные дискуссии на библиотечных форумах и страницах печати.

Разный инструментарий, которым оснащены библиотечные сайты, разнообразные настройки программного обеспечения не только не гарантируют точности измерений, но и не способны обеспечить простой сопоставимости результатов. Многолетний опыт показывает, что погрешности данных статистики могут достигать и 15, и даже 30%.

Если бы появилась возможность оснастить библиотечные сайты унифицированными статистическими программами (модулями), смонтированными по единой методике на серверах библиотек, входящих в консорциумы, то это в серьезной степени могло бы нивелировать статистические погрешности и предоставить всем желающим унифицированный экспериментальный материал для сопоставлений и выводов.

Сбор и интерпретация статистических данных осложняются рядом ограничений, связанных: с техническими особенностями сети и конкретных сайтов, множественностью подходов к сбору статистики, наличием широкого спектра средств мониторинга и неопределенным (размытым) характером рассматриваемых показателей. Казалось бы, для целей унификации и сопоставления данных можно довериться системам «баннерной» статистики, образующим популярные рейтинги (Mail.ru, Rambler's Top100 (рис.1), OpenStat - бывший Spylog, HotLog).

Rambler's Top100
 
Рис.1. Страница посещаемости сайта отделения ГПНТБ СО РАН
 
в проекте Rambler's Top100.
 

Утверждается, что в их основе лежат единые критерии и единообразно понимаемые «соревновательные» правила. Однако при ближайшем рассмотрении обнаруживается, что счетчики этих проектов нередко измеряют не реальную посещаемость ресурсов, а, вероятнее всего, технические условия доступа к сетям, особенности маршрутизации трафика и функционирования сайтов.

Наиболее дискуссионными проблемами, на наш взгляд, являются количественная и качественная стороны библиотечной веб-аналитики.

Количественная сторона библиотечной веб-аналитики задается вопросами: Какие количественные показатели считать первостепенными, а какие менее существенными, в какой степени можно им доверять? Чем отличаются подходы к веб-аналитике в коммерческом секторе, веб-маркетинге и рекламе (показатели «отказов», «вовлеченности», «конверсии» и пр.) и секторе некоммерческом (библиотечном)?

По нашему мнению, показатель «уникальных посетителей» принципиально важен именно потому, что в значительно меньшей степени подвержен искажению со стороны автоматических средств индексации (роботов), чем цифра «обращений к страницам». Показатель «величины перекачки» тесно связан как с размерами индексации сайтов, так и с «тяжестью» размещенных на них файлов, поэтому принципиально важно публиковать количественные данные о размерах сайтов, об их файловой структуре и наполнении, чего практически никто не делает. Это также важно делать из-за прямой зависимости между количеством документов, представленных на сайте, и количеством обращений к ним, что требует вычисления особых «коэффициентов обращений» для сопоставления разнородных ресурсов.

С точки зрения качественной стороны дискуссионным остается вопрос об учете статистики роботов, так как очевидна прямая связь между индексированием сайта и популярностью («продвижением») ресурсов, веб-репутацией и посещаемостью страниц. Большой интерес для анализа содержательной стороны сайтов представляет и массив поисковых запросов, генерируемый поисковиками в результате предварительного индексирования документов. Не будем забывать также и о том, что роботы создают кэшированные копии страниц, дополняя возможности прямого обслуживания пользователей оригинальными страницами сайта.

Особый интерес вызывает отношение к иллюстративной информации и мультимедиа файлам (звуку, видео), так как в электронных библиотеках они являются существенным компонентом обслуживания и присутствуют в поисковых запросах и выдачах. Исключив из анализа статистику «картинок», мы рискуем потерять много значимой информации. Напомним, что многие электронные библиотеки предоставляют сканированные издания в форматах JPG или PNG. Из этого следует, что особенности учета медиафайлов представляют собой достаточно актуальную проблему.

Своего обсуждения и решения ожидают многие другие вопросы, как то:

  • сведение воедино статистических показателей и создание комплексных отчетов по технологически разнородным информационным ресурсам (статическим документам и динамическим каталогам, базам данных);
  • изучение особенностей использования типологически разных электронных ресурсов (веб-навигаторов, библиографий, полнотекстовых материалов);
  • критерии эффективности управления библиотечными сайтами и др.

Наши предложения следующие. Во-первых, необходимо усилить внимание к развитию библиотечной веб-аналитики и веб-метрики, причем не только со стороны количественных показателей создания и использования информационных ресурсов, структур и технологий, но и со стороны их качественных характеристик. Регулярный анализ качественных показателей использования электронных ресурсов (веб-метрик) позволит более эффективно приспосабливать работу интернет-библиотекарей к быстро меняющимся условиям веб-среды и возможной смене парадигмы информационной деятельности.

Во-вторых, при оценке деятельности библиотечных сайтов следует учитывать оснащение электронных библиотек современными инструментами веб-анализа и представление подробных статистических отчетов для всеобщего ознакомления. Желательно, чтобы инструменты статистики носили унифицированный (как, например, система автоматизации библиотек ИРБИС) или хотя бы нормативно рекомендованный характер (из свободно распространяемого софта). На данный момент вполне приемлемой для этих целей является статистическая система AWStats, функционирующая на основе лицензии GNU General Public License. Последняя стабильная версия программы (7.0), которая монтируется на библиотечном сервере, появилась в декабре 2010 г., новая бета-версия 7.1 - 30 декабря 2011 г. Официальный сайт программы - http://awstats.sourceforge.net.

Наконец, обозначилась потребность в создании постоянной площадки для обмена опытом в области библиотечной веб-статистики и аналитики, публикации материалов, обзоров и консультаций по названной проблематике. Трибуной для выступлений могли бы стать специализированные секции на регулярно проводимых конференциях Российской библиотечной ассоциации (РБА), Национального информационно-библиотечного центра ЛИБНЕТ, Ассоциации региональных библиотечных консорциумов (АРБИКОН) и других библиотечных организаций, а также соответствующие рубрики или разделы в профессиональных изданиях («Научные и технические библиотеки», «Библиосфера» и пр.).

 *
 
«Кибо» (япон.) означает «надежда» (Прим. автора).

 

Литература
 1.Веб-аналитика // Википедия - свободная энциклопедия. - URL: http://ru.wikipedia.org/wiki/Веб-аналитика (дата обращения: 20.09.2012). 
2.Web Analytics Association Web Analytics Definitions - Draft for Public Comment 9/22/2008. Page 3. - URL: http://www.digitalanalyticsassociation.org/resource/resmgr /PDFstandards/WebAnalyticsDefinitions.pdf (дата обращения: 20.09.2012).

Сведения об авторе:Канн Сергей Константинович - кандидат исторических наук, старший научный сотрудник лаборатории информационных ресурсов отделения ГПНТБ СО РАН, тел.: (383) 330-79-66, e-mail: serge@prometeus.nsc.ru
 
БИБЛИОСФЕРА (ISSN 1815-3186)ПубликацииПубликации С.Канна  
[О библиотеке | Академгородок | Новости | Выставки | Ресурсы | Библиография | Партнеры | ИнфоЛоция | Поиск | English]
  Пожелания и письма: www@prometeus.nsc.ru
© 1997-2017 Отделение ГПНТБ СО РАН (Новосибирск)
Статистика доступов: архив | текущая статистика
 

Документ изменен: Wed Apr 13 17:29:35 2016. Размер: 20,530 bytes.
Посещение N 2239 с 25.02.2013