Создатели сайтов с диверсифицированным библиотечным контентом всегда стремились привлекать к своим ресурсам качественную профильную аудиторию пользователей. Эта цель наиболее полно отражает предназначение библиотек в новую информационную эпоху. На сайте Научной библиотеки Томского политехнического университета дана исчерпывающая формулировка цели, к которой следует стремиться: «Миссия библиотеки, - пишут авторы, - заключается в том, чтобы предоставить каждому пользователю качественный и эффективный доступ к любым информационным ресурсам, которые способствуют их образовательной, научной и профессиональной деятельности, к записанной мудрости, опыту и идеям других..» [1]. Однако гарантировать упомянутый качественный и эффективный доступ наиболее заинтересованному контингенту пользователей необычайно трудно. Причина кроется в том, что трафик библиотечного сайта отличается сложной комплексной природой и более чем на 85% формируется ботами. Если меньшую часть из них можно считать условно полезной для продвижения библиотечных ресурсов, то остальные носят откровенно деструктивный характер - ухудшают репутацию сайта, угнетают показатели посещаемости, снижают результативность работы, искажают статистику. Безотносительно к целям создания ботов, темпы их выхода в интернет в последние годы значительно возросли. Подавляющая часть ботов используется для нелегальной или неодобряемой деятельности - DDoS-атак, перебора паролей, генерации спама. Вдобавок, возник и новый бизнес по майнингу криптовалюты. С.Ю.Комаров называет внешний трафик библиотечных сайтов, ориентированный на технологии вирусного SEO и неприемлемый контент (порнографию и пр.), негативным трафиком, предлагая исключать его из итоговой статистики и аналитики академических библиотек [2, с.128-129]. Действенным средством очищения веб-статистики от реферального спама является фильтрация внешнего трафика на уровне сервера с помощью стоп-листа .htaccess, куда вносятся IP-адреса самых активных спам-ботов. Проверка и оценка этой меры на практике проводилась на сайте Отделения ГПНТБ СО РАН prometeus.nsc.ru с февраля по декабрь 2017 г. Рабочая гипотеза состояла в том, что эффекты количественного уменьшения внешнего трафика, вызванные фильтрацией спам-адресов, должны компенсироваться качественным ростом ключевых показателей сайта (KPI - key performance indicators). Основные результаты исследования отражены в Таблицах 1 и 2. В первой колонке обеих таблиц приводится конкретная дата, на которую производилось расширение списка блокировки спам-ботов (файла .htaccess) и фиксация метрик посещаемости.
Во 2-й колонке указано количество IP-адресов, внесенных в блок-лист на соответствующую дату первой колонки. В остальных колонках Таблицы 1 представлены данные по посещаемости сайта с накоплением за предыдущий период, начиная с 01.01.2017 г. Они позволяют сопоставить два ряда метрик, полученных от двух систем веб-аналитики сайта prometeus.nsc.ru - Яндекс-Метрики (установлена в 2011 г.), и Google Analytics (2016). Сравнение «доблокировочного» периода (8.04.2016-5.02.2017) с тестовым (6.02.2017-8.12.2017), примерно одинаковым по продолжительности (около 305 дней), обнаруживает падение всех количественных показателей в среднем на 25%. При этом по просмотрам и пользователям больше упала Яндекс-Метрика, а по визитам (сеансам) - Google Analytics. Вместе с тем, увеличение списка блокировки отчетливо обнаруживает эффект сближения метрик обеих систем вплоть до их полного совпадения (см. Табл.1). В течение всего 2017 года показатель просмотров по GA колебался в узком диапазоне 98,32 - 99,66% от данных Я-М. Ряд метрик различается на несколько десятков или сотен единиц. Так, на 3.04 разница по визитам между GA и Я-М составила всего лишь 15 (!).
В Таблице 2 можно проследить некоторые положительные эффекты фильтрации реферального спама. Показатель «новых посетителей» устойчиво растет в течение всего года - как по GA (87,9-88,9%), так и по Я-М (95,5-99,2%). Для информационного сайта с универсальным политематическим контентом это явление можно считать нормальным, хотя было бы неплохо, чтобы и количество возвращающихся посетителей тоже не уменьшалось. Зато видна положительная тенденция на снижение уровня отказов как по GA, так и по Я-М. Сначала этот показатель слегка нарастал (до 79,78% по GA и до 78,7% по Я-М), но по мере расширения списка блокировки - с 2,5 тыс. до 6 тыс. IP-адресов - начал устойчиво падать и к декабрю достиг 78,32% по GA и 77% по Я-М. Одновременно выросла и глубина просмотра страниц, снижавшаяся весной. К концу года она составила 1,89 по GA и 1,91 по Я-М (см. Табл.2). Выводы. Таким образом, ограничение влияния реферальных спам-ботов на трафик библиотечного сайта выявила следующие эффекты фильтрации:
|
[О библиотеке
| Академгородок
| Новости
| Выставки
| Ресурсы
| Библиография
| Партнеры
| ИнфоЛоция
| Поиск
| English]
| |||
| |||