Обновления в gemiusTraffic: Система интернет-статистики теперь не только считает статистику по факту, но и прогнозирует ее!
2007-06-30
Прогнозные значения посещаемости сайта (по числу посетителей и просмотров страниц) можно теперь увидеть непосредственно в интерфейсе владельца аккаунта gemiusTraffic. Например, заглянув в свою статистику сегодня, вы сможете узнать, какое по прогнозу число пользователей (cookies) и просмотров страниц будет к концу дня, недели, а также всего месяца. Прогнозы базируются на данных за последний час/день и на архивных данных по данному сайту и вычисляются одновременно с основными данными.
Методика
Алгоритм прогнозирования основан на том, что трафик на каждом сайте имеет примерно одинаковые характеристики – но под этим не подразумеваются абсолютные числовые величины, а скорее общий график, например, пики числа пользователей (cookies) в определенные часы дня, дни недели, дни месяца.
Для выведения прогнозных показателей мы основываемся на:
- текущей статистике по трафику (числовые величины), рассчитанной до времени, для которого ведется расчет,
- и на графике среднего трафика для соответствующего периода времени на данном сайте в предыдущих периодах.
Упрощенно, алгоритм расчета таков: допустим, 14 мая до 11 утра на сайте было засчитано 6 000 посетителей (cookies). Исходя из графика среднего трафика (вычисленного на основе распределения в предыдущих периодах для этого сайта), к 11 утра сайт должно было посетить 20% интернет-пользователей (cookies) от значения за весь день. Таким образом, к 11 утра прогноз по числу посетителей (cookies) на конец дня составляет 30 000.
Технические подробности
Прогнозные значения числа посетителей и просмотров страниц в gemiusTraffic могут определяться как для всего сайта, так и для каждого отдельно скрипта (страницы сайта) или раздела. Данные могут быть представлены для страниц или разделов, удовлетворяющих следующим условиям: посещаемость такой страницы (раздела) за предыдущий месяц – не менее 5000 cookies, и за месяц до него – также не менее 5000 cookies. Соответственно, подобная статистика не доступна для страниц (разделов), созданных менее 2х месяцев назад – потому как в каждом из трех анализируемых периодов (дни, недели, месяцы) должны присутствовать данные за 2 предыдущих периода. Алгоритм способен эффективно предсказывать посещаемость страниц сайта, при условии, что в данный период не проводится никаких рекламных кампаний или акций, так как такие действия способны вызвать серьезные краткосрочные колебания тренда. Для того, тчобы подтвердить корректность работы алгоритма прогнозирования gemiusTraffic, нами был проведен ряд тестов:
- Тесты проводились по отдельности для трех групп сайтов: имеющих небольшой трафик за единицу времени (10 000 - 50 000 пользователей (cookies)), средний трафик (50 000 - 300 000 пользователей (cookies)) и большой трафик (более 300 000 пользователей (cookies)).
- Каждая из групп, определенных выше, состояла из 300 сайтов, отобранных в случайном порядке из базы исследования gemiusTraffic.
- Тесты были проведены отдельно для статистики по дням, неделям, месяцам.
- Тесты заключались в сравнении полученных прогнозных значений и фактического числа посетителей (cookies) и просмотров страниц, зафиксированного в исследовании gemiusTraffic по окончании анализируемого периода. Прогнозы рассчитывались на каждую временную долю, составляющую для дней – 15 минут, для недель – каждый час, для месяцев – каждые 8 часов.
- Полученные в результате сравнения величины в идеале должны быть близки к единице, что покажет идентичность прогноза по отношению к фактическим величинам.
- Согласно этим значениям, должны быть получены последовательности чисел, независимые для проанализированных групп сайтов и для каждого периода. Для всех последовательностей должны быть высчитаны средняя величина (µ) и стандартное отклонение (σ). Анализ таких результатов позволяет оценить корректность прогнозов.
Как видно, значения среднего прогноза практически не отличаются от фактических данных. Величина среднеквадратического отклонения (в идеале должно стремиться к нулю) также находится в стандартных статистических рамках – только 1,64% всех данных могут быть признаны исключениями, прогнозы для которых оказались некорректными.
Очевидно на результаты здесь повлияли объективные изменения, связанные с самими сайтами – например, проведение рекламных кампаний или редизайн самого ресурса.
Тем не менее, тесты со всей определенностью показали полное соответствие прогнозов реальным данным статистики посещаемости: в 63% случаев среднеквадратическое отклонение составило даже менее 0.1.
Скачать полную версию пресс-релиза в формате MS Word
Для дополнительной информации обращайтесь: contact@gemius.com.ua

Go to our global site (EN/PL)




