Интернет и потребительское поведение в нём - глобальный источник информации. Например, операторы связи фиксируют множество событий: присутствие абонента в зоне действия конкретных базовых станций, модель телефона, данные по длительности звонков и data-сессий, регистрационные данные (пол, возраст), выезды в другие регионы страны и за её пределы. Интернет-компании знают, какие поисковые запросы делает тот или иной человек, чем он интересуется в данный момент времени, каковы его интересы и т.п. О том, как оцифровать пространство для повышения эффективности разных видов бизнеса и зачем нужна геоаналаитика, рассказали на онлайн-форуме «BIG DATA 2020».
Петабайты накопленных данных и специальные системы обработки позволяют строить аналитические модели. Операторы оценивают социально-демографический портрет групп пользователей, где они живут, работают и проводят выходные, маршруты передвижения, на чём люди передвигаются (авто, общественный транспорт или пешком), куда и как часто путешествуют, какими приложениями на своём смартфоне пользуются, как часто выходят в интернет. На основании этих знаний можно с достаточно высокой точностью определить уровень дохода и потенциальные потребности по разнообразным товарам и услугам.
Стоит отметить, что вся информация о людях обрабатывается в виде больших массивов данных и является обезличенной на всех этапах. Идентифицировать человека по ним нельзя. Операторы больших данных отвечают на запросы заказчиков и клиентов, а также предоставляют глобальные аналитические карты.
Одно из самых перспективных направлений больших данных - геоаналитика. Геоаналитика – это современный подход в области исследования агрегированных массивов данных с их привязкой к геопозиции объекта и его положению в пространстве.
Уникальность метода, лежащего в основе геоаналитики, заключается в том, что он позволяет за счет анализа технологических событий сети операторов мобильной связи и построения математических, предиктивных моделей получать информацию о маршрутах людей, их передвижении, исключая использование и обработку персональных данных абонентов.
Геоаналитика обладает рядом преимуществ, в сравнении с другими методами сбора данных:
- Возможностью обеспечить сплошной охват населения, пребывающего на территории (определение ряда показателей возможно с точностью до секторов 500х500м.);
- Способностью учета неравномерности распределения населения по территориям проживания;
- Предоставлением данных за любые интервалы времени (от получаса до года);
- Оперативного сбора и предоставления актуальных данных о численности населения и динамике его перемещений по территориям;
- Экономической эффективностью.
Геоаналитика позволяет коммерческим предприятиям и государственным учреждениям оценить эффективность ведения бизнеса, потенциал территорий с точки зрения обеспеченности социальной инфраструктуры (больницы, школы, детские сады, учреждения культуры), трафика (маятниковая миграция, ситуация на дорогах, общественный транспорт) и окупаемости (актуальна для гостиниц, кафе, ресторанов, мест отдыха).
О своих проектах в области геоаналитики рассказали представители Tele2. Оператор развивает это направление в течение последних лет.
«Геопространственный анализ - эффективный метод обработки информации, на основе которого можно исследовать все объекты пространства, включая численность и динамику перемещений населения на больших территориях во времени, - говорит Константин Загуменнов, старший менеджер по внедрению продуктов больших данных Tele2. - Метод представляет собой растровый, векторный и пространственный принцип представления данных».
Когда абоненты совершают звонки или выходят в интернет, их смартфоны регистрируются на базовых станциях. Оператор мобильной связи «видит» данные о том, через какие вышки проходил сигнал, но не точный маршрут человека. Первичные данные обрабатывают с помощью метода Map matching, который разработала команда геоаналитики Tele2. Используя машинное обучение и триангуляцию сигнала, можно с высокой степенью точности смоделировать маршрут объекта (например, автомобиля или общественного транспорта). Также для геопространственного анализа используются метод графов, геослои, пространственный принцип представления данных.
Свою эффективность геопространственный анализ показывает в ритейле и онлайн-торговле. Такая оценка помогает оптимизировать доставку товаров, анализировать лояльность, отток или переток клиентов к конкурентам, а также планировать качественное привлечение аудитории магазинов, изменять ассортимент под сегменты покупателей.
В качестве иллюстрации работы метода в Tele2 рассказали о проекте анализа перетока покупателей к конкурентам для одного из крупных сетевых ритейлеров. Оператору предстояло определить, в какие торговые сети и магазины конкурентов ушли покупатели. Также требовалось установить причины такой миграции.
Для реализации поставленных задач разработали модель покупок клиентов программы лояльности заказчика и проанализировали истории посещений других торговых сетей. Были определены приоритетные магазины при помощи построения карты «якорей» (свои) и «магнитов» (чужие). Геопространтвенный анализ позволил выявить изменения в сценариях потребления тех же продуктов, но в других магазинах.
По результатам исследования были определены проблемные магазины. Далее заказчик принимал решение о закрытии неэффективных магазинов.
«Аналитику больших данных Tele2 использует и в своей работе. Например, для разработки эффективного расписания работы продавцов в салонах связи. Сначала data-scientists определили оптимальное количество менеджеров зала для эффективного обслуживания покупателей. Для этого мы сделали прогноз объема продаж и трафика покупателей, разработали прогноз графика потребности в персонале в каждом магазине по дням, дали рекомендации по изменению штатного расписания в каждом салоне связи. В результате эффективность работы салонов связи выросла, а «холостой» трафик был существенно сокращён. Другими словами, больше не происходила ситуация, когда клиент зашел в салон связи, а все консультанты заняты и не могут ему помочь», - отмечает Константин Загуменнов.
Также Tele2 использует геоаналитику для определения приоритетов улучшения покрытия сети на автодорогах. Данные позволяют оценить текущую загруженность федеральных трасс учётом сезонности, рассчитать доходность проезжающих абонентов на каждом участке трассы и т.п.
Помимо этого, Tele2 разработала на основе Big Data карту оптимальных маршрутов транспорта для обслуживания объектов связи в регионах. Было просчитано расстояние между всеми объектами и общее время маршрута. Далее были построены матрицы времени и расстояний, составлен оптимальный маршрут с учётом времени на дорогу, расход бензина, количества человеко-часов на обслуживание. В итоге экономия составила 15%.
Еще одно направление, в котором активно используется анализ больших данных, - развитие «умного города». Он предусматривает анализ пассажиропотока и планирование движения действующего общественного транспорта; запуск новых маршрутов, исходя из текущих потребностей жителей города (агломерации); выявление мест наиболее плотного трафика в определённый период времени; анализ профиля посетителей территорий, туристических курортов, крупных мероприятий. Также геоаналитика используется для благоустройства территорий, прогнозирования нагрузки на строительные объекты и сети при их проектировании, мониторинг состояния строительных объектов.
С помощью геоаналитики можно анализировать маятниковую миграцию между разными городами и принимать бизнес-решения на основе этих данных. Например, решение о развитии операций оператора связи в Московской области. Так, в Tele2 оценили маятниковую миграцию жителей двух подмосковных городов – Электростали и Балашихи. Выяснилось, что жители Электростали в основном передвигаются в своем городе и ездят в Ногинск. А жители Балашихи тяготеют к Москве, многие из них работают в столице. Таким образом, чтобы удовлетворить потребности жителей Электростали в хорошем покрытии, емкости сети, наличии салонов связи, нужно построить инфраструктуру только в Электростали и Ногинске. А вот жителям Балашихи нужно качественное покрытие сети, интернета и салонов связи в самой Балашихе, на трассах в Москву, в столице. Поэтому в наших приоритетах оператора связи Электросталь была на первом месте.
Один из последних проектов – аналитика перемещений граждан между городами с разделением на виды транспорта: авиа, авто и ж/д. Данные помогают аэропортам запускать прямые авиарейсы, ж/д перевозчикам – скоростные составы с теми городами, откуда к ним чаще всего прибывают гости со стыковками в Москве или в других регионах. Примеры такой работы есть с аэропортами Краснодарского края, аэропортом Новосибирска и т.п. По аналогичной схеме анализировалась загрузка поездов «Ласточка».
«Мы можем оценить загрузку прямых рейсов с учётом субсидирования перевозок. Таким образом, пассажиры получают больший комфорт, а авиакомпании и собственники могут заработать», - отмечает Константин Загуменнов.
Проекты Tele2 по аналитике имеют спрос и у бизнеса. Так оператор работал над проектом определения аудитории горнолыжного курорта «Игора» в Ленинградской области. В качестве выборки для этого исследования были взяты абоненты Tele2, которые провели как минимум одну ночь на курорте среди тех, кто не проживает постоянно на этой территории. Были составлены карты плотности и демографический портрет абонентов, попавших в выборку. Например, выяснилось, что чаще всего на курорт Игора приезжают кататься мужчины в возрасте от 25 до 34 лет. В среднем они проводят на курорте 3 дня. Живут как правило в трех районах Санкт-Петербурга: Калининском, Приморском и Невском. В итоге администрация курорта смогла точечно повысить качество сервиса и привлечь больше гостей.
В Краснодарском крае проводился анализ туристического потока. На основе загруженности базовых станций Tele2 была рассчитана карта концентрации туристов, которая позволила определить места, где наиболее целесообразно открывать отели, кафе и объекты туристической инфраструктуры.
Выручка телеком-операторов от монетизации аналитических данных на основе Big Data по итогам 2019 года выросла в несколько раз. Эксперты отмечают, что в 2020 году рост будет не менее стремительным. Помимо Москвы к покупке геоаналитики больших данных приступают и в регионах. В лидерах роста на Урале - Екатеринбург, Челябинск и Тюмень.
Примечательно, что более половины участников опроса форума «BIG DATA 2020» о стратегии развития в области больших данных и аналитики в текущих условиях указали, что проекты в их компаниях продолжают развиваться, и бизнес ставит новые задачи в этом направлении.