Зачем нужны big data

Примеры использования больших данных.
3 минуты10592

В статье «Три заблуждения о big data» мы развеяли популярные мифы и узнали про требование «3V» (volume, velocity, variety), отвечая которому, данные становятся «big».

«Если мы возьмем котировки акций всех компаний на рынке за несколько десятков лет, то мы получим определенную информационную базу. Однако отнести ее к большим данным нельзя, поскольку она удовлетворяет всего одному критерию из представленных выше, да и то с большой натяжкой.

Но если мы представим анализ активности пользователей в социальных сетях по отношению к этим же компаниям за все время существования Facebook, Twitter, ВКонтакте и попытаемся связать полученные данные с курсом акций, то мы как раз получим те самые большие данные. Активности пользователей и объемы генерируемой ими информации — это те недостающие критерии, которые нужны для того, чтобы мы начали говорить в данном случае о big data» — приводит пример Павел Эдигер, руководитель проекта BI, IT-компании «Эттон». В этой статье поговорим о том, для чего используются большие данные.

Умный таргетинг

Иван Дворников, Senior MS SQL разработчик в i-Free:

«Приведу в пример американскую компанию, производящую фитнес-браслеты. Этот серьёзный по мировым меркам бизнес с прибылью в несколько сотен миллионов долларов в своё время произвёл переполох в сфере big data. Представители бренда заявили, что бизнес уходит в другую область и будет заниматься торговлей данными. Каким образом?

Браслеты измеряли всю биометрику человека и собирали данные. А так как клиентов много, появилась возможность структурировать данные в разрезе городов, штатов, страны, целого континента. Производители стали продавать эти данные фармацевтическим компаниям. Понятно, что те легко заметили определённости сезонных заболеваний и использовали данные для создания таргетинговой рекламы».

Предугадывание поведения и настройка рекламных компаний

Иван Бегтин, директор АНО «Информационная культура»:

«Cотни терабайт компании WallMart позволяют предугадывать поведение их посетителей. Огромные хранилища данных Facebook позволяют аккуратно настраивать рекламные кампании, исходя из характеристик пользователя».

Самоходные автомобили и совершенствование диагностики

Светлана Ермаченкова, генеральный директор компании Digital Society Laboratory и руководитель проекта SocialKey Ads:

«Среди ярких примеров в FMCG — работа американской компании Tesla над созданием автомобиля, который сам будет везти водителя в нужное место назначения, в медицине — установка точного диагноза благодаря анализу не только истории болезни пациента, но и полученному опыту других врачей (помимо лечащего), знаниям об экологическом состоянии района, где он проживает/работает».

«Вычисление» пользователей телеком-услуг

Богданов Александр, архитектор Big Data компании AT Consulting:

«Допустим, вы телеком-оператор, у вас на рынке существует такое понятие, как „внутренний отток“. Абонент покупает новую SIM-карту и вставляет ее в свой новый телефон (старая карта при этом продолжает работать в старом) или регистрирует SIM-карту на документ другого человека. Перед вами встает задача определить, что это один и тот же абонент.

В этом случае вы начинаете изучать поведение человека в сети при помощи big data: анализируете, на какие номера он звонит, в какое время и т.д. Полученная матрица с данными сохраняется и постоянно актуализируется. И каждая новая SIM-карта изучается по тем же алгоритмам и накладывается на эту матрицу. В течение месяца с высочайшей точностью (до 99,99%) система определяет внутренний отток.

Для наглядности немного цифр, затрагиваемых в этой задаче: big data ежедневно обрабатывает данные почти 50 млн абонентов, а объем трафика звонков составляет около 3 Тб информации».

И многое другое

Иван Андриевский, Первый Вице-президент Российского союза инженеров:

«Практическая реализация big data — это современные нейронные сети и производные на их основе системы, например системы распознавания образов, имитационное моделирование, машинное обучение, прогнозная аналитика. Примеры из жизни — программы распознавания лиц на фото- и видео-съемке в современных смартфонах, фотоаппаратах, видеокамерах; алгоритм Microsoft по распознаванию эмоций на фото; системы кредитного скоринга в банках. Big data достаточно давно и успешно используется такими транснациональными корпорациями как: IBM, VISA, Master Card, Facebook, Google (с октября 2015 года Alphabet).

Фактически, big data работает в сфере человеческих интересов, которые невозможно оценить статистически обычными методами. Например, американская компания Alphabet, анализируя запросы пользователей в ее поисковой системе Google, посещаемые ими сайты, а также клики и движения курсора, может предложить с высокой точностью правильную и нужную контекстную рекламу.

Другой пример, это анализ предпочтений пользователей мобильных устройств, по которым ритейлеры и производители могут понять на какие устройства будет больший спрос, а на какие меньший. Это хорошо становится видно при анализе того, какие интернет-сервисы и программы наиболее часто используются потребителями».

 

Не big data, но тоже интересно: профессия «Веб-разработчик».

Освоить востребованную профессию в Аналитике больших данных можно всего за полтора года на курсах GeekBrains. 

big-data-analyticsbig data
Нашли ошибку в тексте? Напишите нам.
Спасибо,
что читаете наш блог!