Big Data отличается рядом характеристик:
- Volume. Огромные объемы данных, которые организации получают из бизнес-транзакций, интеллектуальных (IoT) устройств, промышленного оборудования, социальных сетей и других источников.
- Velocity. Скорость прироста, с которой данные поступают в реальном времени. Эта характеристика объясняет необходимость обработки данных с высокой скоростью из-за темпов изменения и всплесков активности. Компании и организации должны иметь возможности использовать эти данные и генерировать информацию из них в режиме реального времени.
- Variety. Разнообразие больших данных проявляется в их форматах: структурированные цифры из клиентских баз, неструктурированные текстовые, видео- и аудиофайлы, а также полуструктурированная информация из нескольких источников. Разнообразие больших данных делает их по своей сути сложными, что приводит к необходимости в системах, способных обрабатывать различные структурные и семантические различия.
Big Data используют, чтобы понять привлекательность товаров и услуг, спрогнозировать спрос на рынке и реакцию на рекламную кампанию. Работа с Big Data помогает компаниям привлечь потенциальных клиентов и увеличить доходы, использовать ресурсы рационально и строить грамотную бизнес-стратегию.
Применение в городе:
- городской трафик (информация, поступающая от транспортных компаний, водителей, пешеходов позволяет понять, какие направления и виды транспорта наиболее востребованы у горожан и как можно изменить ситуацию, чтобы избежать пробок);
- анализ состояния дорожного полотна;
- анализ дорожной ситуации (Алгоритмы машинного обучения (Machine Learning) анализируют погодные и дорожные условия (ширину и изменение пропускной способности участка дороги, средний балл заторов в городе и скорость потока). Если, с учетом текущей транспортной ситуации и погоды, какой-то участок относится к критическим (авария в этом месте приведет к сильным заторам), ему присваивается наивысший приоритет в случае вызова машин ГИБДД);
- объединение светофоров в саморегулирующуюся систему;
- электронные табло для общественного транспорта;
- создание маршрутов общественного транспорта (на основе использования электронных чипов в билетах);
- прогноз и реагирование на техногенные катастрофы (землетрясения, наводнения);
- экология (датчики наполнения мусорных контейнеров, датчики разбрызгивания в парках, мониторинг и анализ уровня загрязненности городского воздуха);
- система велопроката;
- демографическая ситуация (строительство школ);
- системы экстренного реагирования (скопления людей или машин, вспышки заболеваний и т.д).
Применение в госсекторе:
- безопасность - система ALPR (автоматическое распознавание номерных знаков, карта преступности);
- чат-боты для оптимизации муниципального, регионального или федерального контактного центра;
- системы для взаимодействия с обращениями.
Применение в ритейле:
- анализ кассовых чеков (какие предложения получили наибольший отклик у покупателей);
- эффективность промоакций;
- сервис персональных рекомендаций;
- динамическое ценообразование.
Применение в здравоохранении:
- планирование медицинского обслуживания физических лиц и групп населения, включая прогностическое управление течением заболеваний;
- определение и реализация максимально эффективных практических мер, способствующих сокращению числа повторных госпитализаций;
- снижение риска заражения крови и почечной недостаточности, вмешательство на ранних стадиях для уменьшения негативных последствий;
- оптимизация управления результатами лечения и затратами на лекарственные препараты;
- разработка инструментов, позволяющих повысить качество обслуживания пациентов.
Применение в образовании:
- электронные дневники и библиотеки;
- системы оценок профильного образования;
- анализ и прогнозирование траекторий обучения.