Ежедневно мы создаем 2,5 квинтильона байтов данных - так много, что только за последние два года создано 90% данных, существующих в сегодняшнем мире. Эти данные поступают отовсюду: от датчиков для сбора информации о климате, из публикаций на сайтах социальных сред, с цифровых изображений и видеозаписей, из записей о транзакциях по продажам и сигналов GPS с мобильных телефонов, - и это всего лишь несколько примеров. Такие данные называются большими данными.
Большие данные объединяют три измерения: объем, скорость и разнообразие.
- Объем: предприятия переполнены данными всех типов, объем которых растет и легко может достичь терабайтов и даже петабайтов.
- Скорость: иногда 2 минуты - это слишком долго. В таких чувствительных ко времени процессах, как выявление мошенничества, большие данные следует использовать по мере их поступления в организацию для того чтобы максимально повысить их ценность.
- Разнообразие: большие данные могут относиться к любому структурированному или неструктурированному типу, представляя собой текст, данные с датчиков, звук, видеозапись, списки посещенных веб-страниц, файлы протоколов и другие данные. Когда все эти данные различных типов анализируются, рождаются новые идеи.
Суть больших данных - не только в размере. Они являются возможностью извлечь знания из новых и развивающихся типов данных и контента для повышения гибкости бизнеса и для получения ответов на вопросы, которые ранее были вне вашей досягаемости. До настоящего времени не было практических способов воспользоваться этой возможностью.
Решения IBM для управления большими данными (IBM Big Data)