Ежедневно мы создаем 2,5 квинтильона байтов данных - так много, что только за последние два года создано 90% данных, существующих в сегодняшнем мире. Эти данные поступают отовсюду: от датчиков для сбора информации о климате, из публикаций на сайтах социальных сред, с цифровых изображений и видеозаписей, из записей о транзакциях по продажам и сигналов GPS с мобильных телефонов, - и это всего лишь несколько примеров. Такие данные называются большими данными.
Большие данные объединяют три измерения: объем, скорость и разнообразие.
- Объем: предприятия переполнены данными всех типов, объем которых растет и легко может достичь терабайтов и даже петабайтов.
- Скорость: иногда 2 минуты - это слишком долго. В таких чувствительных ко времени процессах, как выявление мошенничества, большие данные следует использовать по мере их поступления в организацию для того чтобы максимально повысить их ценность.
- Разнообразие: большие данные могут относиться к любому структурированному или неструктурированному типу, представляя собой текст, данные с датчиков, звук, видеозапись, списки посещенных веб-страниц, файлы протоколов и другие данные. Когда все эти данные различных типов анализируются, рождаются новые идеи.
Суть больших данных - не только в размере. Они являются возможностью извлечь знания из новых и развивающихся типов данных и контента для повышения гибкости бизнеса и для получения ответов на вопросы, которые ранее были вне вашей досягаемости. До настоящего времени не было практических способов воспользоваться этой возможностью.
Решения IBM для управления большими данными (IBM Big Data)
Ссылки по теме