IBM Big Data

Что такое большие данные?

Ежедневно мы создаем 2,5 квинтильона байтов данных - так много, что только за последние два года создано 90% данных, существующих в сегодняшнем мире. Эти данные поступают отовсюду: от датчиков для сбора информации о климате, из публикаций на сайтах социальных сред, с цифровых изображений и видеозаписей, из записей о транзакциях по продажам и сигналов GPS с мобильных телефонов, - и это всего лишь несколько примеров. Такие данные называются большими данными.

Большие данные объединяют три измерения: объем, скорость и разнообразие.

Объем: предприятия переполнены данными всех типов, объем которых растет и легко может достичь терабайтов и даже петабайтов.
Скорость: иногда 2 минуты - это слишком долго. В таких чувствительных ко времени процессах, как выявление мошенничества, большие данные следует использовать по мере их поступления в организацию для того чтобы максимально повысить их ценность.
Разнообразие: большие данные могут относиться к любому структурированному или неструктурированному типу, представляя собой текст, данные с датчиков, звук, видеозапись, списки посещенных веб-страниц, файлы протоколов и другие данные. Когда все эти данные различных типов анализируются, рождаются новые идеи.

Суть больших данных - не только в размере. Они являются возможностью извлечь знания из новых и развивающихся типов данных и контента для повышения гибкости бизнеса и для получения ответов на вопросы, которые ранее были вне вашей досягаемости. До настоящего времени не было практических способов воспользоваться этой возможностью.

Платформа корпоративного класса IBM Big Data позволяет решить все проблемы бизнеса, связанные с большими данными. Платформа объединяет традиционные технологии, которые хорошо подходят для выполнения структурированных повторяемых задач, с дополнительными новыми технологиями, которые обеспечивают скорость и гибкость, являясь идеальными для специальных случаев анализа и обнаружения данных, а также анализа неструктурированных данных.

Основные возможности интегрированной платформы IBM Big Data:

Аналитика на основе Hadoop: обрабатывает и анализирует любые типы данных в кластерах серверов.
Потоковые вычисления: обеспечивает постоянный анализ крупных объемов потоковых данных со временем ответа, составляющим менее миллисекунды.
Организация хранилищ данных: предоставляет знания об операциях и расширенную аналитику, встроенную в базу данных.
Интеграция данных и управление информацией: позволяет понимать, очищать, преобразовывать, контролировать и доставлять достоверную информацию для важнейших бизнес-программ.

Дополнительные службы платформы:

Визуализация и обнаружение: помогает конечным пользователям анализировать крупные и сложные наборы данных.
Разработка приложений: ускоряет процесс разработки приложений для работы с большими данными.
Управление системами: отслеживает системы больших данных и управляет ими для обеспечения защиты и повышения производительности.
Акселераторы: ускоряют окупаемость с помощью аналитических и отраслевых модулей.

Продукты

IBM PureData System for Analytics (Netezza)

Специализированный аппаратно-программный комплекс для выполнения сложной аналитики над сверхбольшими объемами структурированных данных и управления хранилищами данных.

IBM InfoSphere BigInsights

Готовое к использованию на предприятии решение на основе Apache Hadoop для контроля и анализа крупных объемов структурированных и неструктурированных данных.

IBM InfoSphere Streams

Обеспечивает непрерывный анализ крупных объемов потоковых данных со временем ответа, составляющим менее миллисекунды.

IBM InfoSphere Data Explorer

Система для быстрого и точного поиска информации в корпоративных источниках структурированных и неструктурированных данных и отображения результатов на веб-панелях.