IBM InfoSphere Streams - это передовая вычислительная платформа, которая предоставляет возможность быстро принимать, анализировать и сопоставлять информацию в решениях, разработанных пользователями, по мере поступления информации из тысяч источников в реальном времени. Это решение способно обрабатывать данные с очень высокой пропускной способностью - до нескольких миллионов событий или сообщений в секунду.
IBM InfoSphere Streams помогает решать следующие задачи:
Анализировать данные "в движении" - обеспечивает время отклика менее миллисекунды, что позволяет просматривать информацию и события по мере возникновения.
- Поддержка анализа непрерывно поступающих данных, в том числе текстов, изображений, аудио- и голосовых данных, видео, Web-трафика, электронной почты, данных GPS, данных о финансовых транзакциях, спутниковых данных и показаний датчиков.
- Содержит наборы инструментов и ускорители для выполнения расширенной аналитики, включая ускоритель для работы с телекоммуникационными событиями, анализирующий большие объемы потоковых данных от телекоммуникационных систем практически в реальном времени, а также ускоритель социальных данных для анализа данных из социальных сетей.
- Распределяет программы по вычислительным узлам кластера для обработки нескольких миллионов сообщений в секунду, при этом на обработку одного сообщения тратится менее миллисекунды.
- Позволяет осуществлять фильтрацию и выделять только значимые данные из огромных объемов информации, что помогает снизить затраты на хранение данных.
- В зависимости от объемов данных и сложности выполняемого анализа расширяется с одного сервера до нескольких тысяч вычислительных узлов.
- Предоставляет возможности обеспечения безопасности и обеспечивает конфиденциальность совместно используемой информации.
Упростить разработку потоковых приложений - использует интегрированную среда разработки на основе Eclipse.
- Позволяет создавать приложения с возможностями перетаскивания и динамически добавлять новые представления к уже работающим приложениям с использованием возможностей визуализации данных, в частности, диаграмм и графиков.
- Позволяет создавать, редактировать, визуализировать, тестировать, отлаживать и запускать приложения на языке Streams Processing Language (SPL).
- Обладает композитной структурой, необходимой для повышения модульности приложений и поддержки разработки крупных приложений распределенными командами разработчиков.
- Позволяет создавать вложенные и агрегированные типы данных в рамках единого определения потока.
- Позволяет выстраивать приложения на кластере разработки и перемещать их в рабочую среду без перекомпиляции.
Повысить ценность уже используемых систем - интегрируется с приложениями и поддерживает как структурированные, так и неструктурированные источники данных.
- Адаптируется к быстро меняющимся формам и типам данных.
- Позволяет быстро разрабатывать новые приложения, которые могут быть сопоставлены широкому спектру конфигураций аппаратного обеспечения.
- Поддерживает повторное использование кода на языках Java и C++, а также моделей Predictive Model Markup Language (PMML).
- Включает ограниченную лицензию IBM InfoSphere BigInsights - предложения для анализа больших объемов неструктурированных данных на основе Hadoop.
- Интегрируется с IBM DB2, IBM Informix, IBM Netezza, IBM solidDB, IBM InfoSphere Warehouse, IBM Smart Analytics System, Oracle, Microsoft SQLServer и MySQL.