Компания Oracle анонсировала новую платформу для организации хранения больших объемов данных - Oracle Big Data Appliance, позволяющую организовать надежное хранение и анализ петабайтов данных. Решение позволяет обеспечить горизонтальную масштабируемость (при необходимости увеличения хранилища в кластер добавляются новые узлы), высокую надежность хранения (данные дублируются на нескольких узлах) и отсутствие единой точки отказа (в синхронном состоянии поддерживаются несколько узлов репликации).
Платформа функционирует на базе Oracle Linux и построена на базе следующих открытых компонентов:
- Для организации распределенного отказоустойчивого хранилища задействована платформа Apache Hadoop, базирующаяся на парадигме map/reduce;
- Для управления данными поверх кластера Hadoop запускается БД Oracle NoSQL Database, основанная на Java-варианте открытой БД BerkeleyDB (Oracle Berkeley DB Java Edition), оперирующая данными в формате ключ/значение и позволяющая гарантировать целостность и атомарность выполняемых транзакций;
- Для анализа и статистической обработки данных предлагается использовать язык программирования R (поставляется открытый пакет Oracle R Enterprise, отличающийся адаптацией для работы с данными в кластере Hadoop).