Технология Oracle Data Mining предназначена для анализа данных методами, относящимися к классу извлечения знаний.
Основная задача этой технологии состоит в выявлении в больших наборах данных скрытых закономерностей, зависимостей и взаимосвязей, полезных при принятии решений на различных уровнях управления. Такие закономерности представляются в виде моделей различного типа, позволяющих проводить классификацию ситуаций или объектов, прогнозировать их поведение, выявлять группы сходных объектов и т.п. Существенно, что модели строятся автоматически на основе анализа имеющихся данных об объектах, наблюдениях и ситуациях с помощью специальных алгоритмов.
Основу Data Mining составляют процедуры, реализующие различные алгоритмы построения моделей классификации, регрессии, кластеризации. Версия Data Mining 12с поддерживает широкий спектр таких алгоритмов.
Алгоритмы реализованные в Oracle Data Mining:
Классификация |
Naїve Bayes, Decision Trees, Generalized Linear Models (GLM), Support Vector Machine |
Регрессия |
Support Vector Machine, Generalized Linear Models (GLM) |
Поиск существенных атрибутов |
Minimal Descriptor Length |
Кластеризация |
Enhanced K-means, O-cluster |
Поиск ассоциаций |
Apriory |
Выделение признаков |
Non-Negative Matrix Factorization |
Важная особенность алгоритмов состоит в том, что все они работают непосредственно в реляционной базе данных Oracle и не требуют выгрузки и сохранения данных в специальных форматах.