НОВОСТЬ14.07.00

Появилась возможность интеллектуального поиска в русскоязычных документах, хранимых в Oracle8i

Вышла новая версия RCO – дополнительного ПО для работы сервера Oracle8i с текстовыми базами данных на русском языке

В продукте RCO 3.0 for Oracle8i компании “Гарант-Парк-Интернет” сделан существенный акцент на русификации лингвистических опций Oracle interMedia. Так, в RCO 3.0 добавлен ряд полезных возможностей, которые позволяют использовать Oracle для интеллектуального анализа русскоязычных документов, – нечеткий поиск, тематический анализ, а также автоаннотирование документов. Таким образом, можно утверждать, что русифицирован полный набор функциональных возможностей Oracle interMedia. Использование Oracle interMedia в комплекте с RCO позволяет строить полнофункциональные русскоязычные информационные системы.

Выпуск RCO 3.0 был вызван ростом рынка документоориентированных баз данных в российском сегменте Интернет, где постоянно возрастает потребность в средствах, позволяющих создавать информационные системы, соответствующие нуждам современного бизнеса и способные удовлетворить возрастающие запросы пользовательской аудитории.

Новые возможности RCO 3.0:
Нечёткий поиск. Предоставляет адаптированный для русского языка симбиоз возможностей функций Fuzzy и Soundex. "Нечёткость" в RCO позволяет находить слова с ошибками и опечатками по правильно введённому слову запроса и, наоборот, по неправильно введённому слову возможно нахождение правильных слов, содержащихся в словаре системы.
Тематический анализ. Основная возможность тематического анализа - это возможность получения для произвольного документа списка понятий (List of Themes), обозначающих основные темы, затрагиваемые текстом. Каждое понятие в списке снабжается весом, характеризующим значимость понятия. Кроме того, имеется возможность проводить "тематический поиск", т.е. контекстный поиск только по темам документов используя предварительно построенный тематический индекс.
Автоматическая аннотация. Для каждого документа могут быть теперь построены аннотации, которые представляют собой набор предложений документа, максимально отражающих его содержание. Тематическая аннотация состоит из предложений текста, наиболее эффективно освещающих данную тему (понятие), т.е. из тех предложений, в которых указанное понятие содержится с наибольшим весом (весом связей). В случае, когда требуется построить общую аннотацию, аннотация строится по всем темам документа.

За дополнительной информацией обращайтесь в Interface Ltd.

Interface Ltd.

Ваши замечания и предложения отправляйте автору
По техническим вопросам обращайтесь к вебмастеру
Документ опубликован: 14.07.00