Семантические поисковик, переводчик, операционная система

Эдисон

Семантический (понимающий смысл) поисковик переводит вопрос в семантический формат, в котором хранится текст индексированных сайтов. Семантический формат: текст на языке-3000 из самых универсальных, самых популярных человеческих понятий для уменьшения числа команд компьютера. Частота использования понятия прямо пропорциональна его популярности. Вопрос на язык-3000 сравнивается с семантическими моделями понятий. Семантические модели понятий напоминают статью Википедии. Информация семантических моделей понятий берётся с Семантической энциклопедии, из Википедии, других интернет-энциклопедий.

База данных семантического поисковика, переводчика: семантическая энциклопедия: семантические модели слов, понятий, используемые в компьютерном распознавании смысла слов. Для каждой интернет-энциклопедии определены алгоритмы доверия, приоритет. Семантические модели понятий созданы человеком на язык-3000, корректируются. По контексту вопроса поисковик "GE2.0" синтезирует собственный (без ссылок) синтез-текст на язык-3000. Синтез-текст - ответ на вопрос, синтезированный поисковиком с семантических моделей понятий. По близости к смыслу синтез-текста поисковик ищет ссылки в проиндексированной базе сайтов. По близости к смыслу синтез-текста поисковик ищет ссылки в индексной базе сайтов: в таблицах решений "эталон смысла - сайты". При изменении текста сайта семантический поисковик в индексной базе выделит измененную часть текста сайта на язык-3000, заменит ее синтезированным текстом. Каждое из слов русского языка имеет перевод на язык-3000 в базе данных поисковика.

Переведённый на язык-3000 вопрос идет в единственный ствол Дерева анализа вопроса, в начальные ветви:

фильтр существительных. Существительное - идентификатор объекта.
фильтр корней слов.
фильтр глаголов. Глагол - идентификатор действия.
фильтр прилагательных. Прилагательное - идентификатор параметра объекта.
фильтр предлогов. Предлог - идентификатор адресации.
фильтр окончаний слов. Окончание слова - ограничитель идентификации параметра, действия.
фильтр приставок к словам. Приставка к слову - ограничитель идентификации.
фильтр знаков препинания.

Высший смысловой приоритет у существительного, местоимения. Затем у глагола. Затем у прилагательного. У существительных и местоимений приоритет выше у объекта с более высоким параметром по шкале интеллекта. Следующие по приоритету - шкалы скорости, силы объекта.

Анализ смысла текста по каналам. Смысл текста анализируется по каналам:

Контекстный канал-1: контекст каждого объекта.
Контекстный канал-2: контекст каждого действия.
Контекстный канал-3: контекст качества каждого объекта.
Контекстный канал-4: контекст качества каждого действия.

Каждый из 4 контекстных каналов делится на 3 временных контекста: прошлое, настоящее, будущее.

Каждый из 4 контекстных каналов делится на 3 временных контекста: прошлое, настоящее (контекстный диапазон времени), будущее. Таблицы контекстных диапазонов времени. Предыдущие ветви переходят в ветвь "модель предложения". Ветвь "модель предложения" работает по алгоритму точки и запятой: алгоритм поиска, расположения точек и запятых как разделителей элементов смысла в потоке слов.

Каждая ветвь "модель предложения" переходит в ветви:

Ветвь-1: модели объектов.
Ветвь-2: модели действий объектов.
Ветвь-3: модели качества объекта.
Ветвь-4: модели качества действия.
Ветвь-5: иерархия объектов предложения.
Ветвь-6: временное событие связано (нет) с последующим выражением после запятой в предложении.
Ветвь-7: пространственное расположении пользователя информации относительно объекта.
Ветвь-8: списки уточнения.

Ветвь "списки уточнения" переходит в:

Ветвь-1: "список заменителей букв в словах на парные по звучанию". Человек часто неправильно меняет буквы в слове на парные по звучанию.
Ветвь-2: "список заменителей букв в словах на ошибочные (в нажатии) парные в клавиатуре компьютера".
Ветвь-3: "списки объектов сопутствующих в предложении или моносмысловом абзаце".

Параметры некоторых действий увязаны по времени с координатами пространства в компьютерной модели. Ветвь "универсальная модель объекта" и ветви "параметры действия объекта" переходят в ветви моделей мира:

Ветвь-1: пространственная модель мира.
Ветвь-2: навигационная модель мира.
Ветвь-3: габаритная модель мира.
Ветвь-4: временная модель мира.
Ветвь-5: структурная модель мира.
Ветвь-6: масштабная модель мира.
Ветвь-7: физическая модель мира.
Ветвь-8: химическая модель мира.
Ветвь-9: энергетическая модель мира.
Ветвь-10: температурная модель мира.
Ветвь-11: топливная модель мира.
Ветвь-12: приоритетная модель мира.
Ветвь-13: иерархическая модель мира.
Ветвь-14: объектная модель мира.
Ветвь-15: причинно-следственная модель мира.
Ветвь-16: биологическая модель мира.
Ветвь-17: зоологическая модель мира.
Ветвь-18: технологическая модель мира.
Ветвь-19: транспортная модель мира.
Ветвь-20: логистическая модель мира.
Ветвь-21: метеорологическая модель мира.
Ветвь-22: политическая модель мира.
Ветвь-23: юридическая модель мира.
Ветвь-24: культурная модель мира.
Ветвь-25: жаргонная модель мира.
Ветвь-26: языковая модель мира.
Ветвь-27: грамматическая модель мира.
Ветвь-28: профессиональная модель мира.
Ветвь-29: эволюционная модель мира.
Ветвь-30: гендерная модель мира.
Ветвь-31: эмоциональная модель мира...

В ветви топливная модель мира заправка человека человечьим топливом и заправка автомобиля, другой техники и любой живности (включая тараканов, блох, микробов) топливом сведены к единой топливной модели мира. Каждая из ветвей "модель мира" переходит в свои ветви "модель действий объекта". Сколько объектов, столько ветвей "модель действий объекта". Ветви "модель действий объекта" делятся на ветви "модель личности". Ветви "модель личности" делятся на ветви "параметр личности". Сколько параметров, столько ветвей. Ветви "параметр личности" делятся на ветви "тип речи", ветви "тип мышления", ветви "эмоциональный тип", ветви "целевой тип", ветви "тип лица"....

Все ветви дерева анализа вопроса - это единые для всех слов язык-3000 исполняемые программы, обслуживаемые индивидуальной информацией из баз данных слов. Информация баз данных слов чаще хранится в форме краткого набора цифр (диапазоны...) для ветвей дерева анализа вопроса.

Ветвь "физическая модель мира" дерева анализа вопроса делится на ветвь "масштаб", ветвь "пространство", ветвь "время".

Ветвь "пространство" делится на ветвь "широта-долгота", ветвь "координаты XYZ", ветвь "масштаб пространства". Ветвь "масштаб пространства" делится на ветви диапазонов: от элементарных частиц до вселенной.

Ветвь "время" делится на ветвь "прошлое", ветвь "настоящее" (алгоритм определения контекстного диапазона настоящего времени), ветвь "будущее". Ветви "прошлое", "будущее" делятся на ветви диапазонов времени.

Выходные ветви Дерева анализа вопроса в физической модели мира переходят в ветви Дерева синтеза ответа в физической модели мира. Аналогично остальные ветви Дерева анализа вопроса переходят в ветви Дерева синтеза ответа. Исключений в обоих деревьях нет. Каждая ветвь Дерева синтеза ответа определяет слова, цели, приоритеты целей в моделях мира. На выходе единственного конечного ствола Дерева синтеза полный ответ на вопрос в виде синтез-текста. Ветви Дерева анализа вопроса разветвляются в ветви моделей целей. Ветви моделей цели разветвляются в ветви анализа цели. Ветви анализа целей разветвляются на ветви анализа процентных приоритетов целей. Ветви анализа процентных приоритетов целей переходят в ветви синтеза целей на Дереве синтеза ответа. Далее до выхода в единственный конечный ствол Дерева синтеза ответа количество ветвей всегда только уменьшается, ветви срастаются. Ветви синтеза целей переходят в ветви синтеза процентных приоритетов целей. Ветви синтеза процентных приоритетов целей срастаясь переходят в единственный конечный ствол Дерева синтеза ответа.

Ветви Дерева анализа вопроса также разветвляются в ветви анализа баланса "приоритет - цена действия". Ветви анализа баланса "приоритет - цена действия" переходят в ветви выбора баланса "приоритет - цена действия" в Дереве синтеза ответа. Ветви выбора баланса "приоритет - цена действия" переходят в ветви синтеза действий. Ветви синтеза действий срастаясь переходят в конечный ствол Дерева синтеза ответа.

Количество ветвей любой модели мира ограничено так же, как ограниченно понимание окружающей среды человеком.

Крупные ветви Дерева анализа вопроса, Дерева синтеза ответа: "двигатель", "движитель", "средство управления", "навигатор", "датчик", "рабочий орган", "средство транспортировки", "линия передачи информации", "линия передачи энергии".... Ветвь "ответственность" в Дереве анализа вопроса и в Дереве синтеза ответной реакции разветвляется на ветви: "ответственность юридическая", "ответственность фактическая", "ответственность моральная".

В анализе смысла предложения ветвь "объекты" делится на число объектов в предложении. В ветвь-1 идёт анализ предложения с объектом-1. В ветвь-2 идёт анализ предложения с объектом-2. И так далее. Аналогичен синтез в Дереве синтеза ответа. Дерево синтеза ответа похоже на дерево анализа вопроса.

Возможны 2 ветви эволюции семантического поисковика:

1: дерево анализа вопроса + дерево синтеза ответа. Эта ветвь эволюции семантического поисковика используется в проекте "GE2.0".

2: дерево анализа вопроса на выходе сбрасывает информацию в память выходных ветвей. Дерево анализа вопроса переключается в режим дерева синтеза ответа, пропускает информацию в обратном направлении от ветвей к единственному конечному стволу.

Часть алгоритмов обоих деревьев унифицированы. Для каждого понятия статистика поисковика корректирует приоритетный (в процентах значимости) список моделей мира, семантические модели понятий.

Каждое слово язык-3000 имеет свою базу данных, содержащую не модели мира или действий, а вспомогательную нестандартную информацию для их функционирования. База данных слова содержит перекрёстные ссылки в базы данных других слов. Иностранные языки заранее переведены в язык-3000 иностранного языка. Язык-3000 иностранных языков взаимно унифицированы, объединены в таблицы соответствия смысла понятий разных языков. Обратные переводчики с язык-3000 на обычный язык. Перевод некоторых слов на язык-3000 требует несколько слов язык-3000. Каждое новое слово можно заменить 2-8 старыми словами. В повседневном общении люди во всех функционально развитых языках мира используют обычно 800-2000 слов.

При переводе текста на иностранный язык семантический поисковик получает на языке-3000 синтез-текст. Синтез-текст язык-1 переводится в синтез-текст язык-2. Дополняется до словарного запаса, стиля (таблицы семантических стилей) первоисточника. Поисковик "GE2.0" выполняет поиск похожих изображений. Пользователь вставляет картинку в поисковик.

Алгоритм распознавания изображения создает словесное описание картинки. Поисковик в индексной базе словесных описаний картинок находит наиболее схожие описания картинок. Выводит их на страницу результатов поиска схожей картинки. Поисковик "GE2.0" выполняет поиск похожих по смыслу речевых аудиофайлов. Пользователь вставляет аудиофайл в поисковик. Алгоритм по аудиофайлу распознает словесное описание в форме язык-3000. Поисковик в индексной базе словесных описаний речевых аудиофайлов находит наиболее схожие, выводит их на страницу результатов поиска. Алгоритм распознавания речевых аудиофайлов имеет акустические базы данных:

Акустическая база-1: таблицы решений "слово - акустический аналог".
Акустическая база-2: таблицы решений "слово - сходные по звучанию слова".
Акустическая база-3: таблицы решений "слово - схожие по звучанию акустически искаженные слова".
Акустическая база-4: таблицы решений "слово - произношение этого слова с искаженными буквами".
Акустическая база-5: таблицы решений "слово - связки этого слова с другими словами, с их искаженными версиями".

На основе семантического поисковика я создаю семантическую операционную систему "GE2.0". Интерфейс операционной системы голосовой. Пользователь в микрофон дает поручение операционной системе. Операционка, распознав по картинке телекамеры законного пользователя компьютера, мимикой, голосом, лицом её аватара в экране подтверждает: выполню поручение. Выполняет. Означает: все компьютерные языки с их инфраструктурой идут в одно место: на свалку эволюции. Их заменит моя семантическая операционная система. Роботы будут оснащаться семантической операционной системой. Связисты армии Чингисхана вставляли ключевые слова в стандартные, известные всем солдатам, военные стихи. Так и передавали. Требовалось запомнить (имя, время…) несколько ключевых слов. Стихи унифицированы, имеют высокую помехоустойчивость. В современном аналоге стихи заменяем стандартными текстами. По линии передаём не текст, а его номер в списке текстов, передаваемые ключевые слова, номера слов текста или пробелов между ними, после которых стоят ключевые слова. Эта технология применяется в поисковике "GE2.0" для сжатия информации.

(далее читать осторожно. прим. ред.)

Семантический поиск решит проблему дублирования смысла текстового и голосового контента, отсутствия мировой новизны, докажет: 99% диссертаций во всем мире: плагиат. Это даст компромат на сотни миллионов диссертантов всего мира. Им, их официальным юридическим наследникам придется вернуть сворованные у налогоплательщика деньги с реальными по годам кредитными процентами, с учетом инфляции. Семантический поисковик уничтожит сам госинститут диссертаций как форму паразитирования человека на налогоплательщике. Взамен интеллектуалы будут создавать свои сайты со своими идеями. И ставить научное содержание своего сайта на голосование по парламентским правилам в форумах научных сайтов с тремя обязательными для большинства тем голосующими форумами.

В форуме-1 (F1) голосуют профессионалы.
В форуме-2 (F2) голосуют полупрофессионалы.
В форуме-3 (F3) голосуют любители.

Форум-2 может голосованием дать статус полупрофессионала любителю. Форум-1 может голосованием дать статус профессионала полупрофессионалу. Эта система уничтожит коррупцию и блат. Хороший блатной - мертвый блатной! Науку надо строить так, а не по образу и подобию секретных силовых структур государства. В принципе в научном форуме лучшей авангардной научной работой 20века в области физики скорее всего голосованием признали бы диссертацию Нильса Бора про строение атома водорода, уместившейся в одной странице. За 19век скорее всего лучшими признали бы научные работы Майкла Фарадея.

В масштабный проект семантического поисковика и переводчика "Compreno" российская компания ABBYY вложила $50000000 с 1997г. Проектом "Compreno" занимаются сотни программистов 15лет. Вместо язык-3000 использован язык-60000 (60000 универсальных понятий). Есть подозрение: в "Compreno" вместо создания единых моделей мира, единых моделей действий объекта, единых моделей личности, общих у всех слов язык-60000, и привязки к ним человеческих слов только как минимальных, чисто индивидуальных баз данных обслуживающих софт моделей мира и личности, разработчики сделали наоборот. Они создали собственные компьютерные модели мира, модели действий объекта, модели личности в базе данных каждого слова языка-60000. Результат:

1: "Compreno" припух до нетоварного размера.

2: получается сложным переход с компьютерных моделей мира, моделей действий объекта, моделей личности одного слова язык-60000 в модели мира, модели поведения объекта, модели личности другого слова язык-60000.

Трудности ориентирования в этом массиве баз данных слов язык-60000 тормозит эволюцию "Compreno". Публичная демонстрация 2012г: перевод на английский: "Compreno" выиграл у статистических алгоритмов перевода google.com Алгоритмы компании Google работают (плохо) только в 5 языков мира. Вселенский проект "Compreno" претендует на все языки Вселенной. "Compreno" получил в 2012г сколковский грант $15000000 от разведслужб России. Причиной уступки государству части прав на проект "Compreno" стало появление в сайте титана мысли Эдисона обновляющейся статьи "Семантический поисковик". Парни компании ABBYY вздохнув от ужаса, раскаленными за 15лет проекта "Compreno" мозгами решили: зачем дымить измотанными мозгами, если этот вконец окабаневший Эдисон, объявивший себя чемпионом мира по искусственному интеллекту, публично печатает в своём сайте словесные описания алгоритмов работы искусственного интеллекта. Придётся списывать. Списав не запатентуешь право на алгоритмы законченного проекта. Ужас!!! Накрылись мясным тазом $50000000!!! Но нашли выход хитропопые, отфутболив ответственность за будущее списывание у Эдисона на до этого невинное создание: государство. И получили находчивые парни за снятие целки государству $15000000 (Всемирная история: 21век: Искусственный интеллект:). Американская фирма BBN Technologies (785 человек) получила $30000000 DARPA по "Программе машинного чтения": технология компьютерного понимания текстов. В семантическом поисковике "GE2.0" кнопка "поиск" слева, справа поисковой строки: длинный вопрос - она удлиняется вправо, вниз. Номера страниц результатов поиска верху справа поисковой строки.

Упорядочение списков в поисковике:

Тематический список.
Список убывания популярности запроса.
Список убывания даты.
Список убывания распространенности слова.
Алфавитный список.
Список популярности информации по профессиям. Профессии по тематическому или алфавитному признаку.
Список по географическому признаку.
Список по половому признаку интереса к информации по убыванию популярности или ином порядке.
Список по убыванию эмоциональной реакции на информацию.
Список по странам происхождения информации в алфавитном, ином порядке.
Список по профессиям происхождения информации в алфавитном или ином порядке.

Семантический поисковик будет наращивать уровень контекстного осмысленного восприятия мира в словесном описании через самостоятельное, без человека, смысловое изучение словарей, энциклопедий, ключевых сайтов Интернета. Критерии определения ключевых сайтов Интернета вкладывает в семантический поисковик человек. Со временем семантический поисковик будет делать это и другое сам, без человека. При критической массе ключевых алгоритмов поисковика. Поисковики, социальные сети - главный объект покупки, главным источник информации разведки, контрразведки промышленно развитых страна.