2009-07-20

Словарь Векторная модель текста сеть Кохонена-Гроссберга

Семантическое ядро

Андрей Орлов  2009-07-20 16:09

Семантическое ядро - это множество связанных между собой слов (или понятий), отобранных по некоторому критерию. Понятие семантического ядра находит применение в лингвистике, статистическом анализе текста, разработке поисковых систем и поисковой оптимизации.

Словарь

Основная форма:семантическое ядро
Предметная область::
NeuralNetwork
Семантическое ядро

Семантическое ядро

Семантическое ядро - это подборка понятий, имеющих существенное значение для данной предметной области. Точное определение семантического ядра зависит от области применения. Так, в лингвистике, семантическим ядром называют "не упрощаемое замкнутое подмножество языка", подразумевая при этом скорее смысловую составляющую языка, а не грамматические конструкции.

Если отказаться от когнитивистских фантазий и попытаться перейти в доступную пониманию область теории информации, оперирующую статистическими параметрами текста, то можно говорить о семантическом ядре как о подборке смысловых единиц, достаточной для классификации текста. В качестве такой единицы может выступать словоформа, лексема или другая языковая конструкция.

Для использования в статистическом анализе текста можно дать определение нескольких подборок смысловых едениц, сходных с семантическим ядром, например:

Специфичные слова предметной области
Это такие слова, которые встречаются исключительно в текстах предметной области и позволяют установить принадлежность текста этой предметной области.
Высокоинформативные слова предметной области
Это такие слова, которые позволяют рубрицировать тексты внутри предметной области.

Эти классы слов частично пересекаются и дополняют друг друга, но для их нахождения используются разные подходы, основанные на векторной модели текста. Специфичность слова оценивается по частоте появления слова внутри и вне множества текстов предметной области. Информативность слова оценивается по характеристикам распределения в текстах предметной области.

Семантическое ядро при поисковой оптимизации

Поисковая оптимизация текста - это задача обратная к классификации и поиску: текст отодвигается на второй план, а первичным становится поисковый запрос. Запросы к поисковой системе - это упрощенная версия естественного языка, его семантическое ядро можно определить как "минимальное подмножество запросов, используемых при поиске текстов данной предметной области".

Зная семантическое ядро и алгоритм поиска, любой текст можно переформулировать так, чтобы существенно увеличить частоту его появления в результатах поиска. Нахождение такой оптимальной формулировки является целью поисковой оптимизации.

Эпицентр Zope3 Учат тут DreamBot Репозиторий Статистика Редакторам
Официальный сайт Zope3 Московская группа изучения реактивного движения The Dream Bot Site