Стемминг (Stemming) – технология работы поисковой системы, позволяющая сделать морфологический анализ ключевого слова и выделить грамматическую основу, отделяя окончания, суффиксы и предлоги.
Задачей стемминга является расширение поисковой базы с учетом словоформ, чтобы в результате предоставить наиболее точные ответы на запрос пользователя.
Технология морфологического поиска активно применяется в отечественной поисковой системе Яндекс, разработчики которой создали специальную программу Mystem с бесплатной лицензией для некоммерческого применения.
На рынке представлены версии программы для популярных платформ Windows, Mac OS X, FreeBSD, Linux.
Кроме выделения в ключевом слове базовой формы, анализатор определяет и другие параметры – частотность употребления, некоторые дополнительные характеристики слова в русском языке.
В программе-анализаторе Mystem интегрирован глоссарий часто употребляемых слов, а в версии 1.0 доступна функция морфологического анализа ключевых фраз на английском языке.
Применение стеммингового принципа в поисковых машинах позволяет вебмастерам расширить семантическое ядро сайта за счет использования словоформ поисковых запросов, и тем самым, значительно повысить органический трафик.
Нажимая кнопку вы даете информированное
согласие на обработку своих персональных данных