Уникальность
Уникальность – один из качественных показателей контента , отражающий количественную долю повторений опубликованной информации на других сайтах в интернете. Чаще всего свойство уникальности относится к текстам, хотя может быть применено и к графическому контенту, видео, аудио и информации в любом формате.
Уникальность текстов выражается в процентах и, предположительно, влияет на ранжирование контента и сайтов в поисковых системах. Хотя абсолютной ясности в этом вопросе не существует. Реальные алгоритмы поисковых систем неизвестны никому за пределами рабочих кабинетов Яндекса и Google.
Как оценивается уникальность
Для определения процентного содержания заимствованного контента, существуют разные программы и онлайн-сервисы, каждые из которых используют собственные принципы и алгоритмы.
- Это могут быть законы Зипфа, с сегментацией текстов по шинглам – блокам из заданного количества слов.
- Другие сервисы используют семантический анализ и делают акцент на информационную уникальность.
- Третьи просто проверяют наличие одинаковых кусков текста в интернете.
Проблемы возникают, когда автор статьи, с целью повысить качество информации, использует ссылки и цитаты из сторонних источников. Что это – плагиат или экспертный уровень подачи сведений?
Лучшие из программ для определения текстового плагиата имеют базы данных общеупотребительных оборотов, идиом, терминологии, и способны определять “добросовестные цитирования”.
Еще один из проблемных вопросов относится к размещениям спецификации товаров в интернет-магазинах. Каким образом можно обеспечить уникальность в технических данных продукта, продаваемого на сотнях электронных площадок?
Влияние уникальности на поисковое продвижение
Есть основания полагать, что программисты поисковых систем отлично понимают перечисленные выше проблемы с уникальностью, и не пессимизируют сайты по результатам только лишь машинной проверки уникальности.
При определении качества контента используется целый комплекс взаимосвязанных параметров:
- Поведенческие факторы – могут ли пользователи эффективно решать свои задачи на сайте?
- Насколько авторитетные источники цитируются?
- Каков авторитет и траст самого ресурса, допустившего копипаст.
В отношении последнего пункта – на более известных и старых сайтах процесс индексации апдейтов происходит значительно быстрее, чем на молодых проектах.
Таким образом, даже если новый автор опубликовал совершенно уникальную статью, а ее перепечатали на более трастовых ресурсах – приоритет индексации, а следовательно и авторства, будет за более крупными авторитетами.