оставить заявку

Оценка качества текста

Сергей Анисимов
15 апреля, 2020

При написании текстов для сайта перед копирайтером ставится сразу несколько задач: выполнить технические требования к статьям, увеличить посещаемость, заинтересовать посетителей, поднять уровень продаж. Требования к материалам могут частично или полностью противоречить друг другу. Именно эта особенность делает написание текстов творческим процессом.

При этом поисковые алгоритмы работают на основе математических моделей. Отсюда вопрос: можно ли математически оценить качество текста? Ведь даже Пушкин в трагедии «Моцарт и Сальери» писал, что невозможно «проверить гармонию алгеброй».

На данном этапе развития технологий оценить качество текста чисто математическими методами невозможно. Но это не означает, что нельзя проверить отдельные параметры и характерики текстового материала.

Именно эти параметры мы рассмотрим в данной статье.

Уникальность текста

Предположим, что в силу каких-либо причин SEO-специалист решит скопировать тексты для продвигаемого сайта с другого ресурса. Если он сделает это без разрешения владельца — это нарушение авторских прав. Но даже если такое разрешение получено, нужно помнить, что копирование текстов не позволит сайту занять хорошие места в выдаче поисковых систем по нужным запросам.

Дело в том, что поисковые алгоритмы тщательно проверяют уникальность текста. Это базовая метрика, по которой оцениваются все материалы. Считается, что только оригинальный текст представляет ценность для пользователя и Сети в целом, поэтому в выдаче по целевым запросам всегда будет находиться сайт-первоисточник, а не ресурс, который просто скопировал с него тексты (из этого правила есть курьезные исключения, но в данной статье мы их рассматривать не будем).

Из всего сказанного следует непреложный вывод: все тексты на продвигаемом сайте должны быть уникальны.

Уникальность проверяется с помощью специальных алгоритмов, например, методом шинглов или законом Ципфа. При написании материалов для сайта можно проверять уникальность с помощью специальных сервисов и программ, ссылки на которые легко найти в Сети.

Однако такой формальной проверки может быть недостаточно. Дело в том, что наполнить сайт оригинальным и полезным контентом непросто, а зачастую и просто дорого. Поэтому в Сети широкое распространение получило явление рерайтинга, когда вместо оригинального контента для сайта просто переделываются уже существующие на других площадках тексты.

Такие тексты могут быть уникальными по формальным признакам, но фактически они не оригинальны и не несут ничего полезного для пользователей. Современные алгоритмы вполне неплохо научились определять такие материалы, а поисковые системы могут наложить за них санкции на сайт.

Вывод прост: контент должен быть оригинальным не по формальным признакам, а по сути. Даже если, к примеру, интернет-магазин продает «то же, что и все», всегда можно найти факты, цифры и другую полезную информацию, которой нет на других ресурсах. Если привести эти данные в текстах, можно не только занять более высокие места в выдаче, но и отстроиться от конкурентов с их безликими текстами, написанными как «под копирку».

Грамотность

Банальные грамматические и синтаксические ошибки могут крайне отрицательно повлиять на ранжирование страницы и всего сайта. Кроме того, они сильно снижают конверсию: у посетителя появляется впечатление «небрежности», с которой владельцы сайта ведут бизнес, и он не захочет совершить на площадке целевое действие.

Конверсия — это количество пользователей, которые совершили на сайте целевое действие (покупку, подписку, регистрацию, посещение конкретной страницы). Как правило, конверсия определяется в процентах от общего количества посетителей сайта. Например, если целевое действие совершает один пользователь из ста, то конверсия будет составлять 1%.

Конверсия зависит от сотен параметров: количества трафика, удобства сайта, уровня цен, позиций в поисковиках. Понятно, что чем больше конверсия, тем выше доходы владельца сайта. Поэтому над этим показателем идет постоянная работа, которую мы обсудим в последующих статьях.

С первого взгляда может показаться, что конверсия — это сугубо внутренний показатель бизнеса. Однако это не так. Поисковики учитывают этот показатель при ранжировании сайтов по принципу "если пользователь совершил целевое действие, значит сайт качественный и нужный". В большинстве случаев пользователь, совершивший целевое действие, уже не вернется к результатам поиска. Значит в следующий раз, при следующем запросе, поисковой машине стоит поставить такой сайт выше в результатах поиска, чем сайт, который не смог удовлетворить потребности пользователя (и пользователь не совершил там целевого действия). Это один из так называемых поведенческих факторов ранжирования, которые мы обсудим позже.

Вывод простой: перед публикацией нужно внимательно вычитать тексты и исправить все ошибки. Для этого есть специальные программы и сервисы, ссылки на которые легко найти в Сети.

Информационная плотность

Великий русский писатель Антон Павлович Чехов утверждал, что «краткость — сестра таланта». Увы, современные авторы часто пренебрегают этим правилом. Для этого есть несколько причин:

  1. Перед копирайтером стоят четкие задачи по количеству ключевых слов и размеру текста. Чтобы им соответствовать, автор «раздувает» объем материала.
  2. Копирайтеру зачастую платят за объем, поэтому он начинает использовать длинные, но малоинформационные шаблонные фразы («Наша компания стремится к высокому качеству оказания услуг в области информационной безопасности...»).
  3. Писать длинно проще и быстрее, чем коротко. В условиях недостатка бюджета копирайтеру зачастую не хватает времени на редактуру текста.
  4. Копирайтер может не быть профессионалом в предметной области. Чтобы не допустить фактических ошибок, он пишет общими фразами, что называется, «льет воду» в тексте.

Если в тексте много «воды», его информационная плотность снижается. Читателю приходится по крупинкам вылавливать полезную информацию из заковыристых словесных оборотов, которые использовал автор. Разумеется, это вызывает негативную реакцию как со стороны пользователей сайта, так и со стороны поисковых систем.

Водность текста оценивается по-разному, в основном отслеживается наличие:

  • слов-паразитов,
  • вводных фраз,
  • шаблонных оборотов и штампов,
  • стоп-слов,
  • бессмысленных и общих фраз,
  • преувеличений, пафоса и прочих стилистических ошибок.

Для оценки информационной плотности текста существуют специальные интернет-сервисы (1, 2, 3), но алгоритм их работы зачастую непрозрачен и вызывает нарекания.

К примеру, одни сервисы к стоп-словам относят только так называемые слова-связки, которые не несут самостоятельной смысловой нагрузки, но без которых невозможно написать связный текст. Это местоимения, предлоги, частицы, междометия, причастия, союзы и союзные слова, числительные. Другие системы добавляют в этот список еще и слова-усилители, некоторые наречия, а также самые распространённые существительные и глаголы.

Написать текст в условиях таких строгих ограничений может быть проблематично. Кроме того, нужно помнить о двух моментах:

  1. Без «водных» конструкций текст становится слишком сухим и неестественным, он плохо воспринимается пользователями. По сути, водные конструкции нужны, но в точно определённой пропорции к содержательному тексту.
  2. Результаты автоматических проверок могут существенно отличаться от результатов оценки поисковыми системами (которые могут использовать другие алгоритмы) и пользователями (которые оценивают текст с точки зрения «человеческой», а не машинной логики).

В качестве перспективного инструмента повышения полезной нагрузки текста можно рекомендовать информационный стиль — «приемы редактирования, которые помогают очистить текст от мусора, наполнить его полезной информацией и сделать читаемым.»

Однако нужно помнить, что никакие приемы не дают гарантированного результата. Нужно постараться привлечь профессиональных авторов и не жалеть ресурсов на написание текстов — эти инвестиции окупятся с лихвой.

Адекватность ответа на запросы пользователя

В идеале текст должен полностью отвечать потребностям посетителей продвигаемого сайта. На практике добиться этого непросто, но соблюдение приведенных ниже рекомендаций поможет повысить шансы на успех:

  1. Нужно проанализировать заявленные и скрытые потребности, которые стоят за конкретным запросом пользователя, а затем написать в тексте именно о них. Классический пример: за запросом «купить молоток» стоит мотив «забить гвозди», но также и возможные скрытые потребности («молоток каменщика», «декоративный молоток», «молоток невропатолога»).
  2. Для раскрытия отдельных подзапросов желательно использовать отдельные информационные блоки (подзаголовок и несколько абзацев текста).
  3. Не следует анонсировать решение вопросов, на которые продвигаемый сайт не дает ответа. Другими словами, не нужно оптимизировать сайт под запрос «торты на заказ», если компания продает только готовую кондитерскую продукцию.
  4. Необходимо рассказывать о преимуществах компании и продукции с позиции потребностей пользователя. Бессмысленно писать о том, что интернет-магазин продает «удобные и качественные дрели». Лучше указать, что у цены на сайте ниже, чем у конкурентов, а в случае производственного брака компания готова обменять продукцию без проведения экспертизы.
  5. Нужно призывать к совершению целевого действия, чтобы подтолкнуть пользователя к решению своего вопроса.
  6. Желательно дополнить текст программным функционалом, если это является отраслевым стандартом. Пример: статья про пластиковые окна должна дополняться калькулятором расчета их установки.
  7. Нужно изучить первые 10 сайтов в выдаче поисковых систем по целевым запросам: посмотреть, чем дополняется текст (таблицы, видео, иллюстрации). Так можно понять, что ожидает увидеть пользователь на сайте, и адекватно на эти ожидания отреагировать.

Стоит отметить, что со временем запросы пользователей будут меняться. Нужно отслеживать и вовремя реагировать на эти изменения, а в идеале — первым внедрять инновации. Так можно формировать ожидания рынка и все время опережать конкурентов.

Соответствие текста статистической языковой модели

Статистическое моделирование естественных языков представляет собой развитие вероятностных моделей, которые могут предсказать следующее слово в последовательности, учитывая предшествующие слова. Эти модели широко используются:

  • при распознавании речи: если какое-то слово распознать не получилось, его можно попробовать «угадать»;
  • при машинном переводе, чтобы выбрать правильный вариант перевода какого-либо многозначного слова;
  • в информационном поиске для определения тематики текстовых документов.

Давайте разберемся с принципами, которые помогают поисковым системам оценивать качество текста с помощью приемов статистического моделирования. Согласно языковым моделям, определенным запросам соответствует определенная тематика, а определённой тематике соответствует некоторый набор ключевых слов (терминов, языковых конструкций и синонимов).

Соответственно, если заданный набор слов присутствует в тексте, значит текст посвящен определённой тематике, хорошо раскрывает тему и релевантен конкретным поисковым запросам. А вот если текст формально посвящен какой-то тематике, но нужных терминов в нем нет — значит или тематику он имеет другую, либо плохо раскрывает заданную тему.

С понятием статистических моделей тесно связано явление LSI-копирайтинга — способа написания текста, который убеждает поисковые машины в достоверности, актуальности и полезности статьи. LSI — это аббревиатура от latent semantic indexing, что в переводе с английского языка означает «скрытое семантическое индексирование» или «индексация скрытого смысла».

В профессиональной среде LSI-копирайтинг нередко противопоставляется «традиционному» SEO-копирайтингу. Утверждается, что «для SEO-копирайтинга основой являются ключевые слова, их плотность (частота применения и расположение) и виды вхождения в текст». Но эти факторы сейчас якобы уже не играют значимой роли, а на первое место выходит латентно-семантический анализ текста, согласно которому релевантность документа определяется:

  • вариантами использования ключевых слов,
  • соответствием ключевых слов контексту,
  • уместности применения слов из окружения ключевиков, которые их характеризуют и дополняют,
  • использованием неключевых слов и фраз, имеющих прямое отношение к теме статьи.

Именно перечисленные критерии, по мнению приверженцев LSI-копирайтинга, позволяют правильно раскрыть содержание и смысл текста как пользователям, так и поисковым системам.

Для оценки LSI-составляющей текста есть специальные сервисы, но их работа далека от идеальной. Да и противопоставление LSI и традиционного копирайтинга кажется неправильным — скорее нужно объединить сильные стороны обоих подходов.

Ниже приведен перечень рекомендаций, соблюдение которых позволит улучшить соответствие текстов статистическим моделям, повысить их тематичность и полезность для пользователей:

  1. Если есть возможность, поручить написание текста профессионалу, который хорошо разбирается в предметной области (для бухгалтеров должен писать бухгалтер). Редактуру может сделать копирайтер, но основу статьи должен задать погруженный в тему специалист.
  2. Ввести запрос, для которого пишется статья, в поисковую систему и проанализировать выдачу. Часто среди слов, которые выделяет поисковик, можно увидеть синонимы слов из целевого запроса. Эти синонимы нужно использовать при написании текстов.
  3. Провести аналитику сайтов успешных конкурентов. Посмотреть, насколько часто они используют те или иные термины и выражения. Так можно составить частотный словарь — список слов, которые задают тематику. Далее необходимо применять частотный словарь при написании текстов, и при этом стараться использовать слова в соответствии с их частотностью на сайтах конкурентов.
    Для решения этой задачи также можно воспользоваться специальными интернет-сервисами.
  4. Писать тексты на основе достоверных и качественных источников.

Необходимо отметить, что на практике выполнение перечисленных рекомендаций приводит к удорожанию процесса написания текстов. Необходим баланс между улучшением качества текста и экономической целесообразностью дополнительных инвестиций в процесс создания контента.

Но даже если в проекте по продвижению нет необходимого бюджета для привлечения профессионалов и глубокой аналитики, нужно постараться внедрить как можно больше приведенных выше рекомендаций. Зачастую это не требует больших затрат, но позволит писать более качественные, предметные и детальные тексты.

 

Больше информации:

Тэги

Поисковое продвижениетекстовая оптимизация