Проверка текста на уникальность и защита от копирования.

Проверка текста на уникальность — тема сегодняшний статьи. Расскажем как это сделать оптимально быстро, каким образом исправить не уникальный текст  и что нужно сделать, чтобы минимизировать риски кражи контента.

Проверять уникальность будем на специальном сервисе text.ru. Данный инструмент существует много лет и уже зарекомендовал себя. Знаете лучше — можете оставить ссылку в комментариях — «будем посмотреть».

  1. Переходим на text.ru
  2. В поле «проверить текст на уникальность» вставляем свой текст.
  3. Разбор результатов. Для примера взяли одну из статей с сайта нашего клиента.

  4. проверка текста на уникальностьКлючевые моменты выделены:
    — совпадения
    — ошибки
    — seo-анализ
    — подсветка не уникальных фраз.

Теперь уже будем разбирать подробней

 

Проверка текста на уникальность — подробный анализ

  1. во-первых видно куда текст был скопирован. Можно конечно обратиться к администрации чужого ресурса, с требованием убрать сворованный текст. Но редко на такие просьбы откликаются, и если таких сайтов много — начинать даже эту процедуру малоперспективно.
  2. Также видим ошибки. Часть слов — термины, от которых никуда не денешься. Но есть уже и просто грамматические ошибки. При нажатии на кнопку «Подробнее..»  все ошибки подсветятся в тексте
  3. Если мы нажмем на цифры напротив «Заспамленность» и «вода» — в тексте отобразятся соответствующие фразы. Если данные показатели выделены желтым или красным цветом — значит нужно корректировать текст.
    проверка текста на водность проверка текста на заспамленность«Вода» — это стоп-слова, фразеологизмы, соединительные слова не несущими значимой смысловой нагрузки и служащие для связи слов. Естественное содержание «воды» до 15%.Если больше — лучше переписать предложения до понижения данного параметра
    «Заспамленность» — количество поисковых (ключевых) фраз в тексте. Рекомендуемый показатель — 50%.Отдельно про прайс и техническое описание. Как правило такие тексты содержат много повторов одних и тех же фраз. Оптимальный вариант — заключить текст в теги «<noindex>» (запрет на индексацию поисковиками) и/или «<blockquote>» (цитата)
  4. Ну и наконец про уникальность текста. Нажимаем на цифры справа от слова «Уникальность» (в данном примере 39,68%) — нам подсвечиваются неуникальные фразы. Изменяем их и запускаем проверку вновь. Идеальный вариант — 100%. Допустимый вариант — 80%. При меньших показателях — переписывать.

Как защитить уникальный текст от копирования

Сразу скажем — идеальный защиты нет. Однако способы сократить риск кражи информации есть:

  • загружать статью сначала в сервис яндекса «Оригинальный текст»  Яндекс не гарантирует защиту, но обещает способствовать и учитывать при поисковой выдаче, что Ваш текст был первоисточником. Хочется надеяться, со временем алгоритм будет отлажен полностью.
  • Добавлять в документ больше собственных меток.. к примеру не «… наша компания предоставляет..» , а наша компания «Название компании» предоставляет
  • Отключить правую кнопку мыши, сочетание клавиш копирования, просмотра исходного кода.
  • или же сделать так, чтобы при копировании с сайта автоматически добавлялась ссылка на Ваш сайт.
  • Регулярно проверять уникальность текста. В случае обнаружения воровства, незамедлительно писать с требованием убрать текст, а то вы будете жаловаться в яндекс )
  • Поставить информацию, что текст нельзя полностью или частично копировать с вашего сайта.
  • Добавить информацию, что текст проходит предварительную регистрацию в яндексе и в случае копирования вреда для похитителя будет больше чем пользы.
  • Защитить информацию с помощью text.ruдополнительная защита текста от копирования
    и разместить на сайте такой вот баннер
    TEXT.RU - 100.00%

В совокупности данные способы снизят вероятность «заимствования» Вашего контента.

Если знаете другие способы защиты информации — можете поделиться в комментариях.

 

Аудит сайта Балтик Тур

При проверке сайта были выявлено достаточно много ошибок. Часть из них изначально не принималась во внимание и не проектировать ввиду неактуальности на тот день. Часть возникла уже в процессе эксплуатации сайта. Ниже краткие отчеты проверок для примера.

Прежде чем расширять семантическое ядро сайта и повышать конверсию — требуется их устранить. Т.к. задача ставится «вылизать» весь сайт в плане поисковой оптимизации — все страницы и запросы важны и будут проверяться на качественную оптимизацию.

аудит сайта Балтик Тур

В первую очередь избавились от ошибок 404 и 403, а также удалили «битую» ссылку (ссылка на несуществующую страницу).

аудит сайта исправление ошибок

Также был подключен поиск для удаленных или перемещенных страниц.
поиск по сайту яндекс

пример оптимизированной страницыС title, h1 и description сложнее — сайт за время своего существования оброс достаточным количеством страниц и разделов. Много дублей. На их устранение потребуется время.

Но в первую очередь взялись за главную страницу сайта. Пример правильно оптимизированной странице вы можете наблюдать на картинке слева.

Время загрузки не радует. Потребуется оптимизировать скорость.

Проверка уникальности показала что текст был сворован. Причем многими ресурсами. В некоторых случая на 99%. Связываться с каждым — смысла мало. Текст придется переписывать, с предварительной регистрацией в яндексе, и дополнительными элементами защиты.

воровство контента

Размещение информации на сайте

 

  1. Любая информация должна использовать поисковые фразы из семантического ядра сайта. Если текст изначально не содержит данных фраз — следует правильно их разместить в тексте, заголовках, подзаголовках, подписям к изображениям. Где брать семантическое ядро сайта можно посмотреть здесь
  2. Не более одного запроса на статью. Запросы можно группировать в пределах одной статьи.
  3. Поисковый запрос входить в заголовок страницы (title), заголовок текста(h1), подзаголовки текста (h2-h6), описание страницы(description) и непосредственно встречаться самом тексте. Но не повторяться во всех местах одинаково.
  4. title оптимальная длина title 40-55 символов. Можно больше, но Google отображает до 57 символов, Yandex — не более 70.
  5. description — 25-30 слов.
  6. Чем ближе к началу стоит поисковый запрос — тем лучше. (Это касается всех тегов)
  7. При этом логичность изложения предложения не должна теряться.
  8. Сам текст, публикуемый на сайте должен быть уникальным.
  9. Не забывайте делать подписи к изображениям (тег alt — альтернативное изображение)
  10. выделите 1-2 раза ключевой головок жирным (тег <b>) и курсивом (тег <i>)

Правильное размещение информации на примере

Рассмотрим данные правила на примере данной статьи.

  • ключевой запрос «размещение информации«
  • также (по тексту) у нас добавляются запросы «Правильное размещение информации«, «размещение информации на примере«, «размещение информации на сайте«. По дополнительным запросам, при условии минимальной конкуренции и выполнения остальных требований к статье — большой шанс что данная статьи будет также отображаться в поисковиках без дополнительно продвижения. Если нет — надо будет под эти дополнительные поисковые фразы писать отдельные статьи и/или продвигать их.
  • Заголовок страницы (title) — 52 символа. В него входит запрос, но он не повторяет заголовок текста (h1).
  • Описание страницы (description) — 20 слов. Минимально, ничего лишнего.
    пример правильного размещения статьи. title и description
    Так это будет выглядеть в Google. Как видите ключевые слова стоят вначале и автоматически выделяются.
  • Заголовок простой «Размещение информации на сайте«.
  • Текст уникален. Проверять уникальность можно на text.ru.
    Большая заспамленость — так, что есть над чем поработать.
    Уникальность 100% — обычный показатель, если текст не переписывается с чужого сайта, а составляется с нуля самостоятельно.
    проверка уникальности текста
  • Подпись к картинке, если смотреть по коду — проставлена. В данном случае ключевое слово не повторяется в описании точно. Но в данном случае это не критично — нет задачи привлекать траффик через изображения по данной картинке.
    простановка альтернативного изображения
  • Есть заголовок h2 (подзаголовок текста), и заголовок 3 (под-подзаголовок )) с вхождением поискового запроса.
  • Объем данной страницы — символов. Не много, но достаточно, т.к. статья пишется в первую очередь для клиентов. Если потребуется привлекать дополнительный трафик по ней — будем смотреть на конкурентов, возможно увеличивать размер текста.
  • Ключевой запрос выделен в тексте жирным и наклонными начертаниями шрифтов

Еще рекомендации по размещению информации.

Это минимальные технические рекомендации к размещению информации на сайте. Разумеется со временем будут появляться новые требования, что-то будет уже не актуально — статья будет корректироваться в соответствии с этими изменениями.

Есть также советы к оформлению текста:

  • отступы от границ экрана и других графических и текстовых элементов
  • Читабельные шрифты и размеры
  • Призывы к действию в заголовках
  • Больше медийного контента (видео, фотографий, иллюстраций)
  • Перелинковка (ссылки на другие тематические или справочные материалы)
  • и т.д.

Эти действия направлены на повышения лояльности посетителя, увеличению времени посещения сайта, желания вернуться, поделиться информацией с коллегами и друзьями, увеличению конверсии. Об этом чуть позже в отдельных статьях.

 

Семантическое ядро сайта: что это и для чего нужно.

Семантическое ядро сайта (СЯ) — это группа словосочетаний, наиболее точно отражающих специфику Вашей деятельности: товар или услуг. Если проще — слова, по которым Вас могут найти в поисковых системах.

Как составить семантическое ядро сайта

Семантическое ядро составляется на основе анализа материалов Вашего сайта. Но более правильно — ориентироваться на пользователей. И список фраз составлять из статистики поисковых запросов. Например здесь wordstat.yandex.ru. C помощью данного сервиса можно посмотреть как пользователи Интернета запрашивают информацию по Вашей тематике и выбирать те, которые подходят Вам. При составлении СЯ следует учитывать сезонность запросов и региональную принадлежность.

На картинке показан пример запроса по фразе «продвижение сайта». В левой колонке отображается перечень фраз связанных с нашей фразой «продвижение сайта». В правой — похожие запросы.

Список поисковых фраз для сайта — зависит от размера контента сайта, от количества страниц.
Может исчисляться как десятком фраз, так и сотнями и тысячами словосочетаний.

Что может помочь в составлении семантического ядра

  • Плагин Yandex Wordstat Assistant для Google Chrome (и для яндекс-браузера). С помощью данного инструмента можно достаточно легко выбрать интересные фразы. Вручную, но зато не попадет ничего лишнего.
  • Тренды Google. Позволяет найти набирающие популярность, быстрорастущие запросы — трендовые.
  • keywords от megaindex.ru. Не очень удобный инструмент, но бесплатный и частично автоматизированный.

Также множество платный инструментов, но их не рассматриваем, т.к. подобные программы более актуальны для специалистов.

Что такое дубли и почему они вредны

Под дублями понимается дублирующий контент на сайте.  Когда одно и то же содержимое доступно по разным адресам.
К примеру главная страница сайта может быть доступна по адресам

  • www.сайт.ru
  • сайт.ru
  • www.сайт.ru/index.php
  • www.сайт.ru/?q=index
  • www.сайт.ru/?q=index&comments
  • и еще множество вариантов

Такие ошибки, как правило решаются достаточно легко. Особенно до запуска сайта. В случае же если сайт уже наполнен и давно не модернизировался — потребуется приложить усилия от дублирующихся страниц.

Другая распространенная проблема — когда происходит частичное дублирование информации. Когда повторяются заголовки страниц и мета-данные для разных страниц сайта. Такая ошибка происходит в связи с отсутствием контроля со стороны администратора сайта.  Решается установкой дополнительно программного обеспечения, которое будет автоматически следить, чтобы вы не создавали одинаковые заголовки для разных страниц сайта или банально список всех страниц сайта должен быть у модератора перед глазами.

Еще пример частичного дублирования — когда анонс статьи выводится на главную страницу и повторяется в полном варианте страницы.

 

Чем вредны дубли страниц

Дублирующий контент вреден тем, что часть страниц не попадает в поисковую выдачу. И может оказывать негативное влияние не только на данные страницы, но и понизить рейтинг всего сайта.

Ранее поисковые системы не слишком требовательны были к дублям. Сейчас же это серьезная ошибка для сайта, обязательная к устранению.

Если Вы не уверены в отсутствии дублей на своем сайте — обращайтесь к нам. Поможем найти и избавиться от данной ошибки.

 

 

Как отредактировать страницу в InstantCSM

[vc_row][vc_column][vc_column_text]Достался нам на продвижение сайт на платформе InstantCSM. К сожалению разработчик сайта не озаботился должным обучением сотрудников компании нашего клиента, а на дополнительные вопросы отправил на форум InstantCSM. В общем надо было помогать клиенту. Вместо обучения сотрудника, решили писать справочные материалы, к которым всегда можно вернуться, если что-то забудется. Итак.. задача отредактировать на любой из страниц.[/vc_column_text][vc_separator][/vc_column][/vc_row][vc_row][vc_column width=»1/2″][vc_single_image image=»3828″ img_size=»medium» img_link_large=»yes» animate=»afc» animate_delay=»0.6″ align=»left»][/vc_column][vc_column width=»1/2″][vc_column_text]1. Авторизуемся на сайте www.название-сайта.ru/admin/[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column width=»1/2″][vc_single_image image=»3829″ img_size=»medium» img_link_large=»yes» animate=»afc» animate_delay=»0.6″][/vc_column][vc_column width=»1/2″][vc_column_text]2. Попадаем в панель управления сайтом. Для того, чтобы отредактировать страницу переходим в Каталог статей[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column width=»1/2″][vc_single_image image=»3832″ img_size=»medium» img_link_large=»yes» animate=»afc» animate_delay=»0.6″][/vc_column][vc_column width=»1/2″][vc_column_text]3. Далее нужно найти страницу которую мы хотим отредактировать. Это можно сделать вручную, через навигационное меню слева или через строку поиска, в которую нужно ввести название нужного нам документа[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column width=»1/2″][vc_single_image image=»3834″ img_size=»medium» img_link_large=»yes» animate=»afc» animate_delay=»0.6″][/vc_column][vc_column width=»1/2″][vc_column_text]4. Чтобы отредактировать главную страницу раздела нужно нажать на иконку карандаша в верхней части страницы.
Чтобы отредактировать страницу раздел — кликнуть на иконку напротив названия страницы[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column width=»1/2″][vc_single_image image=»3836″ img_size=»medium» img_link_large=»yes» animate=»afc» animate_delay=»0.6″][vc_single_image image=»3837″ img_size=»medium» img_link_large=»yes» animate=»afc» animate_delay=»0.6″][vc_separator][/vc_column][vc_column width=»1/2″][vc_column_text]5. Важные области выделены на картинке:

  • сохранение страницы
  • заголовок страницы
  • дата публикации
  • URL страницы

Чуть подробней про эти поля

В заголовке важно указывать ключевое слово. Если Вы собираетесь изменить заголовок у уже созданной ранее страницы, важно сначала указать в поле URL страницы текущий адрес страницы. Его можно получить из адресной строки.

Если этого не сделать — адрес страницы изменится и страницы может стать недоступной с других страниц, с поисковой выдачи.

В случае создания новой страницы поле URL страницы будет автоматически сформирован из заголовка страницы. Хотя лучше заполнить это поле вручную используя транскрипцию (Новости сайта — novosti-saita).[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column width=»1/2″][vc_single_image image=»3840″ img_size=»medium» img_link_large=»yes» animate=»afc» animate_delay=»0.6″][/vc_column][vc_column width=»1/2″][vc_column_text]5. Собственно, сама панель редактирования контента.

Большинство функций здесь — как в Word’e. Изменяйте текст как Вам нужно и сохраняйте изменения внизу страницы.

Опций «разрешить рейтинг» и «разрешить комментарии» рекомендуется включать.

Отдельно стоит рассказать о добавлении изображений — есть там свои нюансы. И о правильности заполнения метаданных для поисковой оптимизации сайта. Об этом в следующих статьях.

Если остались вопросы — можете задавать их в форме комментариев. Если понадобится — напишем еще справочного материала.

Надеюсь теперь отредактировать страницу в instatncsm для Вас теперь не проблема.[/vc_column_text][/vc_column][/vc_row]