МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования
«КУБАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
(ФГБОУ ВПО «КубГУ»)
Физико-технический факультет
Кафедра теоретической физики и
компьютерных технологий
Допустить к защите в ГАК
Заведующий кафедрой
д-р. физ.-мат. наук, профессор
В.Н. Тумаев
ДИПЛОМАЯ РАБОТА
АВТОМАТИЗАЦИЯ РАБОТЫ SEO-СПЕЦИАЛИСТА
Работу выполнил _________________ Шевченко Александр Александрович
Специальность 230201 - Информационные системы и технологии
Научный руководитель
канд. физ.-мат. наук, доцент __________________________ А. А. Мартынов
Нормоконтролёр
канд.
физ.-мат. наук, доцент ___________________________А. А. Мартынов
Краснодар 2014
СОДЕРЖАНИЕ
ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ
ВВЕДЕНИЕ
. SEO и её назначение
.1 Определение и предмет поисковой оптимизации
.2 История развития поисковой оптимизации
.3. Основные элементы оптимизации
. Виды работ SEO-специалиста
.1 Работа над ключевыми словами
.2 Работа над основным текстом
.3 Работа с мета-тегами
.3.1 Тег заголовка <title>
.3.2 Тег описания <description>
.3.3 Тег ключевых слов <keywords>
.4 Технические работы над сайтом
.4.1 Присваивание сайту понятного пользователю доменного имени
.4.2 Выделение отдельного IP-адреса
.4.3 Структурирование разделов сайта
.4.4 Создание карты сайта sitemap
.4.5 Управление индексацией с помощью служебного файла «robots»
.4.6 Оптимизация динамичных страниц и программного кода
.4.7 Использование каскадных таблиц стилей
. Существующие инструменты оптимизации веб-страниц
.1 Системы автоматического продвижения сайтов
.1.1 Приложение Allsubmitter
.1.2 Приложение Site-Auditor
.1.3 Онлайн-инструмент Be1
.1.4 Приложение Yazzle
.1.5 Приложение Page Promoter
.1.6 Приложение SeoRate
.1.7 Система SeoPult
.2 Системы анализа поисковой статистики
. Проект программы автоматизации работы SEO-специалиста
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ПРИЛОЖЕНИЕ А
ПРИЛОЖЕНИЕ Б
ПРИЛОЖЕНИЕ В
ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ
SEO (англ. Search Engine Optimization) - поисковая оптимизация (англ. Search Engine Marketing) - поисковый маркетинг (англ. Social Media Marketing) - маркетинг в социальных сетях
ТИЦ тематический индекс цитирования
ВИЦ взвешенный индекс цитирования
PR (англ. Page Rank) - ранг страницы
ПМ поисковая машина
CGI (англ. Common Gateway Interface) - общий интерфейс шлюза (англ. Cascading Style Sheets) - каскадные таблицы стилей (англ. JavaScript Object Notation) - текстовый формат обмена данными, основанный на языке JavaScript
API (англ. Application Programming
Interface) - интерфейс программирования приложений (англ. Simple Object Access Protocol) - простой протокол доступа к
объектам
ВВЕДЕНИЕ
В условиях развития глобального информационного пространства, когда возникают уникальные возможности в коммуникации и информационном обмене, всё большее значение приобретает сеть Интернет, как средство донесения информации до широких народных масс. При этом главным источником информации в сети выступают веб-сайты, на которые ложится основная информационная нагрузка. Содержа в себе данные различных тематик, веб-ресурсы являют собой хаотически разветвлённую сеть из множества миллионов электронных страниц.
При этом возникают огромные трудности в поиске и ориентировании среди информационных потоков такого объёма. Именно для навигации и успешного обнаружения нужной информации, были созданы поисковые системы. Невозможно представить себе современный Интернет без поисковиков. Храня информацию о миллиардах веб-страниц, эти системы являются наиболее мощным инструментом для поиска информации и распределения пользовательского внимания. Именно привлечение внимания пользователей посредством демонстрации целевой веб-страницы в поисковой системе является целью поисковой оптимизации.
Особую актуальность в данных условиях обретает умение повысить рейтинг сайта в глазах поисковой системы, что автоматически обеспечит ресурсу пользовательское внимание. Отнимая большое количество времени и трудозатрат, меры по поисковой оптимизации неустанно требуют улучшений в процессе их выполнения. В связи с этим остро встаёт вопрос об автоматизации работы специалистов, занятых оптимизацией сайтов с целью сокращения времени и трудозатрат при данных видах работ.
На основании вышеизложенного возможно формирование основной цели данной работы: создание программного продукта, позволяющего автоматизировать часть работ SEO-специалиста.
. снизить количество времени и трудозатрат на оптимизацию сайтов посредством разработки специализированного приложения;
. реализовать в данном приложении функционал по работе с ключевыми словами и сбору поисковой статистики запросов пользователей;
. учесть в приложении региональные особенности поиска пользователей по запросам;
. включить в состав программного продукта функционал
семантического анализа текста для определения его ключевых фраз.
1. SEO и её назначение
Чтобы осознать непосредственно рассматриваемый предмет и его назначение, необходимо изучить его предметную область. Прежде всего, расшифруем саму аббревиатуру «SEO»: Search Engine Optimization (англ. оптимизация под поисковые машины, поисковая оптимизация).
Под поисковой оптимизацией понимают комплекс мер, направленных на повышение позиции сайта в поисковой выдаче по определённым поисковым запросам. При этом соответствие содержания сайта запросу называют релевантностью. Поисковая оптимизация включает в себя как улучшение внутреннего содержания сайта (качества и количества информации, совершенствования внутренних технических аспектов реализации сайта, улучшения его визуальной привлекательности для потенциальных пользователей), так и работу над внешними факторами (ссылки, ведущие на сайт, цитируемость сайта на других ресурсах и прочее).
Согласно исследованиям компании Forrester Research Inc в 2013 году, процент посетителей сайтов распределяется следующим образом:
. Через поисковые системы - 81%;
. По ссылке с другого сайта - 59%;
. Через маркетинговые коммуникации - 56%;
. Через телевидение - 48%;
. Посредством онлайн-рекламы - 20%;
. По радио - 19%;
. Через рассылку электронной почтой - 10%.
Рисунок
1 - Распределение притока аудитории на сайты
Следовательно, наиважнейшим источником посетителей для сайта являются поисковые системы.
В последнее время всё чаще звучит определение поисковой оптимизации как ветви Интернет-маркетинга. Поисковый маркетинг, как следующий шаг в развитии SEO являет собой ту же поисковую оптимизацию, сместившую свой фокус, однако, в сторону поиска новых путей понравиться пользователю. Данная оптимизация сайта включает в себя не только техническую работу над страницами ресурса, но и анализ рынка поисковых услуг с учётом текущих потребностей в спросе и предложении. Эта новая ступень работы над качеством сайтов породила в наши дни на свет множество удобных для пользователей, сложных в технической реализации и, безусловно, полезных в своей тематической группе сайтов, что в целом благотворно сказалось на общем уровне качества Интернет-ресурсов.
Процесс оптимизации сайта для поисковых систем заключается в определённой работе над контентом сайта и его структурой, а также над внутренними и внешними факторами, позволяющими поисковым машинам, основываясь на текущей версии их алгоритма, присваивать сайту некоторое место в поисковой выдаче среди прочих известных ему страниц. При этом специалист, занимающийся оптимизацией сайта, должен ориентироваться не только в текущей версии поискового алгоритма той или иной поисковой системы, но и знать некоторые психологические аспекты поведения пользователей в сети Интернет.
Согласно исследованию компании Google, проведённому в 2012 году, имеется следующее распределение посетителей
сайтов в поисковой выдаче в зависимости от позиции, показанное в таблице 1.
Таблица 1 - Распределение посетителей сайтов
|
Первая страница выдачи |
Вторая страница выдачи |
||
|
Позиция в выдаче |
Процент посетителей |
Позиция в выдаче |
Процент посетителей |
|
1-я позиция |
30% |
1-я позиция |
6% |
|
2-я позиция |
15% |
2-я позиция |
4% |
|
3-я позиция |
7% |
3-я позиция |
2% |
|
4-я позиция |
5% |
4-я позиция и ниже |
менее 1% |
|
5-я позиция |
4% |
|
|
|
6-я позиция |
4% |
|
|
|
7-я позиция |
2% |
|
|
|
8-я позиция |
2% |
|
|
|
9-я позиция |
3% |
|
|
|
10-я позиция |
5% |
|
|
Как видно из таблицы 1, наиболее успешными с точки зрения посетителей являются первые три строчки выдачи. Как правило, перед началом оптимизации ставится задача, на какое место в поисковой выдаче ожидается продвинуть сайт. Учитывая поведенческие факторы, такие, как потеря интереса у пользователей по мере удаления от вершины поисковой выдачи, целью оптимизации является непосредственно первая страница поисковика и три строчки второй страницы.
Следует также отметить, что поисковую оптимизацию также иногда называют «продвижением», имея в виду продвижение определённых страниц сайта как можно ближе к первому месту в поисковой выдаче по определённому запросу.
В целом, поисковая оптимизация делится на два вида: внешнюю и внутреннюю оптимизацию.
Внутренняя поисковая оптимизация - это набор действий и методов, направленных на улучшение внутреннего содержания и структуры сайта. К внутренней оптимизации непосредственно относится:
· создание семантического ядра сайта, то есть подбор тех ключевых слов, по которым сайт будет отображаться в результатах поиска;
· редактирование текстов, исправление орфографических либо логических ошибок;
· техническая работа над структурой сайта, как то: создание карты сайта, присваивание страницам легко запоминающихся и понятных адресов, задание инструкций для поисковых роботов и прочие методы, призванные упростить работу с сайтом как пользователям, так и поисковым машинам;
· работа над дизайном сайта и повышение визуальной привлекательности ресурса;
· устранение технических ошибок, замедляющих или вовсе
компрометирующих работу сайта: начиная от несуществующих ссылок и дублей
страниц, заканчивая грубыми семантическими и логическими ошибками в коде
страниц, действующих на них скриптов, сетевых приложений.
Рисунок 2 - Схема работ SEO-специалиста
К внешней оптимизации относится такие методы, как наращивание ссылочной массы на сайт и анализ работы, произведённой другими оптимизаторами. Наращивание ссылочной массы представляет собой приобретение (как коммерческое, так и добровольное) ссылок на продвигаемый сайт. На заре своего существования, поисковые системы ориентировались в основном на то, сколько ссылок имеет сайт и согласно этому присваивали им место в поисковой выдаче. Сейчас же поисковики научились более тщательно анализировать содержание сайта, что, несомненно, благоприятно отразилось на качестве Интернет-ресурсов.
Не смотря на то, что внутренняя оптимизация сайта стала более важна, нежели внутренняя, последний вид оптимизации также важен для повышения позиции сайта. Внешняя оптимизация влияет на такие показатели, как ТИЦ и PR.
ТИЦ (Тематический Индекс Цитирования) - индекс, разработанный компанией «Яндекс», отражающий, сколько сайтов по схожей тематике ссылаются на определённый ресурс. Данный индекс влияет только на позицию сайта в Yandex-каталогах.
PR (англ. Page Rank) - «ранг страницы», аналогичный метод компании «Google», определяющий количество и популярность станиц, ссылающихся на тот или иной ресурс. Каждой странице либо объекту в сети присваивается некоторое начальное числовое значение, которое изменяется в зависимости от количества ссылок на него. Суть метода в том, что все объекты, связанные гиперссылками представляются в виде графа и чем больше ссылаются на определённую страницу в сети, тем «важнее» она выглядит для поисковой системы. Примечательная особенность, отличающая этот метод от метода ТИЦ - это то, что ранг может присваиваться как страницам, так и любому объекту, то есть любому графу.
Кроме того, существует определённое деление на типы поисковой оптимизации в зависимости от применяемых методов, так называемые: «белая», «серая» и «чёрная» оптимизация.
Под «белой» оптимизацией подразумевают некий комплекс мер, направленных на повышение позиции сайта в поисковой выдаче, в результате которых не нарушаются какие-либо правила, установленные поисковыми сервисами для индексируемых сайтов. Другими словами, оптимизатор не должен пытаться обмануть поисковую систему, заставляя её, при помощи неких уловок, думать, будто оптимизируемый сайт является лучше (как в плане технического исполнения, так и по содержащейся информации), нежели он есть на самом деле.
«Чёрная» оптимизация же наоборот, ставит своей целью именно обман
поисковой системы, что зачастую влечёт за собой соответствующие последствия со
стороны поисковой машины. Сайт, уличённый в жульничестве, может быть понижен в
общей поисковой выдаче, а то и вовсе исключён из него, не говоря уже о
морально-этических аспектах такого рода оптимизации. Ведь специалисты,
избирающие такой вид работ по оптимизации, далеко не всегда заботятся об
удобстве и информативности их сайта непосредственно для пользователя, что в
целом негативно складывается на общей картине Интернета.
Рисунок
3 - Пример "чёрных" методов оптимизации
Что касается «серой» оптимизации, то она не влечёт серьёзных санкций со стороны поисковиков, так как не нарушает напрямую тех правил, которые устанавливают поисковые системы для сайтов при индексации. Данный вид продвижения требует от специалиста хорошего уровня навыков и опыта, а также знаний внутреннего устройства и принципов работы поисковой машины.
Какой бы путь ни выбрал в своей работе оптимизатор, ему необходимо, хотя-бы в общих чертах, представлять себе работу поисковых сервисов. В настоящее время эти сервисы занимают ведущее положение в распределении трафика пользователей сети Интернет. В ней размещены многие миллионы сайтов и найти из них нужные, а тем более, запомнить их адреса рядовому пользователю бывает трудно, а порой и вовсе непосильно. Таким образом, поисковые системы выполняют наиважнейшую функцию: они занимаются распределением внимания пользователей между сайтами, занесёнными в их базу данных.