|
Алгоритм Яндекса и спам ключевых слов
Платный хостинг
Создание и раскрутка сайтов
Увеличение члена
- Хотелось бы получить отклики на следующее "утверждение":
Допустим, мы хотим поднять место страницы в запросе к Яндексу по фразе А Б В
Например, Пластиковые окна КБЕ
Но нам хочется поднять эту же страницу и по другим "пластиковым" запросам.
И начинаем мы множить ахинею:
Пластиковые окна kbe
Пластиковые окна rehau
Пластиковые окна aluplast
Пластиковые окна пвх
и так далее
Те начинаем множить фразы типа
А Б В
А Б Г
А Б Д
А Ж Б
И мы думаем, что кашу маслом не испортишь.
Однако, некоторая проверка (экспериментальная) показывает (показывает ли ?????), что такое умасливание снижает релевантность именно к запросу А Б В, так как лишние А Б ( без В) как бы размазывают ПОЗИЦИИ "А Б" ВДАЛЬ от ОПТИМАЛЬНОЙ позиции в одно слово (предложение) от "В"
КТО МОГ БЫ ПРИВЕСТИ конкретные примеры ЗА и ПРОТИВ (без воды и было бы вообще идеально с числовыми выкладками)?
Все естественно понимают, что если бы не было ссылочного ранжирования, то ответ можно было бы получить в течение нескольких минут-часов. даааа, это дело нехорошее - надо попробовать! - Так и есть. Сам такое наблюдал.
Но цыфр к сожалению нет. Примеров тоже. Вот только мое слово !exact. - Высококачественный веб-девелопмент, веб-дизайн и промоушен
Graffiti.Org.Ua - Украинское граффити - Миныч, мне всегда интересно читать ваши арифметические наблюдения. Но вы не учитываете чистоту эксперимента. Тл есть на бумаге все так как вы сказали - да размывается... но есть еще ссылочное ранжирование, вес страницы, вес ссылающихся страниц и тд.
и поэтому в серпе порой висят сайты у которых и текста то нет -), не то что а б с или а б в... - Евген, я так понимаю, что на то у меня и тыква, чтобы ее чесать :)
Вот я ее недавно и почесал насчет того, как бы ссылочное ранжирование отфильтровать на некоторых запросах и страницах. Кое - что отфильтровывается. Но вдруг у кого более успешные примеры есть и вдруг ему будет не жалко поделиться с товарищами?
А цифры часто бывают очень точные. Я скоро собираюсь выложить у себя на сайте, как в Яндексе фильтр по кворуму идет. Предварительно:
веса слов из запроса складываются, но предварительно возводятся в степень 0.38 (точность этого коэффициента - до 8 знака после запятой).
Надо заметить, что ПРИ РАНЖИРОВАНИИ (а не фильтрации по кворуму) веса складываются БЕЗ ВОЗВЕДЕНИЯ в степень (проверил пока на малом числе примеров, точность примерно на уровне 3%, те если суммы весов с учетом среднего веса по странице отличаются более чем на 3%, то резудьтат ранжирования предсказывается на 100%). Естественно, если ссылочный фактор одинаков.
Проходной балл для кворума равен (1-мягкость)^sqrt(qq-1)*Сумма_по_всем_i ((вес слова i)^0.38)
i - для перечисления слов в запросе
мягкость почти всегда Яндекс использует 0.06 (это сейчас, экспериментально и на TRECе они и другую мягкость испытывают)
qq- примерно соответствует числу слов в запросе, я проверил для двух и трех слов, например для qq=3 получил отклонение от корня квадратного из двух в 3 тысячные.
Сегалович и Маслов в своей статье тумана напустили насчет ЛОГАРИФМА и что, якобы, усиливается значение редких слов при фильтрации по уворуму, так это с точностью до наоборот: логарифма нет и в помине (степенная функция), влияние редких слов УМЕНЬШАЕТСЯ (степень 0.38 меньше 1). А вот их утверждение о корнях (между квадратным и кубическим) истине соответствует. даааа, это дело нехорошее - надо попробовать!Последний раз редактировалось: Миныч (Чт Апр 14, 2005 4:44 pm), всего редактировалось 1 раз - ну как выложишь - кинь ссылку, почитаю. и вообще захаживать буду -) -
Если не секрет, а почему позиции размазывают именно А и Б?
Мне казалось, что проблемма в лишних Г, Д - они увеличивают общее количество слов, ссылающихся на сайт и тем самым уменьшают относительный вес Г.
Т.е. если толкать сайт по словам "Пластиковые окна" и "Деревянные окна" лучший результат будет по запросу "окна". Чем больше запросов используются в ссылочном ранжировании, тем тяжелее работать с индивидуальным запросом. - Надо все таки различать, какую страницу и под какой запос оптимизируем. Про однословный запрос - особая история. Я еще с ним разбираюсь. Как его спамить лучше и как РЕЗАТЬ текст на ПРЕДЛОЖЕНИЯ. Как сделать это одно слово КОНТРАСТНЕЕ. Нашпигуете страницу относительно редкимим словами kbe пвх рехау - уменьшите контрастность слова окно по отношению к тексту всей страницы. И понизите релевантность страницы.
У вас есть программа для определения среднего веса слова на странице? Надо занижать средний вес и спамить только словами из запроса. Плюс, Вы знаете как Яндекс поступает со словами которые часто идут в ОДНОМ Предложении? Отсюда вывод, не очевидно что в одном предложении желательно использовать конструкции типа "окна пвх, окна кбе, деревянные окна". Возможно надо вместо запятых точки ставить :)
Euhenio делал тут анализ по слову "порно". Очень полезный. Ему бы в анализ включить такие параметры как средний вес слова на странице и нарезку на ПРЕДЛОЖЕНИЯ. Многое бы прояснилось.
По многословным запросам (пример):
Запрос А Б
В тексте встретилось А 1 Б 3 А (цифры - расстояние в словах)
Вес слова А ДЕЛИТСЯ на две СЛОВОПОЗИЦИИ. Причем вторая - не оптимальна по расстоянию в словах. Вы то думаете, что ОБЕ "А" вносят примерно вдвое больше, чем одна "А". Однако это не так. Заведомо ДВЕ А а ОДНОМ ПАССАЖЕ будут хуже, чем Одна А в оптимальной для запроса позиции. Хотя, возможно, я в этом ошибаюсь. Потому и эту тему затеял. даааа, это дело нехорошее - надо попробовать! - Буквально сегодня озадачивался этим вопросом, на примере
http://zub-m.ru
завтра начну переписывать ядро и проверять на практике свои и ваши гипотезы Раскрутка сайтов / Продвижение сайтов / Оптимизация сайтов - Миныч, могу дать базу скачанных страниц, кажется, я ее еще не удалил... И сам нарежешь.
Но, как оказалось, влияние ссылочного ранжирования и там есть. Т.е., даже выбрав такой запрос, как "порно" от него избавиться не удалось. -
Читали анализ какой-то, может тот самый, по этому запросу адалт-оптимизаторы, помню все дружно смеялись. Т.к. реально по этому запросу частично рандом присутсвует)) Статья была далека от реальности, не попробовав продвинуть сайт автор всегда будет далек от реальных выводов. А если продержится ресурс год в 10-ке и ни разу не вылетит вообще из базы Яндеса на полгода, то это чудо-оптимизатор - Спасибо, Euhenio, было бы интересно. Сколько МБ она тянет? И через что качать?
Конечно от ссылок никуда не деться, но ведь в первом приближении уже можно основную часть усечь и учесть :) А там методом последовательных приближений...
Насчет наличия рэндома - сильно сомневаюсь. Для Яндекса это невыгодно (для верхних позиций). Ведь народ плеваться начнет - вчера нужная информация находилась легко, а сегодня что за черт? Пойду-ка я лучше на Рамблер старый и добрый :).
За рэндом можно принять регулярную борьбу Яндеса со спамом, кстати, особенно активную по этому слову и на эдалт сайтах. Или гиперактивность (нимфоманию :) в смене контента страниц на эдалте. Сейчас идут Даши, через секунду Маши, потом Феклы, Свеклы, то сзади, то спереди...
А теперь всем любителям поломать голову над секретами Яндекса - вот вам диаграмка. Специально вывел в диалоговом окне, там меньше пустот в графике и лучше видна заковыка :)
http://www.minich.ru/photo-album/seo/ya-page-rank-1.jpg
Сравнивались по первенству в выдаче две странички одинаковой длины (в словах). Практически все слова на этих страничках встречаются только один раз. Слова одной страницы за исключением 10 слов отличны от слов другой. Средний вес одного слова 1й страницы 1846621,762 а средний вес одного слова второй 2408732,912
Задавался запрос ИЛИ, причем находилось по одному слову на каждой страничке в ОДНОЙ И ТОЙ ЖЕ ПОЗИЦИИ от ГОЛОВЫ страниц.
Первенство в выводе отмечается цветом По осям веса найденных слов на страницах.
В СРЕДНЕМ линейность по весу очевидна, но, что интересно, смотрите какие ступеньки хитрые :)
Кто даст разумные объяснения?
Денька через два повторю проверку, макросик уже отлажен, время займет немного. Чтобы на рэндом не списали :) даааа, это дело нехорошее - надо попробовать! - Раз уж я в другой теме уже немного заикнулся о некоторой "тыквенной" работе:
http://seochase.com/viewtopic.php?p=16955#16955
Но здесь это более уместно повториться:
Методы профессиональной работы -это и "ручками" и "статистикой" и "тыквой". Что-то такое якобы Гугль нахимичил, что анализу не поддается - это больше от тыквы зависит, а не от неограниченных возможностей :)
С Яндексом... А Гугль мне кажется еще более простым. Не надо забывать о таких методах, как АКТИВНЫЕ эксперименты.
Я вот с Яндексом делаю такую штуку - генерю страницы по определенной схеме. Один из приемов: как отделить ссылочный фактор.Страницы, которые я генерю с точки зрения веса слов, порядка слов и знаков препинания ИДЕНТИЧНЫ, но совершенно различны по содержанию (нет ни одного совпадающего слова) Небольшое уравнение - и ссылочного неизвестного вклада уже нет :). Мало ли таких тыквенных приемчиков? даааа, это дело нехорошее - надо попробовать! - Добавил еще одну картиночку. Страницы уже другие, а результат (ступеньки ) тот же. Тут я даже не очень следил за позицией относительно головы, что означает, что от позиции относительно головы мало что зависит :)
http://www.minich.ru/photo-album/seo/ya-page-rank-2.jpg даааа, это дело нехорошее - надо попробовать! - Для поддержания интереса к теме выдам еще порцию информации.
Ступеньки - объективная реальность.
Ступеньки имеют строго горизонтальную поверхность и строго вертикальную составляющую (проверено на уровне долей процента).
Высота предыдущей ступеньки составляет примерно 0.72-0.73 от высоты следующей.
Внешние изломы ступенек попадают на прямую с углом наклона ровно 45 градусов.
Внутренние изломы ступенек - на стороне страницы с бОльшим средним весом слова (меньшей контрастностью ключевого слова).
Близость ключевого слова к Голове или к концу документа не имеет измеримого эффекта.
:)
Скажу спасибо за комментарии и подсказки :) даааа, это дело нехорошее - надо попробовать! - Меня попросили объяснить, что отложено на осях диаграмм, что означает цвет точек и как рассчитывается вес слов.
Начнем с самого простого.
Вес слова дает сам Яндекс, видимо из своей стандартной коллекции документов. Если Вы посмотрите на url ссылки в "Найденные слова", то после слова (в кодировке браузера) будут идти два двоеточия и после них число. Это и есть вес слова. Когда Яндекс отключит этот просмотр - ничего страшного, будем определять по реперным соотношениям и тестовым страницам. Да и в индексе Яндекса Рамблера и Гугля их можно будет найти еще через много лет (правда Яндекс может эти значения время от времени корректировать).
По осям диаграмм отложен веса слов, найденных на страницах. Так как слов искалось два в одном запросе, то и диаграмма двумерная. Можно n-мерные использовать, так быстрее закономерности можно отловить.
На одной оси вес 1-го слова, по другой оси 2-го.
Каждая точка - ОДИН!!! эксперимент, экспериментов много, страницы во ВСЕХ экспериментах одинаковые, а запросы на поиск разные (то есть РАЗНЫЕ слова искались и с РАЗНЫМИ весами).
Цвет точки на диаграмме означает какой по порядку выдавалась страница ( один цвет - первой в выдаче, другой цвет, второй в выдаче
Одной точке на диаграмме соответствует ДВА слова запроса к Яндексу на поиск (ИЛИ). Каждое из этих двух слов принадлежит только одной странице (из наших двух).
Попутно для тех кому это интересно :)
Попробуйте определить веса слов domain url link и сравните с данными Рамблера и Яндекса. даааа, это дело нехорошее - надо попробовать!
Интернет казино
Онлайн игры
Купить DVD
Другие сайты
|