Из рассказа разработчика генератора дорвеев
doorway-guru

Изменения за три года весьма значительные.

По генератору текстов:
Установлен потоковый накопитель кейвордов для их комбинаторного наращивания и диффузионный генератор синтагм, который редуцирует диалогический и монологический контекст. Внесены изменения в блок параллельной лингвистики и модуль метонимической обработки диссонансных категорий.

Механизм генерации отдельных синонимов тоже видоизменен. Добавлены градации для наблюдаемых текстовых категорий.
Ритмическая организованность таких текстов не всегда очевидна, поэтому в дорген интегрирована лингво-структура без использования формальных признаков художественных стилей.
Вместо цепочек Маркова применена эвристическая рандомизация групп текстового контента. Диалектический анализатор абзацев и предложений, основываясь на парадоксальном совмещении исключающих друг друга принципов характерности и ритмичности, выбирает оптимальный механизм генерации текстовых конструкций.

Лексический блок доргена, за счет использования параллелизмов и повторов на разных языковых уровнях, осуществляет заимствование, проводя реальный конструктивный композиционный анализ, таким образом в некоторых случаях образуются рефрены, кольцевые композиции, анафоры.
Комбинаторное приращение запускает синтагмический верлибр – это уже пятая стадия генерации контента.
Блок аллитерации, который оптимизирует конкретный размер синтагм и формирует словесные формации нового типа, улучшая его морфологическую форму, в расширенном варианте будет задействован в следующей версии доргена.

На автомате сайты не банятся. Внешне от белых не отличаются ничем.

Отдельно разрабатывался модуль внутренней перелинковки для обеспечения эффективной навигации поисковых ботов по сайту.
От статической структуры внутренней перелинковки сразу пришлось отказаться. Динамическая перелинковка позволяет показать поисковому боту максимальное количество новых страниц, которые он с большим аппетитом индексирует. Навигацию бота по сайту контролирует флуктуационный манипулятор доргена, изменяя структуру перелинковки, которая определяет пути движения бота. При этом решается транспортная задача (задача Монжа – Канторовича) — математическая задача линейного программирования специального вида. Для простоты понимания рассматривается как задача об оптимальном плане перевозок грузов из пунктов отправления в пункты потребления, с минимальными затратами на перевозки.

В случае движения бота по сайту решением транспортной задачи является создание оптимальных путей для его перемещения от страницы к странице. Флуктуационный манипулятор доргена каждый раз изменяет внутреннюю перелинковку сайта, заставляя тем самым поискового бота индексировать только новые страницы, на которых бот еще не побывал. В этом случае бот работает заинтересованно и индексирует за несколько проходов по сайту рекордное количество страниц. Аналогичным образом решается задача по индексации исходящих ссылок. Флуктуационный манипулятор подсовывает боту каждый раз новые исходящие ссылки.

Сравним классическую схему индексации, при статической перелинковке с описанной выше. Если считать индексацию одной ссылки выстрелом из винтовки, к примеру, то при вышеописанном способе индексации стрельба происходит уже из оружия с вращающимся блоком стволов (пулемет системы Гатлинга).
Флуктуационный манипулятор выполнен по схеме Гатлинга и пуляет ссылками из 48 стволов.

Для обеспечения заинтересованной работы поисковых ботов на сайтах используется система honeypot – своеобразных приманок для ботов. Боты очень любят мёд! Почему? Кто поймёт? В самом деле, почему?
В качестве honeypot используются самообновляемые страницы, которые парсят тексты из выдачи поисковых систем по заданному списку ключевых слов – эти страницы боты очень любят.

В остальном обычная схема – редиректы всякие, ифрейм, можно включить клоакинг по юзер-агентам и защиту от лишних ботов.
Технически все сделано на PHP с применением нанотехнологий, рифлетки и шабера.

(Visited 46 times, 1 visits today)