FeedBurner: удаляем лишние GET параметры из ссылок фида

archive view archive save

rss-feed-logo Если Вы используете FeedBurner для обработки своих RSS/ATOM лент новостей, то нужно и самому подписаться на свой "фид" и следить за тем, чтобы рассылаемые сообщения и ссылки в них были корректными.

При создании RSS/ATOM ленты в FeedBurner можно пропустить некоторые настройки, в результате чего ссылки на материалы могут быть с кучей дополнительных параметров в строке запроса, которые могут определяться веб-сервером как вредоносные, например:

http://www.remoteshaman.com/forum/hosting-providers/70-ishchu-kitajskij-khosting
-fajlov-zhelatelno-fri?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3
A+remote-shaman-forum+%28%D0..tra-ta-ta...&utm_content=FeedBurner#100
 
[Sat May 10 14:44:12 2014] [error] [client 76.53.243.87] ModSecurity:  [file "/e
tc/httpd/modsecurity.d/activated_rules/modsecurity_crs_40_generic_attacks.conf"]
 [line "37"] [id "960024"] [rev "2"] [msg "Meta-Character Anomaly Detection Aler
t - Repetative Non-Word Characters"] [data "Matched Data:  (\\xd0\\x9f\\xd0\\xbe
\\xd1\\x81\\xd0\\xbb\\xd0\\xb5\\xd0\\xb4\\xd0\\xbd\\xd0\\xb8\\xd0\\xb5 \\xd1\\x8
2\\xd0\\xb5\\xd0\\xbc\\xd1\\x8b -  found within ARGS:utm_campaign: Feed: remote-
shaman-forum (\\xd0\\x9f\\xd0\\xbe\\xd1\\x81\\xd0\\xbb\\xd0\\xb5\\xd0\\xb4\\xd0\
\xbd\\xd0\\xb8\\xd0\\xb5 \\xd1\\x82\\xd0\\xb5\\xd0\\xbc\\xd1\\x8b - Remote Shama
n - \\xd0\\xa4\\xd0\\xbe\\xd1\\x80\\xd1\\x83\\xd0\\xbc - www.remoteshaman.com)"]
 [ver "OWASP_CRS/2.2.8"] [maturity "9"] [accuracy "8"] Access denied with code 4
03 (phase 2). Pattern match "\\\\W{4,}" at ARGS:utm_campaign. [hostname "www.rem
oteshaman.com"] [uri "/forum/hosting-providers/70-ishchu-kitajskij-khosting-fajl
ov-zhelatelno-fri"] [unique_id "U24RDF2qgHIAAD7hQVUAAAAC"]

Самым неприятным из аргументов строки GET запроса оказался utm_campaign, который был запеленгован сервером как Meta-Character Anomaly Detection Alert - Repetative Non-Word Characters, на что сервер ответил "отлупом" с кодом ответа HTTP 403 (Доступ запрещён).

Правило mod_security можно отключить следующим образом:

# Config for mod_security
<IfModule mod_security2.c>
    SecRuleRemoveById 960024
</IfModule>

Но отключение правил mod_security не является хорошей идеей и от неё лучше сразу отказаться, - лучше избавится от параметров! Но как?

Перечисленные выше параметры в строке запроса добавляются FeedBurner-ом во все ссылки ленты RSS/ATOM для сбора дополнительной статистики, эти параметры также каким-то образом могут стать причиной появления дублей страницы в поисковом индексе ибо были случаи появления в индексе ссылок FeedBurner-овскими GET параметрами.

В настройках FeedBurner-а feedburner - analyze - configure stats есть такая "фича" как item link clicks и Tracks clicks as a traffic source in Google Analytics, - вот их то нам и нужно выключить.

feedburner-urls-without-query-strings

На стороне сайта также желательно включить ЧПУ (Человеко-Понятные Урлы).


Комментарии   

Michalych
0 #1 Michalych 07.08.2016 22:31
Спасибо за статью! А то непонятно, откуда эти параметры включились. Вроде небыло при создании, либо же я не заметил. У меня с ними 404 ошибка вылетала. Теперь всё хокей!!! 8-)
Цитировать

Добавить комментарий

АХТУНГ! Все комменты гостей модерасятся модерастом.
  1. Мессаги исключительно рекламного содержания, либо содержащие только одни оценочные суждения типа "круто" ("отлично", "спасибо", "автор дебил" и т.п.) не публикуются;
  2. Злостным спамерам, пранкерам и прочей сетевой нечисти рекомендуем напрасно не тратить своего времени и удовлетворять свои больные фантазии на специализированных Интернет ресурсах!;
  3. Разумная обоснованная критика, замечания, дополнения приветствуются. Поля помеченные символом * обязательны к заполнению.


Защитный код
Обновить

Комментарии в блоге
Новое на форуме