Back to Question Center
0

Семалт пружа савете о томе како се бавити боцама, паукама и гусарима

1 answers:

Поред стварања пријатељских УРЛ-ова претраживача , датотека .хтаццесс омогућава вебмастере блокирање одређених бота од приступања њиховом веб локацији. Један од начина блокирања ових робота је датотека роботс.ткт. Међутим, Росс Барбер, Семалт Менаџер за успех купаца, наводи да је видео неке скретнице игноришући овај захтев. Један од најбољих начина јесте да користите .хтаццесс датотеку да их спречите да индексирају свој садржај.

Који су то ботови?

Они су врста софтвера који користе претраживачи за брисање новог садржаја са Интернета ради индексирања.

Обављају следеће задатке:

  • Посетите веб странице са којима сте се повезали
  • Проверите свој ХТМЛ код грешака
  • Сачувате које веб странице повезујете и видите које веб странице повезују са вашим садржајем
  • Они индексирају ваш садржај

Међутим, неки ботови су злонамерни и претражујте своју локацију за е-адресе и обрасце који се обично користе за слање нежељених порука или нежељене поште. Други чак и траже сигурносне рупе у вашем коду.

Шта је потребно за блокирање веб претраживача?

Прије кориштења .хтаццесс датотеке, потребно је провјерити сљедеће ствари:

1. Ваша страница мора бити покренута на Апацхе серверу. Данас, чак и оне веб хостинг компаније полу-пристојне у свом послу, дају вам приступ потребном документу.

2. Требали бисте имати приступ сировим серверима на вашој веб локацији тако да можете да пронађете које боте су биле у посјети вашим веб страницама.

Имајте на уму да нећете моћи блокирати све штетне ботове, осим ако их не блокирате, чак и оне за које сматрате да су корисне. Нови ботс долазе сваки дан, а старији су модификовани. Најефикаснији начин је осигурати свој код и отежати ботс да вас спамују.

Идентификоване боте

Боте се могу идентифицирати по ИП адреси или из њиховог "Стринга корисника агента", које шаљу у ХТТП заглавља. На пример, Гоогле користи "Гооглебот."

Можда вам је потребна ова листа са 302 бота ако већ имате име бот-а који желите да задржите уз помоћ .хтаццесс

<п стиле = "лине-хеигхт: 1..5; тект-алигн: јустифи; "> Други начин је да преузмете све датотеке дневника са сервера и отворите их помоћу уређивача текста. Њихова локација на серверу може се променити у зависности од конфигурације вашег сервера. помоћ вашег веб домаћина.

Ако знате која је страница посјетила или вријеме посјете, лакше је доћи са нежељеним ботом. Можете да претражите датотеку евиденције помоћу ових параметара.

Једном сте приметили које боте морате блокирати; онда их можете укључити у .хтаццесс датотеку. Имајте на уму да блокирање бота није довољно да га заустави. Може се вратити новом ИП или именом.

Како их блокирати

Преузмите копију датотеке .хтаццесс. Правите резервне копије ако је потребно.

Метод 1: блокирање ИП-ом

Овај фрагмент кода блокира бот користећи ИП адресу 197.0.0.1

Наручите одбијање, дозволи

Одбија од 197.0.0.1

Прва линија значи да ће сервер блокирати све захтјеве који одговарају образцима које сте навели и дозволити свим осталим.

Друга линија говори серверу да изда 403: забрањену страницу

Метод 2: Блокирање од стране Кориснички агенти

Најлакши начин је да користите Апацхе-ов мотор за преправљање

РевритеЕнгине Он

РевритеЦонд% {ХТТП_УСЕР_АГЕНТ} БотУсерАгент

РевритеРуле. - [Ф, Л]

Прва линија осигурава да је модул за преписивање омогућен. Друга линија је услов за који се примењује правило. "Ф" у реду 4 говори серверу да врати 403: Забрањено док "Л" значи ово је последње правило.

Тада ћете уплоадовати .хтаццесс датотеку на ваш сервер и преписати постојећу. Временом ћете морати да ажурирате ИП адресу бот-а. Ако направите грешку, само отпремите резервну копију коју сте направили.

November 29, 2017
Семалт пружа савете о томе како се бавити боцама, паукама и гусарима
Reply