Преглед садржаја
Када претраживачи стигну на веб локацију, почињу да траже датотеку роботс.ткт да би је прочитали. То ће зависити од његовог садржаја тако да паук тражилице настави унутар странице или пређе на другу.Датотека роботс.ткт садржи списак страница које је дозвољено индексирати претраживачу, што заузврат селективно ограничава приступ одређеним претраживачима.
Ово је АСЦИИ датотека која се мора налазити у корену веб локације. Команде које може да садржи су:
Агент усер: Користи се за одређивање робота који ће следити представљена наређења.
Не дозвољавају: Користи се за идентификацију страница које ће претраживач искључити током процеса анализе. Важно је да свака страница која се изузима мора имати засебне редове и такође мора почети симболом /. Са овом симболиком се прецизира; на „све странице веб локације“.
Изузетно је важно да датотека роботс.ткт нема празних редова.
Неки примери су приказани испод;
- Када желите да изузмете све странице; Кориснички агент је: Не дозволи: /.
- Ако циљ није изузимање било које странице, онда датотека роботос.ткт не сме постојати на веб локацији, односно све странице сајта ће бити посећене једнако.
- Када је одређени робот искључен, то ће бити:
- Корисник агента: Име робота Не дозволи: / Корисник агента: * Не дозволи:
- Када је страница искључена; Корисник агента: * Не дозволите: /дирецтори/патх/паге.хтмл
- Када се све странице именика искључе са веб локације са одговарајућим подмапама, то ће бити; Корисник агента: * Не дозволи: / дирецтори /
Друга функција је спречавање индексирања дупликата садржаја који се налази на веб локацији, како се не би казнили.
Остало треба узети у обзир да неки роботи могу занемарити упутства представљена у овој датотеци, а такође мора бити јасно да је датотека јавна јер сви који пишу ввв.екампле.цом/роботс.ткт могу јој приступити.
Сада се може поставити питање; Како генерисати датотеку роботс.ткт?
Заправо је прилично једноставно јер је то текстуални документ са именом "роботс.ткт", а затим га отпремите у корен домена странице, тамо ће претраживачи ићи да га траже да би га прочитали.
Основна датотека роботс.ткт може бити:
Кориснички агент: *
Забрани: / приватно /
Генеришу се упутства за забрану приступа директоријуму који ће бити „приватан“ за све претраживаче.
Команда одређује да је адресирана на све роботе (Усер-агент: *), наводећи да је директоријум забрањен (Дисаллов: / привате /).
Параметар који се користи за Гоогле претраживач је; Кориснички агент: Гооглебот
Као што је раније поменуто, његова употреба у СЕО -у се користи за ограничавање приступа робота дупликату садржаја.Да ли вам се допао и помогао овај водич?Можете наградити аутора притиском на ово дугме да бисте му дали позитиван поен