Информационни ресурси

© Христо Тужаров, 2012         

ИНДЕКСИРАНЕ НА ИНТЕРНЕТ  РЕСУРСИ

 

• Home • Съдържание • Консултации • Асеневци •

 

ИНТЕРНЕТ ИНФОРМАЦИОННИ  РЕСУРСИ

 

Търсене на информация в Интернет

 

7 стъпки за намиране информация в Интернет

АРХИТЕКТУРА НА WEB-ПРОСТРАНСТВОТО

ИНСТРУМЕНТИ ЗА ТЪРСЕНЕ В ИНТЕРНЕТ

СКРИТ ИЛИ НЕВИДИМ WEB

ИНДЕКСИРАНЕ НА ИНФОРМАЦИОННИ РЕСУРСИ

 

ОЦЕНКА НА ИНТЕРНЕТ РЕСУРСИ

Оценка  на  Web  сайт

9 стъпки за индексиране на Интернет ресурси

1. Мрежови агенти, или роботи паяци „пълзят” по Мрежата, анализират съдържанието на Web-страниците и събират информация за това, какво и на коя страница е открито.

 

При намиране на поредната HTML-страница, търсачките фиксират думи, картинки, връзки и други елементи, съдържащи се в нея.

 

2. Търсачката формира списък с думи и адресите, където те са намерени.

 

При проследяване на думите в страницата се фиксира не само тяхното наличие, но и местоположението - заглавие (title), подзаглавие (subtitles) метатаговете или на други места.

 

При това обикновено си фиксират значими думи, а  съюзи и междуметия (стоп-думи) от типа "а", "но" и "или" се игнорират.

 

Метатаговете позволяват да се обозначат ключовите думи  и тематиката, по които се индексират страниците. Метатаговете подпомагат търсачката да се ориентира в разнообразието на думи и тяхната релевантна стойност. Поради неправилното използване на метатаговете с рекламна и комерсиална цел,  днес те все по-слабо се използват от търсачките.

 

3. Данните се индексират с отчитане на коефициенти на тежест. Извършва се прекодировка на данните.

 

Търсейки определена дума, търсещия механизъм трябва да намери не всички страници, съдържащи тази дума, а само тези страници, където думата има отношение към темата на сайта. За да определи доколко една или друга дума има отношение към профила на страницата е необходимо да се оцени:

  • колко често думата се среща в страницата;,

  • има ли от дадената дума хипервръзки;

Трябва да се ранжират намерените в страницата думи по степен на важност. На думите се присвояват коефициенти на тежест в зависимост от това колко пъти и къде те се срещат (в заглавиено, в края или началото, в хипервръзка, в метатаг и т.н.).

 

4. Създадения индекс се съхранява в базата данни, която постоянно се обновява.

 

Роботите-паяци при пътешествието по хипервръзки формират файл, съдържащ индекса на страницата, който може да бъде доста голям. За намаляването му се прибягва към минимизация и компресиране на файла.

 

5. Търсенето по индекс се състои в това, че потребителя формира заявка и я предава на търсачката.

 

При заявката се използват булеви оператори (AND, OR, NOT) и други оператори, специфични за конкретната търсачка.

 

6. Търсещата система обработва синтаксиса на заявката и сравнява ключовите думи с думите в индекса.

 

7. Съставя се списък на сайтовете, съдържащи ключовите думи.

 

8. Списъкът се ранжира по релевантност.

 

9. Формира се резултата от търсенето.