Algorytm wyszukiwarki

Jak działają wyszukiwarki? Podstawowe informacje o algorytmach wyszukiwania.

Każda wyszukiwarka internetowa składa się z 3 głównych modułów, które odpowiedzialne są odpowiednie przetworzenie danych dostępnych w zasobach Internetu. Moduły te dotyczą zbierania informacji o stronach, przetwarzania i analizy zebranych danych oraz prezentacji wyników dla danych zapytań użytkowników.

Robot internetowy

Głównym zadaniem tego modułu jest odwiedzane stron WWW. Przechodzenie między poszczególnymi witrynami następuje poprzez znalezione na witrynach łącza i odnośniki. Moduł ten jest często także robotem indeksującym lub pajączkiem. Od szybkości przechodzenia między poszczególnymi stronami, omijania zapętleń, zależy ilość odwiedzonych stron w danym okresie czasu.

Moduł indeksujący

Odpowiedzialny jest za analizę treści zawartych na stronach WWW. Do każdej strony dodatkowo przypisywane są słowa i frazy jakie znalazły się na nich i z jakich zostały przekierowane. Dla każdego słowa znalezionego na danej witrynie zostaje przypisany odpowiedni „ranking”, który określa jak konkretna strona jest powiązana z daną frazą. Wartość jaką uzyska witryna dla danego słowa zależy od wielu różnych czynników takich jak, czy słowo znajduje się w tytule strony, metatagach, ile razy zostało użyte na całej powierzchni strony, czy znajduje się na początku bądź końcu treści. Ważnym czynnikiem jest także odpowiednia renoma witryny w Internecie, która określana jest na podstawie ilości i jakości linków prowadzących do ocenianej strony. O wartości przypisywanym danym słowom decyduje algorytm, który ustala ranking stron (zwany często TrustRank). Każda wyszukiwarka posiada unikalny algorytm, który łączy poszczególne wagi z słowami kluczowymi i na ich podstawie ustala kolejność stron w SERP. Od prawidłowego przydzielenia wartości zależy poprawność i jakość wyników wyszukiwania.

Procesor zapytań

Jest to zewnętrza część każdej wyszukiwarki, która umożliwia użytkownikom zadanie konkretnego zapytania i przedstawia wyniki wyszukiwania dla danej frazy. Procesor zawsze odnajduje wszystkie strony, które otrzymały jakąkolwiek wartość przez analizę w module indeksującym, prezentowana lista wyników jest uporządkowana w kolejności od tych najlepiej spełniających kryterium danego użytkownika, do tych najmniej spełniających. Głównym elementem poprawiającym ten moduł jest możliwość podpowiedzi zapytań oraz czas przestawienia wyników.

Komentuj

Twój e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *.
Możesz użyć następujących tagów HTML lub atrybutów: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>