Google indeksiranje stranica je proces ubacivanja novih web stranica u Google bazu (indeks). Rezultati Google pretrage su efikasni (brzi, a daju veliki broj rezultata) upravo iz razloga što Google ne ide svaki put kada ukucate svoj zahtev u pretragu kompletnog interneta, već samo u pretragu svoje baze.
Znači, od momenta kada se novi sajt pojavi na internetu potrebno je određeno vreme dok ga Google indeksira i “ubaci” u svoju bazu (koriste se i termini “da ga Google pročita”, da postane vidljiv na Google, da izađe u rezultatima pretrage itd.).
Proces Google indeksiranja stranica pokušaćemo da ukratko opišemo u narednim pasusima.
O samom načinu rada pretraživača možete da pročitate ovde.
Spider (“pauk”- robot, program za pretraživanje) pretraživača skenira stranicu u potrazi za linkovima i zatim prati te linkove i skenira te stranice u potrazi za još linkova i to radi stalno.
Prilikom zatraživanja stranice od servera svakoj stranici daje broj da ih kasnije može razlikovati (i ostale podatke poput vremena indeksiranja).
A zatim te linkove prosleđuje drugom spideru koji vrši indeksiranje.
Nakon indeksiranja ti dokumenti nisu spremni za rezultate pretraživanja već na temelju njih prvo treba izgradi indeks pretraživača iz koje se vuku rezultati (ono što se često naziva glavni indeks).
Taj indeks se ne radi na način da se pretražuju sve indeksirane stranice svaki put već se sortiraju stranice po ključnim rečima što je velika razlika u brzini.
Time se dobije indeks iz kojeg se dobivaju rezultati pretraživanja spremni za određivanje relevatnosti, ali na način da ako upišete ključnu reč „apartmani“ prvo se se sortiraju sve stranice koje sadrže ključnu reč apartmani, a zatim se pretražuju samo te stranice.
Znači ukoliko se u stranici nigde ne spominje reč „apartmani“ nećete biti uopšte na popisu iz kojeg se vuku rezultati što je logično.
Zatim da bi se stvar još više ubrzala Google ne koristi par računara da bi sortirao te stranice već znatno znatno više (navodi se čak i do 500 računara koji sve izračunaju ispod pola sekunde), deli posao pretraživanja između računara od kojih svaki računar pretražuje svoj deo.
Time se dobija indeks koji sadrži stranice koje sadrže ključnu reč kojom korisnik pretražuje.
Kada se to dobije tek se onda kreće na određivanje relevatnosti svake stranice.
Tu u igru dolaze faktori, to su faktori koji određuju koliko je stranica relevatna za određeno pretraživanje i koliko je popularna tj. koliko ima linkova prema njoj. Time se dobijaju konačni rezultati koji se serviraju od najrelevatnijih prema onima koji su manje relevatni.
Ovo otvara niz pitanja tipa zašto će nešto indeksirati, zašto neće nešto indeksirati, zašto će nešto sporije indeksirati, zašto će nešto brže indeksirati itd.
Glavni faktor koji utiče na indeksiranje su ulazni i izlazni linkovi, koga vi linkujete na svojim stranicama i ko vas linkuje.
Budući da su linkovi usko vezani uz Google Page Rank (PR) on je jedan od presudnih faktora koji utiču na indeksiranje.
Tu su i onpage faktori ili faktori vezani uz to što je na samoj stranici. I oni se uzimaju u obzir , ali su nešto manje bitni.
Ukoliko želite biti brže indeksirani to ne zavisi od vremena, već o tome koliko imate linkova te koga linkujete i pritom treba biti oprezan da se ne linkuju sumnjivi domeni, da se ne učestvuje u preteranoj razmeni linkova, da domeni nemaju samo slabe linkove i slično.
Znači kad nas netko pita koliko vremena treba Google-u da indeksira nečiji sajt, nećemo mu odgovoriti dve nedelje ili mesec dana nego mu odgovoaramo da to zavisi od količinie i kvaliteta linkova, što više kvalitetnih linkova, pre će bit indeksiran.