Traženje informacija na internetu. Osnovne metode traženja informacija na Internetu. Načini traženja informacija na Internetu pomoću pretraživača

Mogu se razlikovati sljedeće glavne metode pretraživanja informacija na Internetu, koje se, ovisno o ciljevima i zadacima pretraživača, koriste pojedinačno ili u kombinaciji jedna s drugom:

1. Direktno pretraživanje koristeći hipertekstualne veze

Budući da su sve stranice u WWW prostoru zapravo povezane jedna s drugom, informacije se mogu pretraživati ​​uzastopnim pregledavanjem povezanih stranica pomoću pretraživača.
Iako je ovaj potpuno ručna metoda pretraga izgleda kao potpuni anahronizam na Webu, sadrži više od 60 miliona čvorova, "ručno" pregledavanje web stranica je često jedino moguće završnim fazama pretraživanje informacija, kada mehaničko “kopanje” ustupi mjesto dubljoj analizi.
Korištenje kataloga, klasifikovanih i tematskih lista i svih vrsta malih imenika također se odnosi na ovu vrstu pretraživanja.

2. Upotreba pretraživača

Danas je ova metoda jedna od glavnih i, zapravo, jedina metoda pri obavljanju preliminarne pretrage. Rezultat potonjeg može biti lista mrežnih resursa koji su predmet detaljnog razmatranja.
Po pravilu, upotreba pretraživača se zasniva na upotrebi ključne riječi, koji se prosljeđuju serverima pretraživanja kao argumenti pretraživanja: šta tražiti.
Ako se uradi ispravno, generisanje liste ključnih reči zahteva preliminarni rad na sastavljanju tezaurusa.

3. Pretražujte pomoću posebnih alata

Ova potpuno automatizovana metoda može biti vrlo efikasna za provođenje početnih pretraga.
Jedna od tehnologija ove metode zasniva se na upotrebi specijalizovani programi- pauci koji su unutra automatski način rada pretražuju web stranice, tražeći informacije koje traže.
Zapravo, ovo je automatizirana verzija pregledavanja pomoću hipertekstualnih veza, opisanih iznad (pretraživači koriste slične metode za pravljenje svojih indeksnih tabela).
Nepotrebno je reći da su rezultati automatsko pretraživanje nužno zahtijevaju dalju obradu.
Aplikacija ovu metodu Preporučljivo je ako korištenje pretraživača ne može dati potrebne rezultate (na primjer, zbog nestandardne prirode upita, koji se ne može adekvatno specificirati postojećim alatima tražilice).
U nekim slučajevima ova metoda može biti vrlo efikasna.
Izbor između korištenja pauka ili tražilica je opcija klasičan izbor između upotrebe univerzalnih ili specijaliziranih proizvoda.

1.4 Analiza novih resursa

Pretraživanje novostvorenih resursa može biti neophodno kada se ponavljaju ciklusi pretraživanja, traže se najnovije informacije ili se analiziraju trendovi u razvoju objekta proučavanja tokom vremena.
Drugi mogući razlog Može biti da većina pretraživača ažurira svoje indekse sa značajnim zakašnjenjem uzrokovanim ogromnim količinama podataka koji se obrađuju, a to je kašnjenje obično veće što je tema koja vas zanima manje popularna.
Ovo razmatranje može biti veoma značajno kada se vrši pretraga u visoko specijalizovanoj predmetnoj oblasti.

1. Određivanje adrese stranice . Ovo je najviše brz način pretraživanje, ali se može koristiti samo ako je poznata tačna adresa dokumenta.

ZA PRETRAŽIVANJE POTREBNIH INFORMACIJA NA MREŽI KORISTI SE ADRESA Uniform Resource Locator (URL), koja sadrži naziv protokola pomoću kojeg trebate pristupiti traženim informacijama, adresa servera i naziv datoteke na ovom serveru, na primjer:

http www.kazan.ru

(hijerarhijska struktura - s desna na lijevo http - hipertekst protokol, www - čvor se nalazi u web prostoru).

Dijelovi adrese:

Ru - Rusija (može biti troslovna)

Kazanj - izvor Kazana,

Www - Internet resurs, web stranica (web stranica), stranica sadrži hiperveze koje vam omogućavaju da se krećete kroz tok informacija pomoću principa matrjoške. Program pretraživača vam omogućava da se ne izgubite (Početna stranica).

Http je protokol za prijenos hiperteksta.

Što se tiče protokola, Internet koristi nekoliko tipova protokola koji su se pojavili tokom vremena i napretka kompjuterske tehnologije. To uključuje telnet tekstualni protokol, ftp protokol datoteka, usenet protokol za telekonferencije, wais protokol baze podataka, gopher protokol, itd.

2. Kontaktiranje servera za pretragu (pretraživača). Najviše se koristi tražilice zgodan način traženje informacija.

Trenutno su sljedeći serveri za pretraživanje popularni na ruskom govornom području interneta:

Primjer pretraživača:

www.rambler.ru

www.goo-gle.ru

Pretraživač pronalazi adresu stranice koristeći ključne riječi, čak i fraze.

Postoje i drugi pretraživači. Na primjer, efikasan sistem pretraživanja implementiran je na serveru mail.ru servisa pošte.

Jezik upita pretraživača

Grupa ključnih riječi formirana prema određenim pravilima - korištenjem jezika upita - naziva se zahtjev serveru za pretraživanje. Jezici upita za različite servere pretraživanja su vrlo slični. Više o tome možete saznati ako posjetite odjeljak „Pomoć“ na željenom serveru za pretragu. Pogledajmo pravila za formiranje upita koristeći Yandex tražilicu kao primjer.

Sintaksa operatora Šta znači operator? Primjer zahtjeva
prostor ili & Logično I (unutar rečenice) fizikalnu terapiju
&& Logički I (unutar dokumenta) recepti && (topljeni sir)
I Logično OR foto | fotografija | sni-mock | fotografska slika
+ Obavezno prisustvo riječi u pronađenom dokumentu +biti ili +ne biti
() Grupisanje riječi (tehnologija\proizvodnja) (sir\svježi sir)
~ Binarni operator I NE (unutar rečenice) banke ~ zakon
~~ ili ___ Binarni A NE operator (unutar dokumenta) vodič za Pariz ~~ (agencija | obilazak)
/(n m) Udaljenost u riječima (minus (-) - nazad, plus (+) - naprijed) dobavljači /2 kafe muzike /(-2 4) obrazovna radna mjesta - /+1 student
“ ” Potražite frazu "crvenkapa" Ekvivalentno: crvena /+1 kapulja
&&/(n m) Udaljenost u rečenicama (minus (-) - nazad, plus (+) - naprijed) bankovni && /1 porezi

Da biste dobili najbolje rezultate pretraživanja, morate zapamtiti nekoliko jednostavnih pravila:


Nemojte tražiti informacije koristeći samo jednu ključnu riječ.

Bolje je ne unositi ključne riječi sa veliko slovo, jer to može dovesti do toga da iste riječi malim slovima neće biti pronađene.

Ako ne dobijete rezultate pretraživanja, provjerite ima li u vašim ključnim riječima pravopisnih grešaka.

Moderni pretraživači pružaju mogućnost povezivanja semantičkog analizatora sa generiranim upitom. Uz njegovu pomoć možete unijeti riječ i odabrati dokumente u kojima se nalaze izvedenice ove riječi u različitim padežima, vremenima itd.

Najpristupačniji i najprikladniji način pretraživanja informacija na World Wide Webu je korištenje pretraživača. U ovom slučaju, pretraživanje informacija može se izvršiti pomoću kataloga, kao i korištenjem skupa ključnih riječi koje karakteriziraju tekstualni dokument koji se traži.

Pogledajmo detaljnije upotrebu pretraživača. Server za pretragu sadrži veliki broj linkovi na široku lepezu dokumenata, a svi ti linkovi sistematizovani su u tematske kataloge. Na primjer: sport, bioskop, automobili, igre, nauka, itd. Štaviše, ove veze server instalira samostalno, automatski redovnim pregledavanjem svih web stranica koje se pojavljuju na World Wide Webu.

Osim toga, serveri za pretraživanje pružaju korisniku mogućnost pretraživanja informacija pomoću ključnih riječi. Nakon unosa ključnih riječi, server za pretraživanje počinje pregledavati dokumente na drugim web serverima i prikazivati ​​veze do onih dokumenata u kojima se pojavljuju navedene riječi. Obično se rezultati pretrage sortiraju u opadajućem redoslijedu prema posebnoj ocjeni dokumenta, koja pokazuje koliko u potpunosti dati dokument ispunjava uslove pretraživanja ili koliko često se traži na Internetu.

Neke važne adrese:

www.kros.ru - Kazanska regionalna obrazovna mreža,

www.edu.ru - web stranica ruskog ministarstva obrazovanja,

www.fio.ru - Federacija Internet obrazovanja.

3. Navigacija preko hiperlinkova. Ovo je najnezgodniji metod, jer se može koristiti za traženje dokumenata koji su samo po značenju bliski trenutnom dokumentu. Ako aktuelni dokument je posvećen, na primjer, muzici, a onda koristeći hiperveze ovog dokumenta, malo je vjerovatno da ćete moći doći do stranice posvećene sportu

16.Traženje informacija na internetu

Informacije objavljene na World Wide Webu iznose ogroman broj bajtova. Za traženje informacija na World Wide Webu koriste se posebne web stranice - sistemi za pronalaženje informacija. Oni vam omogućavaju da koristite ključne riječi za pronalaženje izvora informacija vezanih za ključne riječi. To može biti tekst koji sadrži ključne riječi ili grafička slika jedna od ključnih reči. Primjeri sistema za pronalaženje informacija su Google sistemi i Yandex.

Potražite informacije– jedan od najpopularnijih zadataka u praksi koji svaki korisnik interneta mora riješiti.

Postoje tri glavna načina za traženje informacija na Internetu:

1. Određivanje adrese stranice.

3. Kontaktiranje pretraživača (pretraživačkog servera).

Metoda 1: Određivanje adrese stranice

Ovo je najbrži način pretraživanja, ali se može koristiti samo ako znate tačno adresu dokumenta ili lokaciju na kojoj se dokument nalazi.

Ne zaboravite mogućnost pretraživanja web stranice otvorene u prozoru pretraživača (Uredi-Pronađi na ovoj stranici...).

Ovo je najmanje zgodna metoda, jer se može koristiti za traženje dokumenata koji su samo po značenju bliski trenutnom dokumentu.

Metoda 3: Pristup pretraživaču

Koristeći hipertekstualne veze, možete beskrajno putovati u informatičkom prostoru Interneta, prelazeći s jedne web stranice na drugu, ali ako uzmete u obzir da je u svijetu kreirano mnogo miliona web stranica, malo je vjerovatno da ćete moći pronađite potrebne informacije o njima na ovaj način.

Specijalni pretraživači (koji se nazivaju i pretraživači) priskaču u pomoć. Adrese servera za pretragu su dobro poznate svima koji rade na Internetu. Trenutno su na ruskom govornom području interneta popularni sljedeći serveri za pretraživanje: Yandex (yandex.ru), Google (google.ru) i Rambler (rambler.ru

Tražilica- web stranica koja pruža mogućnost pretraživanja informacija na Internetu.

Većina pretraživača traži informacije na web stranicama World Wide Web, ali postoje i sistemi koji mogu pretraživati ​​fajlove na FTP serverima, proizvode u online prodavnicama i informacije u Usenet diskusionim grupama.

Po principu rada Pretraživači su podijeljeni u dvije vrste: direktorije pretraživanja i indeksi pretraživanja.

Pretražite imenike služe za tematsko pretraživanje.

Informacije na ovim serverima su strukturirane po temama i podtemama. Ako namjeravate pokriti određenu temu, nije teško pronaći popis web stranica posvećenih tome.

Direktorij Internet resursa ili direktorij Internet resursa ili jednostavno internetski imenik je strukturirani skup veza ka web lokacijama sa kratkim opisom istih.

Pretražite indekse rade kao abecedni indeksi. Klijent specificira riječ ili grupu riječi koja karakterizira njegovo područje pretraživanja i prima listu linkova na web stranice koje sadrže navedene pojmove.

Prva tražilica za World Wide Web bio je Wandex, sada nepostojeći indeks koji je razvio Matthew Gray sa Massachusetts Institute of Technology 1993. godine.

Kako funkcionira indeks pretraživanja?

Pretražite indekse automatski, pomoću posebnih programa (web spiders), skeniraju internet stranice i indeksiraju ih, odnosno unose u svoje ogromna baza podataka podaci.

Robot za pretragu(“web spider”) je program koji je sastavni dio tražilice i dizajniran je za indeksiranje internetskih stranica kako bi se informacije o njima (ključne riječi) unijele u bazu podataka tražilice. U svojoj srži, pauk najviše liči na običan pretraživač. Skenira sadržaj stranice, postavlja ga na server pretraživača kojem pripada i šalje ga putem linkova na sljedeće stranice.

Kao odgovor na zahtjev gdje pronaći potrebne informacije, server za pretraživanje vraća listu hiperlinkova koji vode do web stranica na kojima su potrebne informacije dostupne ili spomenute. Lista može biti bilo kog obima, u zavisnosti od sadržaja zahteva.

http://www.yandex.ru/

Yandex - ruski sistem pretražite na webu. Web stranica kompanije Yandex.ru otvorena je 23. septembra 1997. godine. Sjedište kompanije nalazi se u Moskvi. Kompanija ima kancelarije u Sankt Peterburgu, Jekaterinburgu, Odesi i Kijevu. Broj zaposlenih prelazi 700 ljudi.

Riječ "Yandex" (koja se sastoji od slova "Ya" i dijela indeksa riječi; igra na činjenici da ruska zamjenica "Ya" odgovara engleskom "I") skovao je Ilya Segalovich, jedan od osnivača Yandexa, trenutno obavljajući funkciju tehničkog direktora kompanije.

Yandex Search vam omogućava da pretražite RuNet za dokumente na ruskom, ukrajinskom, bjeloruskom, rumunskom, engleskom, njemačkom i francuskom, uzimajući u obzir morfologiju ruskog i engleski jezici i blizina riječi u rečenici. Posebnost Yandexa je mogućnost finog podešavanja upita za pretraživanje. Ovo se postiže fleksibilnim jezikom upita.

Podrazumevano, Yandex prikazuje 10 veza na svakoj stranici rezultata u postavkama rezultata pretrage, možete povećati veličinu stranice na 20, 30 ili 50 pronađenih dokumenata.

S vremena na vrijeme se mijenjaju Yandex algoritmi odgovorni za relevantnost rezultata pretraživanja, što dovodi do promjena u rezultatima upita pretraživanja. Konkretno, ove promjene imaju za cilj suzbijanje neželjene pošte pretraživanja, što dovodi do irelevantnih rezultata za neke upite.

http://www.google.ru/

Vođa internet pretraživača Google zauzima više od 70% svetskog tržišta. Trenutno registruje oko 50 miliona upita za pretraživanje dnevno i indeksira više od 8 milijardi web stranica. Google može pronaći informacije na 115 jezika.

Prema jednoj verziji, Google je iskrivljeno pravopis engleske riječi googol. "Googol" je matematički izraz za jedan iza kojeg slijedi 100 nula. Termin je skovao Milton Sirotta, nećak američkog matematičara Edwarda Kasnera, a prvi put je opisan u knjizi Matematika i imaginacija od strane Kasnera i Jamesa Newmana. Googleova upotreba termina odražava izazov organiziranja ogromne količine informacija na Internetu.

Googleov interfejs sadrži prilično složen jezik upita koji vam omogućava da ograničite pretragu na određene domene, jezike, tipove datoteka itd.

http://www.rambler.ru/

Rambler Media Group je internet holding kompanija koja kao usluge uključuje pretraživač, klasifikator rejtinga ruskih internet resursa i informativni portal.

Rambler je nastao 1996. godine.

Rambler pretraživač razumije i razlikuje riječi na ruskom, engleskom i ukrajinskom jeziku. Podrazumevano, pretraga se vrši u svim oblicima reči.

Efikasno traženje informacija pomoću računara je hitan zadatak koji se postavlja ne samo za početnike, već i za iskusne korisnike interneta, jer onaj ko posjeduje podatke posjeduje svijet, kako kaže poznata poslovica. Danas ćemo pogledati načina da brzo pronađete ono što vam treba i važne informacije V Internet na ruskom jeziku . On trenutno Postoje samo tri vrste njih:

  1. navođenjem direktne adrese stranice na kojoj se nalaze potrebni podaci i informacije;
  2. surfovanje linkovima koristeći personalni kompjuter na Internetu;
  3. korištenje pretraživača (mašina) na Internetu.

Pogledajmo bliže sve metode pretraživanja ažurne informacije na mreži pomoću računara.

Traženje informacija putem direktne veze na Internetu

Ako već znate na kojoj adresi na Internetu su postavljene potrebne informacije, pretraživanje pomoću računara postaje mnogo lakše: samo trebate unijeti adresu stranice u traku preglednika i upoznati se sa datim podacima. Ako vidite obiman tekst na web stranici na Internetu, a zanima vas doslovno nekoliko redova skrivenih u "toni" ispisanih znakova, onda možete koristiti pretragu unutar stranice. Da biste to uradili, pritisnite kombinaciju tastera Ctrl i F (bilo koji raspored tastature računara), a u predloženu kolonu „Pronađi“ unesite frazu ili reč koja se tačno nalazi u odlomku sa informacijama koje tražite, a zatim pritisnite „ Enter”.

Pregledač će istaknuti drugom bojom sve riječi spomenute na stranici koje su slične riječi koju tražite. Međutim, vrlo često se dešava da se ne sjećamo ili čak ne znamo linkove do lokacije informacija na internetu. U ovom slučaju, najpogodnije je pribjeći druga dva tipa pretraživanja podataka pomoću računara.

Pretražujte koristeći surfovanje internetom

Surfanje internetom je pretraživanje koje uključuje uzastopno praćenje linkova s ​​jedne tematske stranice na drugu dok se ne pronađe izvor potrebnih podataka. Prednost ove metode pretraživanja podataka na Internetu je njena fascinantnost i sposobnost da se dosljedno i temeljito savladava velika količina informacija sa različitih stranica. Među nedostacima ove vrste pretrage je i njeno trajanje, kao i činjenica da morate nekako doći i do originalne stranice sa koje će početi vaše surfanje. A ako nemate adresu stranice s koje ćete početi surfati, onda ćete ovdje morati pribjeći pomoći takve metode pretraživanja kao što su tražilice.

Načini traženja informacija na Internetu pomoću pretraživača

Danas su takvi pretraživači kao što su Yandex.ru, Rambler.ru, Google.ru nadaleko poznati javnosti Runeta. Ove stranice vam omogućavaju da pretražujete podatke unosom upita na svim internet stranicama. Prema principu rada, pretraživači su dvije vrste: indeksi pretraživanja i direktoriji pretraživanja:

  • Pretražite imenike. Ove stranice pružaju pomoć u traženju podataka o određenoj temi na Internetu: informacije u takvim katalozima jasno su strukturirane u grupe i teme, što pomaže u brzom pronalaženju rezultata. U svakoj temi korisniku se nudi niz linkova ka stranicama na kojima može pronaći znanja koja ga zanimaju.
  • Pretražite indekse. Riječ je o indeksnim stranicama na kojima prilikom unošenja ključne riječi u traku za pretraživanje korisnik dobiva niz linkova na stranice na Internetu koje sadrže traženu riječ ili frazu. Indeksi pretraživanja vrše pretrage pomoću posebnih programa zvanih “pauci” koji skeniraju stranice web stranica na Internetu u potrazi za njihovim predmetom. Nakon takvog skeniranja, tražilica ih unosi u svoju bazu podataka, iz koje se informacije kasnije „izvlače“ kada korisnik unese upit u pojam za pretraživanje.

Pravila za pretraživanje informacija na Internetu

Pogledajmo sada osnovna, ali važna pravila za efikasno traženje ažuriranih informacija na internetu na ruskom jeziku pomoću računara.

  1. Formirajte ispravnu ključnu frazu za pristup tražilici. Ne možete koristiti samo jednu riječ za pretraživanje ako želite da dobijete zaista koristan rezultat i ne biste trebali unositi preduge fraze. Optimalna veličina upit za pretraživanje je od 2 do 4 riječi. Ako tražilica pronađe premalo rezultata u rezultatima pretraživanja, pokušajte preformulirati unesenu frazu, zamjenjujući neke riječi sinonimima, a također provjerite ima li pravopisnih grešaka u riječima. Zapamtite: nema informacija koje nisu na internetu. Samo odaberite prave riječi, slijedite pravila i naći ćete ono što tražite.
  2. Koristite posebne operatere. Moderan, efikasan i brza pretraga Sve potrebne informacije putem pretraživača i korišćenjem personalnog računara podrazumevaju poznavanje i primenu nekih trikova, a to su skraćenice i specijalni karakteri operatora. Operatori su ikone koje se koriste prilikom formiranja upita u tražilici i olakšavaju pronalaženje potrebnih podataka. Pogledajmo najčešće operatore i njihova značenja, što može biti korisno u praksi.
  3. Razmak ili znak & znači da trebate pretražiti dokumente sa traženom frazom unutar iste rečenice. Primjer unosa traka za pretragu: ukusan recept ili ukusno i recept.
  4. && - znači potrebu traženja stranice na kojoj će se pojedine riječi iz fraze spominjati kroz cijeli tekst, a ne samo jednu rečenicu. Primjer: ukusan && recept.
  5. | - biće vam ponuđeni članci u okviru kojih će se koristiti samo 1 od unesenih riječi. Primjer: brak | nedostatak | defekt.
  6. + - znači traženje teksta sa obaveznom kombinacijom riječi unesenih između znaka “+”. Primjer: ukusno + recept.
  7. “ ” – traži lanac riječi bez razbijanja na pojedinačne riječi. Primjer: “Krasnaya Polyana bomboni”.

Posmatrajući ove jednostavna pravila Kada pretražujete podatke pomoću računara i interneta, olakšaćete svoj zadatak i uvek možete brzo pronaći informacije koje su vam potrebne u bilo kom trenutku.

Pronalaženje potrebnih informacija na Internetu je često prilično teško. Internet se razvija haotično, nema jasno definisanu strukturu. Niko ne može garantovati da će jedan domen sadržavati samo informacije o određenoj temi, a drugi - informacije o drugoj, ali i jasno definisanoj temi. Na primjer, na domains.com možete pronaći ne samo komercijalne informacije, već, na primjer, raznu dokumentaciju o softverskih proizvoda ili čak šale.

Da je struktura domena slična strukturi direktorija, na primjer, u domeni ru.comp.os.linux (kao u sistemu vijesti) postojale bi sve informacije o operativni sistem Linux je na ruskom jeziku i neka moderirajuća organizacija se pobrinula da informacije o Linuxu ne budu objavljene u drugim domenima, tada bi pretraga bila mnogo jednostavnija. Uostalom, znali bismo gde da tražimo. Otvorite svoj pretraživač, unesete ru.comp.os.linux i dobijete... milione različitih linkova ka člancima, HOWTO dokumentima i drugim informacijama vezanim za Linux na ovaj ili onaj način.

Efikasnost pretrage

    Efikasnost pretrage zavisi od mnogo faktora:
  • Iz same informacije - može biti puno informacija o jednoj temi, ali malo o drugoj. Ponekad možete pronaći mnogo informacija o datoj temi, ali efikasnost ove pretrage će biti blizu 0,0%, a možete pronaći samo 3-4 linka, a to će biti upravo ono što vam treba. Ovo također uključuje sposobnost webmastera da ispravno predstavi informacije tako da ih sami pretraživači mogu pronaći. Pretpostavimo da se negdje vrlo daleko nalaze informacije koje su vam potrebne, ali tražilica ne zna ništa o tome. Možda je informacija samo objavljena ili jednostavno webmaster koji je objavio informaciju nije ni svjestan postojanja pretraživača. Tražite informacije pomoću tražilice. Ako ona ne "zna" informacije koje su vam potrebne, onda, dakle, nećete znati ništa o njoj.
  • Od tražilice - postoji mnogo pretraživača i svi su različiti. Čak i ako pripadaju istom tipu (o tipovima pretraživača ćemo govoriti malo kasnije), svaki od njih će nesumnjivo imati svoj algoritam. Ako ne pronađete informacije pomoću jedne tražilice, pokušajte je potražiti pomoću druge. Nemojte se zaglaviti na jednom pretraživaču, bez obzira koliko vam se sviđa.
  • Mnogo toga ovisi o sposobnosti korištenja tražilice – kako znate koristiti tražilicu. Ako ne znate kako da koristite pretraživač, malo je vjerovatno da će vaša pretraga biti efikasna.

Kako ispravno tražiti informacije

Budući da najčešće iz kataloga tražilice ne birate stranicu koja vam je potrebna, već upisujete određenu ključnu riječ (ili nekoliko ključnih riječi), morate biti što konkretniji baš o ovoj ključnoj riječi. Što preciznije definišete predmet Vaše pretrage, to će rezultat biti tačniji. Pretraživač ne može pogoditi vaše misli, morate mu jasno reći šta tražite.

Svaki pretraživač ima svoju sintaksu koju morate znati. Ovo poglavlje će opisati sintaksu pretraživača Google, Yandex i Rambler. Ako želite da koristite neki drugi pretraživač, možete saznati njegovu sintaksu na njegovoj web stranici (obično je detaljno opisana).

Pretraživači

Hajde sada da pričamo o samim pretraživačima.

Na području bivšeg ZND-a, prema SpyLog-u (Openstat), najpopularniji su sljedeći pretraživači:

  • 1. Yandex (www.yandex.ru);
  • 2. Google (www.google.com);
  • 3. [email protected] (go.mail.ru);
  • 3. Rambler (www.rambler.ru);
  • 5. Yahoo! (www.yahoo.com);
  • 6. AltaVista (www.altavista.com);
  • 7. Bing (www.bing.com).

Pretraživači su navedeni u opadajućem redoslijedu popularnosti. Kao što vidite, naš najpopularniji pretraživač je Yandex.

Vrste pretraživača

    Postoje dvije glavne vrste pretraživača:
  • indeks - Google, AltaVista, Rambler, HotBot, Yandex, itd.;
  • klasifikacija (katalog) - Rambler, Yahoo! itd.

Nemojte se iznenaditi da je Rambler pretraživač naveden dva puta - bio je i indeks i mašina za klasifikaciju. Na ovo ćemo se vratiti kasnije, ali za sada razgovarajmo o razlikama između ova dva sistema.

Kako radi indeksni pretraživač? Pokreće se pretraživač poseban program, koji pregleda sadržaj web servera, indeksira informacije: u svoju bazu podataka unosi ključne riječi određene web stranice, neke informacije sa web stranice.

Kratka istorija Google-a

Počnimo s imenom. Google je malo izmijenjena verzija riječi googol (nije uzalud što se često naziva "Google"). Riječ je zauzvrat skovao Milton Sirota, nećak poznatog matematičara Edwarda Kasnera, a zatim popularizirana u Kasnerovoj i Newmanovoj knjizi Matematika i imaginacija. Riječ "googol" prikazuje broj sa jednom jedinicom i 100 nula. Naziv "Google" odražava pokušaj organiziranja ogromne količine informacija na webu.

Pa počnimo od početka. Budući Google programeri Sergey Brin i Larry Page upoznali su se 1999. na Univerzitetu Stanford. Larry je tada imao 24 godine, a Sergej 23. Larry je u to vrijeme bio student na Univerzitetu Michigan i došao je na Stanford na nekoliko dana. Sergej je bio u grupi studenata koja je goste trebala upoznati sa univerzitetom. Od prvog susreta Sergej i Lari se, najblaže rečeno, nisu svideli jedno drugom - svađali su se oko svega o čemu se moglo raspravljati. Ovo se na kraju pokazalo kao pozitivna stvar, jer su njihova različita mišljenja dovela do stvaranja algoritma za rješavanje jednog od najhitnijih problema u kompjuterima: pretraživanja potrebne informacije među ogromnom količinom podataka. U januaru 1996. Larry i Sergei su započeli rad na pretraživaču BackRub, koji je trebao analizirati "povratne veze" koje upućuju na datu web stranicu. Rad na ovom serveru odvijao se u stalnom nedostatku sredstava - uostalom, u to vrijeme Sergey i Larry su bili diplomirani studenti na univerzitetu - sami razumijete da diplomirani studenti nemaju mnogo novca. Inače, Larryju je ovo bio prvi put da je sudjelovao u ovako ozbiljnom projektu, a prije toga je bio uključen u razne „neozbiljne“, čak ponekad i anegdotske projekte, na primjer, napravio je radni štampač od Lego-a.

Osnovna Google sintaksa

Googleov interfejs je upečatljiv svojom jednostavnošću: polje za unos i dva dugmeta. Kako kažu, sve genijalno je jednostavno.

Google posebna (proširena) sintaksa

Pored Booleovih operatora, Google vam pruža modifikatore pretraživanja koji su navedeni u tabeli. Modifikatori pretraživanja nazivaju se Google posebna sintaksa. Ozbiljno shvatite ovu tabelu: kada jednom pokušate da tražite nešto koristeći modifikatore, nećete ih moći odbaciti.

Pravilna upotreba inurl modifikatora

Inurl modifikator se koristi za pretraživanje navedenog URL-a. I za razliku od modifikatora stranice, koji vam omogućava da pretražujete informacije samo na jednoj stranici ili domeni, inurl modifikator vam omogućava da pretražujete informacije u poddirektorijumima stranice, na primjer:

inurl: siteskype-zvonim-besplatno

Inurl modifikator vam omogućava da koristite znak * za označavanje domene, na primjer:
inurl: "*.redhat.com"

Najefikasnije je koristiti inurl zajedno sa sajtom. Sljedeći upit će tražiti informacije u domeni gidmir.ru, na svim njenim poddomenama osim www:
site: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

Google mješovita sintaksa

Google dozvoljava mješovitu sintaksu, tj. sintaksa koja koristi nekoliko posebnih modifikatora pretraživanja u svom upitu. To vam omogućava da postignete najbolje rezultate.

Evo vrlo jednostavnog primjera mješovite sintakse:
stranica: ru inurl: disk

U ovom slučaju, pretraga će se izvršiti na web lokacijama domene, a URL mora sadržavati riječ disk.

Evo još jednog primjera:
sajt: ru -inurl: org.ua

Pretraživanje će se vršiti na stranicama domene ru, ali rezultati pretrage neće sadržavati stranice koje se nalaze na org.ua.

Kako prevazići ograničenje ključnih riječi

Za većinu činova Google korisnici ograničenje od 10 ključeva nije primjetno. Ali ljubitelji dugih upita možda su primijetili da Google uzima u obzir samo prvih 10 ključnih riječi, a sve ostale jednostavno ignoriše.

Zašto trebate tražiti dugačke fraze? U većini slučajeva to su odlomci iz djela. Pretpostavimo da tražimo djelo "Majstor i Margarita". Treba napomenuti da ključna fraza trebalo bi da izgleda kao "Master Margarita", pošto su reči i, ili, i, od, ili, I, a, the i neke druge zanemarene od strane pretraživača. Ako želite da unesete jednu od ovih riječi u pretragu, ispred riječi stavite znak "+", kao što je +the.

Ispravna konstrukcija upita vam omogućava da prevaziđete ograničenje od 10 riječi. Sljedeće preporuke pomoći će vam ne samo da smanjite dužinu vašeg upita, već i poboljšate efikasnost pretraživanja općenito.

Google napredna pretraga

Upisujemo adresu u liniju za unos pretraživača - www.google.ru/advanced_search i idemo na Google naprednu pretragu.

Koristeći naprednu pretragu, možete pretraživati ​​informacije gotovo jednako fleksibilno kao i korištenjem modifikatora pretraživanja. Zašto "skoro"? Interfejs za napredno pretraživanje ne omogućava pristup svim modifikatorima pretraživanja.

Podešavanje svojstava Google pretrage

Ne želim da vam punim glavu tehničkim detaljima, pa ću ukratko reći šta su kolačići i ne, ne sa čime se jedu, već kako sa njima raditi.

Zamislimo da nam je dat sljedeći zadatak: trebamo napisati pojedinačni izvještaj o posjeti za svakog klijenta web stranice naše kompanije. Odnosno, tako da korisnik ne vidi ukupan broj posjeta, već tačno zna koliko je puta bio na našoj stranici. Za svaku IP adresu moramo voditi evidenciju u jednoj tabeli, koja će najvjerovatnije biti velika, a iz toga proizilazi da neracionalno koristimo procesorsko vrijeme i prostor na disku. Bilo bi mnogo ispravnije s naše strane da ovaj prostor iskoristimo u veću korist.

Postavljamo kolačiće - varijablu koja će biti pohranjena na korisnikov disk. Ova varijabla će pohraniti informacije o posjetima. Korist je očigledna. Prvo, ne treba nam nikakva tabela, a drugo, pojednostavljujemo rad našeg programa.

Rezultat Google pretrage

Rezultat Google pretraga- ovo nije samo skup odgovarajućih linkova specificirani uslovi traži. Ovo je nešto više što zaslužuje posebnu pažnju. Unesite riječ "rusopen" i kliknite na dugme Pretraži Google.

Na vrhu vidimo ukupan broj rezultata (883.000.000) i ukupno vrijeme traženja, odnosno 0,34 sekunde.

    U većini slučajeva, rezultat je predstavljen kao:
  • naslov stranice;
  • opis stranice;
  • URL stranice;
  • veličina stranice;
  • datum indeksiranja posljednje stranice;

Google pretraga slika

Google Images vam omogućava da pronađete različite slike na Internetu. Iako se same slike ne mogu indeksirati, stranice koje sadrže slike su indeksirane. Unesite opis slike i dobijte mnogo, mnogo linkova, kao i samih slika, predstavljenih u galeriji.

    Da biste efikasnije pretraživali slike, trebate koristiti sljedeće modifikatore pretraživanja:
  • intitle: - pretraga u naslovu stranice;
  • filetype: - omogućava vam da odredite tip slike, možete odrediti sljedeće tipove: JPEG i GIF, ne BMP, PNG, slike drugih tipova nisu indeksirane;
  • inurl: - pretraga po navedenom URL-u, na primjer inurl: www.gidmir.ru ;
  • site: pretražite na određenoj domeni ili web lokaciji, na primjer site: com.

Google Apps

Google je najmoćniji pretraživač, koji obuhvata preko 3 milijarde stranica. Pored običnih web stranica, Google indeksira fajlove Word formati, Excel, PowerPoint, PDF i RTF. Također možete koristiti Google za pretraživanje slika i telefonskih brojeva: usluge Google Slike i Telefonski imenik su dizajnirane za to. U ovom članku ćemo govoriti o posebnim Google uslugama.

Google Mail

Pokušajte koristiti Google e-poštu. Treba napomenuti da ovo nije obična web pošta.

    Neke od funkcija Gmaila uključuju sljedeće:
  • velika veličina poštanskog sandučića - više od 7 GB;
  • umjesto brisanja pisama, možete ih arhivirati - tada ćete imati dovoljno prostora za dugo vremena, a možete vratiti pisma koja ste primili ili poslali prije nekoliko godina;
  • mogućnost pretraživanja po poštansko sanduče uz efikasnost Google-a;
  • pogodna organizacija pisama i odgovora na njih: sva pisma i odgovori čine jedan lanac koji je lako pratiti;
  • dobra zaštita od neželjene pošte;
  • nezaboravna adresa vaš[email protected];
  • pogodan interfejs.

Pretraživač Rambler

Istorija Ramblera

Sve je počelo davne 1991. godine u gradu Puščino u Moskovskoj oblasti. Te daleke godine okupila se grupa istomišljenika, među kojima su bili Dmitrij Krjukov, Sergej Lisakov, Viktor Voronkov, Vladimir Samojlov, Jurij Eršov. Zajednički interes ove grupe bio je internet. Vjerovatno 1991. godine nitko od budućih programera Ramblera nije ni zamišljao da će postati kreatori jednog od najvećih i najpoznatijih pretraživača na Runetu. Uostalom, prije toga su svi oni servisirali radiotehničke uređaje na Institutu za biohemiju i fiziologiju mikroorganizama Ruske akademije nauka. Godine 1992. stvorena je kompanija Stack, na čijem je čelu bio Sergej Lysakov. Profil kompanije - lokalne mreže i internet. U suštini, Stack je bio provajder Internet usluga. Kompanija je stvorila unutargradsku mrežu, zatim je Puščino povezala sa Moskvom, a preko nje i na Internet. Inače, ovo je bio prvi IP kanal izvan Moskve. A to je bilo 1992. godine! Danas je postavljanje kanala prilično problematično - uvijek ima puno nijansi, ali tada su kablovi morali biti položeni samostalno, ručno, pod zemljom, a sve se to radilo zimi.

Kako je Rambler radio

Internet se stalno razvija: broj stranica i njihove veličine se povećavaju svakim danom. Zamislite samo: velike stranice se ažuriraju svaki dan, čak i ako je obim ažuriranja 1024 bajta (1 KB), onda ako pretpostavimo da postoji 10.000 takvih stranica, svaki dan pretraživač mora obraditi (indeksirati) 10.000 KB (otprilike govor, 10 MB) informacija. Broj 10.000 uzet je "iz zraka" - primjera radi. Može biti veći ili niži - uostalom, čak ni velike stranice se ne ažuriraju svaki dan. Veličina ažuriranja je također izmišljena. Zamislite informativno-analitičku stranicu na kojoj se gotovo svakodnevno objavljuju novi članci ili se ponovo objavljuju materijali s drugih stranica. U ovom slučaju, veličina ažuriranja će biti daleko od 1 KB, ali najmanje 10. Dodajte na sve ove vijesti i druge informacije i ispada da s brojem ažuriranih stranica od 10.000, pretraživač mora indeksirati 120 MB tekst. Uz sve to, tražilica ne samo da mora precizno prikazati rezultate pretraživanja, već i to učiniti što je brže moguće kako bi korisnik mogao s njom udobno raditi. Ko želi da čeka 10 minuta na rezultate pretrage? Preterujem, naravno, ali lično ne bih čekao više od 30 sekundi na rezultate pretrage (od trenutka kada kliknete na dugme Pronađi do prvih deset rezultata). Ispostavilo se da programeri pretraživača moraju stalno da održavaju na odgovarajućem nivou ne samo hardver, koji mora biti u stanju da obrađuje konstantno rastuće količine informacija, već i "matematiku" ne može postići samo hardverom. Potrebno je stalno poboljšavati algoritme pretraživanja tako da kada se obim baze pretraživanja poveća, vrijeme pretraživanja ne raste (to znači značajno povećanje vremena - za korisnika je svejedno da li će pretraga trajati 2,5 sekunde ili 2,0555 sekundi, jer nije u stanju da proceni koliko je ovo vreme).

Rambler sintaksa

Zahtjev upućen Rambleru može se sastojati od jedne ili više riječi, a zahtjev može sadržavati znakove interpunkcije. Rambler programeri dizajnirali su svoj pretraživač za maksimalnu udobnost korisnika. Rambler bi mogao koristiti čak i neiskusan korisnik koji uopće nije upoznat s jezikom upita. Sve što je trebao da uradi je da unese upit koji se sastoji od nekoliko reči (na primer, neke fraze) i bez interpunkcije - Rambler ga je sam pronašao neophodna dokumenta, i uradio to što je moguće efikasnije. Naravno, ako pravilno koristite jezik upita, efikasnost se značajno povećava, ali čak i uz potpuno nepoznavanje jezika upita, efikasnost pretraživanja je bila visok nivo. Kao što je već napomenuto, poznavanje jezika upita je u vašem interesu, jednostavno ćete moći mnogo brže da pronađete informacije koje su vam potrebne.

Tražilica Yandex (Yandex)

Istorijska pozadina

Davne 1990. godine kompanija Arcadia, na čelu sa Arkadijem Borkovskim i Arkadijem Voložom, počela je da razvija pretraživač softver. Šest godina kasnije pojavila se web stranica Yandex. Ali šta se dogodilo tokom ovih šest godina?

Za dvije godine stvorena su dva sistema za pronalaženje informacija – „Međunarodna klasifikacija izuma“ i „Klasifikator roba i usluga“. Oba sistema su radila pod DOS-om i omogućavala su traženje riječi iz datog rječnika koristeći Boolean operatore.

Godine 1993. Arcadia je postala divizija CompTek-a. Tokom 1993-1994, tehnologije pretraživanja su se značajno poboljšale, na primjer, rečnik koji omogućava pretragu uzimajući u obzir morfologiju ruskog jezika zauzimao je samo 300 KB, što znači da se lako mogao uklopiti u; RAM, a rad sa njim se desio vrlo brzo. Na osnovu ovoga nova tehnologija 1994. godine kreiran je “Bible Computer Reference” – sistem za pronalaženje informacija koji radi sa prijevodima Starog i Novog zavjeta.

Kako Yandex tumači riječi

Kako će pretraživač protumačiti riječ koju ste unijeli?

    Sada ćemo pričati o ovome:
  • Pravilo 1. Ispada da ga sistem tumači prema pravilima ruskog jezika. Primjer: Ako unesete riječ "automobil", također ćete dobiti rezultate koji sadrže riječi "automobili", "automobil" itd. Isto je i s glagolima - pretraživanjem "idi" dobićete dokumente koji sadrže riječi "ide", "ide", "hodao", "otišao" itd. Kao što vidite, pretraživač je inteligentniji nego što ste mislili – nije samo sredstvo za pronalaženje određene riječi u bazi podataka.
  • Pravilo 2. Posebna pažnja se poklanja riječima koje se pišu velikim slovom. Ako je riječ napisana velikim slovom i nije prva riječ u rečenici, naći će se samo velike riječi. U suprotnom, naći će se riječi napisane i velikim i malim slovima. Primjer: za zahtjev "Javačar A." naći će se dokumenti koji sadrže i "porez" (taksa) i "porez" (prezime), jer riječ "porez", iako napisana velikim slovom, dolazi na prvom mjestu u rečenici. Ali upit "A jazavčar" će pronaći dokumente koji sadrže samo riječ "jasavovac" napisanu velikim slovom.

Osnovna sintaksa Yandexa

Yandex po defaultu koristi logički operator I. To znači da ako ste uneli upit " Samsung TV", tada će rezultati vratiti dokumente u kojima će se riječi "TV" i "Samsung" pojaviti u istoj rečenici. Ako želite eksplicitno specificirati operator AND, tada koristite simbol ampersanda &. Drugim riječima, upit " Samsung TV" sličan je upitu "TV & Samsung". Možete koristiti i upit "TV + Samsung".

Ako želite suprotan efekat, tj. Ako želite da dobijete dokumente koji sadrže reč “TV” i reč “Samsung” odvojeno, onda morate da koristite OR operator (|), na primer: “TV Samsung |

Znak tilde (~) pomoći će vam da pronađete dokumente koji sadrže prvu riječ, ali ne i drugu. Na primjer, upit “TV ~ Horizon” će pronaći dokumente koji sadrže riječ “TV”, ali pored nje (u istoj rečenici) nema riječi “Horizont”. Šta ako trebamo pronaći dokumente koji uopće ne sadrže riječ “Horizon”, ali sadrže riječ “TV”. Da biste prešli sa nivoa rečenice na nivo dokumenta, dvaput navedite operator koji želite, na primer: && ili ~~. U našem slučaju, upit “TV ~~ Horizon” će odgovarati.

Vrlo često morate pronaći tačnu frazu, na primjer, "predsjednik Rusije", u kojoj riječ "Rusija" striktno slijedi odmah iza riječi "predsjednik". U ovom slučaju, fraza za pretraživanje mora biti stavljena pod navodnike.

Pretražujte na osnovu udaljenosti u Yandexu

Yandex numeriše sve riječi u tekstu dokumenta redom. Udaljenost između susjednih riječi je 1 (ne 0!), a udaljenost između riječi je obrnutim redosledom jednako -1. Isto važi i za ponude.

Da biste označili udaljenost između riječi, stavite znak /, nakon čega odmah slijedi broj, što znači da je ovo udaljenost između riječi. Na primjer, upit "programer / 2 programa" će pronaći dokumente koji sadrže riječi "programi" i "programi", a razmak između riječi ne smije biti veći od dvije riječi i sve ove riječi trebaju biti u jednoj rečenici. U tom slučaju će se pronaći dokumenti koji sadrže "programer". aplikativni programi", "programer sistemski programi"itd.

Ako znamo tačno udaljenost i red riječi, onda možemo koristiti /+n sintaksu. Na primjer, upit "crvena /+1 kapa" će vratiti rezultat u kojem riječ "beanie" odmah slijedi iza riječi "crvena". Upit "crvenkapica" doveo bi do istog rezultata.

Korištenje zagrada prilikom pretraživanja u Yandexu

Zagrade se koriste za predstavljanje cijelog izraza u upitu. Na primjer, upit "(povijest | tehnologije | programi)/+1 Linux" će pronaći dokumente koji sadrže jednu od fraza "povijest Linuxa", "Linux tehnologije", "Linux programi".

Zone

Zona je mjesto za traženje informacija koje su vam potrebne. Možete odrediti zonu u kojoj želite da tražite - naslove (Title zona), linkove (sidra) ili adresu (Address). Možete koristiti i zonu svih za pretraživanje cijelog dokumenta.

Sintaksa: $zone_name zahtjev.

Na primjer: zahtjev $title "Microsoft" найдет все документы, в заголовках которых встречается !} tacna fraza"Microsoft".

Dodatne opcije Yandex pretraživanja

Google pretraživač je omogućio da se lokacija pretraživanja ograniči na određenu listu servera ili, obrnuto, da se neki serveri izuzmu iz liste za pretraživanje. Potpuno iste mogućnosti dostupne su u Yandex pretraživaču. Također možete pretraživati ​​dokumente koji sadrže veze do određenih URL-ova ili slika. Prilikom navođenja maske datoteke (na primjer, slike), možete koristiti simbol *, što znači sve znakove, na primjer: „audi-*“.

Sintaksa je: #element_name=”value”.

    Element može biti:
  • url - određeni sajt;
  • link - link;
  • slika - slika;
  • ključne riječi - ključne riječi (*);
  • sažetak - napomena (*);
  • hint - natpis za sliku (*).