Ce se înțelege prin motor de căutare - definiție, istorie și fapte interesante. Motoare de căutare

Internetul este necesar pentru mulți utilizatori pentru a primi răspunsuri la întrebările (întrebările) pe care le introduc.

Dacă nu ar exista motoare de căutare, utilizatorii ar trebui să caute în mod independent site-urile de care au nevoie, să le amintească și să le noteze. În multe cazuri, să găsești ceva potrivit „manual” ar fi foarte dificil și adesea pur și simplu imposibil.

Motoarele de căutare fac toată această muncă de rutină de căutare, stocare și sortare a informațiilor pe site-uri web pentru noi.

Să începem cu celebrele motoare de căutare Runet.

Motoare de căutare pe internet în limba rusă

1) Să începem cu motorul de căutare autohton. Yandex lucrează nu numai în Rusia, ci și în Belarus și Kazahstan, Ucraina și Turcia. Există și Yandex în engleză.

2) Motorul de căutare Google a venit la noi din America și are localizare în limba rusă:

3) Motorul de căutare intern Mail ru, care reprezintă simultan rețeaua de socializare VKontakte, Odnoklassniki, de asemenea My World, celebrul Answers Mail.ru și alte proiecte.

4) Motor de căutare inteligent

Nigma (Nigma) http://www.nigma.ru/

Din 19 septembrie 2017, „intelectualul” nigma nu a funcționat. A încetat să mai prezinte interes financiar pentru creatorii săi, aceștia au trecut la un alt motor de căutare numit CocCoc.

5) Cunoscuta companie Rostelecom a creat motorul de căutare Sputnik.

Există un motor de căutare numit Sputnik, conceput special pentru copii, despre care am scris.

6) Rambler a fost unul dintre primele motoare de căutare interne:

Există și alte motoare de căutare celebre în lume:

  • Bing,
  • Yahoo!,
  • DuckDuckGo,
  • Baidu,
  • Ecosia,

Să încercăm să ne dăm seama cum funcționează un motor de căutare, și anume cum sunt indexate site-urile, cum sunt analizate rezultatele indexării și cum sunt generate rezultatele căutării. Principiile de funcționare ale motoarelor de căutare sunt aproximativ aceleași: căutarea informațiilor pe Internet, stocarea acestora și sortarea lor pentru livrare ca răspuns la solicitările utilizatorilor. Dar algoritmii pe care îi folosesc motoarele de căutare pot diferi foarte mult. Acești algoritmi sunt păstrați secreti și dezvăluirea lor este interzisă.

Introducând aceeași interogare în șirurile de căutare ale diferitelor motoare de căutare, puteți obține răspunsuri diferite. Motivul este că toate motoarele de căutare folosesc proprii algoritmi.

Scopul motoarelor de căutare

În primul rând, trebuie să știi că motoarele de căutare sunt organizații comerciale. Scopul lor este să facă profit. Puteți obține profit din publicitate contextuală, alte tipuri de publicitate și din promovarea site-urilor necesare în partea de sus a rezultatelor căutării. În general, există multe moduri.

Depinde de mărimea audienței, adică de câte persoane folosesc acest motor de căutare. Cu cât publicul este mai mare, cu atât mai multor persoane le va fi afișat anunțul. În consecință, această publicitate va costa mai mult. Motoarele de căutare își pot crește audiența prin propria publicitate, precum și prin atragerea utilizatorilor prin îmbunătățirea calității serviciilor lor, a algoritmului și a confortului căutării.

Cel mai important și dificil lucru aici este dezvoltarea unui algoritm de căutare complet funcțional, care ar oferi rezultate relevante pentru majoritatea interogărilor utilizatorilor.

Munca unui motor de căutare și acțiunile webmasterilor

Fiecare motor de căutare are propriul algoritm, care trebuie să țină cont de un număr mare de factori diferiți atunci când analizează informațiile și compilează rezultate ca răspuns la solicitarea unui utilizator:

  • vârsta unui anumit site,
  • caracteristicile domeniului site-ului web,
  • calitatea conținutului de pe site și tipurile acestuia,
  • caracteristicile de navigare și structura site-ului,
  • uzabilitate (confort pentru utilizatori),
  • factori comportamentali (motorul de căutare poate determina dacă utilizatorul a găsit ceea ce căuta pe site sau utilizatorul a revenit din nou la motorul de căutare și acolo caută din nou un răspuns la aceeași interogare)
  • etc.

Toate acestea sunt necesare tocmai pentru ca rezultatele la cererea utilizatorului să fie cât mai relevante, satisfacând solicitările utilizatorului. În același timp, algoritmii motoarelor de căutare se schimbă și sunt perfecționați în mod constant. După cum se spune, nu există limită pentru perfecțiune.

Pe de altă parte, webmasterii și optimizatorii inventează în mod constant noi modalități de a-și promova site-urile, care nu sunt întotdeauna sincere. Sarcina dezvoltatorilor algoritmului motorului de căutare este să-i facă modificări care să nu permită site-urilor „rele” ale optimizatorilor necinstiți să apară în TOP.

Cum funcționează un motor de căutare?

Acum să vorbim despre cum funcționează de fapt motorul de căutare. Constă din cel puțin trei etape:

  • scanare,
  • indexare,
  • variind.

Numărul de site-uri de pe Internet este pur și simplu astronomic. Și fiecare site este informație, conținut informațional care este creat pentru cititori (oameni vii).

Scanare

Acesta este un motor de căutare care rătăcește pe Internet pentru a colecta informații noi, a analiza link-uri și a căuta conținut nou care poate fi folosit pentru a reveni la utilizator ca răspuns la solicitările acestuia. Pentru scanare, motoarele de căutare au roboți speciali numiți roboți de căutare sau păianjeni.

Roboții de căutare sunt programe care vizitează automat site-uri web și colectează informații de la acestea. Crawl-ul poate fi principal (robotul vizitează un site nou pentru prima dată). După colectarea inițială a informațiilor de pe site și introducerea lor în baza de date a motorului de căutare, robotul începe să-și viziteze paginile cu o oarecare regularitate. Dacă au apărut modificări (a fost adăugat conținut nou, conținut vechi a fost șters), atunci toate aceste modificări vor fi înregistrate de motorul de căutare.

Sarcina principală a unui păianjen de căutare este să găsească informații noi și să le trimită motorului de căutare pentru următoarea etapă de procesare, adică pentru indexare.

Indexarea

Un motor de căutare poate căuta informații doar printre acele site-uri care sunt deja incluse în baza sa de date (indexate de acesta). Dacă crawling-ul este procesul de căutare și colectare a informațiilor disponibile pe un anumit site, atunci indexarea este procesul de introducere a acestor informații în baza de date a motorului de căutare. În această etapă, motorul de căutare decide automat dacă introduce această sau acea informație în baza sa de date și unde să le introducă, în ce secțiune a bazei de date. De exemplu, Google indexează aproape toate informațiile găsite de roboții săi pe Internet, în timp ce Yandex este mai pretențios și nu indexează totul.

Pentru site-urile noi, etapa de indexare poate fi lungă, astfel încât vizitatorii din motoarele de căutare pot aștepta mult timp pentru site-uri noi. Iar informațiile noi care apar pe site-uri vechi, bine promovate, pot fi indexate aproape instantaneu și ajung aproape imediat în „index”, adică în baza de date a motorului de căutare.

Variind

Clasamentul este aranjarea informațiilor care au fost indexate anterior și introduse în baza de date a unui anumit motor de căutare, în funcție de rang, adică ce informații le va afișa motorul de căutare utilizatorilor săi în primul rând și ce informații vor fi plasate " rang” mai jos. Clasamentul poate fi atribuit stadiului de serviciu al motorului de căutare către clientul său - utilizatorul.

Pe serverele motoarelor de căutare, informațiile primite sunt procesate și sunt generate rezultate pentru o gamă largă de tot felul de interogări. Aici intră în joc algoritmii motoarelor de căutare. Toate site-urile incluse în baza de date sunt clasificate pe subiecte, iar subiectele sunt împărțite în grupuri de solicitări. Pentru fiecare grup de cereri se poate alcătui o problemă preliminară, care va fi ulterior ajustată.

Un sistem de căutare este un complex software și hardware conceput să caute pe internet și să răspundă la o solicitare a utilizatorului, specificată sub forma unei fraze text (interogare de căutare), prin producerea unei liste de legături către surse de informații, în ordinea relevanței ( conform cererii). Cele mai mari motoare de căutare internaționale: "Google", "Yahoo", „MSN”. Pe internetul rusesc este - "Yandex", "Hoinar", "Aport".

Să descriem principalele caracteristici ale motoarelor de căutare:

    Completitudine

Completitudinea este una dintre principalele caracteristici ale unui sistem de căutare, care este raportul dintre numărul de documente găsite prin cerere și numărul total de documente de pe Internet care satisfac cererea dată. De exemplu, dacă există 100 de pagini pe Internet care conțin expresia „cum să alegi o mașină” și doar 60 dintre ele au fost găsite pentru interogarea corespunzătoare, atunci caracterul complet al căutării va fi de 0,6. Evident, cu cât căutarea este mai completă, cu atât este mai puțin probabil ca utilizatorul să nu găsească documentul de care are nevoie, cu condiția ca acesta să existe deloc pe Internet.

    Precizie

Precizia este o altă caracteristică principală a unui motor de căutare, care este determinată de gradul în care documentele găsite se potrivesc cu interogarea utilizatorului. De exemplu, dacă interogarea „cum să alegi o mașină” conține 100 de documente, 50 dintre ele conțin expresia „cum să alegi o mașină”, iar restul conțin pur și simplu aceste cuvinte („cum să alegi radioul potrivit și să-l instalezi în o mașină”), atunci precizia căutării este considerată egală cu 50/100 (=0,5). Cu cât căutarea este mai precisă, cu atât utilizatorul va găsi mai repede documentele de care are nevoie, cu atât mai puține tipuri de „gunoi” vor fi găsite printre acestea, cu atât mai rar documentele găsite nu vor corespunde cererii.

    Relevanţă

Relevanța este o componentă la fel de importantă a căutării, care se caracterizează prin timpul care trece din momentul în care documentele sunt publicate pe Internet și până când sunt introduse în baza de date a indexului motorului de căutare. De exemplu, a doua zi după ce au apărut știri interesante, un număr mare de utilizatori au apelat la motoarele de căutare cu interogări relevante. Obiectiv, a trecut mai puțin de o zi de la publicarea informațiilor de știri pe această temă, dar principalele documente au fost deja indexate și disponibile pentru căutare, datorită existenței așa-numitei „baze de date rapide” a marilor motoare de căutare, care este actualizat de mai multe ori pe zi.

    Viteza de căutare

Viteza de căutare este strâns legată de rezistența la sarcină. De exemplu, conform Rambler Internet Holding LLC, astăzi, în timpul programului de lucru, motorul de căutare Rambler primește aproximativ 60 de solicitări pe secundă. Un astfel de volum de muncă necesită reducerea timpului de procesare a unei cereri individuale. Aici coincid interesele utilizatorului și ale motorului de căutare: vizitatorul dorește să obțină rezultate cât mai repede, iar motorul de căutare trebuie să proceseze solicitarea cât mai repede posibil, pentru a nu încetini calculul interogărilor ulterioare.

    Vizibilitate

Prezentarea vizuală a rezultatelor este o componentă importantă a căutării convenabile. Pentru majoritatea interogărilor, motorul de căutare găsește sute sau chiar mii de documente. Din cauza interogărilor neclare sau a căutărilor inexacte, chiar și primele pagini ale rezultatelor căutării nu conțin întotdeauna doar informațiile necesare. Aceasta înseamnă că deseori utilizatorul trebuie să efectueze propria căutare în lista găsită. Diverse elemente ale paginii cu rezultate ale motorului de căutare vă ajută să navigați în rezultatele căutării. Explicații detaliate ale paginii cu rezultatele căutării, de exemplu pentru Yandex, pot fi găsite la link http://help.yandex.ru/search/?id=481937.

4. Scurt istoric al dezvoltării motoarelor de căutare

În perioada inițială de dezvoltare a Internetului, numărul utilizatorilor săi a fost mic, iar cantitatea de informații disponibile a fost relativ mică. În cea mai mare parte, doar personalul de cercetare avea acces la internet. În acest moment, sarcina de a căuta informații pe internet nu era la fel de urgentă ca acum.

Una dintre primele modalități de organizare a accesului la resursele informaționale din rețea a fost crearea de directoare deschise de site-uri, link-uri către resurse în care au fost grupate în funcție de subiecte. Primul astfel de proiect a fost site-ul Yahoo.com, care a fost deschis în primăvara anului 1994. După ce numărul de site-uri din directorul Yahoo a crescut semnificativ, a fost adăugată capacitatea de a căuta informațiile necesare în director. În sensul deplin, nu era încă un motor de căutare, întrucât zona de căutare era limitată doar la resursele prezente în catalog, și nu la toate resursele de pe Internet.

Directoarele de link-uri au fost utilizate pe scară largă în trecut, dar și-au pierdut aproape complet popularitatea în prezent. Deoarece chiar și cataloagele moderne, uriașe ca volum, conțin informații doar despre o parte neglijabilă a Internetului. Cel mai mare director al rețelei DMOZ (numit și Proiectul Open Directory) conține informații despre 5 milioane de resurse, în timp ce baza de date a motorului de căutare Google este formată din peste 8 miliarde de documente.

Primul motor de căutare cu drepturi depline a fost proiectul WebCrawler, publicat în 1994.

În 1995, au apărut motoarele de căutare Lycos și AltaVista. Acesta din urmă este lider în domeniul căutării de informații pe Internet de mulți ani.

În 1997, Sergey Brin și Larry Page au creat motorul de căutare Google ca parte a unui proiect de cercetare la Universitatea Stanford. Google este în prezent cel mai popular motor de căutare din lume!

În septembrie 1997, motorul de căutare Yandex, care este cel mai popular de pe internetul în limba rusă, a fost anunțat oficial.

În prezent, există trei motoare de căutare internaționale principale - Google, Yahoo și MSN, care au propriile baze de date și algoritmi de căutare. Majoritatea celorlalte motoare de căutare (dintre care există un număr mare) folosesc într-o formă sau alta rezultatele celor trei enumerate. De exemplu, căutarea AOL (search.aol.com) utilizează baza de date Google, în timp ce AltaVista, Lycos și AllTheWeb folosesc baza de date Yahoo.

5. Componența și principiile de funcționare a sistemului de căutare

În Rusia, principalul motor de căutare este Yandex, urmat de Rambler.ru, Google.ru, Aport.ru, Mail.ru. Mai mult, în acest moment, Mail.ru utilizează motorul de căutare și baza de date Yandex.

Aproape toate motoarele de căutare majore au propria lor structură, diferită de celelalte. Cu toate acestea, este posibil să se identifice principalele componente comune tuturor motoarelor de căutare. Diferențele de structură pot fi doar sub forma implementării mecanismelor de interacțiune a acestor componente.

Modul de indexare

Modulul de indexare este format din trei programe auxiliare (roboți):

Spider este un program conceput pentru a descărca pagini web. Păianjenul descarcă pagina și preia toate linkurile interne de pe pagina respectivă. Codul html al fiecărei pagini este descărcat. Roboții folosesc protocoale HTTP pentru a descărca pagini. Păianjenul funcționează după cum urmează. Robotul trimite cererea „get/path/document” și alte comenzi de solicitare HTTP către server. Ca răspuns, robotul primește un flux de text care conține informații de serviciu și documentul în sine.

    Adresa URL a paginii

    data la care pagina a fost descărcată

    Antet http pentru răspunsul serverului

    corpul paginii (cod html)

Crawler („călător”) este un program care urmărește automat toate linkurile găsite pe pagină. Selectează toate linkurile prezente pe pagină. Sarcina sa este de a determina unde ar trebui să meargă păianjenul, pe baza linkurilor sau a unei liste predeterminate de adrese. Crawler, urmând linkurile găsite, caută documente noi care sunt încă necunoscute motorului de căutare.

Indexer (robot indexer) este un program care analizează paginile web descărcate de păianjeni. Indexatorul parsează pagina în părțile sale componente și le analizează folosind proprii algoritmi lexicali și morfologici. Sunt analizate diferite elemente ale paginii, cum ar fi text, titluri, link-uri, caracteristici structurale și de stil, etichete HTML pentru servicii speciale etc.

Astfel, modulul de indexare vă permite să accesați cu crawlere un anumit set de resurse folosind link-uri, să descărcați pagini întâlnite, să extrageți link-uri către pagini noi din documentele primite și să efectuați o analiză completă a acestor documente.

Bază de date

O bază de date, sau index al motorului de căutare, este un sistem de stocare a datelor, o matrice de informații în care sunt stocați parametrii special convertiți ai tuturor documentelor descărcate și procesate de modulul de indexare.

Server de căutare

Serverul de căutare este cel mai important element al întregului sistem, deoarece calitatea și viteza căutării depind direct de algoritmii care stau la baza funcționării acestuia.

Serverul de căutare funcționează după cum urmează:

    Solicitarea primită de la utilizator este supusă analizei morfologice. Se generează mediul informațional al fiecărui document conținut în baza de date (care va fi afișat ulterior sub forma unui fragment, adică informații text corespunzătoare solicitării din pagina cu rezultatele căutării).

    Datele primite sunt transmise ca parametri de intrare la un modul special de clasare. Datele sunt prelucrate pentru toate documentele, drept urmare fiecare document are propriul rating care caracterizează relevanța interogării introduse de utilizator și diferitele componente ale acestui document stocate în indexul motorului de căutare.

    În funcție de alegerea utilizatorului, această evaluare poate fi ajustată prin condiții suplimentare (de exemplu, așa-numita „căutare avansată”).

    În continuare, se generează un fragment, adică pentru fiecare document găsit, titlul, un scurt rezumat care se potrivește cel mai bine interogării și un link către documentul în sine sunt extrase din tabelul de documente, iar cuvintele găsite sunt evidențiate.

    Rezultatele căutării rezultate sunt transmise utilizatorului sub forma unei SERP (Search Engine Result Page) – o pagină cu rezultatele căutării.

După cum puteți vedea, toate aceste componente sunt strâns legate între ele și funcționează în interacțiune, formând un mecanism clar, destul de complex pentru funcționarea sistemului de căutare, care necesită cantități uriașe de resurse.

Niciun motor de căutare nu acoperă toate resursele de pe Internet.

Fiecare motor de căutare colectează informații despre resursele Internet folosind metodele sale unice și formează propria sa bază de date actualizată periodic. Accesul la această bază de date este acordat utilizatorului.

Motoarele de căutare implementează două moduri de a căuta o resursă:

    Cauta dupa subiect cataloage - informatii este prezentat sub forma unei structuri ierarhice. La nivelul superior sunt categorii generale („Internet”, „Afaceri”, „Artă”, „Educație”, etc.), la nivelul următor categoriile sunt împărțite în secțiuni etc. Cel mai de jos nivel sunt link-urile către anumite pagini web sau alte resurse de informații.

    Căutare prin cuvinte cheie (căutare index sau căutare detaliată) - utilizatorul trimite către motorul de căutare cerere, constând din cuvinte cheie. Sistem se intoarce utilizatorului o listă de resurse găsite la cerere.

Majoritatea motoarelor de căutare combină ambele metode de căutare.

Motoarele de căutare pot fi locale, globale, regionale și specializate.

În partea rusă a internetului (Runet), cele mai populare motoare de căutare cu scop general sunt Rambler (www.rambler.ru), Yandex (www.yandex.ru), Aport (www.aport.ru), Google (www.rambler.ru). google.ru).

Majoritatea motoarelor de căutareimplementate sub formă de portaluri.

Portal (din engleză.portal- intrare principală, poartă) este un site web care integrează diverse servicii Internet: instrumente de căutare, mail, știri, dicționare etc.

Portalurile pot fi specializate (cum ar fi,www. muzeu. ru) și general (de exemplu,www. km. ru).

Căutare după cuvinte cheie

Setul de cuvinte cheie utilizate pentru căutare se mai numește și criteriu de căutare sau subiect de căutare.

O solicitare poate consta fie dintr-un cuvânt, fie dintr-o combinație de cuvinte combinate de operatori - simboluri prin care sistemul determină ce acțiune trebuie să efectueze. De exemplu: solicitarea „Moscova Sankt Petersburg” conține operatorul AND (așa este perceput un spațiu), ceea ce indică faptul că ar trebui să căutați documente care conțin ambele cuvinte - Moscova și Sankt Petersburg.

Pentru ca căutarea să fie relevantă (din engleză relevant - relevant, relevant), ar trebui luate în considerare câteva reguli generale:

    Indiferent de forma în care cuvântul este folosit în interogare, căutarea ia în considerare toate formele sale de cuvânt conform regulilor limbii ruse. De exemplu, interogarea „bilet” va găsi și cuvintele „bilet”, „bilet”, etc.

    Literele majuscule trebuie folosite numai în numele proprii, pentru a evita vizualizarea referințelor inutile. La cererea „fierarilor”, de exemplu, vor fi găsite documente care vorbesc atât despre fierari, cât și despre Kuznetsov.

    Este recomandabil să restrângeți căutarea folosind câteva cuvinte cheie.

    Dacă adresa necesară nu se numără printre primele douăzeci de adrese găsite, ar trebui să modificați solicitarea.

Fiecare motor de căutare folosește propriul său limbaj de interogare. Pentru a vă familiariza cu acesta, utilizați ajutorul încorporat al motorului de căutare

Site-urile mari pot avea sisteme integrate de recuperare a informațiilor în paginile lor web.

Interogările în astfel de sisteme de căutare, de regulă, sunt construite după aceleași reguli ca și în motoarele de căutare globale, totuși, familiaritatea cu ajutorul de aici nu va fi de prisos.

Cautare Avansata

Motoarele de căutare pot oferi utilizatorului un mecanism pentru a crea o interogare complexă. Urmând un link Cautare Avansata face posibilă editarea parametrilor de căutare, specificarea parametrilor suplimentari și selectarea celui mai convenabil formular pentru afișarea rezultatelor căutării. În continuare sunt descriși parametrii care pot fi setați în timpul unei căutări avansate în sistemele Yanex și Rambler.

Descrierea parametrilor

Numele în Yandex

Nume înHoinar

Unde să căutați cuvinte cheie (titlul documentului, textul corpului etc.)

Dicţionar filter

Căutați după text...

Ce cuvinte ar trebui sau nu ar trebui să fie prezente în document și cât de precisă ar trebui să fie potrivirea

Dicţionar filter

Căutați cuvinte de interogare... Excludeți documentele care conțin următoarele cuvinte...

Cât de departe ar trebui să fie amplasate cuvintele cheie?

Dicţionar filter

Distanța dintre cuvintele de interogare...

Restricție la data documentului

Data documentului...

Limitați căutarea la unul sau mai multe site-uri

Site/Sup

Căutați documente doar pe următoarele site-uri...

Limitarea căutării după limba documentului

Limba documentului...

Căutați documente care conțin o imagine cu un anumit nume sau semnătură

Imagine

Găsirea paginilor care conțin obiecte

Obiecte speciale

Formularul de prezentare a rezultatelor căutării

Formatul problemei

Afișarea rezultatelor căutării

Unele motoare de căutare (de exemplu, Yandex) vă permit să introduceți interogări în limbaj natural. Scrieți ceea ce trebuie să găsiți (de exemplu: comandați bilete de tren de la Moscova la Sankt Petersburg). Sistemul analizează cererea și produce rezultatul. Dacă nu sunteți mulțumit de aceasta, treceți la limba de interogare.

Ce este asta

DuckDuckGo este un motor de căutare open source destul de cunoscut. Serverele sunt situate în SUA. Pe lângă propriul robot, motorul de căutare folosește rezultate din alte surse: Yahoo, Bing, Wikipedia.

Cu atât mai bine

DuckDuckGo se poziționează ca un motor de căutare care oferă confidențialitate și confidențialitate maximă. Sistemul nu colectează date despre utilizator, nu stochează jurnalele (fără istoric de căutare), iar utilizarea cookie-urilor este cât se poate de limitată.

DuckDuckGo nu colectează și nu partajează informații personale de la utilizatori. Aceasta este politica noastră de confidențialitate.

Gabriel Weinberg, fondatorul DuckDuckGo

De ce ai nevoie de asta

Toate motoarele de căutare majore încearcă să personalizeze pe baza datelor despre persoana din fața monitorului. Acest fenomen se numește „bulă de filtru”: utilizatorul vede doar acele rezultate care sunt în concordanță cu preferințele sale sau pe care sistemul le consideră ca atare.

DuckDuckGo creează o imagine obiectivă care nu depinde de comportamentul tău trecut pe Internet și elimină publicitatea tematică de pe Google și Yandex pe baza interogărilor tale. Cu DuckDuckGo, este ușor să cauți informații în limbi străine: Google și Yandex în mod implicit acordă preferință site-urilor în limba rusă, chiar dacă interogarea este introdusă într-o altă limbă.


Ce este asta

not Evil este un sistem care caută în rețeaua Tor anonimă. Pentru a o folosi, trebuie să mergeți la această rețea, de exemplu, lansând una specializată cu același nume.

not Evil nu este singurul motor de căutare de acest gen. Există LOOK (căutarea implicită în browserul Tor, accesibilă de pe internetul obișnuit) sau TORCH (unul dintre cele mai vechi motoare de căutare din rețeaua Tor) și altele. Ne-am hotărât pe not Evil din cauza indicii clare de la Google (doar uitați-vă la pagina de pornire).

Cu atât mai bine

Căută unde Google, Yandex și alte motoare de căutare sunt în general închise.

De ce ai nevoie de asta

Rețeaua Tor conține multe resurse care nu pot fi găsite pe internetul care respectă legea. Iar numărul acestora va crește pe măsură ce controlul guvernului asupra conținutului internetului se va înăspri. Tor este un fel de rețea din Internet cu propriile rețele sociale, trackere de torrent, media, platforme de tranzacționare, bloguri, biblioteci și așa mai departe.

3. YaCy

Ce este asta

YaCy este un motor de căutare descentralizat care funcționează pe principiul rețelelor P2P. Fiecare computer pe care este instalat modulul software principal scanează Internetul independent, adică este analog cu un robot de căutare. Rezultatele obținute sunt colectate într-o bază de date comună care este utilizată de toți participanții YaCy.

Cu atât mai bine

Este dificil de spus dacă acest lucru este mai bun sau mai rău, deoarece YaCy este o abordare complet diferită a organizării căutării. Absența unui singur server și a unei companii proprietare face ca rezultatele să fie complet independente de preferințele oricui. Autonomia fiecărui nod elimină cenzura. YaCy este capabil să caute pe web profund și rețele publice neindexate.

De ce ai nevoie de asta

Dacă sunteți un susținător al software-ului open source și al unui internet gratuit, care nu este supus influenței agențiilor guvernamentale și a marilor corporații, atunci YaCy este alegerea dvs. Poate fi folosit și pentru a organiza o căutare în cadrul unei rețele corporative sau autonome. Și chiar dacă YaCy nu este foarte util în viața de zi cu zi, este o alternativă demnă la Google în ceea ce privește procesul de căutare.

4. Pipl

Ce este asta

Pipl este un sistem conceput pentru a căuta informații despre o anumită persoană.

Cu atât mai bine

Autorii lui Pipl susțin că algoritmii lor specializați caută mai eficient decât motoarele de căutare „obișnuite”. În special, sursele prioritare de informații includ profiluri de rețele sociale, comentarii, liste de membri și diverse baze de date care publică informații despre persoane, cum ar fi hotărârile judecătorești. Conducerea lui Pipl în acest domeniu este confirmată de evaluările de la Lifehacker.com, TechCrunch și alte publicații.

De ce ai nevoie de asta

Dacă aveți nevoie să găsiți informații despre o persoană care locuiește în SUA, atunci Pipl va fi mult mai eficient decât Google. Bazele de date ale instanțelor ruse sunt aparent inaccesibile motorului de căutare. Prin urmare, nu se descurcă atât de bine cu cetățenii ruși.

Ce este asta

FindSounds este un alt motor de căutare specializat. Caută diverse sunete (casă, natură, mașini, oameni etc.) în surse deschise. Serviciul nu acceptă interogări în limba rusă, dar există o listă impresionantă de etichete în limba rusă pe care le puteți căuta.

Cu atât mai bine

Ieșirea conține doar sunete și nimic în plus. În setările de căutare puteți seta formatul dorit și calitatea sunetului. Toate sunetele găsite sunt disponibile pentru descărcare. Există o căutare de sunete după model.

De ce ai nevoie de asta

Dacă trebuie să găsiți rapid sunetul unei împușcături de muschetă, loviturile unei ciocănitoare care alăptează sau strigătul lui Homer Simpson, atunci acest serviciu este pentru dvs. Și am ales acest lucru numai din interogările disponibile în limba rusă. În engleză spectrul este și mai larg.

Dar serios, un serviciu specializat necesită un public specializat. Dar dacă îți este de folos și ție?

Ce este asta

Wolfram|Alpha este un motor de căutare computațional. În loc de link-uri către articole care conțin cuvinte cheie, oferă un răspuns gata făcut la cererea utilizatorului. De exemplu, dacă introduceți „comparați populațiile din New York și San Francisco” în formularul de căutare în limba engleză, Wolfram|Alpha va afișa imediat tabele și grafice cu comparația.

Cu atât mai bine

Acest serviciu este mai bun decât altele pentru a găsi fapte și a calcula date. Wolfram|Alpha colectează și organizează cunoștințele disponibile pe Web dintr-o varietate de domenii, inclusiv știință, cultură și divertisment. Dacă această bază de date conține un răspuns gata făcut la o interogare de căutare, sistemul îl afișează, dacă nu, calculează și afișează rezultatul; În acest caz, utilizatorul vede doar informațiile necesare și nimic de prisos.

De ce ai nevoie de asta

Dacă sunteți student, analist, jurnalist sau cercetător, de exemplu, puteți utiliza Wolfram|Alpha pentru a găsi și a calcula date legate de munca dvs. Serviciul nu înțelege toate solicitările, dar se dezvoltă constant și devine mai inteligent.

Ce este asta

Motorul de metacăutare Dogpile afișează o listă combinată de rezultate din rezultatele căutării de la Google, Yahoo și alte sisteme populare.

Cu atât mai bine

În primul rând, Dogpile afișează mai puține anunțuri. În al doilea rând, serviciul folosește un algoritm special pentru a găsi și afișa cele mai bune rezultate din diferite motoare de căutare. Potrivit dezvoltatorilor Dogpile, sistemele lor generează cele mai complete rezultate de căutare de pe întregul Internet.

De ce ai nevoie de asta

Dacă nu puteți găsi informații pe Google sau pe alt motor de căutare standard, căutați-o în mai multe motoare de căutare simultan folosind Dogpile.

Ce este asta

BoardReader este un sistem de căutare de text în forumuri, servicii de întrebări și răspunsuri și alte comunități.

Cu atât mai bine

Serviciul vă permite să restrângeți câmpul de căutare la platformele sociale. Datorită filtrelor speciale, puteți găsi rapid postări și comentarii ale utilizatorilor care corespund criteriilor dvs.: limbă, data publicării și numele site-ului.

De ce ai nevoie de asta

BoardReader poate fi util pentru oamenii de PR și pentru alți specialiști media care sunt interesați de opinia unui public de masă asupra anumitor probleme.

In cele din urma

Viața motoarelor de căutare alternative este adesea trecătoare. Lifehacker l-a întrebat pe fostul director general al filialei ucrainene Yandex, Serghei Petrenko, despre perspectivele pe termen lung ale unor astfel de proiecte.


Serghei Petrenko

Fost director general al Yandex.Ukraine.

În ceea ce privește soarta motoarelor de căutare alternative, este simplu: să fie proiecte foarte de nișă cu un public restrâns, deci fără perspective comerciale clare sau, dimpotrivă, cu claritatea deplină a absenței lor.

Dacă te uiți la exemplele din articol, poți vedea că astfel de motoare de căutare fie sunt specializate într-o nișă îngustă, dar populară, care, poate, încă nu a crescut suficient pentru a fi vizibilă pe radarele Google sau Yandex, fie testează. o ipoteză originală în clasament, care nu este încă aplicabilă în căutarea obișnuită.

De exemplu, dacă o căutare pe Tor se dovedește brusc a fi solicitată, adică rezultatele de acolo sunt necesare de cel puțin un procent din publicul Google, atunci, desigur, motoarele de căutare obișnuite vor începe să rezolve problema cum să găsiți-le și arătați-le utilizatorului. Dacă comportamentul publicului arată că pentru o proporție semnificativă de utilizatori dintr-un număr semnificativ de interogări, rezultatele oferite fără a lua în considerare factorii care depind de utilizator par mai relevante, atunci Yandex sau Google vor începe să producă astfel de rezultate.

„Fii mai bun” în contextul acestui articol nu înseamnă „fii mai bun în orice”. Da, în multe aspecte, eroii noștri sunt departe de Google și Yandex (chiar departe de Bing). Dar fiecare dintre aceste servicii oferă utilizatorului ceva ce giganții industriei de căutare nu pot oferi. Cu siguranță cunoști și tu proiecte similare. Distribuie cu noi - haideți să discutăm.

Cele mai bune motoare de căutare pe Internet. motor de căutare pe internet Acestea sunt programe speciale de căutare instalate pe o întreagă gamă de mașini specializate. În termeni simpli, este același site web cu un set de programe, doar pe un motor de căutare special (server). Cu ajutorul motoarelor de căutare găsiți toate informațiile de care aveți nevoie. Există o mulțime de motoare de căutare.

1. Ce este un motor de căutare pe Internet

2. Motoare de căutare populare în țara noastră

3. Motoare de căutare populare în străinătate

4. Motoare de căutare neobișnuite

5. Cum să căutați corect informații pe Internet

Cel mai cel mai bun psisteme de căutare in tara noastra:

http://www.yandex.ru

http://www.google.com

http://www.aport.ru

http://www.rambler.ru/

http://go.mail.ru

http://www.webalta.ru/

Cel mai neiubit și mai intruziv motor de căutare de către toți.

Motoare de căutare populare în străinătate

http://www.altavista.com

http://www.alltheweb.com

http://www. bing.com

http://www.google.com
http://www.excite.com
http://www.lycos.com
http://www.mamma.com

http://www.yahoo.com

http://www.dmoz.com
http://www.hotbot.com
http://www.dogpile.com
http://www.netscape.com
http://www.msn.com
http://www.webcrawler.com
http://www.jayde.com
http://www.aol.com
http://www.euroseek.com
http://www.teoma.com
http://www.about.com
http://www.ixquick.com
http://www.lookle.com
http://www.metaeureka.com
http://www.searchspot.com
http://www.slider.com
http://www.allthesites.com
http://www.clickey.com
http://www.galaxy.com
http://brainysearch.com
http://www.orura.com

Fiecare țară are propriile sale motoare de căutare populare.

Motoare de căutare neobișnuite

  • DuckDuckGo (https://duckduckgo.com/) - un motor de căutare hibrid cu o politică de confidențialitate pentru utilizator și interogările sale de căutare.

  • TinEye (http://tineye.com/) este un motor de căutare specializat în căutarea de imagini pe Internet. Recent și-a pierdut relevanța după ce Google a introdus aceeași funcție în căutarea de imagini.

  • Guenon (http://www.genon.ru/) este un motor de căutare care colectează și creează conținut pe site-ul său web.

În aproape fiecare motor de căutare, pe lângă caseta de căutare, există link-uri către cele mai populare site-uri de știri și site-uri cu anumite subiecte.

Cum să căutați corect informații pe Internet

Fiecare motor de căutare are propriii algoritmi (reguli) pentru căutarea informațiilor.

Pentru a găsi unele informații pe Internet printr-un motor de căutare, trebuie să introduceți în câmpul de căutare cerere. Dacă introduceți un cuvânt, atunci această solicitare vă va oferi mii de link-uri către site-uri unde este menționat acest cuvânt.

Prin urmare, este necesar să introduceți o interogare cât mai specifică, constând din două, trei sau mai multe fraze.

Să ne uităm la un exemplu de interogare de motor de căutare Yandex.

Să presupunem că doriți să găsiți informații despre cumpărarea unui computer. Dacă scrieți un cuvânt în caseta de căutare „ Calculator„, atunci vei primi 133 de milioane de răspunsuri

Trebuie să solicitați o cerere mai precisă. Este mai bine să indicați ce computer doriți să cumpărați și unde (în ce oraș).

Atunci motorul de căutare vă va oferi mult mai puține răspunsuri la întrebarea dvs.

Motorului de căutare nu îi pasă deloc dacă introduceți interogarea cu litere mari sau mici.

Yandex face distincție între substantive și adjective, dar ignoră complet terminațiile.

De asemenea, este complet indiferent la cazuri, plurale și altele asemenea.

Pentru a face căutarea mai precisă, trebuie să puneți interogarea între ghilimele sau să puneți un semn de exclamare înaintea cuvântului.

Acum uitați-vă la aceeași interogare, dar fără semnele exclamației.

Vedeți diferența? Cu semnele exclamării, numărul răspunsurilor nu este de 2 milioane, ci de 186 de mii.

Dacă puneți un semn de exclamare în fața unui cuvânt cu majuscule, vi se vor oferi răspunsuri în care apare acel cuvânt cu majusculă.

Dacă cuvântul este în cazul nominativ și aveți nevoie de informații despre exact un astfel de cuvânt și exact așa cum l-ați scris, atunci puneți două semne de exclamare în fața acestui cuvânt. De exemplu: !!Minge .

Căutarea vă va oferi răspunsuri pentru exact acest cuvânt " Minge„cum ai scris-o. Nu " minge", Nu " bile", și cu majusculă.

Dacă scrieți o frază cu cuvântul " pe", atunci Yandex va ignora " pe" De exemplu: " pe raft" Căutarea va fi efectuată numai folosind cuvântul " raft ».

Pentru ca el să-l ia în considerare și să nu îl ignore, este necesar înaintea cuvântului „ pe» pune semnul plus – « +pe ».

Fiecare motor de căutare are propriul algoritm de căutare, așa că dacă utilizați un anumit motor de căutare și doriți să învățați cum să compuneți corect interogări, trebuie doar să introduceți „ regulile de căutare înGoogle " sau " regulile de căutare în Yandex ", urmați linkul din răspunsul la solicitarea dvs. și citiți informațiile necesare.

Un motor de căutare este o bază de date cu informații specifice de pe Internet. Mulți utilizatori cred că, de îndată ce introduc o interogare într-un motor de căutare, întregul Internet este imediat accesat cu crawlere, dar acest lucru nu este deloc adevărat. Internetul este scanat constant, de multe programe, datele despre site-uri sunt introduse într-o bază de date, unde, după anumite criterii, toate site-urile și toate paginile lor sunt distribuite în diverse tipuri de liste și baze de date. Adică este un fel de dulap de fișiere de date, iar căutarea are loc nu pe Internet, ci pe acest dulap de fișiere.

Motoare de căutare populare

Yandex este cel mai mare motor de căutare din RuNet.

Pe lângă motorul de căutare, compania Yandex oferă 77 de servicii suplimentare, dintre care cele mai populare sunt serviciul de e-mail Yandex, browser Yandex, disc Yandex, informații despre trafic și vreme, bani Yandex și multe altele. Motorul de căutare ia în considerare locația dvs. atunci când afișează rezultatele căutării. Programul de căutare este, de asemenea, în continuă modernizare pentru a produce rezultate mai corecte, concepute să fie cât mai informativ pentru utilizator.

Google este cel mai popular motor de căutare din lume.

Pe lângă motorul de căutare, Google oferă multe servicii suplimentare, programe și hardware, inclusiv un serviciu de e-mail, browser Google Chrome, cea mai mare bibliotecă video YouTube și multe alte proiecte. Google cumpără cu încredere multe proiecte care aduc profituri mari. Majoritatea serviciilor nu sunt destinate utilizatorului direct, ci spre a face bani pe internet și sunt integrate cu accent pe interesele utilizatorilor europeni și americani.

Mail este un motor de căutare care este popular în principal datorită serviciului său de e-mail.

Există multe servicii suplimentare, a căror cheie este Mail, în acest moment compania Mail deține rețeaua socială Odnoklassniki, propria rețea „My World”, serviciul Money-mail, multe jocuri online, trei browsere aproape identice cu nume diferite. . Toate aplicațiile și serviciile conțin o mulțime de conținut publicitar. Rețeaua socială VKonatkte blochează tranzițiile directe către serviciile de e-mail, justificându-le cu un număr mare de viruși.

Wikipedia.

Wikipedia este un sistem de referință de căutare.

Motorul de căutare non-profit, care funcționează cu donații private, nu își umple, așadar, paginile cu publicitate. Un proiect multilingv al cărui scop este să creeze o enciclopedie de referință completă în toate limbile lumii. Nu are autori anumiți și este completat și gestionat de voluntari din toată lumea. Fiecare utilizator poate să scrie și să editeze un articol.

Pagina oficială - www.wikipedia.org.

Youtube este cea mai mare bibliotecă de fișiere video.

Gazduire video cu elemente ale unei retele sociale, unde fiecare utilizator poate adauga un videoclip. De la achiziționarea lor de către Google Ink, nu este necesară înregistrarea separată pentru YouTube, trebuie doar să vă înregistrați în serviciul de e-mail Google.

Pagina oficială - youtube.com.

Yahoo! este al doilea cel mai important motor de căutare din lume.

Există servicii suplimentare, dintre care cel mai faimos este Yahoo mail. Ca parte a îmbunătățirii calității motorului de căutare, Yahoo transferă date despre utilizatori și interogările acestora către Microsoft. Din aceste date, se formează o idee despre interesele utilizatorilor și se formează o piață pentru conținut publicitar. Motorul de căutare Yahoo, precum , este implicat în achiziția altor companii, de exemplu, Yahoo deține serviciul de căutare Altavista și site-ul de comerț electronic Alibaba.

Pagina oficială - www.yahoo.com.

WDL este o bibliotecă digitală.

Biblioteca colectează cărți care oferă valoare culturală în formă digitală. Scopul principal este de a crește nivelul de conținut cultural al internetului. Accesul la bibliotecă este gratuit.

Pagina oficială - www.wdl.org/ru/.

Bing este un motor de căutare de la Microsoft.

Pagina oficială - www.baidu.com.

Motoare de căutare în Rusia

Rambler este un motor de căutare „pro-american”.

Inițial a fost creat ca un portal media de internet. La fel ca multe alte motoare de căutare, are servicii de căutare pentru imagini, fișiere video, hărți, prognoze meteo, o secțiune de știri și multe altele. Editorii oferă, de asemenea, un browser gratuit, Rambler-Nichrome.

Pagina oficială - www.rambler.ru.

Nigma este un motor de căutare inteligent.

Un motor de căutare mai convenabil datorită prezenței multor filtre și setări. Interfața vă permite să includeți sau să excludeți valori similare sugerate în căutare pentru a obține rezultate mai bune. De asemenea, atunci când primiți un rezultat de căutare, vă permite să utilizați informații de la alte motoare de căutare majore.

Pagina oficială - www.nigma.ru.

Aport - catalog de produse online.

În trecut, un motor de căutare, dar după ce dezvoltarea și inovarea au fost oprite, a pierdut rapid teren și . În prezent, Aport este o platformă de tranzacționare în care sunt prezentate produsele a peste 1.500 de companii.

Pagina oficială - www.aport.ru.

Sputnik este un motor de căutare național și un portal de internet.

Creat de Rostelecom. Momentan in faza de testare.

Pagina oficială - www.sputnik.ru.

Metabot este un motor de căutare în creștere.

Sarcinile Metabot sunt de a crea un motor de căutare pentru toate celelalte motoare de căutare, creând poziții de rezultate ținând cont de datele din întreaga listă de motoare de căutare. Adică este un motor de căutare pentru motoarele de căutare.

Pagina oficială - www.metabot.ru.

Motorul de căutare a fost suspendat.

Pagina oficială - www.turtle.ru.

KM este un multiportal.

Inițial, site-ul a fost un multiportal cu introducerea ulterioară a unui motor de căutare. Căutarea poate fi efectuată atât în ​​cadrul site-ului, cât și pe toate site-urile RuNet monitorizate.

Pagina oficială - www.km.ru.

Gogo - nu funcționează, redirecționează către un motor de căutare.

Pagina oficială - www.gogo.ru.

Multiportalul rusesc, nu foarte popular, necesită îmbunătățiri. Motorul de căutare include știri, televiziune, jocuri și o hartă.

Pagina oficială - www.zoneru.org.

Motorul de căutare nu funcționează, dezvoltatorii sugerează utilizarea unui motor de căutare.

Pagina oficială - www.au.ru.

  • Serghei Savenkov

    un fel de recenzie „scurtă”... de parcă s-ar grăbi undeva