Apa itu mesin pencari dan bagaimana cara kerjanya? Apa itu mesin pencari? Mesin pencari Google

Di Internet, ada situs web khusus di mana pengguna, atas permintaan tertentu, dapat menerima tautan ke situs yang sesuai dengan permintaan ini. Sistem pencarian terdiri dari tiga komponen: 1 robot pencari; 2 indeks sistem; dan 3 program,... ... Kamus Keuangan

Kata benda, jumlah sinonim: 3 pencari (9) anjing pelacak (16) mesin pencari (13) Kamus sinonim AS ... Kamus sinonim

mesin pencari- mesin pencari Situs yang digunakan untuk mencari situs lain. Pencarian dilakukan dengan memasukkan kata kunci ke dalam kotak pencarian. Berbeda dengan direktori, meskipun situs tersebut belum didaftarkan sebelumnya, situs tersebut dapat ditemukan menggunakan mesin pencari.... ... Panduan Penerjemah Teknis

mesin pencari- ieškos sistema statusas T sritis automatika atitikmenys: engl. sistem pencarian vok. Sistem seperti itu, n rus. mesin pencari, f pranc. sistem pencarian, m … Terminal otomatis mati

Mesin pencari- – (Mesin pencari bahasa Inggris, sinonim: mesin pencari, mesin pencari, mesin pencari) – Alat untuk mencari informasi di Internet. Biasanya, pekerjaan mesin pencari terdiri dari dua tahap. Program khusus (robot pencari, mesin, agen,... ... Kamus Ensiklopedis Media

Kontrol, sistem kontrol otomatis (Lihat Kontrol otomatis), di mana tindakan kontrol secara otomatis diubah dengan metode pencarian sehingga kontrol objek yang terbaik (dalam arti tertentu) dilakukan; pada… … Ensiklopedia Besar Soviet

Sistem kendali otomatis, di mana tindakan kendali diubah secara otomatis menggunakan metode pencarian otomatis untuk memberikan kendali terbaik terhadap objek; dalam hal ini perubahan ciri-ciri benda atau pengaruh luar. Rabu sebelumnya... Kamus Besar Ensiklopedis Politeknik

SMP 1 dirancang untuk mencari penyelamat yang berada dalam kondisi kritis yang terkait dengan ancaman terhadap kehidupan, serta mencari kargo yang jatuh dan berbagai benda dalam kondisi jarak pandang yang buruk. Ini termasuk: unit radio untuk mencari aktif... ... Kamus situasi darurat

sistem pengambilan informasi otomatis- 3.2.5 sistem pengambilan informasi otomatis: IPS, diimplementasikan berdasarkan teknologi komputer elektronik Sumber ... Buku referensi kamus istilah dokumentasi normatif dan teknis

Istilah ini memiliki arti lain, lihat Aport. Pelabuhan... Wikipedia

Buku

  • Masalah ekstrim teori grafik dan Internet. Buku teks, Raigorodsky Andrey Mikhailovich. Brosur ini dikhususkan untuk mempelajari berbagai masalah ekstrem dalam teori graf, yang solusinya (setidaknya sebagian) dapat berguna dalam analisis data. Itu muncul berdasarkan...
  • Masalah ekstrem teori graf dan Internet, Raigorodsky F.M.. Brosur ini dikhususkan untuk mempelajari berbagai masalah ekstrem teori graf, yang solusinya (setidaknya sebagian) dapat berguna dalam analisis data. Itu muncul berdasarkan...

Apa ini

DuckDuckGo merupakan mesin pencari open source yang cukup terkenal. Server berlokasi di AS. Selain robotnya sendiri, mesin pencari menggunakan hasil dari sumber lain: Yahoo, Bing, Wikipedia.

Semakin baik

DuckDuckGo memposisikan dirinya sebagai mesin pencari yang memberikan privasi dan kerahasiaan maksimal. Sistem tidak mengumpulkan data apa pun tentang pengguna, tidak menyimpan log (tidak ada riwayat pencarian), dan penggunaan cookie dibatasi mungkin.

DuckDuckGo tidak mengumpulkan atau membagikan informasi pribadi dari pengguna. Ini adalah kebijakan privasi kami.

Gabriel Weinberg, pendiri DuckDuckGo

Mengapa Anda membutuhkan ini

Semua mesin pencari utama mencoba melakukan personalisasi berdasarkan data tentang orang di depan monitor. Fenomena ini disebut “gelembung filter”: pengguna hanya melihat hasil yang sesuai dengan preferensinya atau yang dianggap demikian oleh sistem.

DuckDuckGo menciptakan gambaran objektif yang tidak bergantung pada perilaku Anda sebelumnya di Internet, dan menghilangkan iklan tematik dari Google dan Yandex berdasarkan kueri Anda. Dengan DuckDuckGo, mudah untuk mencari informasi dalam bahasa asing: Google dan Yandex secara default memberikan preferensi ke situs berbahasa Rusia, meskipun kueri dimasukkan dalam bahasa lain.


Apa ini

not Evil adalah sistem yang mencari jaringan Tor anonim. Untuk menggunakannya, Anda perlu masuk ke jaringan ini, misalnya dengan meluncurkan jaringan khusus dengan nama yang sama.

not Evil bukan satu-satunya mesin pencari dari jenisnya. Ada LOOK (pencarian default di browser Tor, dapat diakses dari Internet biasa) atau TORCH (salah satu mesin pencari tertua di jaringan Tor) dan lain-lain. Kami memilih bukan Jahat karena petunjuk yang jelas dari Google (lihat saja halaman awal).

Semakin baik

Ia mencari di tempat Google, Yandex, dan mesin pencari lainnya umumnya ditutup.

Mengapa Anda membutuhkan ini

Jaringan Tor berisi banyak sumber daya yang tidak dapat ditemukan di Internet yang taat hukum. Dan jumlah mereka akan bertambah seiring dengan semakin ketatnya kontrol pemerintah terhadap konten Internet. Tor adalah sejenis jaringan di dalam Internet dengan jejaring sosialnya sendiri, pelacak torrent, media, platform perdagangan, blog, perpustakaan, dan sebagainya.

3. YaCy

Apa ini

YaCy adalah mesin pencari terdesentralisasi yang bekerja berdasarkan prinsip jaringan P2P. Setiap komputer tempat modul perangkat lunak utama diinstal memindai Internet secara mandiri, yang dianalogikan dengan robot pencari. Hasil yang diperoleh dikumpulkan ke dalam database umum yang digunakan oleh seluruh peserta YaCy.

Semakin baik

Sulit untuk mengatakan apakah ini lebih baik atau lebih buruk, karena YaCy adalah pendekatan yang sangat berbeda dalam mengatur pencarian. Tidak adanya satu server dan perusahaan pemilik membuat hasil benar-benar tidak bergantung pada preferensi siapa pun. Otonomi setiap node menghilangkan sensor. YaCy mampu mencari web dalam dan jaringan publik yang tidak diindeks.

Mengapa Anda membutuhkan ini

Jika Anda adalah pendukung perangkat lunak sumber terbuka dan Internet gratis, tidak terpengaruh oleh lembaga pemerintah dan perusahaan besar, maka YaCy adalah pilihan Anda. Ini juga dapat digunakan untuk mengatur pencarian dalam jaringan perusahaan atau jaringan otonom lainnya. Meskipun YaCy tidak terlalu berguna dalam kehidupan sehari-hari, YaCy merupakan alternatif yang layak untuk Google dalam hal proses pencarian.

4. Pipl

Apa ini

Pipl adalah sistem yang dirancang untuk mencari informasi tentang orang tertentu.

Semakin baik

Penulis Pipl mengklaim bahwa algoritma khusus mereka mencari lebih efisien daripada mesin pencari “biasa”. Secara khusus, sumber informasi prioritas mencakup profil jaringan sosial, komentar, daftar anggota, dan berbagai database yang mempublikasikan informasi tentang orang-orang, seperti keputusan pengadilan. Kepemimpinan Pipl di bidang ini dikonfirmasi oleh penilaian dari Lifehacker.com, TechCrunch, dan publikasi lainnya.

Mengapa Anda membutuhkan ini

Jika Anda perlu mencari informasi tentang seseorang yang tinggal di AS, Pipl akan jauh lebih efektif daripada Google. Basis data pengadilan Rusia tampaknya tidak dapat diakses oleh mesin pencari. Oleh karena itu, dia tidak bisa menangani warga Rusia dengan baik.

Apa ini

FindSounds adalah mesin pencari khusus lainnya. Mencari berbagai suara (rumah, alam, mobil, orang, dll.) di sumber terbuka. Layanan ini tidak mendukung kueri dalam bahasa Rusia, tetapi ada daftar tag berbahasa Rusia yang mengesankan yang dapat Anda cari.

Semakin baik

Outputnya hanya berisi suara dan tidak ada tambahan. Dalam pengaturan pencarian Anda dapat mengatur format dan kualitas suara yang diinginkan. Semua suara yang ditemukan tersedia untuk diunduh. Ada pencarian suara berdasarkan pola.

Mengapa Anda membutuhkan ini

Jika Anda ingin dengan cepat menemukan suara tembakan senapan, pukulan burung pelatuk yang menyusu, atau teriakan Homer Simpson, maka layanan ini cocok untuk Anda. Dan kami memilih ini hanya dari pertanyaan berbahasa Rusia yang tersedia. Dalam bahasa Inggris spektrumnya bahkan lebih luas.

Tapi serius, layanan khusus memerlukan audiens khusus. Tapi bagaimana jika itu juga berguna bagi Anda?

Apa ini

Wolfram|Alpha adalah mesin pencari komputasi. Alih-alih link ke artikel yang mengandung kata kunci, ini memberikan jawaban siap pakai atas permintaan pengguna. Misalnya, jika Anda memasukkan “bandingkan populasi New York dan San Francisco” ke dalam formulir pencarian dalam bahasa Inggris, Wolfram|Alpha akan segera menampilkan tabel dan grafik beserta perbandingannya.

Semakin baik

Layanan ini lebih baik daripada layanan lain dalam mencari fakta dan menghitung data. Wolfram|Alpha mengumpulkan dan mengatur pengetahuan yang tersedia di Web dari berbagai bidang, termasuk sains, budaya, dan hiburan. Jika database ini berisi jawaban siap pakai untuk permintaan pencarian, sistem akan menampilkannya; jika tidak, sistem akan menghitung dan menampilkan hasilnya. Dalam hal ini, pengguna hanya melihat informasi yang diperlukan dan tidak ada informasi tambahan.

Mengapa Anda membutuhkan ini

Jika Anda seorang pelajar, analis, jurnalis, atau peneliti, misalnya, Anda dapat menggunakan Wolfram|Alpha untuk mencari dan menghitung data terkait pekerjaan Anda. Layanan ini tidak memahami semua permintaan, namun terus berkembang dan menjadi lebih pintar.

Apa ini

Mesin metasearch Dogpile menampilkan daftar gabungan hasil dari hasil pencarian dari Google, Yahoo dan sistem populer lainnya.

Semakin baik

Pertama, Dogpile menampilkan lebih sedikit iklan. Kedua, layanan ini menggunakan algoritma khusus untuk menemukan dan menampilkan hasil terbaik dari berbagai mesin pencari. Menurut pengembang Dogpile, sistem mereka menghasilkan hasil pencarian terlengkap di seluruh Internet.

Mengapa Anda membutuhkan ini

Jika Anda tidak dapat menemukan informasi di Google atau mesin pencari standar lainnya, carilah di beberapa mesin pencari sekaligus menggunakan Dogpile.

Apa ini

BoardReader adalah sistem pencarian teks di forum, layanan tanya jawab dan komunitas lainnya.

Semakin baik

Layanan ini memungkinkan Anda mempersempit bidang pencarian ke platform sosial. Berkat filter khusus, Anda dapat dengan cepat menemukan postingan dan komentar pengguna yang sesuai dengan kriteria Anda: bahasa, tanggal publikasi, dan nama situs.

Mengapa Anda membutuhkan ini

BoardReader dapat berguna bagi spesialis PR dan spesialis media lainnya yang tertarik dengan opini khalayak ramai mengenai isu-isu tertentu.

Kesimpulannya

Kehidupan mesin pencari alternatif sering kali cepat berlalu. Lifehacker bertanya kepada mantan direktur umum Yandex cabang Ukraina, Sergei Petrenko, tentang prospek jangka panjang dari proyek semacam itu.


Sergei Petrenko

Mantan Direktur Jenderal Yandex.Ukraina.

Adapun nasib mesin pencari alternatif, sederhana saja: menjadi proyek yang sangat khusus dengan audiens yang kecil, sehingga tanpa prospek komersial yang jelas atau, sebaliknya, dengan kejelasan yang lengkap tentang ketidakhadiran mereka.

Jika Anda melihat contoh dalam artikel tersebut, Anda dapat melihat bahwa mesin pencari tersebut mengkhususkan diri pada ceruk yang sempit namun populer, yang, mungkin, belum cukup berkembang untuk terlihat di radar Google atau Yandex, atau mereka sedang menguji hipotesis asli dalam pemeringkatan, yang belum dapat diterapkan dalam pencarian reguler.

Misalnya, jika pencarian di Tor tiba-tiba ternyata diminati, artinya, hasil dari sana dibutuhkan oleh setidaknya sebagian dari audiens Google, maka tentu saja mesin pencari biasa akan mulai memecahkan masalah bagaimana caranya. temukan dan tunjukkan kepada pengguna. Jika perilaku audiens menunjukkan bahwa untuk sebagian besar pengguna dalam sejumlah besar kueri, hasil yang diberikan tanpa memperhitungkan faktor-faktor yang bergantung pada pengguna tampak lebih relevan, maka Yandex atau Google akan mulai memberikan hasil seperti itu.

“Menjadi lebih baik” dalam konteks artikel ini tidak berarti “menjadi lebih baik dalam segala hal.” Ya, dalam banyak aspek, pahlawan kita jauh dari Google dan Yandex (bahkan jauh dari Bing). Namun masing-masing layanan ini memberi pengguna sesuatu yang tidak dapat ditawarkan oleh raksasa industri pencarian. Pasti Anda juga mengetahui proyek serupa. Bagikan dengan kami - mari berdiskusi.

Agar berhasil memelihara dan mengembangkan blog kita, pertama-tama kita perlu mengetahui algoritma apa yang digunakannya. Pemahaman yang jelas tentang jawaban atas pertanyaan-pertanyaan ini akan memungkinkan kita untuk berhasil memecahkan masalah promosi situs web di mesin pencari. Namun perbincangan tentang optimasi mesin pencari website masih terus berlanjut, namun untuk saat ini sedikit teori tentang mesin pencari.

Apa itu mesin pencari Internet?

Jika kita membuka Wikipedia, inilah yang kita temukan:

“Mesin pencari adalah kompleks perangkat lunak dan perangkat keras dengan antarmuka web yang menyediakan kemampuan untuk mencari informasi di Internet.”

Dan sekarang dalam bahasa yang kami pahami. Katakanlah kita sangat membutuhkan informasi tentang suatu topik tertentu. Agar kita dapat menemukannya dengan cepat, telah dibuat mesin pencari - situs di mana, dengan memasukkan permintaan pencarian di formulir pencarian, kita akan diberikan daftar situs di mana, dengan tingkat kemungkinan yang tinggi, kita akan menemukan apa yang kita cari. sedang mencari. Daftar ini disebut hasil pencarian. Ini dapat terdiri dari jutaan halaman dengan 10 situs di setiap halaman. Tugas utama seorang webmaster adalah masuk setidaknya sepuluh besar.

Ingatlah bahwa ketika Anda mencari sesuatu di Internet, Anda biasanya menemukannya di halaman pertama hasil pencarian, jarang berpindah ke halaman kedua, apalagi ke halaman berikutnya. Artinya, semakin tinggi peringkat situs, semakin banyak pula pengunjung yang mengunjungi halamannya. Dan traffic yang tinggi (jumlah pengunjung per hari), antara lain, merupakan peluang untuk berhasil.

Bagaimana mesin pencari Internet menemukan informasi di Internet dan atas dasar apa mereka mendistribusikan tempat dalam hasil pencarian?

Dalam beberapa kata, mesin pencari internet- ini adalah keseluruhan web di mana robot laba-laba terus-menerus memindai jaringan dan mengingat semua teks yang masuk ke Internet. Menganalisis data yang diterima, mesin pencari memilih dokumen yang paling sesuai dengan permintaan pencarian, yaitu dokumen yang relevan, dari mana hasil pencarian dibentuk.

Yang paling menarik adalah mesin pencari tidak bisa membaca. Lalu bagaimana mereka mendapatkan informasi? Algoritme mesin pencari bermuara pada beberapa prinsip dasar. Pertama-tama, mereka memperhatikan judul dan deskripsi artikel, judul paragraf, sorotan semantik dalam teks dan kepadatan kata kunci, yang tentu harus sesuai dengan topik artikel. Semakin akurat pencocokan ini, semakin tinggi situs tersebut muncul di hasil pencarian. Selain itu, volume informasi dan banyak faktor lainnya harus diperhitungkan. Misalnya, otoritas sumber daya web, yang bergantung pada jumlah dan otoritas situs yang tertaut ke sumber tersebut. Semakin besar otoritasnya, semakin tinggi peringkatnya.

Serangkaian tindakan yang bertujuan untuk meningkatkan posisi situs dalam hasil pencarian untuk permintaan tertentu disebut optimasi mesin pencari. Sekarang ini adalah ilmu yang utuh -. Tapi lebih dari itu nanti.

Saat ini terdapat banyak sekali mesin pencari di dunia. Saya akan menyebutkan yang paling populer. Di barat, ini adalah: Google, Bing dan Yahoo. Di Runet - Yandex, Mail.ru, Rambler dan Nigma. Pada dasarnya, pengguna memberikan preferensi kepada pemimpin dunia, dan sistem Yandex telah menjadi yang paling populer di Internet berbahasa Rusia.

Sedikit sejarah. Google didirikan pada tahun 1997 oleh penduduk asli Moskow Sergei Brin dan teman Amerikanya Larry Halaman selama studi mereka di Universitas Stanford.

Keunikan Google adalah ia membawa hasil pencarian yang paling relevan dalam urutan logis ke posisi pertama dalam hasil pencarian, sementara mesin pencari lainnya hanya membandingkan kata-kata dalam kueri dengan kata-kata di halaman web.

Pada tanggal 23 September tahun yang sama, sistem Yandex diumumkan, yang sejak tahun 2000 mulai ada sebagai perusahaan terpisah "Yandex".

Saya tidak akan membuat Anda bosan lagi, saya harap ini menjadi lebih jelas sekarang, apa itu mesin pencari internet. Perlu dikatakan bahwa algoritma mesin pencari terus berkembang. Setiap hari, mesin pencari menjadi lebih baik dalam mengidentifikasi kebutuhan pengguna dan menampilkan informasi paling relevan dalam hasil pencarian, berdasarkan banyak faktor (wilayah, pertanyaan apa yang telah diminta pengguna, situs apa yang dia kunjungi selama proses pencarian, kemana dia pergi dari mereka, dll).

Segera Google dan Yandex akan lebih tahu dari kami apa yang kami butuhkan dan apa yang kami pikirkan!

Mesin pencari- kompleks perangkat lunak dan perangkat keras dengan antarmuka web yang menyediakan kemampuan untuk mencari informasi di Internet.

Semua mesin pencari disatukan oleh fakta bahwa mereka berada di server kuat yang didedikasikan khusus dan terikat pada saluran komunikasi yang efektif. Mesin pencari juga disebut sistem pengambilan informasi (IRS). Jumlah pengunjung yang dilayani secara bersamaan dari sistem paling populer mencapai ribuan. Yang paling terkenal melayani jutaan klien per hari. Dalam kasus di mana mesin pencari didasarkan pada suatu direktori, itu disebut direktori. Hal ini didasarkan pada pekerjaan moderator. Dasar dari IRS dengan pencarian teks lengkap adalah pengumpulan informasi secara otomatis. Itu dilakukan dengan program khusus. Program-program ini secara berkala memeriksa isi semua sumber daya Internet. Untuk melakukan ini, mereka bergerak, atau seperti yang mereka katakan, merangkak, melalui sumber daya yang berbeda. Oleh karena itu, program semacam itu disebut robot. Ada nama lain: karena WWW adalah singkatan dari ungkapan World Wide Web, maka wajar jika program semacam itu disebut laba-laba dalam bahasa Inggris. - laba-laba. Baru-baru ini, nama lain telah digunakan: indeks atau direktori otomatis. Semua program ini mengeksplorasi dan “mengunduh” informasi dari berbagai URL. Program jenis ini mengunjungi setiap sumber daya setelah waktu tertentu. Tidak ada mesin pencari yang dapat mengindeks seluruh Internet. Oleh karena itu, database yang mengumpulkan alamat sumber daya yang diindeks berbeda untuk mesin pencari yang berbeda. Namun, banyak dari mereka berusaha, jika mungkin, untuk mencakup seluruh ruang World Wide Web dalam pekerjaan mereka.

Untuk mencari informasi menggunakan mesin pencari, pengguna merumuskan permintaan pencarian. Berdasarkan permintaan pengguna, mesin pencari menghasilkan halaman hasil pencarian. Hasil pencarian tersebut dapat menggabungkan berbagai jenis file, misalnya: halaman web, gambar, file video. Beberapa mesin pencari juga mengambil data dari database dan direktori sumber daya di Internet.

Berdasarkan metode pencarian dan layanan, ada empat jenis mesin pencari:

1.sistem menggunakan robot pencari.

2. sistem yang dikendalikan manusia

3. sistem hibrida

4.meta-sistem.

Arsitektur sistem pencarian meliputi: robot pencari yang memindai situs Internet, pengindeks yang menyediakan pencarian cepat, dan mesin pencari - antarmuka grafis untuk pengguna.

Tujuan dari mesin pencari adalah untuk menemukan dokumen yang mengandung kata kunci atau kata-kata yang terkait dengan kata kunci tersebut. Mesin pencari akan semakin baik jika semakin banyak dokumen yang dikembalikan yang relevan dengan permintaan pengguna.

Contoh Mesin Pencari

Google- salah satu IPS luar negeri terlengkap dan populer. Ciri khas IRS Google adalah teknologi untuk menentukan tingkat relevansi suatu dokumen dengan menganalisis tautan dari sumber lain ke sumber daya tertentu. Semakin banyak tautan ke suatu halaman di halaman lain, semakin tinggi peringkatnya di IRS Google. Google menggunakan algoritma untuk menghitung otoritas PageRank. PageRank adalah salah satu faktor tambahan dalam menentukan peringkat situs dalam hasil pencarian. PageRank bukan satu-satunya, tapi cara yang sangat penting untuk menentukan posisi suatu situs di hasil pencarian Google. Google menggunakan indikator PageRank dari halaman yang ditemukan berdasarkan kueri untuk menentukan urutan halaman ini disajikan kepada pengunjung dalam hasil pencarian. Pada tahun 2010, perusahaan meluncurkan pencarian suara di Rusia. Untuk mencari, Anda perlu menekan tombol di sebelah baris pencarian di ponsel Anda dan mengucapkan permintaan Anda, telepon akan mengirimkan suara Anda ke server, dan browser akan menampilkan baris dengan permintaan Anda dikenali dan hasil pencariannya.

Yandex saat ini merupakan mesin pencari domestik paling populer. Mulai bekerja pada tahun 1997. Perusahaan ini mengelola katalog sumber daya Internetnya sendiri. Juga mesin pencari terbaik untuk mengidentifikasi ilustrasi. Versi bahasa Inggris dilengkapi dengan direktori sumber daya Internet. Ini memiliki sistem pembuatan permintaan yang ekstensif. Secara khusus, dimungkinkan untuk memasukkan instruksi pencarian dalam bahasa alami - dalam hal ini, semua ekstensi yang diperlukan dibuat secara otomatis.

Selain halaman web dalam format HTML, Yandex mengindeks dokumen dalam PDF (Adobe Acrobat), Rich Text Format (RTF), Word (.doc), Excel (.xls), PowerPoint (.ppt), RSS (blog dan forum) .

Mesin pencari Mail.ru mulai bekerja pada tahun 2007. Volume file indeks pada musim semi 2009 berjumlah lebih dari 1,5 miliar halaman yang terletak di server berbahasa Rusia. Selain mencari teks, sistem mencari ilustrasi dan klip video yang diposting di server khusus Rusia yang “mengisi sendiri”: [email protected], Flamber.Ru, 35Photo.ru, PhotoForum.ru, [email protected], RuTube, Loadup, Rambler Vision dan sejenisnya. Gogo.ru memungkinkan Anda membatasi pencarian Anda pada situs komersial, situs informasi, serta forum dan blog. Formulir Pencarian Lanjutan juga memungkinkan Anda membatasi pencarian pada jenis file tertentu (PDF, DOC, XLS, PPT), lokasi kata pencarian dalam dokumen, atau domain tertentu. Pada bulan November 2013, versi baru aplikasi pencarian dari Mail.Ru muncul di Google Play, memungkinkan Anda beralih dari layar utama ke jejaring sosial apa pun dan berisi akses cepat untuk mencari gambar, video, dan berita. Aplikasi Android telah berubah menjadi browser mini yang dirancang untuk mencari informasi yang diperlukan secara efektif. Utilitas juga telah belajar mengenali permintaan pencarian yang ditentukan bukan melalui teks, tetapi dengan suara. Pengembang juga mencatat bahwa mereka telah membuat widget khusus yang dapat ditempatkan di layar beranda ponsel cerdas atau tablet berbasis sistem Google Android. Dapat dipahami bahwa hal ini akan semakin mengurangi waktu yang dihabiskan untuk melakukan pencarian.

AltaVista– salah satu mesin pencari tertua menempati salah satu tempat pertama dalam hal volume dokumen – lebih dari 350 juta. AltaVista memungkinkan pencarian sederhana dan lanjutan. "Bantuan" memungkinkan bahkan pengguna yang tidak terlatih untuk menyusun pertanyaan sederhana dan kompleks dengan benar.

Pengembara– salah satu sistem pencarian informasi Rusia pertama, dibuka pada tahun 1996. Pada akhir tahun 2002, modernisasi radikal dilakukan, setelah itu Rambler kembali menjadi pemimpin dalam pencarian jaringan. Saat ini, volume indeksnya sekitar 150 juta dokumen. Untuk membuat kueri yang kompleks, disarankan untuk menggunakan mode "Kueri Terperinci", yang memberikan banyak peluang untuk menyusun instruksi pencarian menggunakan item menu.

PELAPORAN. Saat ini, databasenya berisi lebih dari 20 juta dokumen. Sistem ini memiliki berbagai kemampuan pencarian. APORT memiliki fungsi penerjemah bawaan, yang memberi pengguna kesempatan untuk merumuskan pertanyaan dalam bahasa Rusia dan Inggris. Selain itu, APORT memiliki mode khusus untuk mencari file ilustrasi dan audio.

Mesin pencari generasi terbaru mengindeks semua kata pada halaman web atau artikel konferensi, padahal sebelumnya ruang lingkup pengindeksan biasanya terbatas pada judul, judul, beberapa baris pertama dan alamat dokumen. Hal ini sangat membatasi kemampuan untuk mengidentifikasi materi tentang topik yang sempit, karena hasil pencarian tidak selalu mencerminkan data aktual. Dengan menghilangkan kekurangan ini, mesin pencari modern menjadi jauh lebih dapat diandalkan dibandingkan pendahulunya.

Fitur terpenting berikutnya adalah peningkatan mekanisme pencarian internal, yang dinyatakan dalam peningkatan jumlah operator dan elemen konstruksi kueri lainnya. Beberapa tahun yang lalu, hanya dua, atau paling banter, tiga operator Boolean klasik yang digunakan: AND (dan), OR (atau) dan NOT (tidak). Sekarang ada DEKAT di Alta Vista dan DIIKUTI OLEH di OpenText - operator jarak yang sangat berguna yang memungkinkan Anda membuat kueri sespesifik mungkin. Banyak sistem memungkinkan Anda untuk memotong akhiran istilah, membatasi pencarian berdasarkan tanggal pembuatan dokumen, mencari kata kunci hanya di elemen halaman web yang ditentukan (judul, judul, alamat email, dll.), serta mencari sebuah frase yang tepat. Perkembangan terkini juga memungkinkan Anda mendeteksi file jenis tertentu (misalnya grafik atau audio) dan peka terhadap huruf kecil dan huruf kapital. Kemampuan mencari data dalam bahasa apa pun sudah menjadi hal yang lumrah. Semua ini memungkinkan terciptanya resep pencarian dengan tingkat akurasi yang tinggi, yang tentunya meningkatkan relevansi hasil yang diperoleh.

Saat ini mesin pencari terpopuler adalah Google dan Yandex, mari kita bandingkan:

    Jumlah halaman yang diindeks. Google punya 8 miliar, dan Yandex hanya punya 2 miliar.

    Artinya, empat kali lebih sedikit. Kemenangan untuk Google.

    Relevansi masalah. Relevansi mengacu pada kesesuaian hasil yang ditampilkan di halaman mesin pencari dengan kueri Anda.

    Saya harus segera mengatakan bahwa sulit untuk menentukan pemenang di sini. Google menunjukkan hasil yang baik di segmen Internet luar negeri, tetapi di Runet, Yandex selalu sedikit lebih maju.

Layanan Internet tambahan. Di sini keunggulannya jelas menjadi milik Yandex. Ini memiliki lusinan layanan berbeda yang mudah dikelompokkan ke dalam kategori, sementara Google memiliki lebih sedikit layanan, ditambah lagi ada integrasi dengan jejaring sosial Google+, yang tidak disukai banyak orang.

Dalam beberapa tahun terakhir, layanan dari Google dan Yandex telah menjadi bagian dari kehidupan kita. Dalam hal ini, mungkin banyak yang bertanya-tanya apa itu mesin pencari? Secara sederhana, ini adalah sistem perangkat lunak yang dirancang untuk mencari informasi di World Wide Web. Hasilnya biasanya disajikan dalam format daftar, sering disebut halaman hasil pencarian (SERPs). Informasi tersebut dapat berupa kombinasi halaman web, gambar, dan jenis file lainnya. Beberapa mesin pencari juga berisi informasi yang tersedia di database atau direktori publik.

Berbeda dengan direktori web yang hanya didukung oleh editornya sendiri, mesin pencari juga memuat informasi real-time dengan menjalankan algoritma pada web crawler.

Sejarah asal usul

Mesin pencari sendiri muncul lebih awal dari World Wide Web - pada bulan Desember 1990. Layanan pertama disebut Archie, dan mencari konten file FTP menggunakan perintah.

Apa itu mesin pencari Internet? Hingga September 1993, World Wide Web seluruhnya diindeks secara manual. Ada daftar server web yang diedit oleh Tim Berners-Lee yang dihosting di server web CERN. Karena semakin banyak server yang online, layanan di atas tidak dapat mengimbangi pemrosesan informasi sebanyak itu.

Segera setelah itu, banyak mesin pencari bermunculan dan popularitasnya meningkat secara signifikan. Ini termasuk Magellan, Excite, Infoseek, Inktomi, Northern Light dan AltaVista. Yahoo! adalah salah satu cara paling populer untuk menemukan halaman web yang diminati, namun algoritma pencariannya beroperasi pada direktori webnya sendiri dan bukan salinan teks lengkap dari halaman tersebut. Pencari informasi juga dapat menelusuri direktori daripada melakukan pencarian kata kunci.

Babak baru perkembangan

Google menganut ide menjual permintaan pencarian pada tahun 1998, dimulai dengan sebuah perusahaan kecil bernama goto.com. Langkah ini berdampak signifikan pada bisnis SEO, yang seiring berjalannya waktu menjadi salah satu aktivitas paling menguntungkan di Internet.

Sekitar tahun 2000, mesin pencari Google mulai dikenal luas. Perusahaan telah mencapai hasil yang lebih baik untuk banyak pencarian melalui inovasi yang disebut PageRank. Algoritme berulang ini memberi peringkat halaman web berdasarkan koneksinya ke situs dan halaman lain, berdasarkan premis bahwa sumber yang baik atau diinginkan sering kali disebutkan oleh orang lain. Google juga mempertahankan antarmuka minimalis untuk mesin pencarinya. Sebaliknya, banyak pesaing yang telah membangun mesin pencari ke dalam portal web. Faktanya, Google telah menjadi sangat populer sehingga mesin penipuan seperti Mystery Seeker bermunculan. Saat ini ada banyak versi regional dari layanan ini, khususnya mesin pencari Google.ru, yang dirancang untuk pengguna berbahasa Rusia.

Bagaimana cara kerja layanan ini?

Bagaimana peringkat dan hasil ditampilkan? Apa mesin pencari dalam hal algoritma tindakan? Mereka memperoleh informasi melalui penjelajahan web dari situs ke situs. Robot atau laba-laba memeriksa nama file robots.txt standar yang dialamatkan sebelum mengirimkan informasi tertentu untuk pengindeksan. Ini berfokus pada banyak faktor, yaitu header, konten halaman, JavaScript, Cascading Style Sheets (CSS), dan markup HTML standar dari konten informasi atau metadata dalam tag meta HTML.

Pengindeksan berarti mengaitkan kata-kata dan token lain yang dapat diidentifikasi yang ditemukan di halaman web dengan nama domain dan bidang berbasis HTML. Asosiasi dibuat dalam database yang dapat diakses publik dan tersedia untuk permintaan pencarian web. Permintaan dari pengguna dapat berupa satu kata. Indeks membantu Anda menemukan informasi terkait kueri secepat mungkin.

Beberapa teknik pengindeksan dan caching merupakan rahasia dagang, sedangkan perayapan web adalah proses sederhana mengunjungi semua situs web secara sistematis.

Di antara kunjungan robot, versi halaman yang di-cache (sebagian atau seluruh konten diperlukan untuk menampilkannya) yang disimpan dalam memori kerja mesin pencari dengan cepat dikirim ke pengguna yang meminta. Jika kunjungan terlambat, mesin pencari dapat bertindak sebagai proxy web. Dalam hal ini, halaman tersebut mungkin berbeda dari indeks pencarian. Sumber yang di-cache menunjukkan versi yang kata-katanya telah diindeks, sehingga berguna jika halaman sebenarnya hilang.

Arsitektur tingkat tinggi

Biasanya, pengguna memasukkan query ke mesin pencari berupa beberapa kata kunci. Indeks sudah memiliki nama situs yang mengandung kata kunci tersebut, dan langsung ditampilkan. Beban kerja sebenarnya adalah membuat halaman web yang merupakan daftar hasil pencarian. Setiap halaman di seluruh daftar harus diberi peringkat sesuai dengan informasi dalam indeks.

Dalam hal ini, elemen hasil teratas memerlukan pencarian, rekonstruksi, dan penandaan fragmen yang menunjukkan konteks dari kata kunci yang cocok. Ini hanya sebagian dari pemrosesan setiap halaman web dalam hasil pencarian, dan halaman selanjutnya (di sebelahnya) memerlukan sebagian besar pemrosesan selanjutnya.

Selain hanya mencari kata kunci, mesin pencari juga menawarkan operator GUI atau perintah berbasis perintah dan parameter pencarian untuk menyaring hasil.

Mereka memberikan kontrol yang diperlukan kepada pengguna melalui putaran umpan balik, pemfilteran dan pembobotan sambil menyempurnakan data yang dicari berdasarkan halaman awal dari hasil pencarian pertama. Misalnya, sejak tahun 2007, Google.com telah memungkinkan untuk memfilter daftar yang dihasilkan berdasarkan tanggal dengan mengeklik "Tampilkan Alat Penelusuran" di kolom paling kiri pada laman hasil asli, lalu memilih rentang tanggal yang Anda inginkan.

Memvariasikan permintaan

Kebanyakan mesin pencari mendukung penggunaan operator Boolean AND, OR, dan NOT untuk membantu pengguna akhir menyaring kueri mereka. Beberapa operator dirancang untuk literal, yang memungkinkan pengguna menyaring dan memperluas istilah pencarian. Robot mencari kata atau frasa dengan cara yang sama seperti mencari perintah yang dimasukkan. Beberapa mesin pencari menyediakan fitur pencarian lanjutan yang memungkinkan pengguna menentukan jarak antar kata kunci.

Ada juga pencarian berbasis konsep, di mana penelitian melibatkan penggunaan analisis statistik pada halaman yang berisi kata atau frasa yang Anda cari. Selain itu, kueri bahasa alami memungkinkan pengguna memasukkan pertanyaan dengan cara yang sama seperti bertanya kepada manusia (contoh paling umum adalah Ask.com).

Kegunaan mesin pencari bergantung pada relevansi kumpulan hasil yang dikembalikannya. Mungkin ada jutaan halaman web yang berisi kata atau frasa tertentu, namun beberapa di antaranya mungkin lebih relevan, populer, atau berwibawa dibandingkan yang lain. Sebagian besar mesin pencari menggunakan metode pemeringkatan untuk memastikan hasil terbaik.

Bagaimana mesin pencari memutuskan halaman mana yang paling cocok untuk suatu kueri, dan dalam urutan apa sumber yang ditemukan harus ditampilkan, sangat bervariasi dari satu robot ke robot lainnya. Metode-metode ini juga berubah seiring waktu seiring dengan perubahan penggunaan Internet dan berkembangnya teknologi baru.

Apa itu mesin pencari: varietas

Ada dua jenis utama mesin pencari. Yang pertama adalah sistem kata kunci yang telah ditentukan sebelumnya dan diurutkan secara hierarkis yang telah diprogram secara massal oleh orang-orang. Yang kedua adalah sistem yang menghasilkan “indeks terbalik” dengan menganalisis teks yang ditemukan.

Sebagian besar mesin pencari adalah layanan komersial yang didukung oleh pendapatan iklan, dan oleh karena itu beberapa mesin pencari mengizinkan pengiklan untuk menentukan peringkat pada hasil yang mereka tampilkan dengan biaya tertentu. Layanan yang tidak menerima uang untuk pemeringkatan menghasilkan uang dengan menjalankan iklan kontekstual di samping situs yang mereka tampilkan. Saat ini, promosi di mesin pencari adalah salah satu penghasilan paling menguntungkan di Internet.

Layanan apa yang paling umum?

Google merupakan mesin pencari terpopuler di dunia dengan pangsa pasar 80,52% per Maret 2017.

  • Google - 80,52%
  • Bing - 6,92%
  • Baidu - 5,94%
  • Yahoo! - 5,35%

Mesin pencari di Rusia dan Asia Timur

Di Rusia dan beberapa negara di Asia Timur, Google bukanlah layanan yang paling populer. Di antara pengguna Rusia, mesin pencari Yandex memimpin dalam hal popularitas (61,9%) dibandingkan dengan Google (28,3%). Di Tiongkok, Baidu adalah layanan paling populer. Portal pencarian Korea Selatan Naver digunakan untuk 70% persen pencarian online di negara tersebut. Juga Yahoo! di Jepang dan Taiwan ini adalah alat paling populer untuk menemukan data yang diperlukan.

Mesin pencari Rusia terkenal lainnya adalah Mail dan Rambler. Dengan dimulainya pengembangan Runet, mereka menikmati popularitas yang luas, tetapi sekarang mereka telah kehilangan posisinya.

Batasan dan kriteria pencarian

Meskipun mesin pencari diprogram untuk menentukan peringkat situs web berdasarkan popularitas dan relevansinya, penelitian empiris menunjukkan kriteria politik, ekonomi, dan sosial yang berbeda dalam memilih informasi yang mereka berikan. Bias ini mungkin merupakan akibat langsung dari proses ekonomi (misalnya, perusahaan yang mengiklankan mesin telusur mungkin juga menjadi lebih populer di hasil penelusuran organik) dan proses politik (misalnya, penghapusan hasil penelusuran karena undang-undang setempat). Misalnya, Google tidak akan menampilkan beberapa situs neo-Nazi di Perancis dan Jerman, dimana penolakan Holocaust adalah ilegal.

Mesin pencari Kristen, Islam dan Yahudi

Pertumbuhan global Internet dan media elektronik di dunia Muslim selama dekade terakhir telah mendorong umat Islam di Timur Tengah dan anak benua Asia untuk mencoba membuat mesin pencari mereka sendiri dan memfilter portal yang memungkinkan pengguna melakukan pencarian yang aman.

Layanan tersebut berisi filter yang selanjutnya mengklasifikasikan situs web sebagai “halal” atau “haram” berdasarkan interpretasi ahli modern terhadap “Hukum Islam”.

Portal ImHalal muncul online pada bulan September 2011, dan Halalgoogling pada bulan Juli 2013. Mereka menggunakan filter haram berdasarkan algoritma dari Google dan Bing.

Mesin pencari berorientasi agama lainnya termasuk Jewgle (Google versi Yahudi) dan SeekFind.org yang berbasis Kristen. Mereka menyaring situs-situs yang mengingkari atau merendahkan keimanan mereka.

  • Sergei Savenkov

    semacam ulasan "pendek"... seolah-olah mereka sedang terburu-buru di suatu tempat