Qidiruv vositalari. Oxirgi bosqichning maqsadi qidiruv muammosini yakuniy hal qilishdir. Bu, shuningdek, uni hal qilish uchun zarur bo'lgan vositalarni qurishni o'z ichiga oladi. qidiruv tizimlarining sifatini tanlash va baholash

Video darslik: Microsoft Access-da 10 daqiqada so'rovlarni qanday yaratish mumkin

Leksiya: Qidiruv mexanizmi vositalaridan foydalanish (so'rovlarni yaratish)

Ma'lumotlar bazalari bilan ishlashda eng muhim funktsiyalar axborot filtri, qidiruv va so'rovdir.


Tartiblash ma'lumotni qandaydir atributga ko'ra tartiblash jarayonidir. Ko'tariluvchi va pasayuvchi turlar mavjud. Agar ma'lumotlar bazasida raqamli ma'lumotlar bo'lsa, unda tartiblash sifatida tartiblash, matnli ma'lumot bo'lsa, alifbo tartibida tartiblash qo'llaniladi.


MS Access-da ma'lumotlar bazasini boshqarish tizimlari bo'yicha tartiblash ko'rib chiqilayotganda, saralash bitta maydon ichida amalga oshiriladi. Agar yangi tartib ishlatilsa, uning oldingi natijalari yo'qoladi. Agar tartib ichki joylashtirilgan bo'lsa, u so'rov yordamida amalga oshirilishi mumkin.


Filtr foydalanuvchi tomonidan talab qilinadigan ma'lumotlarni tanlashdir. Siz murakkab tanlov shartlarini o'rnatishingiz mumkin.

Ba'zi ma'lumotlarni topish uchun siz nomli maxsus belgilardan foydalanishingiz mumkin niqob:


* – istalgan sondagi belgilarni tanlash mumkinligini bildiradi.

? - bu belgi o'rniga foydalanishga ruxsat berilgan har qanday belgi bo'lishi mumkin.

# - bu belgi o'rniga istalgan raqam ishlatilishi mumkin.

- qavs ichidagi har qanday belgilar.

- – tanlangan diapazonga mos keladigan har qanday belgi.

! – har qanday belgi, kvadrat qavs ichiga olinganlardan tashqari.

Belgilar bo'yicha ushbu filtr butun jadval uchun yoki ba'zi mezonlar bo'yicha tanlangan ma'lumotlarning bir qismi uchun ishlatilishi mumkin.

So'rov- bu funksiya katta masshtabli bo‘lib, saralashni ham, filtrlashni ham o‘z ichiga olishi mumkin. Bu xususiyat bir nechta maydonlar va jadvallardagi ma'lumotlarni tanlash imkonini beradi. Siz kelajakda foydalanish uchun saqlanadigan so'rovlar kutubxonasini yaratishingiz mumkin. Maxsus SQL so'rovlar tili mavjud - tuzilgan.

IPS (axborot qidirish tizimi) axborot-qidiruv tili va tegishli qidiruv qoidalari asosida axborot manbalarining tavsiflari (indekslari) bilan maxsus ma’lumotlar bazasida kerakli ma’lumotlarni qidirish va tanlashni ta’minlovchi tizimdir.

Muvofiqlik qidiruv natijalarining tuzilgan so'rovga mos kelishidir.

Muvofiqlik(axborot qidirishda) - olingan ma'lumotlarning foydalanuvchining axborot ehtiyojlariga muvofiqligi.

Muvofiqlik foydalanuvchi kutganlari va qidiruv natijalari o'rtasidagi muvofiqlik darajasi bilan o'lchanadi (muvofiqlik bilan solishtiring), bu foydalanuvchi uchun foydali ma'lumotlar miqdorining qidiruv tizimi tomonidan olingan ma'lumotlarning umumiy miqdoriga nisbati sifatida aniqlanadi.

Yuqori darajadagi muvofiqlikka erishish zamonaviy qidiruv tizimlari uchun raqobatning asosiy maydonidir. Maksimal qoniqish uchun axborot ehtiyojlari foydalanuvchilar, semantik tarmoqlar nazariyalari va usullari, kontent tahlili va chuqur matn tahlili (Matnni qazib olish, matn qazib olish).

Internetda ma'lumot qidirish uchun ishlatiladi resurs manzili (Ingliz . Uniformamanbajoylashtiruvchi (URL) manzil), kerakli ma'lumotlarga kirishingiz kerak bo'lgan protokol nomi, server manzili va ushbu serverdagi fayl nomini o'z ichiga oladi (2-rasm).

Guruch. 2. Resurs manziliga misol

Qidiruv tizimi- Internetda ma'lumot izlash imkoniyatini ta'minlovchi veb-interfeysga ega dasturiy-apparat kompleksi. Qidiruv tizimi odatda tizim interfeysi joylashgan saytni anglatadi. Qidiruv tizimining dasturiy qismi qidiruv tizimi (qidiruv tizimi) - qidiruv tizimining funksionalligini ta'minlovchi dasturlar to'plami va odatda qidiruv tizimini ishlab chiqish kompaniyasining tijorat siri hisoblanadi.

Internetda ma'lumot qidirish so'rovlarni qayta ishlaydigan maxsus dasturlar yordamida amalga oshiriladi - Axborot qidirish tizimlari (IPS). Qidiruv mexanizmlari asoslanadigan bir nechta modellar mavjud, ammo tarixan ikkita model eng mashhurlikka erishgan - bu qidiruv kataloglari va qidiruv indekslari.

Qidiruv kataloglari yirik kutubxonalarning mavzuli kataloglari bilan bir xil printsip asosida tuzilgan. Ular, odatda, ushbu katalogda manzillari joylashgan saytlar mavzusini belgilaydigan, mavzuni bosqichma-bosqich takomillashtirish bilan, ob'ektlar va kichik elementlardan iborat ierarxik gipermatnli menyularni ifodalaydi. Qidiruv kataloglari qo'lda yaratiladi. Yuqori malakali muharrirlar WWW axborot maydonini shaxsan ko'rib chiqadilar, jamoatchilikni qiziqtirgan narsalarni tanlaydilar va ularni kataloglaydilar.

Qidiruv kataloglarining asosiy muammosi WWW resurslarining juda kam qamrovi hisoblanadi. Veb-resurslarni qamrab olish nisbatini ko'paytirish uchun qidiruv tizimining ma'lumotlar bazasini to'ldirish jarayonidan inson omilini istisno qilish kerak - ish avtomatlashtirilgan bo'lishi kerak.

Veb-resurslarni avtomatik kataloglash va mijozlar so'rovlarini qondirish amalga oshiriladi qidiruv indekslari. Qidiruv indeksining ishini shartli ravishda uch bosqichga bo'lish mumkin:

    asosiy ma'lumotlar bazasi to'plami. WWW axborot maydonini skanerlash uchun maxsus agent dasturlari - qurtlar qo'llaniladi, ularning vazifasi noma'lum resurslarni qidirish va ularni ma'lumotlar bazasida ro'yxatdan o'tkazishdir;

    ma'lumotlar bazasini indekslash - qidiruvni optimallashtirish uchun birlamchi ishlov berish. Indekslash bosqichida ixtisoslashtirilgan hujjatlar yaratiladi - haqiqiy qidiruv indekslari;

    olingan ro'yxatni aniqlashtirish. Ushbu bosqichda havolalar ro'yxati tuziladi, natijada u foydalanuvchiga uzatiladi. Olingan ro'yxatni aniqlashtirish qidiruv natijalarini filtrlash va tartiblashdan iborat.

Filtrlash foydalanuvchiga berish uchun mos bo'lmagan havolalarni filtrlashni anglatadi (masalan, dublikatlarni tekshirish). Reyting hosil bo'lgan ro'yxatni taqdim etish uchun maxsus tartibni yaratishdan iborat (kalit so'zlar soni, tegishli so'zlar va boshqalar).

Har qanday ATning asosiy vazifasi foydalanuvchining axborot ehtiyojlariga mos keladigan ma'lumotlarni izlashdir. Qidiruv natijasida hech narsani yo'qotmaslik, ya'ni so'rov bilan bog'liq barcha hujjatlarni topish va ortiqcha narsalarni topmaslik juda muhimdir. Shu sababli, qidiruv jarayonining sifat ko'rsatkichi - dolzarblik kiritiladi.

Muvofiqlikqidiruv natijalarining tuzilgan so'rovga mos kelishidir.

1 Qidiruv vositalari

Qidiruv vositalari - bu maxsus dasturiy ta'minot bo'lib, uning asosiy maqsadi Internet foydalanuvchilari uchun eng maqbul va sifatli ma'lumotlarni qidirishni ta'minlashdir. Qidiruv vositalari maxsus veb-serverlarda joylashgan bo'lib, ularning har biri o'ziga xos funktsiyani bajaradi:

Veb-qidiruv mexanizmlari - bu barcha manzillardagi WWW sahifalariga avtomatik ravishda kiradigan, ushbu sahifalar mazmunini tekshiradigan, sahifalardan kalit so'zlarni shakllantiradigan va ularning ma'lumotlar bazasiga (indeks sahifalari) yozadigan URL manzillarining katta ma'lumotlar bazasiga ega serverlar.

Bundan tashqari, qidiruv tizimi robotlari sahifalarda uchraydigan havolalarni kuzatib boradi va ularni qayta indekslaydi. Deyarli har qanday WWW sahifasi boshqa sahifalarga ko'plab havolalarga ega bo'lganligi sababli, bunday ish bilan qidiruv tizimi yakuniy natijada Internetdagi barcha saytlarni nazariy jihatdan chetlab o'tishi mumkin.

Aynan shu turdagi qidiruv vositalari barcha Internet foydalanuvchilari orasida eng mashhur va mashhurdir. Taniqli veb-qidiruv tizimlari (qidiruv tizimlari) - Yandex, Rambler, Aport nomlarini hamma biladi.

Veb-qidiruv tizimlarining ishi quyidagilardan iborat:

    Veb-sahifalarni tahlil qilish va tahlil natijalarini qidiruv serverining ma'lumotlar bazasining u yoki bu darajasiga kiritish.

    Foydalanuvchi talabiga binoan ma'lumotni qidiring.

    Ma'lumotni qidirish va foydalanuvchi tomonidan qidiruv natijalarini ko'rish uchun qulay interfeysni ta'minlash.

Ushbu yoki boshqa qidiruv vositalari bilan ishlashda ishlatiladigan ish usullari deyarli bir xil. Ularni tavsiflashda quyidagi tushunchalardan foydalaniladi:

    Qidiruv vositasi interfeysi giperhavolalar, so'rovlar qatori (qidiruv qatori) va so'rovlarni faollashtirish vositalariga ega sahifa sifatida taqdim etiladi.

    Qidiruv tizimi indeksi - bu ma'lum qoidalarga muvofiq tuzilgan veb-sahifalarni tahlil qilish natijalarini o'z ichiga olgan ma'lumot bazasi.

    So'rov - bu foydalanuvchi qidiruv paneliga kiritadigan kalit so'z yoki ibora. Turli so'rovlarni shakllantirish uchun maxsus belgilar ("", ~), matematik belgilar (*, +, ?) ishlatiladi.

Axborot qidirish sxemasi oddiy. Foydalanuvchi kalit iborani kiritadi va qidiruvni faollashtiradi va shu bilan tuzilgan (berilgan) so'rovga muvofiq hujjatlar tanlovini oladi. Ushbu hujjatlar ro'yxati ma'lum mezonlar bo'yicha tartiblangan, shuning uchun ro'yxatning yuqori qismida foydalanuvchi so'roviga eng mos keladigan hujjatlar joylashgan. Qidiruv vositalarining har biri qidiruv natijalarini tahlil qilishda ham, indeksni shakllantirishda ham (veb-sahifalarning indeks ma'lumotlar bazasini to'ldirish) hujjatlarni tartiblash uchun turli mezonlardan foydalanadi.

Rossiyada eng katta va eng mashhur qidiruv indekslari:

    Yandex (www.yandex.ru)

    Rambler (www.rambler.ru)

    Google (www.google.ru)

    "Aport2000" (www.aport.ru)

2 Qidiruv tizimlari

Umumiy qidiruv texnologiyasi quyidagi bosqichlardan iborat:

    Foydalanuvchi so'rov yuboradi

    Tizim hujjatlarni (yoki ularning qidiruv rasmlarini) qidiradi.

    Foydalanuvchi natijani oladi (hujjat tafsilotlari)

    Foydalanuvchi so'rovni yaxshilaydi yoki o'zgartiradi

    Yangi qidiruv tashkil qilinmoqda...

Umuman olganda, qidiruv tizimlari ikkita rejimni qo'llab-quvvatlaydi: oddiy qidiruv rejimi va kengaytirilgan qidiruv rejimi. Keling, umumlashtirilgan imkoniyatlarni ko'rib chiqaylik.

Oddiy qidiruv rejimida so'rovni shakllantirish. Siz shunchaki bo'sh joy bilan ajratilgan bir yoki bir nechta so'zlarni kiritishingiz mumkin; barcha mumkin bo'lgan oxiri bilan so'zlarni qidirish so'z oxirida * belgisi bilan modellashtirilgan. Ko'pgina tizimlar iboralar yoki iboralarni qo'shtirnoq ichiga olish orqali qidirishga imkon beradi. Ayrim so'zlarni kiritish yoki chiqarib tashlash mumkin.

Ibtidoiy tuzilgan so'rovni (kalit so'zlarni sanab o'tish shaklida) qidirishning asosiy muammosi shundaki, qidiruv tizimi hujjatning istalgan qismida ko'rsatilgan so'zlar uchraydigan barcha sahifalarni topadi. Qoidaga ko'ra, topilgan sahifalar soni juda ko'p bo'ladi.

Oddiy qidiruv rejimida qidiruv sifatini yaxshilash uchun siz qidiruv doirasini cheklash imkonini beruvchi mantiqiy operatorlar va operatorlardan foydalanishingiz mumkin, shuningdek taqdim etilgan ro'yxatdan hujjatlarning ma'lum bir toifasini tanlashingiz mumkin.

Ko'pgina qidiruv tizimlari o'zlarining so'rovlar tilida maxsus operatorlarni o'z ichiga oladi, ular sizga hujjatning ma'lum joylarida, masalan, uning sarlavhasida qidirish yoki hujjatni manzilining ma'lum qismi bo'yicha qidirish imkonini beradi.

Kengaytirilgan yoki batafsil so'rov rejimi turli tizimlarda u yakka tartibda amalga oshiriladi, lekin ko'pincha bu ko'rsatilgan operatorlar va asosiy elementlar oddiygina tegishli bayroqlarni o'rnatish yoki ro'yxatdan parametrlarni tanlash orqali amalga oshiriladigan shakldir.

Quyida bo'limdagi ma'lumotlarning namunasi keltirilgan Yordam bering Yandex qidiruv tizimi: kengaytirilgan qidiruv oynasi, so'rovlar tili, topilgan qidiruv.

Qidirmoq ichida topildi Agar a ichida Yandex so'rovi natijasi topildi ko'p hujjatlar, lekin siz xohlaganingizdan kengroq mavzuda, so'rovni aniqlashtirish orqali ushbu ro'yxatni qisqartirishingiz mumkin. Yana bir variant - katakchani yoqish ichida topildi ichida qidiruv shakli, qo'shimcha kalit so'zlarni o'rnating va keyingi qidiruv faqat tanlangan hujjatlarda amalga oshiriladi ichida oldingi qidiruv.

So'rovlar tilidan foydalanish bo'yicha eslatma

Misol

Ma'nosi

"Bizga ertalab tuzlangan bodring uchun"

So'zlar aniq shaklda ketma-ket

"Keldi * Elchi"

Qo'shtirnoq ichida etishmayotgan so'z

yarim dumba va mosol

Xuddi shu jumla ichidagi so'zlar

jihozlash && olish

Xuddi shu hujjatdagi so'zlar

capercaillie | keklik | kimdir

Har qanday so'zni qidiring

qila olmaysiz<< винить

Reytingsiz "va": operatordan keyingi ifoda hujjatning qidiruv natijalaridagi pozitsiyasiga ta'sir qilmaydi

Men /2 bajarishim kerak

Har qanday yo'nalishdagi ikki so'z ichidagi masofa (ya'ni, berilgan so'zlar orasida bitta so'z bo'lishi mumkin)

men ~~ tushunadigan narsa

So'zdan istisno tushunish qidiruvdan

mening /+2 fikrim bilan

To'g'ridan-to'g'ri tartibda ikki so'z ichidagi masofa

choy ~ laptem

So'z bo'lgan jumlani qidiring choy so'zsiz uchrashadi bast poyabzal

karam sho'rva /(-1 +2) slurp

Bir so'zdan orqaga ikki so'zgacha bo'lgan masofa

Menimcha! nima! nima

Belgilangan hol bilan aniq shakldagi so'zlar

Bu && chiqadi (+on | !me)

Qavslar murakkab so'rovlarda guruhlarni tashkil qiladi

Siyosat

So'zning lug'at shakli

sarlavha: (mamlakatda)

Hujjat sarlavhalari bo'yicha qidirish

url:ptici.narod.ru/ptici/kuropatka.htm

URL orqali qidirish

albatta inurl:vojne

URL fragmenti asosida qidiruv

Xost bo'yicha qidirish

Qayta yozishda xost boʻyicha qidiring

sayt: http://www.lib.ru/PXESY/FILATOW

Ma'lum bir saytning barcha subdomenlari va sahifalarida qidiring

Bitta fayl turini qidirish

Til cheklangan qidiruv

Domen cheklangan qidiruv

Qidiruv sanasi cheklangan

davlat biznes && /3 ipni tuting

Har qanday yo'nalishda 3 ta jumlada masofa

men ~~ tushunadigan narsa

So'zdan istisno tushunish qidiruvdan

Qiziqarli xususiyat bu siz ko'rsatgan manzil (URL) bilan sahifaga bog'langan Internetda hujjatlarni qidirishdir. Shunday qilib, siz Internetda veb-saytingizga havolalar mavjud sahifalarni topishingiz mumkin. Ba'zi tizimlar ko'rsatilgan domen ichida qidiruv doirasini cheklash imkonini beradi.

Qo'shimcha maxsus operatorlarga quyidagilar kiradi:

    Muayyan grafik faylga ega hujjatlarni qidirish operatorlari;

    Qidiriladigan sahifalar sanasini cheklash operatorlari;

    So'zlar orasidagi yaqinlik operatorlari;

    So'z shaklidagi buxgalteriya operatorlari;

    Natijalarni saralash uchun operatorlar (muvofiqlik, yangilik, qarilik bo'yicha).

Shuni ta'kidlash kerakki, afsuski, bugungi kunda turli xil qidiruv tizimlari uchun qo'llab-quvvatlanadigan operatorlar soni va sintaksisi uchun standart mavjud emas. Qo'llab-quvvatlanadigan operatorlar sintaksisi uchun standartni ishlab chiqishga urinishlar olib borilmoqda, shuning uchun qidiruv tizimini ishlab chiquvchilar foydalanuvchilarning qulayligi haqida qayg'uradilar, deb umid qilamiz. Qidiruv vositalarini ishlab chiqishning ushbu bosqichida foydalanuvchi ma'lum bir qidiruv tizimiga murojaat qilib, birinchi navbatda uning so'rovlarini tuzish qoidalari bilan tanishishi kerak. Qoida tariqasida, bosh sahifada havola bo'ladi Yordam bering bu sizni yordam ma'lumotlariga olib boradi.

Turli xil qidiruv tizimlari Internetdagi turli xil ma'lumot manbalarini tavsiflaydi. Shuning uchun, siz faqat bitta qidiruv tizimida qidirish bilan cheklanib qololmaysiz.

Yo'llarini ko'rib chiqing qidiruv tizimlarida qidiruv natijalarini taqdim etish.

Ko'pincha topilgan hujjatlar soni bir necha o'nlab, ba'zi hollarda esa yuz minglab odamlarga yetishi mumkin! Shuning uchun, berish shakli sifatida, sahifaning pastki qismidagi keyingi qismga o'tish imkoniyati bilan har bir sahifada 5-10-15 birlikdan iborat hujjatlar ro'yxati tuziladi. Topilgan hujjatning sarlavhasi va URL manzili (manzil) ko'rsatilishi kerak, ba'zida tizim hujjatning tegishlilik darajasini foiz sifatida ko'rsatadi.

Hujjat tavsifi ko'pincha birinchi jumlalarni yoki hujjat matnidan parchalarni, kalit so'zlarni ajratib ko'rsatishni o'z ichiga oladi. Qoida tariqasida, hujjatni yangilash (tekshirish) sanasi, uning kilobaytdagi hajmi ko'rsatiladi, ba'zi tizimlar hujjat tilini va uning kodlanishini belgilaydi (rus tilidagi hujjatlar uchun).

Natijalar bilan nima qilish mumkin? Agar hujjatning sarlavhasi va tavsifi sizning talablaringizga javob bersa, havolani bosish orqali darhol uning manbasiga o'tishingiz mumkin. Qidiruv natijalarini yanada tahlil qilish imkoniyatiga ega bo'lish uchun buni yangi oynada qilish qulayroqdir. Ko'pgina qidiruv tizimlari sizga topilgan hujjatlar ichida qidirish imkonini beradi va siz qo'shimcha shartlarni kiritish orqali so'rovingizni aniqlashtirishingiz mumkin.

Agar tizimning intellekt darajasi yuqori bo'lsa, sizga o'xshash hujjatlarni qidirish xizmati taklif qilinishi mumkin. Buning uchun siz o'zingizga juda yoqqan hujjatni tanlaysiz va uni tizimga namuna sifatida ko'rsatasiz.

Biroq, o'xshashlikni aniqlashni avtomatlashtirish ahamiyatsiz ish emas va ko'pincha bu funktsiya sizning kutganingizga mos kelmaydi. Ba'zi qidiruv tizimlari natijalarni saralash imkonini beradi. Vaqtingizni tejash uchun qidiruv natijalarini keyinchalik oflayn o'rganish uchun mahalliy diskingizga fayl sifatida saqlashingiz mumkin.


Ushbu mavzuni o'rganib chiqqandan so'ng, siz o'rganasiz va takrorlaysiz:

Qidiruv serverlari nima uchun?
- qidiruv serverlarining asosiy qismlarini tayinlash;
- Internetda axborot qidirishning qanday turlari mavjud;
- Yandex qidiruv tizimida so'rovni yaratishning asosiy qoidalari.

URL manzillar bo'yicha qidirish

Internetda ma'lumot topishning eng tez va ishonchli usuli bu URL manzillarini qidirishdir. Ularning ko'pchiligi bosma nashrlarda, maxsus ma'lumotnomalarda berilgan, mashhur radiostansiyalar efirida va televizor ekranlarida eshitiladi.

♦ "Zenit" futbol klubi muxlislari www.fc-zenit.ru manzilini yoddan bilishadi.
♦ “Korol i Shut” guruhi muxlislari ushbu guruhning rasmiy www.korol.spb.ru sayti haqida yaxshi bilishadi.
♦ NTV kanalining muxlislari o'z veb-saytini www.ntv.ru saytida osongina topishlari mumkin. Yuqoridagi manbalarga tezkor kirish uchun Internet Explorer kabi brauzer dasturini ishga tushiring va manzil satriga tanish URL manzilini kiriting.

Qidiruv tizimlari

Internetda juda ko'p hujjatlar mavjud. Kerakli ma'lumotlarni qidirishni osonlashtirish uchun maxsus qidiruv tizimlari yaratiladi.

qidiruv tizimlari- Bu global tarmoqqa ulangan serverlarni so'roq qiladigan va serverlarda mavjud ma'lumotlar haqidagi ma'lumotlarni o'z ma'lumotlar bazasida saqlaydigan avtomatik tizimlar. Maxsus tuzilgan so'rovga ko'ra, qidiruv tizimlari kerakli ma'lumotlarni qaerdan olishingiz mumkinligi haqida ma'lumot beradi.

Qoida tariqasida, qidiruv tizimlari uch qismdan iborat: robot, indeks va so'rovni qayta ishlash dasturi.

Robot (o'rgimchak, robot yoki bot) veb-sahifalarga tashrif buyuradigan va ularning mazmunini (to'liq yoki qisman) o'qiydigan dastur. Qidiruv mexanizmi robotlari veb-sahifa mazmunini tahlil qilish uchun individual sxemasida farqlanadi.
Qidiruv mexanizmi indeksi- bu robotlar sahifalari tashrif buyuradigan qidiruv rasmlari ombori. Hujjatning (jumladan, veb-sahifaning) qidiruv tasviri - bu hujjat mazmunini maxsus axborot qidirish tilida tavsiflash. Ushbu tavsif hujjatning ma'nosi va mazmunini aks ettiruvchi kalit so'zlarning kodlarini o'z ichiga oladi. Har bir qidiruv tizimidagi indekslar ma'lumotlarning miqdori va saqlanish usuli bilan farqlanadi. Etakchi qidiruv tizimlarining ma'lumotlar bazalarida o'n millionlab hujjatlar haqida ma'lumotlar saqlanadi va ularning indekslari yuzlab gigabaytlarni tashkil qiladi. Indekslar vaqti-vaqti bilan yangilanadi va to'ldiriladi, shuning uchun qidiruv turli vaqtlarda amalga oshirilgan bo'lsa, bir xil so'rov bilan bitta qidiruv tizimining ish natijalari farq qilishi mumkin.

So'rovni qayta ishlash foydalanuvchi so'roviga muvofiq, kerakli ma'lumotlar mavjudligi uchun indeksni "izlaydigan" va topilgan hujjatlarga havolalarni qaytaradigan dasturdir. Tizimning chiqishidagi havolalar to'plami dastur tomonidan y bog'liqligining kamayishi tartibida taqsimlanadi, ya'ni havolaning so'rovga mos kelishining eng yuqori darajasidan eng pastigacha.

Hozirgi vaqtda rus Internet foydalanuvchilari uchun eng mashhurlari uchta asosiy indeks turidagi qidiruv tizimlari:

Bu tizimlar rus tilining grammatik xususiyatlarini hisobga oladi, shuning uchun ularni rus tilidagi manbalarda qidirish natijalari G'arb tizimlariga qaraganda yuqori sifatga ega.

Qidiruv tizimlari axborot resurslarini qamrab olishda farqlanadi:

♦ umumiy qidiruv tizimlari bilimning barcha sohalari bo'yicha ma'lumotlar bazasiga ega bo'lib, keng ko'lamli indeks va katta hajmdagi to'plangan ma'lumotlar bilan ajralib turadi;
♦ Maxsus maqsadli qidiruv tizimlari faqat musiqa yoki muzey saytlari kabi muayyan mavzularga ega saytlarni qidiradi.

Qidiruv tizimlarining asosiy xususiyatlari quyidagilardan iborat:

♦ indeksdagi hujjatlar hajmi;
♦ axborotni yangilash chastotasi;
♦ qidiruv roboti qamrab oladigan axborot maydoni va ma'lumotlar to'planadigan hujjatlar turlarining xilma-xilligi;
♦ so'rovni qayta ishlash tezligi;
♦ tegishlilikni aniqlash mezoni (topilgan hujjatning qidiruv so'roviga muvofiqligi);
♦ so'rovni batafsil va aniqlashtirish imkoniyati.

Qidiruv tizimining rubrikatori bo'yicha qidirish

Qidiruv kataloglari boshqa internet resurslariga havolalarning tizimli to'plami (tanlash). Bog'lanishlar ierarxik tuzilma bo'lgan tematik rubrikator shaklida tashkil etilgan bo'lib, siz kerakli ma'lumotlarni topishingiz mumkin.

Misol tariqasida Yandex qidiruv Internet katalogining tuzilishini keltiramiz. Bu umumiy maqsadli katalogdir, chunki u deyarli barcha mumkin bo'lgan yo'nalishlarda Internet-resurslarga havolalarni o'z ichiga oladi. Ushbu katalogda quyidagi mavzular mavjud:

♦ Biznes va iqtisodiyot;
♦ Ma'lumotnomalar va havolalar;
♦ Jamiyat va siyosat;
♦ Uy va oila;
♦ fan va ta'lim;
♦ O'yin-kulgi va dam olish;
♦ Kompyuterlar va aloqa;
♦ Madaniyat va san'at.

Har bir mavzu ko'plab kichik bo'limlarni o'z ichiga oladi va ular o'z navbatida rubrikalarni o'z ichiga oladi va hokazo.

Aytaylik, siz G'alaba kuni uchun tadbir tayyorlayapsiz va Internetda Bulat Okudjavaning mashhur harbiy qo'shig'i so'zlarini qidirmoqchisiz "Eshityapsizmi, etiklar shovqini." Qidiruv quyidagicha tashkil etilishi mumkin: Yandex katalogi Madaniyat va san'at Musiqa Muallif qo'shig'i.

Ushbu qidiruv usuli juda tez va samarali. Oxirida sizga faqat 5 ta havola taklif etiladi, ular orasida mashhur bardlarning qo'shiqlari bilan saytlarga havolalar mavjud. Saytda B. Okudjavaning so'zlari bilan arxivni topish va undagi kerakli matnni tanlashgina qoladi.

Yana bir misol. Aytaylik, siz mobil telefon sotib olmoqchisiz va turli kompaniyalar qurilmalarining xususiyatlarini solishtirmoqchisiz. Qidiruv quyidagi katalog sarlavhalari ostida o'tkazilishi mumkin: Yandex katalogi Kompyuterlar va aloqalar Mobil aloqalar Mobil telefonlar.

Cheklangan miqdordagi ma'lumotnomalarni olganingizdan so'ng, siz ularni tezda ko'rishingiz va firmalarning xususiyatlarini va qurilmalarning modifikatsiyalarini o'rganib, telefonni tanlashingiz mumkin.

Kalit so'zlarni qidirish

Ko'pgina qidiruv tizimlari kalit so'zlar bo'yicha qidirish imkoniyatiga ega. Bu eng keng tarqalgan qidiruv turlaridan biridir. Kalit so'zlar bo'yicha qidirish uchun maxsus oynada qidiriladigan so'z yoki bir nechta so'zlarni kiritishingiz va Qidiruv tugmasini bosishingiz kerak. Qidiruv tizimi o'z ma'lumotlar bazasidan topadi va ushbu so'zlarni o'z ichiga olgan hujjatlarni ko'rsatadi. Bunday hujjatlar ko'p bo'lishi mumkin, ammo bu holda ko'p narsa yaxshi degani emas.

Keling, har qanday qidiruv tizimlari bilan tajriba o'tkazaylik. Aytaylik, biz akvariumni ishga tushirishga qaror qildik va biz ushbu mavzu bo'yicha har qanday ma'lumotga qiziqamiz.

Bir qarashda, eng oddiy narsa "akvarium" so'zini qidirishdir. Buni, masalan, Yandex qidiruv tizimida tekshirib ko'raylik. Qidiruv natijasi 3500 ta saytdagi 460 000 dan ortiq sahifalar bo'ladi - juda ko'p havolalar. Bundan tashqari, agar siz diqqat bilan qarasangiz, ular orasida B. Grebenshchikovning "Aquarium" guruhi, savdo markazlari va shu nomdagi norasmiy uyushmalar va akvarium baliqlariga hech qanday aloqasi bo'lmagan yana ko'p narsalarni eslatib o'tadigan saytlar bo'ladi.

Bunday qidiruv hatto oddiy foydalanuvchini ham qoniqtira olmasligini taxmin qilish oson. Taklif etilayotgan barcha hujjatlar orasidan bizga kerak bo'lgan mavzuga tegishli bo'lgan hujjatlarni tanlash va ularning mazmuni bilan tanishish uchun juda ko'p vaqt sarflash kerak bo'ladi.

Darhol xulosa qilishimiz mumkinki, odatda bitta so'z bilan qidirish tavsiya etilmaydi, chunki hujjat, veb-sahifa yoki sayt mavzusini bir so'z bilan aniqlash juda qiyin. Istisno - mavzu doirasidan tashqarida deyarli ishlatilmaydigan noyob so'zlar va atamalar.

Keling, qidiruv shartlarini aniqlashtirishga harakat qilaylik va "akvarium baliqlari" iborasini kiritamiz. Qidiruv natijasi 20 000 sahifadan bir oz ko'proq va 650 ga yaqin sayt bo'ladi. Ko'rib turganingizdek, havolalar soni 20 barobardan ko'proq kamaydi. Bu natija bizga ko'proq mos keladi, lekin baribir, taklif qilingan havolalar orasida, masalan, baliq tasvirlari bilan gugurt yorliqlarining ruscha suvenir to'plamlarini, kompyuter ish stoli ekran saqlovchilari to'plamlarini, fotosuratlar bilan akvarium baliqlari kataloglarini va akvariumni uchratishingiz mumkin. aksessuarlar do'konlari.

Ko'rinib turibdiki, biz qidiruv shartlarini takomillashtirish yo'nalishida davom etishimiz kerak.

Qidiruvni yanada samarali qilish uchun barcha qidiruv tizimlarida o'z sintaksisi bilan maxsus so'rovlar tili mavjud. Bu tillar ko'p jihatdan o'xshash. Ularning barchasini o'rganish juda qiyin, ammo har qanday qidiruv tizimi sizga kerakli tilni o'zlashtirishga imkon beradigan yordam tizimiga ega.

Yandex qidiruv tizimida so'rovni yaratishning o'nta oddiy qoidalari.

1. So'rovdagi kalit so'zlar kichik (kichik) harflar bilan yozilishi kerak. Bu faqat bosh harf bilan boshlangan so'zlar emas, balki barcha kalit so'zlar qidirilishini ta'minlaydi.

2. Qidiruv so'rovdagi so'z shaklidan qat'i nazar, rus tili qoidalariga muvofiq so'zning barcha shakllarini hisobga oladi. Masalan, so'rovda "bilish" so'zi ko'rsatilgan bo'lsa, "bilish", "bilish" va hokazo so'zlar ham qidirish shartini qondiradi.

3. Barqaror iborani izlash uchun siz so'zlarni tirnoq belgilariga qo'shishingiz kerak, masalan, "chinni idishlar".

4. Aniq so'z shakli bo'yicha qidirish uchun siz so'z oldiga undov belgisini qo'yishingiz kerak. Masalan, “sentyabr” so‘zini genitativ holatda qidirish uchun “!Sentyabr” deb yozasiz.

5. Bitta jumla ichida qidirish uchun so'rovdagi so'zlar bo'sh joy yoki & belgisi bilan ajratiladi: "sarguzasht romani" yoki "sarguzasht va roman". So'rovda bo'sh joylar bilan ajratilgan bir nechta so'zlar, ularning barchasi qidirilayotgan hujjatning bitta jumlasiga kiritilishi kerakligini anglatadi.

6. Agar siz faqat so'rovda ko'rsatilgan har bir so'z bo'lgan hujjatlarni tanlamoqchi bo'lsangiz, ularning har biriga "+" belgisini qo'ying. Agar siz, aksincha, qidiruv natijalaridan biron bir so'zni chiqarib tashlamoqchi bo'lsangiz, ushbu so'z oldiga minus "-" belgisini qo'ying. "+" va "-" belgilari oldingisidan bo'sh joy bilan yozilishi va keyingi so'z bilan birlashtirilishi kerak. Misol uchun, "Volga-car" so'rovida "avtomobil" so'zini emas, balki "Volga" so'zini o'z ichiga olgan hujjatlar topiladi.

7. Sinonimlarni yoki ma'nosi yaqin so'zlarni qidirishda so'zlar orasiga vertikal chiziq qo'yishingiz mumkin "|". Masalan, so'rov uchun "bola | bola | chaqaloq" ushbu so'zlarning istalgani bo'lgan hujjatlarni topadi.

8. So'rovda bitta so'z o'rniga butun ifodani almashtirishingiz mumkin. Buning uchun qavs ichida olinishi kerak, masalan, "(bola | chaqaloq | bolalar | chaqaloq) + (parvarish | tarbiya)".

9. *~" (tilde) belgisi birinchi so'zni o'z ichiga olgan, lekin ikkinchisini o'z ichiga olmagan jumlali hujjatlarni topishga imkon beradi. Masalan, "kitoblar ~ do'kon" qidiruvi yonida "do'kon" so'zi bo'lmagan "kitoblar" so'zini o'z ichiga olgan barcha hujjatlarni topadi (jumla ichida).

10. Agar operator bir marta takrorlansa (masalan, & yoki ~), qidiruv gap ichida amalga oshiriladi. Qo'sh operator (&&, -) hujjat ichida qidiradi. Masalan, "saraton - astrologiya" so'rovida munajjimlikka aloqasi bo'lmagan "saraton" so'zi bo'lgan hujjatlar topiladi.

Istalgan sohada eng keng tarqalgan atamalarning ma'lum bir to'plamiga ega bo'lgan holda, siz kengaytirilgan qidiruvdan foydalanishingiz mumkin. Shaklda. 3.3 Yandex qidiruv tizimida kengaytirilgan qidiruv oynasini ko'rsatadi. Bu rejimda so'rovlar tilining imkoniyatlari forma sifatida amalga oshiriladi. Shunga o'xshash xizmat, jumladan lug'at filtrlari deyarli barcha qidiruv tizimlari tomonidan taklif etiladi.

Guruch. 3.3. Yandex tizimida kengaytirilgan qidiruvga misol

Kerakli va talab qilinadigan so'zlarni to'g'ri tanlash va nomaqbul atamalarni chiqarib tashlashni hisobga olsak, bunday qidiruv yaxshi natijalar berishi mumkin.

Keling, akvarium baliqlari misoliga qaytaylik. Qidiruv tizimi tomonidan taklif qilingan bir nechta hujjatlarni o'qib chiqqandan so'ng, Internetda ma'lumot qidirishni akvarium baliqlarini tanlash bilan boshlamaslik kerakligi aniq bo'ladi. Akvarium murakkab biologik tizim bo'lib, uni yaratish va saqlash maxsus bilim, vaqt va jiddiy investitsiyalarni talab qiladi.

Olingan ma'lumotlarga asoslanib, Internetda qidiruvni amalga oshirayotgan shaxs o'rganilayotgan masala bo'yicha maxsus adabiyotlarni o'rganishga qaror qilib, keyingi qidiruv strategiyasini tubdan o'zgartirishi mumkin.

Adabiyot yoki to'liq matnli hujjatlarni qidirish uchun quyidagi so'rovlar mumkin:

"+ (akvarium | akvarist | akvarist) + yangi boshlanuvchilar uchun + (maslahat | adabiyot) + (maqola | tezis | to'liq matn) - (narx | do'kon | yetkazib berish | katalog)".

Qidiruv tizimi tomonidan so'rovni ko'rib chiqqandan so'ng, quyidagi natijaga erishildi: sahifalar - 195, saytlar - kamida 43.

Qidiruv statistikasidan ko'rinib turibdiki, natija juda muvaffaqiyatli bo'ldi. Birinchi havolalar allaqachon kerakli hujjatlarga olib keladi:

Akvariumni sozlash > Yangi boshlanuvchi akvariumchi uchun maslahatlar >
Maqolalar > Aq uascope. uz
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) - qat'iy rioya qilish.
BOSHLANGAN AKVARIUMISTLARGA MASLAHAT. Akvariumni qanday tanlash va o'rnatish, qanday ...
http://www.aquariums.ru/sovna.htm (2KB) 23/07/2002 - qat'iy bo'lmagan yozishmalar.

Endi siz qidiruv natijalarini umumlashtirishingiz, muayyan xulosalar chiqarishingiz va mumkin bo'lgan harakatlar haqida qaror qabul qilishingiz mumkin:

♦ Keyingi qidiruvni to'xtating, chunki turli sabablarga ko'ra akvariumni saqlash sizning kuchingizdan tashqarida.
♦ Tavsiya etilgan maqolalarni o'qing va akvariumni o'rnatishni boshlang.
♦ Hamsterlar yoki to'tiqushlar haqida materiallarni qidiring.

Professional qidiruv

Tadqiqotchilar va mutaxassislar qidiruvni tashkil etishga yanada puxtaroq yondashishlari kerak bo‘ladi. Internetda ma'lumotni professional tarzda qidirishda quyidagi talablarga rioya qilish kerak:

♦ yuqori qidiruv tezligi;
♦ olingan ma'lumotlarning ishonchliligi;
♦ qidiruv jarayonida resurslarni qamrab olishning to'liqligi.

Tezlik. Qidiruv tezligi asosan ikkita omilga bog'liq: qidiruvni malakali rejalashtirish (qidiruv xizmatlari va vositalarini tanlash) va allaqachon tanlangan resurs bilan ishlash ko'nikmalari (uning tuzilishi va navigatsiya usullarini tezda tushunish qobiliyati). Qidiruv indekslari qidiruv tezligini ta'minlash uchun etarli emas. Ularga qo'shimcha ravishda, Internetda bir qator qidiruv resurslari mavjud bo'lib, ulardan foydalanish professional qidiruvni amalga oshirishni ta'minlaydi.

Ishonchlilik. Internetdan olingan ma'lumotlarning ishonchliligi masalasi juda dolzarbdir, chunki har kim u erda har qanday ma'lumotni uning haqiqatga muvofiqligini nazorat qilmasdan joylashtirishi mumkin. Bu esa, o‘z navbatida, internetda to‘lib ketgan tezis va kurs ishlari kabi ko‘plab ishonchsiz manbalarga olib keladi.

Internetda ma'lumot manbasining ishonchliligini baholash imkonini beruvchi maxsus qidiruv xizmatlari mavjud.

To'liqlik. Muvaffaqiyatli to'liq miqyosda ma'lumot to'plashning zaruriy sharti bugungi kunda mavjud bo'lgan asosiy manba turlarini bilish va turli xil qidiruv xizmatlaridan foydalanishdir. Hech bir qidiruv tizimi Internetning barcha resurslarini qamrab ololmaydi.

Qoida tariqasida, ijobiy natijaga erishish uchun foydalanuvchi bir nechta qidiruv tizimlarining xizmatlariga murojaat qilishi kerak. Siz buni tizimdan tizimga o'tishingiz mumkin yoki bu ishni meta-qidiruv mexanizmlaridan biriga topshirishingiz mumkin (meta - boshqa tizimlarni tavsiflash va tadqiq qilish tizimlarini bildiruvchi qo'shma so'zlarning birinchi komponenti).

Guruch. 3.4. Meta-qidiruv oynalari

Meta-qidiruv mexanizmlari o'zlarining qidiruv ma'lumotlar bazalariga ega emaslar va qidirishda ko'plab boshqa qidiruv tizimlarining resurslaridan foydalanadilar. Shu sababli, kerakli ma'lumotlarni topish ehtimoli juda yuqori. Meta-qidiruv tizimlarida ishlash qidiruv tizimlarida ishlash bilan bir xil qoidalarga muvofiq amalga oshiriladi. Buning sababi, meta-qidiruv mexanizmlari qidiruv tizimlariga o'ziga xos qo'shimchalar bo'lib, o'z ishida ularning indeks ma'lumotlar bazasidan foydalanadi. Meta qidiruv tizimlarining ko'rinishi taniqli qidiruv tizimlarining ko'rinishiga o'xshaydi. Shaklda. 3.4 myweb.ru va metabot.ru meta-qidiruv tizimlarining oynalarini ko'rsatadi.

Tajriba shuni ko'rsatadiki, aksariyat hollarda bitta meta-qidiruv mexanizmidan foydalanishdan ko'ra bir nechta mustaqil qidiruv indekslarini qo'llash orqali yaxshi natijaga erishiladi.

Nazorat savollari va topshiriqlari

1. Brauzer dasturining maqsadi nima?

2. Qanday brauzer dasturlarini bilasiz?

3. Internetda qidiruvni rejalashtirayotgan foydalanuvchi URL manzillarini qayerdan topishi mumkin?

4. Qidiruv tizimining rubrikatorini qidirish texnologiyasi qanday?

5. Kalit so‘zlarni qidirish texnologiyasi nima?

6. Internetda ma'lumotni professional qidirishda qanday talablarga rioya qilish kerak?

7. Qidiruv mezonlarida "+" yoki "-" belgilarini qachon ko'rsatish kerak?

8. Yandex-da qanday qidiruv mezonlari quyidagi ibora bilan belgilanadi:

(enaga | o'qituvchi | gubernator) ++ (g'amxo'rlik | tarbiya | nazorat).

9. Murakkab so‘rovni shakllantirishda belgini ikki barobar oshirish (∼∼ yoki ++) nimani anglatadi?

10. Qidiruvning dolzarbligi nima?

11. Meta-qidiruv mexanizmlarining maqsadi nima?

Ma’ruza 4. Axborot izlash vositalari

Axborot majmuasining doimiy yangilanishi ma'lumotlar hajmining oshishi bilan birgalikda mavjud hujjatlarni hisobga olishni va shunga mos ravishda shartli ravishda quyidagilarga bo'linadigan qidiruvni juda qiyinlashtiradi:

  • faktik qidiruv:entsiklopediyalarda, ma'lumotnomalarda, lug'atlarda,
  • bibliografik qidiruv:kutubxonalar, kataloglar, dasturlar.
  • Hujjatlarni qidirish:elektron hujjatlar, elektron kutubxonalar, elektron jurnallar.

Axborotni qidirish muammosining ahamiyati butun bir sanoatning shakllanishiga olib keldi, uning vazifasi foydalanuvchiga kibermakonda navigatsiya qilishda yordam berishdir. Ushbu sohani alohida qilingqidiruv xizmatlari yoki xizmatlar. Ular an'anaviy ravishda quyidagilarga bo'linadi:

  • kataloglar yoki kataloglar
  • qidiruv tizimlari

Bu navlar vizual jihatdan juda o'xshash, chunki"har bir katalog o'z qidiruv tizimiga ega va har bir qidiruv tizimi o'z katalogiga ega". Biroq, ularning ish tamoyillari butunlay boshqa yondashuvlar va texnologiyalarga asoslangan. Bundan tashqari, har bir turdagi qidiruv xizmatlari muayyan turdagi muammolarni hal qilishda qo'llaniladi. Axborotni qidirish muayyan strategiyalar, usullar, mexanizmlar va vositalardan foydalanishni o'z ichiga oladi. Qidiruv jarayonini boshqaradigan foydalanuvchining xatti-harakati nafaqat axborotga bo'lgan ehtiyoj, balki tizimning instrumental xilma-xilligi - tizim tomonidan taqdim etilgan texnologiyalar va vositalar bilan ham belgilanadi. Asbobni tanlash ko'p jihatdan aniqlaydiqidiruv strategiyasi va qidiruv texnologiyalari.

Qidiruv texnologiyalari- foydalanuvchining tizim bilan o'zaro aloqasi jarayonida individual qidiruv vositalaridan samarali foydalanish uchun birlashtirilgan (ma'lum bir ma'lumot qidirish tizimi doirasida optimallashtirilgan) ketma-ketliklar.

Qo'llaniladigan qidiruv texnologiyalariAxborot tizimlarini 3 toifaga bo'lish mumkin:

  • tematik kataloglar va ixtisoslashtirilgan kataloglar (onlayn kataloglar);
  • qidiruv tizimlari (to'liq matnli qidiruv);
  • meta qidiruv vositalari.

Tematik kataloglarhujjatlarni qayta ishlashni va ularni ro'yxati oldindan belgilangan bir nechta toifalardan biriga berishni ta'minlash. Darhaqiqat, bu barcha kutubxonachilarga tanish.tasnifga asoslangan indekslash. Ixtisoslashgan kataloglar yoki yo'riqnomalar alohida tarmoqlar va mavzular bo‘yicha yaratilgan.qidiruv tizimlari(Internetdagi eng ilg'or qidiruv ob'ekti) to'liq matnli qidiruv texnologiyasini amalga oshiradi. So'ralgan serverlarda joylashgan matnlar indekslanadi.Pul mablag'laridan foydalanganda meta-qidiruv So'rov bir vaqtning o'zida bir nechta qidiruv tizimlari tomonidan amalga oshiriladi. Qidiruv natijasi umumiy, ahamiyatlilik, ro'yxat bo'yicha tartiblangan.

Qidiruv vositalari - qayta ishlash ob'ektlarining (hujjatlar, lug'atlar, qidiruv natijalari to'plamlari) tarkibiy va semantik o'zgarishlarini ta'minlaydigan ma'lumotlarni qidirish tillari va ma'lumotlarni aniqlash / boshqarish tillarining o'zaro bog'liq to'plami.

1. Ma'lumotnomalar

Birinchi guruhning qidiruv vositalari aniq ierarxik tizimli yoki mantiqiy-tematik tuzilishga ega bo'lgan elektron ma'lumotnomalar,tizimli kutubxona katalogining tuzilishiga o'xshaydi. Kataloglar bilan ishlash sizga alohida bilim sohalari bo'yicha Internet resurslarida harakat qilish, umumiydan xususiyga o'tish, ierarxik tarmoqlarni o'zgartirish, bir necha qadam orqaga qaytish va h.k. imkonini beradi.

Ushbu sohadagi Rossiya ishlanmalari orasida:

  • Aport (manzil: www.aport.ru),
  • List.ru (manzil: list.mail.ru ),
  • Veb-ro'yxat (manzil: www.weblist.ru),
  • Ivan Susanin (manzil: www.susanin.net
  • Salyangoz (manzil: www.ulitka.ru).

Ma'lumotnomalarning asosiy farqlovchi xususiyati ular qo'lda tayyorlanganligidir. Ma'lumotnomalarning har birining tahririyatlario'z ishining tabiatiga ko'ra ular yirik kutubxonalarning kataloglashtirish va tizimlashtirish bo'limlariga o'xshaydi., yangi paydo bo'lgan serverlar tarkibini muntazam ravishda ko'rib chiqing va mavjudlaridagi o'zgarishlarni kuzatib boring. Aniqlangan ma'lumotlar tahlil qilinadi va qabul qilingan tasnifga muvofiq ma'lumotnomaning bo'limlariga kiritiladi. Serverning butun tavsifi (yoki bo'lim, agar u butunlay mustaqil blok bo'lib ko'rinsa) mavjud ma'lumotlarning tabiati haqida umumiy ma'lumotni o'z ichiga olgan qisqacha izoh bilan ta'minlanadi. Ba'zi hollarda hujjatlarning tili, resursning ishtiroki, uning jismoniy joylashuvi va boshqalar haqida qo'shimcha ma'lumotlar kiritiladi.

Kataloglarning afzalliklarini tavsiflovchi asosiy parametrlar:

  • hajmi;
  • yangi yoki o'zgartirilgan resurslarni aks ettirish samaradorligi;
  • ierarxik tasnif sxemasining izchilligi va izchilligi;
  • strukturaning krossoveri.

Katalogning hajmi uning ishonchlilik darajasini belgilaydi yoki "axborot kuchi". Ba'zi tizimlarda sayt mavjudligini vaqti-vaqti bilan tekshiradigan va Internetda uzoq vaqt "yo'qligi" bo'lsa, uni ro'yxatdan chiqarib tashlaydigan maxsus mexanizm mavjud. Qo'llaniladigan tasniflash sxemasining mantig'i (ilmiy) foydalanuvchilarning kerakli ma'lumotni topish qulaylik darajasini belgilaydi. Tizimoʻzaro havolalarturli yondashuvlar (masalan, hududiy yoki tarmoq) yordamida axborotni aniqlash imkonini beradi. Bunday holda, qaysi qidiruv yo'li tanlangan bo'lishidan qat'i nazar, tasniflash sxemasi foydalanuvchini avtomatik ravishda kerakli ob'ektga olib borishi kerak.

Ushbu turdagi qidiruv vositalari uchun so'rovni tuzish imkoniyati alohida rol o'ynamaydi. So'rovni batafsil bayon qilishni talab qiladigan murakkab qidiruvlar kataloglar yordamida amalga oshirilmaydi.

Kataloglar hal qilish uchun mo'ljallanganuch turdagi vazifalar:

  • noma'lum bilim sohasiga yo'naltirish;
  • yirik ob'ektlarni qidirish, masalan, tashkilotlar serverlari yoki muhim loyihalar;
  • loyqa qidiruv tasviriga ega bo'lgan resurslarning tayyor ro'yxatini olish (ma'lum turdagi kutubxonalar, transport jadvallari yoki siyosiy partiyalarning veb-saytlari va boshqalar).

Yana bir misol, resurs qo‘llanmasini kutubxonaning tizimli katalogi bilan solishtirish, bunda kitob (bu holda butun veb-sayt) faqat tavsif va izoh bilan qoldirilgan.

2. Qidiruv mexanizmlari

Qidiruv mexanizmlarining (qidiruv tizimlari) ishi butunlay boshqa texnologik tamoyillarga asoslanadi. Qidiruv mexanizmlarining vazifasi faqat buxgalteriya hisobi orqali erishish mumkin bo'lgan ma'lumotni batafsil qidirishni ta'minlashdir ( indekslash ) iloji boricha ko'proq veb-sahifalar tarkibi. Kataloglardan farqli o'laroq, qidiruv tizimlari avtomatlashtirilgan rejimda ishlaydi va bir xil ishlash printsipiga ega.

Qidiruv tizimlari ikkita asosiy komponentdan iborat. Birinchi komponent - bu robot dasturi , uning vazifasi serverdan serverga o'tish va u erda yangi (yoki o'zgartirilgan) hujjatlarni topish, ularni tizimning asosiy kompyuteriga yuklab olishdir. Robot hujjat mazmunini ko‘zdan kechiradi, serverdagi boshqa hujjatlarga ham, tashqi saytlarga ham yangi havolalarni topadi. Keyin dastur mustaqil ravishda belgilangan havolalarga o'tadi, yangi hujjatlarni topadi, shundan so'ng jarayon yana takrorlanadi,bibliografiyadagi mashhur "qor to'pi usuli" ni esga olib. Aniqlangan hujjatlar qidiruv tizimining ikkinchi komponenti tomonidan qayta ishlanadi (indekslanadi). Bunday holda, qoida tariqasida, sahifaning barcha mazmuni, jumladan matn, rasmlar, audio va video fayllar hisobga olinadi. Hujjatdagi barcha so'zlar indekslanadi, bu esa eng tor mavzular bo'yicha batafsil qidiruvlar uchun qidiruv tizimlaridan foydalanish imkonini beradi. Shakllangan indeks fayllari , qaysi kalit so'z, necha marta, qaysi hujjatda va qaysi serverda qo'llanilganligi haqidagi ma'lumotlarni saqlash, so'rovlar qatoriga kalit so'z birikmalarini kiritishda kutubxonachi foydalanadigan ma'lumotlar bazasini tashkil qiladi.

Natijalarning chiqishi ishlab chiqaradigan maxsus modul yordamida amalga oshiriladinatijalarning aqlli reytingi . Bu hisobga oladi:

  • atamaning hujjatdagi joylashuvi (nom, sarlavha, asosiy matn), uni takrorlash chastotasi,
  • qidiruv so'zining sahifa matniga foiz nisbati,
  • boshqa saytlardan ushbu sahifaga tashqi havolalar soni va vakolati.

Kimga qidiruv tizimlarining asosiy parametrlari bog'lash:

  • indekslangan serverlar va alohida hujjatlar soni (indeks fayllari hajmi);
  • yangi materiallar to'g'risidagi ma'lumotlarni kiritish va eskirganlarini o'chirish orqali ma'lumotlar bazasini yangilash samaradorligi darajasi;
  • so'rov qilish imkoniyatlari;
  • qidiruv natijalarini reyting tizimining razvedkasi;
  • foydalanuvchi ishini osonlashtiradigan qo'shimcha xizmat funktsiyalarining mavjudligi.

Qidiruv tizimining so'rovni iloji boricha aniq ifodalash qobiliyati, asosan, olingan natijalarning sifatini aniqlaydi. Har bir mashinaning o'ziga xos lug'ati bor, bu sizga har xil usullarda batafsil ma'lumot berishga imkon beradiretseptni qidirish.

Barcha qidiruv tizimlari mavjudqidiruv natijalarini tartiblash moduli. Bu barcha tizimlarning ikkinchi asosiy komponentidir. Hujjatning havolalar ro'yxatidagi o'rnini aniqlashda hisobga olinadigan omillar ro'yxati juda keng: sahifadagi so'zning joylashuvidan tortib topilgan hujjatga havolalari bo'lgan sahifalar reytingi (avtoriteti)gacha.

  • Google (manzil: www.google.com ),
  • AlltheWeb (manzil: www.alltheweb.com ),
  • Alta Vista (manzil: www.altavista.com).

Shunga o'xshash qidiruv vositalari Rossiyada mavjud. Ularning barchasi rus tilidagi hujjatlar bilan ishlash uchun mo'ljallangan va kuchli http://www.metabot.ru).

Ma'ruza bloki mavzusi bo'yicha xulosalar

Qidiruv tizimi so'rovga muvofiq ma'lumotlar bazasidan sahifalarni tanlaydi, so'ngra sahifalar pasayish darajasi bo'yicha tartiblanadi (A.A.ga eslatma).

Bunda kutubxonaning tarqatilgan jamlama kataloglarining ishlash tamoyillari bilan bevosita oʻxshashlik mavjud. Asosiy imkoniyat meta qidiruv Bu foydalanuvchi so'rovlarini bir vaqtning o'zida turli xil qidiruv tizimlariga yuborish qobiliyatidir - natijalarni keyinchalik yig'ish bilan. (A.A.ning eslatmasi)

Kataloglarga murojaat qilgan holda, kutubxonachi faqat mavzu bo'yicha juda umumiy ma'lumot olishni kutishi mumkin, va hech qachon - batafsil ma'lumot: minglab sahifalarni o'z ichiga olgan yirik korporatsiya serveridan katalog faqat nom va bir necha qator izohlarni taqdim etadi.

  • Sergey Savenkov

    qandaydir "oz" ko'rib chiqish ... go'yo qayergadir shoshayotgandek