Другие поисковые. Какие есть поисковые системы в интернете кроме Яндекс и Google: познавательная рубрика

всего

Вступление

Мало кто сейчас может представить Интернет без поиска, поисковой выдачи и организующих всё это информационных поисковых систем (ИПС). А ведь еще недавно, вся информация Интернет умещалась в несколько каталогов, название которые еще на слуху (DMOZ, Yahoo).

Сегодня, объем информации в сети Интернет настолько огромный, что уместить её ни в какие каталоги не возможно. Для обработки, хранения информации, организации поиска созданы и продолжают создаваться, мощные программные продукты которые мы называем поисковые системы (ПС). У каждой поисковой системы (поисковика) свои базы данных, свои алгоритмы обработки, поиска, ранжирования и выдачи информации.

Поисковые системы Интернет это

Можно дать следующее академическое определение поисковым системам. Поисковая система это набор программ и технических средств для организации в сети Интернет пользовательского поиска, при котором на текстовой запрос, пользователь получает список релевантных (соответствующих запросу) результатов.

Выдача производится в виде списка ссылок на источник информации с кратким описанием (превью) иногда с фото.

Для первого примера, вспомним мирового лидера поиска «Google» и лидера Рунета поисковик «Яндекс». Кроме этих поисковиков можно назвать еще десяток существующих поисковых систем, о коих поговорим чуть ниже.

Мнение: Поисковые системы Google, Яндекс и другие, не являются генераторами (производителями) контента, а являются агрегаторами (аккумуляторами) контента и в основной массе, чужого контента. Стоит вспомнить, что использование чужого контента для создания собственного трафика и его монетизации, можно характеризовать, как «пиратство», что на деле, конечно же, не происходит.

Рейтинг

  • и Google делят первые два места лидеров: около 49% и 45%.
  • Третье место: Поиск Mail.ru около 3%;
  • Остальные поисковики плавают ниже 1%.

Смотрю статистику по Google Analytics:

  • yandex / organic 40,26 %
  • google / organic 38,93 %
  • mail.ru / organic 0,60 %
  • rambler / organic 0,52 %
  • bing / organic 0,12 %

Статистика неумолима: к поискам Яндекс и обращаются больше всего, и если посчитать, что 3% это хороший результат по сравнению с 45%, то третьим по популярности можно назвать поиск Mail.ru.

В этой связи рассуждения о популярности поисковиков кроме Яндекс и Google, можно отнести к суемудрию, а специальное продвижение сайтов в других поисковиках (не Яндекс и Google), не заслуживающих внимание.

Как работают поисковики

Вопрос, как работают поисковики, такой же общий, как вопрос «какого цвета небо». Если небо синее, то поисковики собирают информацию в интернет, обрабатывают её, ранжируют и отдают по поисковому запросу пользователю.

Теория поиска Интернет гораздо объемнее и в статье её не изложить. Однако основные моменты нам пригодятся:

Поисковые системы Интернет не осуществляют хранение документов, то есть не производят скачивание и выгрузку документов полностью в свои хранилища;

ИПС используют Интернет в качестве децентрализованного хранилища документов. Поисковики периодически обходят Интернет, выбираю нужную, по их алгоритмам, информацию и частично помещая её (информацию) в свою базу данных (Database). Отсюда несколько проблем:

  • ИПС используют для выдаче не всю информацию Интернет, а только часть;
  • Информация интернет часто меняется. Добавляется около 1500 тыс. страниц в день, отсюда возможная «пустая выдача»;
  • Имеется большое количество дублей (дубли контента). К сожалению, у меня нет точных данных по дублям, а встречающаяся цифра в 25% дублей, кажется завышенной;
  • Много рекламы, которую тоже обходят поисковики;
  • «Блуждание» поисковых роботов в сети многократно увеличивает нагрузку не ресурсы (не относится к поисковикам);
  • Большинства сайтов коммерческие (порядка 83%), и имеют малое информативное значение.

По этим и некоторым другим причинам, подавляющее большинство ИПС Интернет используют схему поиска по ключевым словам (search engines), а не классическую схему поиска по классификации информации.

Особенности поиска по ключевым словам

Несмотря на меняющиеся алгоритмы поисковых систем, реклама которых пытается нас убедить, что машины становятся умнее и понятливее, в основу работы поисковых систем лежит поиск по ключевым словам.

Мне нравится такая схема поиска по ключевым словам.

Как видим, работа поисковые системы Интернет основана на поиске новых документов (поисковой робот Spider + Crawler), индексирование обнаруженных документов (Indexer) и выполнение пользовательского запроса (Search Engine Results Engine). В скобках перечислены названия используемых для этих целей поисковых роботов.

Как я сказал, большинство поисковых систем не копируют полные тексты документов в свою базу данных. Для поиска при индексировании документа создается его поисковый образ. Для организации поиска по , робот индексирования создает образ документа по, так называемому, выводящему методу (derived). То есть в образе документа указывается заголовок и набор ключевых слов.

Однако достаточно точно можно утверждать, что все ИПС обращают внимание на следующее:

  • Присутствие ключевого слова в документа;</li><li>Наличие ключа в URL или домене;</li><li>Присутствие ключа в подзаголовке;</li><li>Общее количество ключей на странице (плотность %);</li><li>Присутствие ключей в описании (description);</li><li>Какие ссылки web ведут на эту страницу;</li><li>Какие внутренние ссылки есть на этой странице.</li> </ul><h2><span>Ранжирование страниц </span></h2><p>В завершении теории стоит упомянуть о . Чаще ранжирование страниц выдаче упоминается в контексте релевантности. То есть, поисковики, должны, выстраивать поисковую выдачу по максимально точному соответствию поисковому запросу. Как пишет Яндекс, ничего не должно быть потеряно (полнота выдачи) и ни чего не должно быть найдено лишнего (точность выдачи). Как это получается на практике, вы видите каждый день.</p><h2>Вывод </h2><ul><li>Поисковые системы Интернет это сложные программные продукты, работу которых обеспечивают тысячи специалистов и огромные материальные ресурсы.</li><li>Алгоритмы поисковых систем держатся в секреты, хотя базовые акценты обновлений алгоритмов общедоступны и носят имена собственные.</li><li>Несмотря на разный подход в формировании выдачи, все поисковики базируются на общих принципах индексирования страниц, которые по сей день остаются базовыми для продвижения.</li> </ul><h2><span>Яндекс поисковик </span></h2><p>Популярный поисковик Рунета, который часто становится самым популярным. По статистике 2009 года, Яндекс постоянно обходит 15 миллионов страниц Рунета, перерабатывая 140 тыс. Гб текстовых данных, 1,6 миллиарда уникальных картинок из 2,1 миллиарда картинок всего.</p><p>Создан Яндекс поисковик в 1993 году. Слово Яндекс ничего не означает, хотя принято считать, что это преобразование слова «Index», или словосочетания «yet another indexer». На сегодня Яндекс.Поиск обрабатывает четверть миллиарда запросов в день и если бы был так навязчив, то был бы моим любимым поисковиком.</p><h2>Поиск Яндекс </h2><p>https://yandex.ru/ : Пользовательский поиск Яндекс организован по интернет с учётом региона пользователя. Возможность искать по картинкам, видео, картам, новостям, блогам, товарам и словарям.</p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-4.png' align="center" width="100%" loading=lazy></p><p>Для тонкого поиска существует свой язык поиска тут (https://yandex.ru/support/search/query-language/).</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-6.png' width="100%" loading=lazy></p><p>поисковые системы Интернет Яндекс</p><h2>Google поисковик </h2><p>В поисковике Google поиск организован без тематики (основной поиск) и поиск по разделам: картинки, новости, карты, видео, покупки, книги, авиабилеты, финансы.</p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-8.png' align="center" width="100%" loading=lazy></p><p>Есть настройки:</p><p><b>Безопасный поиск. </b> Позволяет блокировать неприемлемый контент и изображения сексуального характера в результатах поиска Google. Эта функция не гарантирует стопроцентную защиту, но скрывает большую часть подобного контента.</p><p><img src='https://i1.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-13.png' align="center" width="100%" loading=lazy></p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-9.png' align="center" width="100%" loading=lazy></p><p><b>Настройка количества результатов </b> на странице (по умолчанию 10).</p><p><b>Персональные результаты </b>. Находить в Google ссылки, картинки и видео, которыми с вами поделились ваши друзья в соцсетях.</p><p><b>Выбор региона </b>. По умолчанию текущий регион.</p><p><b>Языки. </b> Можно указать язык поиска.</p><p><b>Расширенный поиск. </b> Позволяет осуществить поиск по расширенным параметрам.</p><p><b>Инструменты. </b> Здесь можно выбрать язык поиска, указать время появления информации, и выбрать точное совпадение или всю выдачу.</p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-10.png' width="100%" loading=lazy></p><p>поисковые системы Интернет Google</p><h2>Mail поисковик </h2><p>https://go.mail.ru/. Здесь поиск организован по Интернет (общий поиск), по видео и картинкам. Есть отдельный поиск по приложениям для мобильных устройств.</p><p> (<span>https://www.bing.com/?scope=web&FORM=Z9LH </span>). Общий поиск, поиск по картинкам, видео, новостям, картам.</p><p><img src='https://i1.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-11.png' align="center" width="100%" loading=lazy></p><p><b>Yahoo поиск по-русски </b>. https://ru.search.yahoo.com/ . Чистый поиск без рекламы. Поиск в Интернет, по картинкам и новостям. Выбор время добавления информации.</p><h2>Другие поисковики</h2><ul><li>DuckDuckGo (https://duckduckgo.com/ ) Интеллектуальный поиск.</li><li>Pipl (https://pipl.com/ ) Поиск людей в США.</li><li>Findsounds (<span>http://www.findsounds.com/ 11 Инструментов для анализа релевантности страниц сайта поисковому запросу</span></li> </ul> <p>Основная задача поисковой системы — быстро сформировать страницу с правильными ответами на запрос пользователя. На первый взгляд, это несложная задача, но если учесть количество пользователей, несколько сотен способов ввода поисковых запросов и десятки миллионов сайтов — она уже не такая простая.</p> <p>Лидерами рынка в России безусловно являются Яндекс или Google , что заставляет SEO-специалистов уделять им основное время. Большинство пользователей не задумываются о том, как устроены поисковые системы и сколько пользы можно извлечь с помощью них. Сегодня я разберу полностью данный вопрос.</p> <p>Темы материала</p><i> </i> <h2><span>Как работают поисковые системы? </span></h2> <p>Поисковые системы могут работать полностью с помощью роботов или людей, а также представлять из себя гибридные системы. В архитектуру поисковой системы чаще всего входят:</p> <ul><li>робот — собирает информацию с различных документов (страниц сайтов),</li> <li>индексатор — отвечает за быстрый поиск информации,</li> <li>поисковик - формирует страницу с поисковой выдачей.</li> </ul> <p><img src='https://i1.wp.com/albakoff.ru/wp-content/uploads/2017/09/poiskovye-sistemy.png' width="100%" loading=lazy></p> <p>Основные характеристики качественного поиска:</p> <ul><li>Полнота. Чем больше проанализированных документов, тем полнее поиск.</li> <li>Точность. Пользователь не захочет искать иголку в стоге сена. Ответ должен быть релевантным .</li> <li>Актуальность. Особенно важно с новостными тематиками.</li> <li>Скорость поиска. Никто не будет ждать, пока система генерирует страницу с ответами.</li> <li>Наглядность. Удобное представление информации.</li> </ul><p>В интернете очень много документов, но всегда можно быть лучше и создавать более полезные для пользователя сайты. Полезность может проявляться в контенте и удобстве его восприятия. Большинство SEO-оптимизаторов делают поиск качественнее, позволяя найти нужные документы. Именно поэтому представители ПС развивают свои сервисы для нас: вебмастеров, владельцев проектов и сеошников.</p> <h2><span>Какую пользу несут поисковые системы для нас? </span></h2> <ul><li>Быстрый способ получить ответ на свой вопрос;</li> <li>Поисковые системы уже давно стали отличным источником получения новых клиентов;</li> <li>Благодаря спросу на трафик, появился рынок услуг: SEO-продвижение, контекстная реклама и т.д.</li> </ul><p>Сегодня не требуется добавлять свой сайт в современные поисковые системы. Рано или поздно роботы обойдут Ваш сайт и включат его в индекс, если с ним нет проблем. Но для получения эффективных результатов, обязательно необходимо прорабатывать ресурс — начиная с семантического ядра и структуры сайта и заканчивая аудитом на наличие технических ошибок .</p> <p>Кстати, ранее я уже затрагивал тему поисковых систем:</p> <ul><li>Поисковые запросы : классификация, типы, виды</li> </ul><h2><span>Крупнейшие поисковые системы России </span></h2> <p>Мировым лидером является Google, но самой популярной поисковой системой в России остается Яндекс. Это заметно по источникам трафика на основе данных из Яндекс.Метрики.</p> <p><img src='https://i1.wp.com/albakoff.ru/wp-content/uploads/2017/09/yandex-radar.png' align="center" width="100%" loading=lazy></p> <ul><li>Подробнее про Yandex.ru</li> </ul><p>Поиск №1 в России по количеству переходов на сайты из поисковой выдачи. LiveInternet (июнь 2017). На долю Яндекса приходится около 50% поискового трафика, но Google постепенно догоняет отечественную поисковую систему. В последнее время Яндекс стал более активно проводить рекламные компании, возможно, это позволит замедлить рост доли Google на российском рынке. Один из основных источников трафика на российском рынке.</p> <p><span class="4gqPRdcRhc8"></span></p> <ul><li>Google.com</li> </ul><p>Занимают большую долю в мобильном поиске России. Также является одним из основных источников трафика для наших проектов. Благодаря росту посетителей с мобильных устройств, доля Google растет.</p> <p><img src='https://i0.wp.com/albakoff.ru/wp-content/uploads/2017/09/mobilnyy-poisk.png' align="center" width="100%" loading=lazy></p> <h2><span>Полезные и интересные поисковые системы </span></h2> <ul><li>wikipedia.org</li> </ul><p>Самая полная свободная интернет-энциклопедия, которая запущена в 2001 году. Контент создают пользователи Интернета.</p> <p><img src='https://i2.wp.com/albakoff.ru/wp-content/uploads/2017/09/wikipedia.png' align="center" width="100%" loading=lazy></p> <ul><li>DuckDuckGo.com</li> </ul><p>Приватный и конфиденциальный поисковик, серверы которого расположены в США. Имеет собственный робот, а также использует данные других сервисов (например, «Википедия», Wolfram|Alpha). В отличии от Яндекса и Google, данная поисковая система не пытается персонализировать результаты выдачи.</p> <p><img src='https://i0.wp.com/albakoff.ru/wp-content/uploads/2017/09/DuckDuckGo.com_.png' align="center" width="100%" loading=lazy></p> <ul><li>YouTube.com</li> </ul><p>Крупнейшая библиотека видеофайлов также обладает поиском, который используют большое количество людей. К сожалению, нет информации о количестве запросов, но если сложить аудиторию Google и YouTube — то доля Google получается очень ощутимой. Но у и Яндекса есть свои интересные проекты.</p> <ul><li>Nigma.ru</li> </ul><p>Поисковая система от выпускников МГУ использует индексы других систем. Больше не нужно искать один и тот же запрос в разных системах. Кроме этого, позволяет решать задачи по Математике и Химии.</p> <p><img src='https://i1.wp.com/albakoff.ru/wp-content/uploads/2017/09/nigma.png' align="center" width="100%" loading=lazy></p> <ul><li>Pipl.com</li> </ul><p>Поиск информации о конкретном человеке в США и Европе. Для российского рынка не очень.</p> <p><img src='https://i0.wp.com/albakoff.ru/wp-content/uploads/2017/09/pipl.png' align="center" width="100%" loading=lazy></p> <ul><li>kinopoisk.ru</li> </ul><p>Огромная база информации о фильмах. Проект принадлежит Яндексу, что делает его долю на рынке еще большей.</p> <p><img src='https://i0.wp.com/albakoff.ru/wp-content/uploads/2017/09/kinopoisk.png' align="center" height="632" width="573" loading=lazy></p> <ul><li>Bing.com — система от Microsoft, которая практически не используется в России.</li> <li>www.baidu.com — китайская поисковая система.</li> <li>mail.ru — крупный игрок на рынке, которому принадлежат социальные сети vk.com, ok.ru и множество других крупных проектов. Доля поиска, к сожалению, незначительна.</li> <li>rambler.ru — также развивает собственные проекты, например: lenta.ru, livejournal, афиша.</li> </ul><p><img src='https://i0.wp.com/albakoff.ru/wp-content/uploads/2017/09/rambler.png' align="center" width="100%" loading=lazy></p> <ul><li>www.multitran.ru — один из популярных инструментов среди переводчиков.</li> <li>avia.travel.ru — поиск авиабилетов.</li> <li>www.sputnik.ru — еще один относительно свежий проект от Ростелеком.</li> </ul><p><img src='https://i0.wp.com/albakoff.ru/wp-content/uploads/2017/09/sputnik.png' align="center" width="100%" loading=lazy></p> <p>Хороших поисковых систем много. Я привел лишь небольшую часть из них. Мне кажется, что для поиска, как и любого проекта, важна аудитория, которую нужно привлекать с помощью рекламных компаний и технологий.</p> <p>Если Вам известны интересные поисковые системы или фишки при работе с ними, делитесь в комментариях.</p> <p>С расцветом цензуры и слежения альтернативы Google и Яндекс интересуют пользователей все больше и больше. Мы расскажем вам о трех поисковых системах без запретов, которые не собирают о вас личную информацию, а, напротив, защищают вашу приватность. </p> <h2>Startpage: самая дискретная поисковая система в мире</h2> <p>Startpage.com называет себя «самой дискретной поисковой системой в мире». С 2016 года сервис был объединен с сайтом Ixquick. В качестве доказательства безопасности своего поиска Startpage.com позиционирует себя как единственная поисковая система, имеющая сертификат ЕС о конфиденциальности. </p> <p>Startpage.com обещает не сохранять IP-адреса пользователей и, по утверждению сервиса, </span><span>не использует файлы cookie для трекинга. Кроме того, Startpage.com доступен из сети Tor. </span><span>Серверы поисковой системы находятся в Нидерландах. </p> <p>У сайта есть удобная особенность: </span><span>результаты поиска можно просматривать при помощи опции «Прокси», которая шифрует соединение с соответствующей веб-страницей с помощью прокси-сервера. Таким образом, это настоящий поисковик без запретов: можно спокойно просматривать то, что блокирует ваш провайдер. </p><p>Поисковые прокси: Startpage спокойно обходит блокировку Яндекс.DNS </p><p>Поисковые прокси - главная фишка Startpage, которые делают его поисковиком без цензуры. Если вам необходимо искать без блокировок, этот сервис для вас.</p> <h2>DuckDuckGo: анонимная поисковая система из США</h2> <p>DuckDuckGo - наиболее широко используемая безопасная альтернатива Google с более чем десятью миллионами запросов в день. </span><span>Несмотря на то, что серверы поисковой системы находятся в США, DuckDuckGo.com, тем не менее, предлагает некоторые интересные функции. </p> <p>При поиске через DuckDuckGo.com ваш IP-адрес не будет сохранен. Система также н </span><span>е использует файлы cookie для отслеживания. </span><span>DuckDuckGo применяет шифрование с использованием HTTPS. В поисковую систему также можно ввести запрос через сеть Tor. Кроме того, можно использовать различные темы, чтобы настроить отображение поисковой страницы. </p> <p>Открывать сайты через прокси тут нельзя. Но с учетом того, что система находится вне юрисдикции РФ, на него не распространяется, к примеру, «право на забвение» в том смысле, в котором оно понимается у нас. </span><span>Результаты поиска могут быть не идеальными, но все же довольно полезными. </p> <br><img src='https://i0.wp.com/ichip.ru/blobimgs/uploads/2018/05/duckduckgo-e1526630040264.jpg' width="100%" loading=lazy> Право на забвение: DuckDuckGo находит сайты с компроматом, заблокированные в РФ. Google — только новости <p>Этот сервис больше подойдет тем, кому в первую очередь важна анонимность и поиск без слежения. Либо тем, кто хочет найти информацию, исключенную из результатов поисковой выдачи в РФ. Однако, следует предупредить: в России DuckDuckGo стал партнером Яндекса, так что можно ожидать всего.</p> <h2>notEvil: поиск по интернету, которого нет</h2> <p>Поисковик notEvil позволяет осуществлять поиск из интернета по анонимной сети Tor. Для этого не надо устанавливать никакого дополнительного программного обеспечения (хотя оно, понадобится для того, чтобы открывать результаты поиска).</p> <p>Эта поисковая система позволяет искать по так называемому даркнету - той части Интернета, которая обычно недоступна среднему пользователю. В связи с блокировками в нее постепенно переезжают полезные сервисы, например, для скачивания контента.</p> <p>Большинство веб-поисковиков по Tor бессовестно зарабатывают на рекламе: вы получаете результаты из Tor, и вдобавок - горсть рекламных объявлений и трекинг в подарок. notEvil принципиально этим не занимается. Понятное дело, что об отслеживании IP и использовании cookie речь тут вообще не идет.</p> <br><img src='https://i0.wp.com/ichip.ru/blobimgs/uploads/2018/05/notevil.jpg' width="100%" loading=lazy> notEvil: помогает найти в Tor то, чего в интернете может не быть <p>Сайт пригодится тем, кто хочет познакомиться с содержимым невидимого интернета; хардкорная анонимность гарантируется. Кстати, рекомендуем сразу сохранить себе ссылку в закладки - URL-адреса категории « Tor-to-web» очень недружелюбны в плане запоминания.</p> <h2>Анонимные поисковые системы как безопасная альтернатива Google</h2> <p>Все три поисковых системы не регистрируют ваш IP-адрес и не используют файлы cookie для слежки. Шифрование с использованием HTTPS предоставляется всеми названными поставщиками. </p> <p>Лучшие результаты поиска в тесте показал поисковик DuckDuckGo, а гарантированную безопасность при выборе альтернативного поисковика вы получите с системой Startpage.com. Сертификация защиты данных ЕС подтверждает, что поисковая система придерживается своих обещаний об анонимности поиска. </span>Для поиска по даркнету, в свою очередь, пригодится notEvil.</p> <p>В архитектуру поисковой системы обычно входят:</p> <i> </i><p><input class="toctogglecheckbox" id="toctogglecheckbox" role="button" style="display:none" type="checkbox"></p><h3><span>Энциклопедичный YouTube </span> </h3> <ul> <p>1 / 5</p><p>✪ Урок 3: Как работает поисковая система. Введение в SEO</p> <p>✪ Поисковая система изнутри</p> <p>✪ Shodan - черный Google</p> <p>✪ Поисковая система ЧЕБУРАШКА заменит Google и Яндекс в России</p> <p>✪ Урок 1 - Как устроена поисковая система</p> <h4>Субтитры</h4> <i> </i> </ul><h2>История </h2> <table class="bordered infobox" style="padding: 5px; font-size: 0.867em;"><tbody><tr><th class="first_header" colspan="«3»">Хронология </th> </tr><tr><th>Год </th> <th>Система </th> <th>Событие </th> </tr><tr><td rowspan="3">1993 </td> <td><span>W3Catalog ?! </span> </td> <td>Запуск </td> </tr><tr><td>Aliweb </td> <td>Запуск </td> </tr><tr><td><span>JumpStation </span> </td> <td>Запуск </td> </tr><tr><td rowspan="3">1994 </td> <td><span>WebCrawler </span> </td> <td>Запуск </td> </tr><tr><td><span>Infoseek </span> </td> <td>Запуск </td> </tr><tr><td>Lycos </td> <td>Запуск </td> </tr><tr><td rowspan="7">1995 </td> <td>AltaVista </td> <td>Запуск </td> </tr><tr><td>Daum </td> <td>Основание </td> </tr><tr><td><span>Open Text </span> Web Index </td> <td>Запуск </td> </tr><tr><td>Magellan </td> <td>Запуск </td> </tr><tr><td>Excite </td> <td>Запуск </td> </tr><tr><td>SAPO </td> <td>Запуск </td> </tr><tr><td>Yahoo! </td> <td>Запуск </td> </tr><tr><td rowspan="5">1996 </td> <td><span>Dogpile </span> </td> <td>Запуск </td> </tr><tr><td><span>Inktomi </span> </td> <td>Основание </td> </tr><tr><td>Рамблер </td> <td>Основание </td> </tr><tr><td><span>HotBot </span> </td> <td>Основание </td> </tr><tr><td>Ask Jeeves </td> <td>Основание </td> </tr><tr><td rowspan="2">1997 </td> <td><span>Northern Light </span> </td> <td>Запуск </td> </tr><tr><td>Яндекс </td> <td>Запуск </td> </tr><tr><td>1998 </td> <td>Google </td> <td>Запуск </td> </tr><tr><td rowspan="5">1999 </td> <td><span>AlltheWeb </span> </td> <td>Запуск </td> </tr><tr><td><span>GenieKnows </span> </td> <td>Основание </td> </tr><tr><td>Naver </td> <td>Запуск </td> </tr><tr><td>Teoma </td> <td>Основание </td> </tr><tr><td><span>Vivisimo </span> </td> <td>Основание </td> </tr><tr><td rowspan="2">2000 </td> <td>Baidu </td> <td>Основание </td> </tr><tr><td><span>Exalead </span> </td> <td>Основание </td> </tr><tr><td>2003 </td> <td><span>Info.com </span> </td> <td>Запуск </td> </tr><tr><td rowspan="3">2004 </td> <td>Yahoo! Search </td> <td>Окончательный запуск </td> </tr><tr><td><span>A9.com </span> </td> <td>Запуск </td> </tr><tr><td><span>Sogou </span> </td> <td>Запуск </td> </tr><tr><td rowspan="4">2005 </td> <td>MSN Search </td> <td>Окончательный запуск </td> </tr><tr><td>Ask.com </td> <td>Запуск </td> </tr><tr><td>Нигма </td> <td>Запуск </td> </tr><tr><td><span>GoodSearch </span> </td> <td>Запуск </td> </tr><tr><td><span>SearchMe </span> </td> <td>Основание </td> </tr><tr><td rowspan="5">2006 </td> <td><span>wikiseek </span> </td> <td>Основание </td> </tr><tr><td>Quaero </td> <td>Основание </td> </tr><tr><td>Live Search </td> <td>Запуск </td> </tr><tr><td><span>ChaCha </span> </td> <td>Запуск (бета) </td> </tr><tr><td><span>Guruji.com </span> </td> <td>Запуск (бета) </td> </tr><tr><td rowspan="4">2007 </td> <td>wikiseek </td> <td>Запуск </td> </tr><tr><td><span>Sproose </span> </td> <td>Запуск </td> </tr><tr><td>Wikia Search </td> <td>Запуск </td> </tr><tr><td><span>Blackle.com </span> </td> <td>Запуск </td> </tr><tr><td rowspan="10">2008 </td> <td>DuckDuckGo </td> <td>Запуск </td> </tr><tr><td>Tooby </td> <td>Запуск </td> </tr><tr><td><span>Picollator </span> </td> <td>Запуск </td> </tr><tr><td><span>Viewzi </span> </td> <td>Запуск </td> </tr><tr><td>Cuil </td> <td>Запуск </td> </tr><tr><td><span>Boogami </span> </td> <td>Запуск </td> </tr><tr><td><span>LeapFish </span> </td> <td>Запуск (бета) </td> </tr><tr><td><span>Forestle </span> </td> <td>Запуск </td> </tr><tr><td>VADLO </td> <td>Запуск </td> </tr><tr><td>Powerset </td> <td>Запуск </td> </tr><tr><td rowspan="5">2009 </td> <td>Bing </td> <td>Запуск </td> </tr><tr><td>KAZ.KZ </td> <td>Запуск </td> </tr><tr><td><span>Yebol </span> </td> <td>Запуск (бета) </td> </tr><tr><td><span>Mugurdy </span> </td> <td>Закрытие </td> </tr><tr><td><span>Scout </span> </td> <td>Запуск </td> </tr><tr><td rowspan="3">2010 </td> <td>Cuil </td> <td>Закрытие </td> </tr><tr><td>Blekko </td> <td>Запуск (бета) </td> </tr><tr><td>Viewzi </td> <td>Закрытие </td> </tr><tr><td rowspan="1">2012 </td> <td>WAZZUB </td> <td>Запуск </td> </tr><tr><td rowspan="1">2014 </td> <td>Спутник </td> <td>Запуск (бета) </td> </tr></tbody></table><p>На раннем этапе развития сети Интернет Тим Бернерс-Ли поддерживал список веб-серверов, размещённый на сайте ЦЕРН . Сайтов становилось всё больше, и поддерживать вручную такой список становилось всё сложнее. На сайте NCSA был специальный раздел «Что нового!» (англ. What"s New! ) , где публиковали ссылки на новые сайты.</p><p>Первой компьютерной программой для поиска в Интернете , была программа <span>Арчи </span> (англ. archie - архив без буквы «в»). Она была создана в 1990 году Аланом Эмтэджем (Alan Emtage), Биллом Хиланом (Bill Heelan) и Дж. Питером Дойчем (J. Peter Deutsch), студентами, изучающими информатику в университете Макгилла в Монреале . Программа скачивала списки всех файлов со всех доступных анонимных FTP -серверов и строила базу данных, в которой можно было выполнять поиск по именам файлов. Однако, программа Арчи не индексировала содержание этих файлов, так как объём данных был настолько мал, что всё можно было легко найти вручную.</p><p>Развитие и распространение сетевого протокола Gopher , придуманного в 1991 году Марком Маккэхилом (Mark McCahill) в университете Миннесоты , привело к созданию двух новых поисковых программ, <span>Veronica </span> и Jughead . Как и Арчи, они искали имена файлов и заголовки, сохранённые в индексных системах Gopher. Veronica (англ. <span>Very Easy Rodent-Oriented Net-wide Index to Computerized Archives </span>) позволяла выполнять поиск по ключевым словам большинства заголовков меню Gopher во всех списках Gopher. Программа Jughead (англ. <span>Jonzy"s Universal Gopher Hierarchy Excavation And Display </span>) извлекала информацию о меню от определённых Gopher-серверов. Хотя название поисковика Арчи не имело отношения к циклу комиксов <span>«Арчи» </span>, тем не менее Veronica и Jughead - персонажи этих комиксов.</p><p>К лету 1993 года ещё не было ни одной системы для поиска в вебе, хотя вручную поддерживались многочисленные специализированные каталоги. Оскар Нирштрасс (Oscar Nierstrasz) в Женевском университете написал ряд сценариев на Perl , которые периодически копировали эти страницы и переписывали их в стандартный формат. Это стало основой для <span>W3Catalog ?! </span>, первой примитивной поисковой системы сети, запущенной 2 сентября 1993 года .</p><p>Вероятно, первым поисковым роботом, написанным на языке Perl, был «World Wide Web Wanderer» - бот Мэтью Грэя (Matthew Gray) из в июне 1993 года. Этот робот создавал поисковый индекс «Wandex ». Цель робота Wanderer состояла в том, чтобы измерить размер всемирной паутины и найти все веб-страницы, содержащие слова из запроса. В 1993 году появилась и вторая поисковая система «Aliweb ». Aliweb не использовала поискового робота , но вместо этого ожидала уведомлений от администраторов веб-сайтов о наличии на их сайтах индексного файла в определённом формате.</p><p>JumpStation </span>, созданный в декабре 1993 года Джонатаном Флетчером, искал веб-страницы и строил их индексы с помощью поискового робота, и использовал веб-форму в качестве интерфейса для формулирования поисковых запросов. Это был первый инструмент поиска в Интернете, который сочетал три важнейших функции поисковой системы (проверка, индексация и собственно поиск). Из-за ограниченности ресурсов компьютеров того времени индексация и, следовательно, поиск были ограничены только названиями и заголовками веб-страниц, найденных поисковым роботом.</p><p>Поисковые системы участвовали в «Пузыре доткомов» конца 1990-х . Несколько компаний эффектно вышли на рынок, получив рекордную прибыль во время их первичного публичного предложения . Некоторые отказались от рынка общедоступных поисковых движков и стали работать только с корпоративным сектором, например, <span>Northern Light </span>.</p><p>Google взял на вооружение идею продажи ключевых слов в 1998 году, тогда это была маленькая компания, обеспечивающая работу поисковой системы по адресу goto.com . Этот шаг ознаменовал для поисковых систем переход от соревнований друг с другом к одному из самых выгодных коммерческих предприятий в Интернете . Поисковые системы стали продавать первые места в результатах поиска отдельным компаниям.</p><p>Поисковая система Google занимает видное положение с начала 2000-х . Компания добилась высокого положения благодаря хорошим результатам поиска с помощью алгоритма PageRank . Алгоритм был представлен общественности в статье «The Anatomy of Search Engine», написанной Сергеем Брином и Ларри Пейджем, основателями Google . Этот итеративный алгоритм ранжирует веб-страницы, основываясь на оценке количества гиперссылок на веб-страницу в предположении, что на «хорошие» и «важные» страницы ссылаются больше, чем на другие. Интерфейс Google выдержан в спартанском стиле, где нет ничего лишнего, в отличие от многих своих конкурентов, которые встраивали поисковую систему в веб-портал. Поисковая система Google стала настолько популярной, что появились подражающие ей системы, например, <span>Mystery Seeker </span>(тайный поисковик).</p> <h3><span>Поиск информации на русском языке </span></h3> <p>В 1996 году был реализован поиск с учётом русской морфологии на поисковой машине Altavista и запущены оригинальные российские поисковые машины Рамблер и Апорт . 23 сентября 1997 года была открыта поисковая машина Яндекс . 22 мая 2014 года компанией Ростелеком была открыта национальная поисковая машина Спутник , которая на момент 2015 года находится в стадии бета-тестировании. 22 апреля 2015 года был открыт новый сервис Спутник. Дети специально для детей с повышенной безопасностью.</p><p>Большую популярность получили методы кластерного анализа и поиска по метаданным . Из международных машин такого плана наибольшую известность получила <span>«Clusty» </span> компании <span>Vivisimo </span>. В 2005 году в России при поддержке МГУ запущен поисковик «Нигма », поддерживающий автоматическую кластеризацию . В 2006 году открылась российская метамашина Quintura , предлагающая визуальную кластеризацию в виде облака тегов . «Нигма» тоже экспериментировала с визуальной кластеризацией.</p> <h2><span>Как работает поисковая система </span></h2> <p>Основные составляющие поисковой системы: поисковый робот , индексатор , поисковик .</p><p>Как правило, системы работают поэтапно. Сначала поисковый робот получает контент, затем индексатор генерирует доступный для поиска индекс, и наконец, поисковик обеспечивает функциональность для поиска индексируемых данных. Чтобы обновить поисковую систему, этот цикл индексации выполняется повторно .</p><p>Поисковые системы работают, храня информацию о многих веб-страницах, которые они получают из HTML страниц. Поисковый робот или «краулер» (англ. Crawler ) - программа, которая автоматически проходит по всем ссылкам, найденным на странице, и выделяет их. Краулер, основываясь на ссылках или исходя из заранее заданного списка адресов, осуществляет поиск новых документов, ещё не известных поисковой системе. Владелец сайта может исключить определённые страницы при помощи robots.txt , используя который можно запретить индексацию файлов, страниц или каталогов сайта.</p><p>Поисковая система анализирует содержание каждой страницы для дальнейшего индексирования. Слова могут быть извлечены из заголовков, текста страницы или специальных полей - метатегов . Индексатор - это модуль, который анализирует страницу, предварительно разбив её на части, применяя собственные лексические и морфологические алгоритмы. Все элементы веб-страницы вычленяются и анализируются отдельно. Данные о веб-страницах хранятся в индексной базе данных для использования в последующих запросах. Индекс позволяет быстро находить информацию по запросу пользователя . Ряд поисковых систем, подобных Google, хранят исходную страницу целиком или её часть, так называемый кэш , а также различную информацию о веб-странице. Другие системы, подобные системе AltaVista, хранят каждое слово каждой найденной страницы. Использование кэша помогает ускорить извлечение информации с уже посещённых страниц . Кэшированные страницы всегда содержат тот текст, который пользователь задал в поисковом запросе. Это может быть полезно в том случае, когда веб-страница обновилась, то есть уже не содержит текст запроса пользователя, а страница в кэше ещё старая. Эта ситуация связана с потерей ссылок (англ. <span>linkrot </span>) и дружественным по отношению к пользователю (юзабилити) подходом Google. Это предполагает выдачу из кэша коротких фрагментов текста, содержащих текст запроса. Действует принцип наименьшего удивления , пользователь обычно ожидает увидеть искомые слова в текстах полученных страниц (<span>User expectations </span>). Кроме того, что использование кэшированных страниц ускоряет поиск, страницы в кэше могут содержать такую информацию, которая уже нигде более не доступна.</p><p>Поисковик работает с выходными файлами, полученными от индексатора. Поисковик принимает пользовательские запросы, обрабатывает их при помощи индекса и возвращает результаты поиска .</p><p>Когда пользователь вводит запрос в поисковую систему (обычно при помощи ключевых слов), система проверяет свой индекс и выдаёт список наиболее подходящих веб-страниц (отсортированный по какому-либо критерию), обычно с краткой аннотацией, содержащей заголовок документа и иногда части текста. Поисковый индекс строится по специальной методике на основе информации, извлечённой из веб-страниц . С 2007 года поисковик Google позволяет искать с учётом времени, создания искомых документов (вызов меню «Инструменты поиска» и указание временного диапазона). Большинство поисковых систем поддерживает использование в запросах булевых операторов И, ИЛИ, НЕ, что позволяет уточнить или расширить список искомых ключевых слов. При этом система будет искать слова или фразы точно так, как было введено. В некоторых поисковых системах есть возможность <span>приближённого поиска </span>, в этом случае пользователи расширяют область поиска, указывая расстояние до ключевых слов . Есть также <span>концептуальный поиск </span>, при котором используется статистический анализ употребления искомых слов и фраз в текстах веб-страниц. Эти системы позволяют составлять запросы на естественном языке. Примером такой поисковой системы является сайт ask com .</p><p>Полезность поисковой системы зависит от релевантности найденных ею страниц. Хоть миллионы веб-страниц и могут включать некое слово или фразу, но одни из них могут быть более релевантны, популярны или авторитетны, чем другие. Большинство поисковых систем использует методы ранжирования, чтобы вывести в начало списка «лучшие» результаты. Поисковые системы решают, какие страницы более релевантны, и в каком порядке должны быть показаны результаты, по-разному . Методы поиска, как и сам Интернет со временем меняются. Так появились два основных типа поисковых систем: системы предопределённых и иерархически упорядоченных ключевых слов и системы, в которых генерируется инвертированный индекс на основе анализа текста.</p><p>Большинство поисковых систем являются коммерческими предприятиями, которые получают прибыль за счёт рекламы , в некоторых поисковиках можно купить за отдельную плату первые места в выдаче для заданных ключевых слов. Те поисковые системы, которые не берут денег за порядок выдачи результатов, зарабатывают на контекстной рекламе, при этом рекламные сообщения соответствуют запросу пользователя. Такая реклама выводится на странице со списком результатов поиска, и поисковики зарабатывают при каждом клике пользователя на рекламные сообщения.</p> <h2><span>Типы поисковых систем </span></h2> <p>Существует четыре типа поисковых систем: с поисковыми роботами, управляемые человеком, гибридные и мета-системы .</p> <ul><li><i>системы, использующие поисковых роботов </i></li> </ul> Состоят из трёх частей: краулер («бот», «робот» или «паук»), индекс и программное обеспечение поисковой системы. Краулер нужен для обхода сети и создания списков веб-страниц. Индекс - большой архив копий веб-страниц. Цель программного обеспечения - оценивать результаты поиска. Благодаря тому, что поисковый робот в этом механизме постоянно исследует сеть, информация в большей степени актуальна. Большинство современных поисковых систем являются системами данного типа. <ul><li><i>системы, управляемые человеком (каталоги ресурсов) </i></li> </ul> Эти поисковые системы получают списки веб-страниц. Каталог содержит адрес, заголовок и краткое описание сайта. Каталог ресурсов ищет результаты только из описаний страницы, представленных ему веб-мастерами. Достоинство каталогов в том, что все ресурсы проверяются вручную, следовательно, и качество контента будет лучше по сравнению с результатами, полученными системой первого типа автоматически. Но есть и недостаток - обновление данных каталогов выполняется вручную и может существенно отставать от реального положения дел. Ранжирование страниц не может мгновенно меняться. В качестве примеров таких систем можно привести <span>каталог Yahoo </span>, dmoz и Galaxy. <ul><li><i>гибридные системы </i></li> </ul> Такие поисковые системы, как Yahoo , Google , MSN , сочетают в себе функции систем, использующие поисковых роботов, и систем, управляемых человеком. <ul><li><i>мета-системы </i></li> </ul> Метапоисковые системы объединяют и ранжируют результаты сразу нескольких поисковиков. Эти поисковые системы были полезны, когда у каждой поисковой системы был уникальный индекс, и поисковые системы были менее «умными». Поскольку сейчас поиск намного улучшился, потребность в них уменьшилась. Примеры: <span>MetaCrawler </span> и MSN Search. <h2><span>Рынок поисковых систем </span></h2> <p>Google - самая популярная поисковая система в мире с долей на рынке 68,69 %. Bing занимает вторую позицию, его доля 12,26 % .</p><p>Самые популярные поисковые системы в мире :</p> <table class="wikitable sortable"><tbody><tr class="odd"><th>Поисковая система </th> <th class="c">Доля рынка в июле 2014 </th> <th>Доля рынка в октябре 2014 </th> <th class="c">Доля рынка в сентябре 2015 </th> </tr><tr><td>Google </td> <td class="e" style="text-align:right;">68,69 % </td> <td style="text-align:right;">58.01 % </td> <td class="e" style="text-align:right;">69.24% </td> </tr><tr class="odd"><td>Baidu </td> <td class="c" style="text-align:right;">17,17 % </td> <td style="text-align:right;">29.06 % </td> <td class="c" style="text-align:right;">6,48% </td> </tr><tr><td>Bing </td> <td class="e" style="text-align:right;">6.22 % </td> <td style="text-align:right;">8.01 % </td> <td class="e" style="text-align:right;">12,26% </td> </tr><tr class="odd"><td>Yahoo! </td> <td class="c" style="text-align:right;">6.74 % </td> <td style="text-align:right;">4.01 % </td> <td class="c" style="text-align:right;">9,19% </td> </tr><tr><td>AOL </td> <td class="e" style="text-align:right;">0,13 % </td> <td style="text-align:right;">0.21 % </td> <td class="e" style="text-align:right;">1,11% </td> </tr><tr class="odd"><td>Excite </td> <td class="c" style="text-align:right;">0.22 % </td> <td style="text-align:right;">0,00 % </td> <td class="c" style="text-align:right;">0.00% </td> </tr><tr><td>Ask </td> <td class="e" style="text-align:right;">0,13 % </td> <td style="text-align:right;">0,10 % </td> <td class="e" style="text-align:right;">0,24% </td> </tr></tbody></table><h3>Азия </h3> <p>В восточноазиатских странах и в России Google - не самая популярная поисковая система. В Китае, например, более популярна <span>поисковая система Soso </span>.</p><p>В Южной Корее поисковым порталом собственной разработки Naver пользуется около 70 % жителей Yahoo! Japan и Yahoo! Taiwan - самые популярные системы для поиска в Японии и Тайване соответственно .</p> <h3><span>Россия и русскоязычные поисковые системы </span></h3> <p>Согласно данным LiveInternet в июне 2015 года об охвате русскоязычных поисковых запросов :</p> <ul><li>Всеязычные: <ul><li>Yahoo! (0,1 %) и принадлежащие этой компании поисковые машины: <span>Inktomi </span>, AltaVista , <span>Alltheweb </span></li> </ul></li> <li>Англоязычные и международные: <ul><li><span>AskJeeves </span> (механизм Teoma)</li> </ul></li> <li>Русскоязычные - большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках - украинском , белорусском , английском , татарском и других. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что, в основном, индексируют ресурсы, расположенные в доменных зонах , где доминирует русский язык, или другими способами ограничивают своих роботов русскоязычными сайтами. </li> </ul><p>Некоторые из поисковых систем используют внешние алгоритмы поиска.</p> <h3><span>Количественные данные поисковой системы Google </span></h3> <p>Число пользователей Интернета и поисковых систем и требований пользователей к этим системам постоянно растёт. Для увеличений скорости поиска нужной информации, крупные поисковые системы содержат большое количество серверов. Сервера обычно группируют в серверные центры (дата центры). У популярных поисковых систем серверные центры разбросаны по всему миру .</p><p>В октябре 2012 года Google запустила проект «Где живёт Интернет», где пользователям предоставляется возможность познакомиться с центрами обработки данных этой компании .</p><p>О работе дата-центров поисковой системе Google известно следующее :</p> <ul><li>Суммарная мощность всех дата-центров Google по состоянию на 2011 год оценивалась в 220 МВт.</li> <li>Когда в 2008 году Google планировала открыть в Орегоне новый комплекс, состоящий из трёх зданий общей площадью 6,5 млн м², в журнале Harper’s Magazine подсчитали, что такой большой комплекс потребляет свыше 100 МВт электроэнергии, что сравнимо с потреблением энергии города с населением 300 000 человек.</li> <li>Ориентировочное число серверов Google в 2012 году - 1 000 000.</li> <li>Расходы Google на дата-центры составили в 2006 году - $1,9 млрд, а в 2007 году - $2,4 млрд.</li> </ul><p>Размер всемирной паутины, проиндексированной Google на декабрь 2014 года, составляет примерно 4.36 миллиарда страниц .</p> <h2><span>Поисковые системы, учитывающие религиозные запреты </span></h2> <p>Глобальное распространение Интернета и увеличение популярности электронных устройств в арабском и мусульманском мире, в частности, в странах Ближнего Востока и Индийского субконтинента , способствовало развитию локальных поисковых систем, учитывающих исламские традиции. Такие поисковые системы содержат специальные фильтры, которые помогают пользователям не попадать на запрещённые сайты, например, сайты с порнографией, и позволяют им пользоваться только теми сайтами, содержимое которых не противоречит исламской вере. Незадолго до мусульманского месяца Рамадан , в июле 2013 года, миру был представлен <span>Halalgoogling </span> - система, выдающая пользователям только халяльные «правильные» ссылки , фильтруя результаты поиска, полученные от других поисковых систем, таких как Google и Bing . Двумя годами ранее, в сентябре 2011 года, был запущен поисковый движок I’mHalal, предназначенный для обслуживания пользователей Ближнего Востока. Однако этот поисковый сервис пришлось вскоре закрыть, по сообщению владельца, из-за отсутствия финансирования .</p><p>Отсутствие инвестиций и медленный темп распространения технологий в мусульманском мире препятствовали прогрессу и мешали успеху серьёзного исламского поисковика. Очевиден провал огромных инвестиций в веб-проекты мусульманского образа жизни, одним из которых был <span>Muxlim </span>. Он получил миллионы долларов от инвесторов, таких как Rite Internet Ventures, и теперь - в соответствии с последним сообщением от I’mHalal перед его закрытием - выступает с сомнительной идеей о том, что «следующий Facebook или Google могут появиться только в странах Ближнего Востока , если вы поддержите нашу блестящую молодёжь» . Тем не менее исламские эксперты в области Интернета в течение многих лет занимаются определением того, что соответствует или не соответствует шариату , и классифицируют веб-сайты как «халяль » или «харам ». Все бывшие и настоящие исламские поисковые системы представляют собой просто специальным образом проиндексированный набор данных либо это главные поисковые системы, такие как Google, Yahoo и Bing, с определённой системой фильтрации, использующейся для того, чтобы пользователи не могли получить доступ к харам-сайтам, таким как сайты о наготе, ЛГБТ , азартных играх и каким-либо другим, тематика которых считается антиисламской .</p><p>Среди других религиозно-ориентированных поисковых систем распространёнными являются Jewogle - еврейская версия Google и SeekFind.org - христианский сайт, включающий в себя фильтры, оберегающие пользователей от контента, который может подорвать или ослабить их веру .</p> <h2><span>Персональные результаты и пузыри фильтров </span></h2> <p>Многие поисковые системы, такие как Google и Bing, используют алгоритмы выборочного угадывания того, какую информацию пользователь хотел бы увидеть, основываясь на его прошлых действиях в системе. В результате, веб-сайты показывают только ту информацию, которая согласуется с прошлыми интересами пользователя. Этот эффект получил название «пузырь фильтров» .</p><p>Всё это ведёт к тому, что пользователи получают намного меньше противоречащей своей точке зрения информации и становятся интеллектуально изолированными в своём собственном «информационном пузыре». Таким образом, «эффект пузыря» может иметь негативные последствия для формирования гражданского мнения .</p> <h2><span>Предвзятость поисковых систем </span></h2> <p>Несмотря на то, что поисковые системы запрограммированы, чтобы оценивать веб-сайты на основе некоторой комбинации их популярности и релевантности, в реальности экспериментальные исследования указывают на то, что различные политические, экономические и социальные факторы оказывают влияние на поисковую выдачу .</p><p>Такая предвзятость может быть прямым результатом экономических и коммерческих процессов: компании, которые рекламируются в поисковой системе, могут стать более популярными в результатах обычного поиска в ней. Удаление результатов поиска, не соответствующих местным законам, является примером влияния политических процессов. Например, Google не будет отображать некоторые неонацистские веб-сайты во Франции и Германии, где отрицание Холокоста незаконно .</p><p>Предвзятость может также быть следствием социальных процессов, поскольку алгоритмы поисковых систем часто разрабатываются, чтобы исключить неформатные точки зрения в пользу более «популярных» результатов . Алгоритмы индексации главных поисковых систем отдают приоритет американским сайтам .</p><p>Поисковая бомба - один из примеров попытки управления результатами поиска по политическим, социальным или коммерческим причинам.</p> <h2>См. также </h2> <ul><li>Qwika</li> <li>Электронная библиотека#Списки библиотек и поисковые системы</li> <li>Панель инструментов веб-разработчика</li> </ul><h2>Примечания </h2> <h2>Литература </h2> <ul><li><span><i>Ашманов И. С. , Иванов А. А. </i> Продвижение сайта в поисковых системах. - М. : Вильямс, 2007. - 304 с. - ISBN 978-5-8459-1155-1 . </span></li> <li><span><i>Байков В.Д. </i> Интернет. Поиск информации. Продвижение сайтов. - СПб. : БХВ-Петербург, 2000. - 288 с. - ISBN 5-8206-0095-9 . </span></li> <li><span><i>Колисниченко Д. Н. </i> Поисковые системы и продвижение сайтов в Интернете. - М. : Диалектика, 2007. - 272 с. - ISBN 978-5-8459-1269-5 . </span></li> </ul><ul><li><span><i>Ландэ Д. В. </i> Поиск знаний в Internet. - М. : Диалектика, 2005. - 272 с. - ISBN 5-8459-0764-0 . </span></li> </ul><ul><li><span><i>Ландэ Д. В., Снарский А. А. , Безсуднов И. В. </i> Интернетика: Навигация в сложных сетях: модели и алгоритмы . - M.: Либроком (Editorial URSS), 2009. - 264 с. - ISBN 978-5-397-00497-8 . </span></li> </ul><ul><li><span><i>Chu H., Rosenthal M. </i> Search engines for the World Wide Web: A comparative study and evaluation methodology (англ.) // PROCEEDINGS OF THE ANNUAL MEETING-AMERICAN SOCIETY FOR INFORMATION SCIENCE: journal. - 1996. - Vol. 33 . - P. 127-135 . </span></li> </ul><ul><li><span><i>Gandal, Neil. </i> The dynamics of competition in the internet search engine market. - 2001. - Vol. 19. - P. 1103–1117. -</span></li></ul> <h3>Что это</h3> <p>DuckDuckGo - это довольно известная поисковая система с открытым исходным кодом. Серверы находятся в США. Кроме собственного робота, поисковик использует результаты других источников: Yahoo, Bing, «Википедии».</p> <h3>Чем лучше</h3> <p>DuckDuckGo позиционирует себя как поиск, обеспечивающий максимальную приватность и конфиденциальность. Система не собирает никаких данных о пользователе, не хранит логи (нет истории поиска), использование файлов cookie максимально ограничено.</p> <blockquote><p>DuckDuckGo не собирает личную информацию пользователей и не делится ею. Это наша политика конфиденциальности.</p><i>Гэбриел Вайнберг (Gabriel Weinberg), основатель DuckDuckGo </i> </blockquote> <h3>Зачем это вам</h3> <p>Все крупные поисковые системы стараются персонализировать поисковую выдачу на основе данных о человеке перед монитором. Этот феномен получил название «пузырь фильтров»: пользователь видит только те результаты, которые согласуются с его предпочтениями или которые система сочтёт таковыми.</p> <p>Формирует объективную картину, не зависящую от вашего прошлого поведения в Сети, и избавляет от тематической рекламы Google и «Яндекса», основанной на ваших запросах. При помощи DuckDuckGo легко искать информацию на иностранных языках, тогда как Google и «Яндекс» по умолчанию отдают предпочтение русскоязычным сайтам, даже если запрос введён на другом языке.</p> <h2></h2> <h3><br><img src='https://i2.wp.com/cdn.lifehacker.ru/wp-content/uploads/2016/02/3_1456746951-1600x998.png' width="100%" loading=lazy></h3> <h3>Что это</h3> <p>not Evil - система, осуществляющая поиск по анонимной сети Tor. Для использования нужно зайти в эту сеть, например запустив специализированный .</p> <p>not Evil не единственный поисковик в своём роде. Есть LOOK (поиск по умолчанию в Tor-браузере, доступен из обычного интернета) или TORCH (один из самых старых поисковиков в Tor-сети) и другие. Мы остановились на not Evil из-за недвусмысленного намёка на Google (достаточно посмотреть на стартовую страницу).</p> <h3>Чем лучше</h3> <p>Ищет там, куда Google, «Яндексу» и другим поисковикам вход закрыт в принципе.</p> <h3>Зачем это вам</h3> <p>В сети Tor много ресурсов, которые невозможно встретить в законопослушном интернете. И их число будет расти по мере того, как ужесточается контроль властей над содержанием Сети. Tor - это своеобразная сеть внутри Сети со своими социалками, торрент-трекерами, СМИ, торговыми площадками, блогами, библиотеками и так далее.</p> <h2>3. YaCy</h2> <p><img src='https://i0.wp.com/cdn.lifehacker.ru/wp-content/uploads/2016/03/77_1488364006-e1488364608241.jpg' width="100%" loading=lazy></p> <h3>Что это</h3> <p>YaCy - децентрализованная поисковая система, работающая по принципу сетей P2P. Каждый компьютер, на котором установлен основной программный модуль, сканирует интернет самостоятельно, то есть является аналогом поискового робота. Полученные результаты собираются в общую базу, которую используют все участники YaCy.</p> <h3>Чем лучше</h3> <p>Здесь сложно говорить, лучше это или хуже, так как YaCy - это совершенно иной подход к организации поиска. Отсутствие единого сервера и компании-владельца делает результаты полностью независимыми от чьих-то предпочтений. Автономность каждого узла исключает цензуру. YaCy способен вести поиск в глубоком вебе и неиндексируемых сетях общего пользования.</p> <h3>Зачем это вам</h3> <p>Если вы сторонник открытого ПО и свободного интернета, не подверженного влиянию государственных органов и крупных корпораций, то YaCy - это ваш выбор. Также с его помощью можно организовать поиск внутри корпоративной или другой автономной сети. И пусть пока в быту YaCy не слишком полезен, он является достойной альтернативой Google с точки зрения процесса поиска.</p> <h2>4. Pipl</h2> <p><img src='https://i2.wp.com/cdn.lifehacker.ru/wp-content/uploads/2016/03/66_1488330031-e1488330070469.jpg' width="100%" loading=lazy></p> <h3>Что это</h3> <p>Pipl - система, предназначенная для поиска информации о конкретном человеке.</p> <h3>Чем лучше</h3> <p>Авторы Pipl утверждают, что их специализированные алгоритмы ищут эффективнее, чем «обычные» поисковики. В частности, приоритетными являются профили социальных сетей, комментарии, списки участников и различные базы данных, где публикуются сведения о людях, например базы судебных решений. Лидерство Pipl в этой области подтверждено оценками Lifehacker.com, TechCrunch и других изданий.</p> <h3>Зачем это вам</h3> <p>Если вам нужно найти информацию о человеке, проживающем в США, то Pipl будет намного эффективнее Google. Базы данных российских судов, видимо, недоступны для поисковика. Поэтому с гражданами России он справляется не так хорошо.</p> <h2></h2> <p><img src='https://i0.wp.com/cdn.lifehacker.ru/wp-content/uploads/2016/03/5_1488327928-e1488328079978.jpg' width="100%" loading=lazy></p> <h3>Что это</h3> <p>FindSounds - ещё один специализированный поисковик. Ищет в открытых источниках различные звуки: дом, природа, машины, люди и так далее. Сервис не поддерживает запросы на русском языке, но есть внушительный список русскоязычных тегов, по которым можно выполнять поиск.</p> <h3>Чем лучше</h3> <p>В выдаче только звуки и ничего лишнего. В настройках можно выставить желаемый формат и качество звучания. Все найденные звуки доступны для скачивания. Имеется поиск по образцу.</p> <h3>Зачем это вам</h3> <p>Если вам нужно быстро найти звук мушкетного выстрела, удары дятла-сосуна или крик Гомера Симпсона, то этот сервис для вас. И это мы выбрали только из доступных русскоязычных запросов. На английском языке спектр ещё шире.</p> <p>Если серьёзно, специализированный сервис предполагает специализированную аудиторию. Но вдруг и вам пригодится?</p> <h2></h2> <p><img src='https://i0.wp.com/cdn.lifehacker.ru/wp-content/uploads/2016/03/wolfram_1508306612-1600x895.jpg' width="100%" loading=lazy></p> <h3>Что это</h3> <p>Wolfram|Alpha - вычислительно-поисковая система. Вместо ссылок на статьи, содержащие ключевые слова, она выдаёт готовый ответ на запрос пользователя. Например, если ввести в форму поиска «сравнить население Нью-Йорка и Сан-Франциско» на английском, то Wolfram|Alpha сразу выведет на экран таблицы и графики со сравнением.</p> <h3>Чем лучше</h3> <p>Этот сервис лучше других подходит для поиска фактов и вычисления данных. Wolfram|Alpha накапливает и систематизирует доступные в Сети знания из различных областей, включая науку, культуру и развлечения. Если в этой базе находится готовый ответ на поисковый запрос, система показывает его, если нет - вычисляет и выводит результат. При этом пользователь видит только и ничего лишнего.</p> <h3>Зачем это вам</h3> <p>Если вы, например, студент, аналитик, журналист или научный сотрудник, то можете использовать Wolfram|Alpha для поиска и вычисления данных, связанных с вашей деятельностью. Сервис понимает не все запросы, но постоянно развивается и становится умнее.</p> <h2></h2> <p><img src='https://i2.wp.com/cdn.lifehacker.ru/wp-content/uploads/2016/03/dogpile_1508306613-1600x895.jpg' width="100%" loading=lazy></p> <h3>Что это</h3> <p>Метапоисковик Dogpile выводит комбинированный список результатов из поисковых выдач Google, Yahoo и других популярных систем.</p> <h3>Чем лучше</h3> <p>Во-первых, Dogpile отображает меньше рекламы. Во-вторых, сервис использует особый алгоритм, чтобы находить и показывать лучшие результаты из разных поисковиков. Как утверждают разработчики Dogpile, их системы формирует самую полную выдачу во всём интернете.</p> <h3>Зачем это вам</h3> <p>Если вы не можете найти информацию в Google или другом стандартном поисковике, поищите её сразу в нескольких поисковиках с помощью Dogpile.</p> <h2></h2> <p><img src='https://i2.wp.com/cdn.lifehacker.ru/wp-content/uploads/2016/03/bordreader_1508306615-1600x895.jpg' width="100%" loading=lazy></p> <h3>Что это</h3> <p>BoardReader - система для текстового поиска по форумам, сервисам вопросов и ответов и другим сообществам.</p> <h3>Чем лучше</h3> <p>Сервис позволяет сузить поле поиска до социальных площадок. Благодаря специальным фильтрам вы можете быстро находить посты и комментарии, которые соответствуют вашим критериям: языку, дате публикации и названию сайта.</p> <h3>Зачем это вам</h3> <p>BoardReader может пригодиться пиарщикам и другим специалистам в области медиа, которых интересует мнение массовой по тем или иным вопросам.</p> <h2>В заключение</h2> <p>Жизнь альтернативных поисковиков часто бывает скоротечной. О долгосрочных перспективах подобных проектов Лайфхакер спросил бывшего генерального директора украинского филиала компании «Яндекс» Сергея Петренко .</p> <p> <br><img src='https://i2.wp.com/cdn.lifehacker.ru/wp-content/uploads/2016/03/Wz3tH0vU_1456918938.jpeg' width="100%" loading=lazy></p> <p>Сергей Петренко</p> <p>Бывший генеральный директор «Яндекс.Украины».</p> <p>Что касается судьбы альтернативных поисковиков, то она проста: быть очень нишевыми проектами с небольшой аудиторией, следовательно без ясных коммерческих перспектив или, наоборот, с полной ясностью их отсутствия.</p> <p>Если посмотреть на примеры в статье, то видно, что такие поисковики либо специализируются в узкой, но востребованной нише, которая, возможно только пока, не выросла настолько, чтобы оказаться заметной на радарах Google или «Яндекса», либо тестируют оригинальную гипотезу в ранжировании, которая пока не применима в обычном поиске.</p> <p>Например, если поиск по Tor вдруг окажется востребованным, то есть результаты оттуда понадобятся хотя бы проценту аудитории Google, то, конечно, обычные поисковики начнут решать проблему, как их найти и показать пользователю. Если поведение аудитории покажет, что заметной доле пользователей в заметном количестве запросов более релевантными кажутся результаты, данные без учёта факторов, зависящих от пользователя, то «Яндекс» или Google начнут давать такие результаты.</p> <p>«Быть лучше» в контексте этой статьи не означает «быть лучше во всём». Да, во многих аспектах нашим героям далеко до и «Яндекса» (даже до Bing далековато). Но зато каждый из этих сервисов даёт пользователю нечто такое, чего не могут предложить гиганты поисковой индустрии. Наверняка вы тоже знаете подобные проекты. Поделитесь с нами - обсудим.</p> <script>document.write("<img style='display:none;' src='//counter.yadro.ru/hit;artfast_after?t44.1;r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+";h"+escape(document.title.substring(0,150))+ ";"+Math.random()+ "border='0' width='1' height='1' loading=lazy>");</script> </article> <div id="disqus_thread"> <div id="dsq-content"> <ul id="dsq-comments"> <li class="comment even thread-even depth-1" id="dsq-comment-2"> <div id="dsq-comment-header-2" class="dsq-comment-header"> <cite id="dsq-cite-2"> <span id="dsq-author-user-2">Сергей Савенков</span> </cite> </div> <div id="dsq-comment-body-2" class="dsq-comment-body"> <div id="dsq-comment-message-2" class="dsq-comment-message"> <p>какой то “куцый” обзор… как будто спешили куда то</p> </div> </div> </li> </ul> </div> </div> </div> </div> <div class="wpb_column vc_column_container td-pb-span4"> <div class="vc_column-inner "> <div class="wpb_wrapper"> <div class="wpb_widgetised_column wpb_content_element"> <div class="wpb_wrapper"> <div class="td-a-rec td-a-rec-id-sidebar td-rec-hide-on-p "> <div id="adriver_banner_1494422254"></div> </div> <div class="td-a-rec td-a-rec-id-custom_ad_1 td-rec-hide-on-p "> <div> </div> <div id='div-gpt-ad-1491821174306-2' style='height:600px; width:300px;'> </div> </div> <div class="td-a-rec td-a-rec-id-custom_ad_2 td-rec-hide-on-p "> <div> </div> <div id='div-gpt-ad-1491821174306-3' style='height:600px; width:300px;'> </div> </div> </div> </div> </div> </div> </div> </div> </div> </div> <div class="td-footer-wrapper td-footer-template-14"> <div class="td-container td-footer-bottom-full"> <div class="td-pb-row"> <div class="td-pb-span3"> <aside class="footer-logo-wrap"><a href="/"><img class="td-retina-data" src="/uploads/logo.png" data-retina="/wp-content/uploads/2017/02/logo_544x180_bw.png" alt="Техника. Новости. Телефоны. Ноутбуки. Сравнение. Windows" title="Техника. Новости. Телефоны. Ноутбуки. Сравнение. Windows"/ loading=lazy></a></aside> </div> <div class="td-pb-span5"> <aside class="footer-text-wrap"> <div class="block-title"><span>Общая информация</span></div>.</aside> </div> <div class="td-pb-span4"> <aside class="footer-social-wrap td-social-style-2"> <div class="block-title"><span>Сайт в социальных сетей</span></div> <span class="td-social-icon-wrap"> <a target="_blank" href="https://www.facebook.com/sharer/sharer.php?u=https://danykom.ru/drugie-poiskovye-kakie-est-poiskovye-sistemy-v-internete/" title="Facebook"> <i class="td-icon-font td-icon-facebook"></i> </a> </span> <span class="td-social-icon-wrap"> <a target="_blank" href="" title="Instagram"> <i class="td-icon-font td-icon-instagram"></i> </a> </span> <span class="td-social-icon-wrap"> <a target="_blank" href="" title="RSS"> <i class="td-icon-font td-icon-rss"></i> </a> </span></aside> </div> </div> </div> </div> <div class="td-sub-footer-container"> <div class="td-container"> <div class="td-pb-row"> <div class="td-pb-span7 td-sub-footer-menu"> <div class="menu-td-demo-footer-menu-container"> <ul id="menu-td-demo-footer-menu" class="td-subfooter-menu"> </ul> </div> </div> <div class="td-pb-span5 td-sub-footer-copy"> © 2024 Техника. Новости. Телефоны. Ноутбуки. Сравнение. Windows </div> </div> </div> </div> </div> <link rel='stylesheet' id='css-5-css' href='/wp-content/mmr/ffba0e2b-1516146715.min.css' type='text/css' media='all' /> <script type='text/javascript' src='https://danykom.ru/wp-content/mmr/4ab436a1-1516146715.min.js'></script> <script> (function() { var html_jquery_obj = jQuery('html'); if (html_jquery_obj.length && (html_jquery_obj.is('.ie8') || html_jquery_obj.is('.ie9'))) { var path = '/wp-content/themes/Newspaper/style.css'; jQuery.get(path, function(data) { var str_split_separator = '#td_css_split_separator'; var arr_splits = data.split(str_split_separator); var arr_length = arr_splits.length; if (arr_length > 1) { var dir_path = '/wp-content/themes/Newspaper'; var splited_css = ''; for (var i = 0; i < arr_length; i++) { if (i > 0) { arr_splits[i] = str_split_separator + ' ' + arr_splits[i]; } //jQuery('head').append('<style>' + arr_splits[i] + '</style>'); var formated_str = arr_splits[i].replace(/\surl\(\'(?!data\:)/gi, function regex_function(str) { return ' url(\'' + dir_path + '/' + str.replace(/url\(\'/gi, '').replace(/^\s+|\s+$/gm, ''); }); splited_css += "<style>" + formated_str + "</style>"; } var td_theme_css = jQuery('link#td-theme-css'); if (td_theme_css.length) { td_theme_css.after(splited_css); } } }); } })(); </script> </body> </html>