Поисковики без запретов: три малоизвестных поисковых системы в сравнении
Содержание:
- Международные поисковые системы
- Какие есть поисковые системы: список малоизвестных ПС
- Справочные поисковые системы
- Поиск конкретных слов на веб-странице
- Поиск в заголовках веб-страниц
- Имена поисковых роботов (ботов) для управления их доступом
- Rambler.ru
- Общие принципы обработки информации
- Способы поиска информации в интернете
- Обзор поисковых систем Интернета
- Как пользоваться поисковыми системами?
- Российские поисковые системы
- Основная поисковая система в мире: Google
- DuckDuckGo — свободный поиск
Международные поисковые системы
Самые известные международные поисковики
-
Китайский поисковик Байду
Сайт является четвертым в мире по посещаемости. 92% его аудитории составляют граждане Китая. - Поисковик Ask
-
Французский поисковик Qwant.
Вышел в свет в 2013 году как альтернатива Гуглу. -
Metasearch Search Engine — Search.com.
Этим поисковиком можно воспользоваться, если ничего не нашли в Гугле -
AlltheWeb. Поисковик, созданный в Норвегии.
Назван «открытием 1999 года». В результатах поиска американские сайты не доминируют.
Ищет также картинки, видео и аудио. Спецпоиск по научным сайтам. - LYCOS
- Live Search. Также от Микрософт.
Какие есть поисковые системы: список малоизвестных ПС
Большинство интернет-пользователей даже не в курсе,
какие есть поисковые системы кроме Яндекса
и Гугла. Так вот они есть;) Знакомьтесь!
Поисковую долю этого поисковика сложно назвать крупной, но показатели потихонечку растут. Хотя не стоит упускать тот факт, что цифры эти напрямую зависят от “Одноклассников”, почты Майл.ру и других штук от Mail корпорации.
Это настоящий олдскул. Только представьте: когда появилась эта поисковая система, некоторые сеошники еще только учились ходить. Вообще, у Рамблера был шанс править балом в , но этого не произошло по целому ряду причин. В настоящее время это уже не совсем поисковик, а своего рода набор сервисов, на которых в качестве поиска используется движок Yandex — например, есть свой . Посещаемость, кстати, довольно приличная: за день главную страницу Rambler посещают чуть больше миллиона пользователей.
Также у Рамблера есть версия
Rambler Lite
(все то же самое, только без погоды, новостей, рекламы и прочего) и
XRambler
, на котором объединены сразу 15 поисковых систем.
Сколько имен сменил это поисковик! За 8 лет он успел поносить имя MSN Search, затем Windows Live Search, потом сократил предыдущее название до Live Search и вот сейчас пришел к названию Bing. Многие утверждают, что качество поиска близко к заложенному стандарту Google.
Теперь сложно назвать Яху поисковой системой, так как по договору на всех площадках, принадлежащих Яху, используется поисковый движок Бинга. Последнюю новость про договор можно узнать на
Searchengines
.
Webalta
Наверняка этот, так называемый, поисковик вам знаком. Приходилось выковыривать его, словно клеща, из вашего браузера?
Уже давно всем известно о темных делишках этого поисковика. Увы, никого эта ПС не интересует. Пользователи ищут лишь статьи о том, как удалить эту дрянь со своего компьютера.
Нигма
Это поисковая система значительно отличается от остальных. И если и индексной базой других поисковиков никого не удивишь, то вот способность решать задачи по химии и математике отличает Нигму от прочих ПС. Также Nigma предлагает поиск по музыке, книгам, играм и торрентам.
Поисковик, созданный по заказу правительства России, считается первым в мире государственным поисковиком. Предлагает отдельный медицинский поиск (поиск аптек, лекарств и статей о заболеваниях). Весьма удобная тема с “Удобной страной”, где в одном месте собраны все рекомендации, помогающие гражданину. Вот, например, раздел “Документы”.
Эта ПС значительно отличается от того,
какие бывают поисковые системы в интернете
.
DuckDuckGo — поисковая система
с открытым исходным кодом и интересной политикой, которая заключается в отказе от использования “пузыря фильтров”. Для тех, кто не знает: “пузырь фильтров” — это когда поисковик показывает в выдаче только те результаты поиска, которые она же (эта ПС) посчитает необходимыми конкретному пользователю. При этом мнение самого пользователя никого не интересует. DuckDuckGo уверяет, что использование их поисковика гарантирует то, что вы получите всю информацию, которая есть у поисковой системы.
“УткаУткаИди” набирает обороты. Уже этим летом (2015 г.) создатель ПС сообщил о трех млрд запросов в годовом выражении.
Во время написания статьи у меня возникло несколько вопросов. В таких случаях на выдачу я не полагаюсь, да, и зачем, если рядом со мной сидит человек, который знает все об интернете? Мини-интервью с Игорем Ивановым.
Игорь Иванов
Руководитель студии SEMANTICA
Если мой сайт в Google и Yandex, то будет ли мой сайт на вершине выдачи в других, менее крупных поисковиках?
Есть очень большая вероятность, что так и будет. Яндекс и Google развивают свои алгоритмы в правильном направлении и другие поисковые системы берут с них пример. Был случай, когда специалисты Google заметили, что поисковая система Bing не только копирует их алгоритмы, но результаты поиска.
Почему вероятность, а не полная уверенность? Потому, что другие поисковые системы не успеют подогнать свои алгоритмы ранжирования под эталон, которые задали их более успешные конкуренты.
Стоит ли вообще продвигаться в Спутнике, Майл и других “наших” поисковиках? Какая поисковая система лучше?
С расцветом цензуры и слежения альтернативы Google и Яндекс интересуют пользователей все больше и больше. Мы расскажем вам о трех поисковых системах без запретов, которые не собирают о вас личную информацию, а, напротив, защищают вашу приватность.
Справочные поисковые системы
Ask – общественная поисковая система, позволяющая находить интернет-сайты, изображения, видео и новости. Также можно задавать вопросы, получая на них мгновенные ответы.
eHow – является одним из самых старых интернет-сайтов по вопросам и ответам, который дает возможность находить информацию на любую тематику – от декоративных элементов дома — до разновидностей блюд, от финансовой системы — до юрисдикции.
Answers – система вопросов-ответов и сообщество, позволяющее людям задавать конкретные вопросы и заниматься поиском ответов.
Wolfram Alpha – вычислительная справочно-поисковая система по поиску ответов на фактические вопросы, которая находит необходимые изображения, выполняет расчеты и множество других функций.
ChaCha – поисковая система, функционирующая за счет активности пользователей. Она предоставляет развернутые ответы на любой поставленный вопрос в режиме реального времени через интернет-сайт. Также с ее помощью можно делиться изображениями и задавать вопросы в режиме онлайн.
Quora – сайт вопросов-ответов, который помогает найти нужный совет либо получить поучительный урок от людей, у которых есть ценный жизненный опыт.
TheQuestion – сравнительно молодой российский сервис вопросов и ответов. Сообщество людей, часть из которых ищет информацию, а часть имеет проф. знания и опыт, чтобы корректно отвечать на вопросы.
Ответы@Mail.ru – российский сайт вопросов и ответов с системой баллов и рейтингов для участников.
Приватные поисковые системы
DuckDuckGo – система поиска, целью которой является защита приватности пользователя. Она позволяет проводить поиск интернет-сайтов, изображений и видео, определений и терминов и др.
Qwant – французкая анонимная поисковая система в интернете. Данная система отрицает всякого рода шпионство за пользователями, предоставляя им поиск интернет-сайтов, изображений и видео, новостей и др.
Startpage – поисковая система от Google, обеспечивающая безопасность и приватность пользователей. Позволяет осуществлять поиск интернет-страниц, изображений, видео и др.
Поиск конкретных слов на веб-странице
Скажем, вы ищете конкретную концепцию или тему, возможно, чьё-то имя, бизнес или конкретную фразу. Вы используете свою любимую поисковую систему, нажимаете на несколько страниц и кропотливо просматриваете тонны контента, чтобы найти то, что ищете. Правильно?
Не обязательно. Вы можете использовать чрезвычайно простой трюк веб-поиска для поиска слов на веб-странице, и это будет работать в любом браузере, который вы используете.
Откройте страницу сайта, нажмите Ctrl + F, а затем введите искомое слово в появившемся поле поиска. Всё просто, и вы можете использовать его в любом веб-браузере, на любом веб-сайте.
Поиск в заголовках веб-страниц
Заголовки веб-страниц находятся в верхней части браузера и в результатах поиска. Вы можете ограничить свой поиск только заголовками веб-страниц с помощью команды поиска allintitle. Термин allintitle – это поисковый оператор, специфичный для Google, который возвращает результаты поиска, ограниченные поисковыми терминами, найденными в заголовках веб-страниц.
Например, если вы хотите получить результаты поиска только со словосочетанием «теннисный чемпионат», вы должны использовать этот синтаксис: allintitle: теннисный чемпионат
Это вернет результаты поиска Google со словами «теннисный чемпионат» в заголовках веб-страниц.
Имена поисковых роботов (ботов) для управления их доступом
Обычно сайт стараются оптимизировать и раскрутить,
чтобы получить конверсию. С этой точки зрения пусть побольше веб-пауков сканируют ваши сайты.
Но с другой стороны излишний трафик замедлит загрузку страниц и снизит поведенческие факторы,
а вам придется платить своему хостеру за превышение процессорной нагрузки.
Может быть, тогда лучше дать доступ к сайту только самым популярным поисковикам, особенно если вы пользуетесь
их статистикой и панелями для веб-мастеров?
Тогда на сегодняшний момент это будут Гугл, Яша, Мэйлру и Бинг.
В прошлом занменитые зарубежные Альтависта, Вебальта и даже Яху (который и сейчас жизнерадостен,
но уже стал отказываться от удобных сервисов) вам не критичны.
Наш Апорт с уникальным алгоритмом поиска превратился в барахолку, а Рэмблер — в новостийную простыню для планшетов
(впрочем, он уверенно заявляет, что будет реанимировать и реформировать свой рейтинг).
Список имен главных веб-сканеров основных поисковых систем прошлых и настоящих лет:
- Апорт (http://www.aport.ru) — Aport
- Мэйл.ру (http://mail.ru) — Mail.Ru
- Рамблер (http://www.rambler.ru) — StackRambler
- Яндекс (http://www.ya.ru) — Yandex
- AOL (http://www.aol.com) — Slurp
- Alexa (http://www.alexa.com) — ia_archiver
- AltaVista (http://www.altavista.com) — Scooter
- Ask (http://www.ask.com) — Teoma
- Baidoo (китайский)
- Google (http://www.google.com) — Googlebot
- Live (http://www.live.com) — MSNBot
- Lycos (http://www.lycos.com) — Lycos
- MSN (http://www.msn.com) — MSNBot
- Nigma (музыкальный)
- Turtle
- Webalta (http://www.webalta.ru) — WebAlta (WebAlta Crawler/2.0)
- Yahoo! (http://www.yahoo.com) — Slurp (или Yahoo! Slurp)
У крупных поисковых систем иногда, кроме основных ботов, имеются также отдельные экземпляры
для индексации блогов, новостей, изображений и т.д.
Поэтому, наверное, стоит закрыть доступ к большинству из них с помощью директив в файлах robots.txt и/ил .htaccess,
открыв только для 3-4 самых популярных в России и зарубежом.
Во всяком случае, к многочисленным элементам дизайна (картинкам, стилям, скриптам, шаблонам) точно нужно закрыть
всем, кто еще не умеет их обрабатывать (а умеют пока Гугль и Яндекс).
Robotstxt.
Все о файле «robots.txt» по-русски — как составить robots.txt.
Имеются краткие обзоры о поисковых роботах. И хорошая статья — «Ошибки, часто встречающиеся в файле robots.txt».
Rambler.ru
Rambler – это один из наиболее ранних вариантов и раньше это была одна из самых популярных поисковых систем на русском языке, наравне с яндексом. И первые пару лет я активно использовал его в качестве поисковой системы по умолчанию, пока не перешел на Яндекс. Сейчас он используется не очень активно (я бы даже сказал совсем не активно), хотя он обладает неплохим качеством и отличной скоростью.
Он является также популярным медийным порталом Рунета, на котором можно использовать почту, узнать последние новости о самых разных сферах жизни. Кстати именно какмедийно-новостной портал он зарекомендовал себя вполне неплохо и я знаю многих людей, которые специально идут именно на рамблер, чтобы почитать последние новости.
Несмотря на свою былую популярность, рамблеру сегодня принадлежит меньше 0,5 процентов от общего количества запросов в интернете.
Общие принципы обработки информации
Каждый этап, описанный выше, выполняется отдельной программой (или их комбинациями). Это — так называемые «составляющие» алгоритмов поисковых систем.
Spider
Робот закачивающий веб страницы на сервер, он скачивает интернет-сайт, что в дальнейшем будет проиндексирован. Причем, загружает он все страницы и готовит полученные данные для анализа следующей программой. Если пользователя на загружаемом сайте интересует только контент (текст, картинки, мультимедиа), то spider работает именно с исходным кодом и html документами.
Crawler
Данная программа автоматически открывает и анализирует все ссылки, которые ей удается найти на сайте (в архиве, предварительно подготовленном с помощью Spyder (Паука). Это позволяет в дальнейшем составить «дерево» адресов, а также обнаружить точные ссылки, которые будут предоставляться в ответ на поисковые запросы. Кстати, если Crawler встречает «битую» ссылку — это затрудняет его работу, и соответственно заставляет поисковик тратить больше бюджета на индексирование Вашего сайта.
Indexer
Программа которая проводит индексацию, всех полученных данных от Spider и Crawler. То есть делит загруженную страницу на составные части (по html-тегам) и формирует список данных, которые здесь представлены.
Database
На основе информации, полученной после индексации, формируются 2 раздельные базы данных. Первая — это «дерево» сайта с его мета-тегами. В дальнейшем она используется при выполнении повторной индексации. То есть вместо того, чтобы повторно изучать сайт, выполняется сверка «деревьев» — так поисковый сервис определяет, вносились ли какие-то изменения на анализируемый веб-ресурс.
Вторая база данных — это результаты индексации. Та самая информация, на основе которой определяется условный рейтинг сайта, а также составляется перечень поисковых запросов, в ответ на которые можно предоставить ссылку.
Search Engine Results Engine
Алгоритм, который выполняет окончательное ранжирование сайтов при получении конкретного поискового запроса. Именно этот алгоритм выбирает ссылки, которые будут показаны пользователю, а также определяет режим их сортировки с 1 места по 10 место , и так 100 места.
Web server
Сервер, на котором хранится сайт поискового сервиса. Именно его открывает пользователь, там же он вводит свой запрос и просматривает результаты выдачи.
Способы поиска информации в интернете
Выделяют основные методы поиска информации:
- Используя поисковый сервер.
- С помощью адреса веб-страницы.
- Через гиперссылки.
Первый вариант является наиболее популярным у клиентов интернета. Он требуется в большинстве ситуаций, когда человеку нужны сведения по конкретной теме, при этом отсутствуют знания о месте (веб-странице, сайте или группе в социальной сети), где можно было получить информацию.
Почему стоит пользоваться несколькими поисковыми системами
Поисковики имеют различные параметры. Например:
- Алгоритмы работы.
- Уровень сложности языка команд.
- Скорость поиска.
- Функционал, наличие расширенных опций.
- Внешнее оформление.
- Удобство использования.
Проанализировав указанные показатели, пользователь может выбрать желаемую систему для своих целей. Но лучшего результата он сможет добиться, если возьмет все ресурсы интернета — будет работать сразу в нескольких браузерах.
Обзор поисковых систем Интернета
Выше мы сделали небольшое описание поисковых систем. А здесь, хотелось бы Вам рассказать о них немного подробно. Когда их создали, и какие у них плюсы и минусы:
- Google. Эта поисковая система была создана в США в 1998 году. Её создали программисты Сергей Брин и Ларри Пейдж. Сейчас она включает в себя более 25 миллиардов веб-сайтов и её используют 200 миллионов пользователей из разных стран мира. Плюсы этой поисковой системы в том, что можно найти качественную информацию быстрее, чем не качественную. Минусы – нагрузка на компьютер, так как частое обновление Гугла нагружает оперативную память компьютера.
- ЯНДЕКС. Её создали в 1997 году. Создатели этой поисковой системы – Аркадий Волож и Илья Сегалович. Занимает второе место по популярности в России. Плюсов у этой системы много и из них – использование электронной почты, кошелька Яндекс деньги, и быстрый доступ к любой информации. Компания установила фильтры поиска, но это не спасает пользователей посещать сомнительные сайты в Интернете. Это один главный минус и недостаток этого поисковика.
- YAHOO. Поисковик является более старым из всех поисковых систем, которые мы рассматриваем. Его создание принято считать в 1995 году, предпринимателями Джерри Янгом и Дэвидом Филом. Он является достаточно крупным Интернет порталом и у него есть только один минус – не устанавливается на компьютер, а используется через браузер.
- MAIL.RU. Эту поисковую систему организовали в 1998 году. Её авторы и создатели – Евгений Голанд и Владимир Шутов. Этот портал принадлежит крупной компании – Мейл Ру Групп. Так же включает в себя популярные проекты: Одноклассники, Вконтакте, Мой мир. Пользоваться этим поисковиком удобно. Но минусы в том, что электронная почта от Мейл не имеет хорошей защиты от взлома и нередко браузеры заражаются вирусной рекламой от этой системы.
- BING. Она была создана в 2009 году. Эта поисковая система работает, как на компьютерах, так и на Смартфонах. В большинстве случаев, ей выгодно пользоваться на телефонах, это считается её главным преимуществом.
Менее популярные поисковые системы
- DUCKDUCK.GO. Наличие поисковика на компьютере, позволит Вам использовать его в полной мере и вместе с этим сохранить свои конфиденциальные данные. Её создал предприниматель Гэбриель Вайнберг в 2006 году. Эта система не сохраняет во время поиска кэш и историю браузера.
- СПУТНИК. Как было уже сказано выше, это поисковая система пока ещё не всеми используется. Её создали в 2014 году, и создателем считают компанию Ростелеком. Эту поисковую систему, планирует использовать государство.
- РАМБЛЕР. Самый известный в Рунете поисковый портал. Создатель портала Дмитрий Крюков – 1996 год. Он существовал до 2011 года, и сейчас по-прежнему работает в полной мере, как поисковая система.
- BAIDU. Данную китайскую поисковую систему основали в 2000 году, предприниматели – Робин Ли и Эрик Сю. Этим поисковиком пользуется только китайское население. К нему очень негативное отношение во многих странах из-за рекламного вируса и нет возможности перевода языка.
- TUT BY. Данная поисковая система была создана в Белоруссии в 2000 году. Его основал журналист Сергей Дмитриев. Посещаемость поисковика уже превышает более 2 000 000 пользователей в этой стране.
Известные поисковики за рубежом
- AOL (Американская поисковая система). Была разработана в США в 90-е годы. У неё довольно слабая популярность среди пользователей. Работают с поисковиком, в основном, жители Америки.
- ASK.COM. Создание поисковой системы принято считать в 1995 году. Чтобы пользоваться этой системой, достаточно лишь внести в поисковую строку какой-либо вопрос, и она выдаст результаты. Её поиск распределяет результаты по порядку, и всегда можно найти необходимую информацию и качественную.
- ECITE. Данная поисковая машина, особо ничем от других не отличается. Сайт был запущен в 1994 году и в данный момент принадлежит компании IAC Search Media. Этот сервис может предлагать пользователям различную информацию в виде обмена быстрыми сообщениями, отправка писем по электронной почте, и имеет полную настройку домашней страницы в браузере.
- Wolfram Alpha. Он был запущен в Интернет – 15 мая 2009 года. Имеет огромную базу знаний, и мощные вычислительные алгоритмы для нахождения этой информации в поиске.
Итак, эти поисковые системы на сегодняшний день самые лучшие. Думаю, Вы сможете выбрать для себя подходящий вариант. Часто приходиться использовать несколько поисковиков для эффективного поиска нужной информации.
Как пользоваться поисковыми системами?
Прежде всего, помните, что сейчас почти все браузеры по умолчанию используют определенную поисковую систему и позволяют искать запрос сразу же в адресной строке самой программы. В браузере Google Chrome (Гугл Хром) по умолчанию стоит поисковая система «Google» (разумеется, ведь, оба продукта принадлежат одной из самых крупных корпораций, разрабатывающей важнейшие составляющие для работы в интернете).
После нажатия на enter появится окно с результатами, которые представляют из себя перечень сайтов, содержащих данную фразу. На нашем конкретном примере, выдача результатов будет такой:
Нам остается лишь перейти по одной из ссылок, чтоб почитать, что это такое. Если мы ищем, как эта глазовыколупывательница выглядит, то нажимаем сверху вкладку «Картинки» и получаем целый набор картинок с этим названием.
Так же можно переходить непосредственно на сам сайт системы и искать уже там. А какой конкретно сайт выбрать — решать Вам.
Российские поисковые системы
С развитием интернета в России возник вопрос о создании поисковика под кириллический сегмент интернета, не только Россия но и другие страны СНГ (Белоруссия и Украина)
Google плохо понимал русский язык, и в самом начале русский интернет, как и весь мир. использовал каталоги сайтов (Мейл ру и Рамблер Портал), все изменилось с появлением Яндекса, который теперь занимает лидирующие позиции.
Поисковая система Yandex
Яндекс — компания, основанная в 1997 году. Она известна своим набором сервисов, которые охватывают поисковые системы, AI и аналитику.
Благодаря инновациям в искусственном интеллекте и технологиях чтения данных, поисковик Яндекс может легко работать с российской терминологией при поиске на зарубежных ресурсах, благодаря чему в отдельных нишах обгоняет по эффективности Google.
В настоящее время Яндекс — крупнейшая технологическая компания в России, владеющая более 50% доли рынка поисковых систем в стране. Яндекс является четвертым по популярности сайтом в России.
Портал Rambler
Rambler начала работу в октябре 1996 года, на начальном этапе в ней содержалось всего 100 тысяч проиндексированных сайтов. Rambler был не первой отечественной поисковой системой, но ставшей одной из самых популярных.
Вторая версия поисковика начала разрабатываться летом 2000 года, в ней представили функции, которые уже были доступны в конкурирующих системах. Учитывалась морфология, улучшился поиск по каталогам
Важной фишкой поисковика был каталог Rambler’s Top100, куда попадали сто самых популярных сайтов Рунета
Удачная архитектура продукта позволяла Rambler иметь количество серверов в два раза меньше, чем у Яндекса и в три раза меньше, чем у Aport.
Основная поисковая система в мире: Google
Доля мирового рынка поисковых систем 91,38%
Трудно представить себе невероятные размеры Google. Эта поисковая система настолько популярна, что во много раз больше, чем все другие поисковые системы мира вместе взятые.
В частности, Google в настоящее время занимает колоссальный 91,38 процента от мировой доли рынка поиска.
Поисковая система была создана в 1996 году Сергеем Брином и Ларри Пейджем, но вот самое интересное: в 1999 году два партнёра хотели продать Google интернет-компании Excite всего за 750 000 долларов. Excite отклонили это предложение…
Сегодня состояние Google и его материнской компании Alphabet составляет более 750 миллиардов долларов.
В результате, Пейдж, генеральный директор Alphabet, занимает восьмое место в списке самых богатых людей в мире с чистым капиталом в 53,5 миллиарда долларов, а Брин, президент Alphabet, занимает девятое место в списке самых богатых людей с чистым капиталом в 52,1 миллиарда долларов.
В наши дни Google – это больше, чем поисковая система.
Компания разработала множество других программных решений, таких как Google Drive. Она владеет YouTube, разработала линейку смартфонов и ноутбуков и даже создала беспилотные автомобили.
Google также поддерживает другие поисковые системы, включая Ask , которая является шестой по величине поисковой системой в мире.
Гигант поискового рынка постоянно обновляет свою страницу результатов поиска, чтобы предоставить ряд полезных форматов контента, таких как Featured Snippets Google.
DuckDuckGo — свободный поиск
Поисковая система DuckDuckGo одна из первых заявила, что не собирает, не хранит и не распространяет данные о пользователе, а также информацию о его активности. Эта система одна из первых отказалась от анализа пользовательских запросов (или «Пузыря фильтров»). Поиск DuckDuckGo предоставляет пользователю только лучшие результаты, находя информацию не только в своей базе, но и анализируя еще более 400 других авторитетных ресурсов, вроде Википедии, Яндекса, Yahoo! и подобных.
Их девизом является фраза «Конфиденциальность, простота». Само название пришло в голову одному из разработчиков. Оно было позаимствовано из популярной детской игры США «Duck, duck, goose» (Утка, утка, гусь). Над разработкой и совершенствованием системы работают около 40 сотрудников. Расположилась компания в Паоли, Пенсильвания.