Текст книги "Интернет-разведка. Руководство к действию"
Автор книги: Евгений Ющук
Жанр:
Интернет
сообщить о нарушении
Текущая страница: 3 (всего у книги 21 страниц) [доступный отрывок для чтения: 8 страниц]
[+креатив && link=www.vershinabooks.ru*]
Результат поиска: страниц – 10.
Остальные страницы, показанные в предыдущем запросе, ссылались на сайт издательства «Вершина», но слова «креатив» не содержали.
13. Оператор поиска в заголовке страницы.
Для тех, кто не занимается сайтами профессионально, напомним, что заголовок страницы – это то, что написано на синем (для Windows XP) поле в самом верху экрана, как бы уже за пределами страницы, на ее рамке. А с точки зрения разметки HTML, эта часть сайта заключена внутри тега
Яндекс справедливо считает, что если ключевое слово содержится в самом заголовке страницы, значит, она однозначно имеет непосредственное отношение к запросу.
Синтаксис оператора выглядит таким образом (на примере поиска слова «разведка» на страницах, содержащих в заголовке словосочетание «ИПК УГТУ»):
Запрос: [+разведка && $title (ИПК УГТУ)]
Результат поиска: страниц – 1
В выдаче:
Институт переподготовки кадров УГТУ (ИПК УГТУ) – Екатеринбург, Свердловская…
… проф. бухгалтеров, семинары и тренинги по управлению недвижимостью, изменениями, бизнес-разведке, технологиям продаж, тренинги личностного роста. www.uralfirm.ru/catalog/card/66.19517 (13 КБ) 18.06.2005
Остальные операторы языка запросов Яндекса представляют меньший практический интерес, хотя и значительно расширяют возможности поиска. Ознакомиться с ними можно на странице помощи в Яндексе,[4]4
http://help.yandex.ru/search/
[Закрыть] пройдя по ссылкам Помощь > Синтаксис запросов.
Поиск в Гугле (Google)
Гугл (google.ru) становится все более популярным. За ним стоит колоссальный финансовый ресурс, которым грамотно распоряжаются. Так, по информации из интервью инженера по программному обеспечению Google Мэта Катса, уже в 2002 г. «каждые 28 дней Google индексировал 3 млрд веб-документов, в том числе более трех млн новых страниц каждый день».
Этот поисковик в чем-то проигрывает Яндексу, а в чем-то выигрывает у него. Поскольку Для удобства читателя при рассказе об операторах Гугла будем в ряде случаев проводить их сравнение с аналогичными операторами Яндекса.
1. Основы поиска.
Чтобы ввести запрос, напечатайте ключевые слова и нажмите ENTER либо щелкните кнопку «Поиск в Google».
Гугл использует интеллектуальную технику анализа текстов, которая позволяет искать важные и вместе с тем релевантные страницы по вашему запросу. Для этого система анализирует не только саму страницу, которая соответствует запросу, но и те, которые на нее ссылаются, чтобы определить ценность этой страницы для целей вашего поиска. Кроме того, Гугл предпочитает страницы, на которых ключевые слова, введенные вами, расположены недалеко друг от друга.
2. Показ ключевых слов в результатах.
Каждый раз в списке найденных страниц Гугл показывает отрывок из текста на странице, выделяя в нем ключевые слова. Тем самым облегчается их обнаружение по всему тексту.
Второй способ увидеть ключевые слова – загрузить страницу по ссылке «Сохранено в кэше». Недостаток данного способа (хотя конкурентной разведкой это нередко рассматривается как преимущество) – в том, что вы видите не ту страницу, которая есть сегодня, а т у, которая сохранена в базе Гугла. Изначально эта опция была придумана для того, чтобы сохранить возможность просмотра страницы даже в тех случаях, когда сервер, на котором она расположена, недоступен.
Третий способ – традиционный для просмотра текста в браузере – заключается в использовании сочетания клавиш CTRL+F. В результате должно появиться окно «найти», в которое необходимо ввести искомые слова. Раскладка клавиатуры, установленная в этот момент на компьютере, значения не имеет.
3. Логическое «И».
В отличие от Яндекса, в Гугле всего одно логическое «И», оно наиболее близко к рассмотренному ранее поисковому механизму «&&» в сочетании с оператором «плюс», поставленным перед каждым словом запроса.
Это логическое «И» позволяет выдавать документы, которые принудительно содержат ключевые слова в любом месте текста. По умолчанию при написании слов запроса через пробел Гугл ищет документы, содержащие все слова запроса.
Запрос: [литейщик провизор стоматолог маркшейдер]
Результаты 1 – 10 из примерно 18 для литейщик провизор стоматолог маркшейдер
В выдаче:
Общероссийский классификатор занятий ОК 010-93 (ОКЗ) (утв…
Общероссийский классификатор занятий ОК 010-93 (ОКЗ) (утв. постановлением Госстандарта
РФ от 30 декабря 1993 г. N 298) Russian Classification of Occupations…
Работа для вас в Самаре. Поиск работы, подбор персонала, вакансии…
Медсестра (стоматологический кабинет, ЕТС). Тел. 39-52-53, Адрес: ул… провизор (аптека, в/о,
наличие сертификата, опыт работы в производственной аптеке,…
Интересно, что Гугл может показать и те источники, кoтopые ключевых слов не содержат, однако они присутствуют в ссылках на показанную страницу. В таком случае при просмотре информации с помощью ссылки «Сохранено в кэше» будет видна надпись: «Эти слова присутствуют только в ссылках на эту страницу».
Описанный механизм работы Гугла хорошо виден, если посмотреть ключевые слова на странице сайта о работе в Самаре, сохраненной в кэше.
Эти слова выделены:
литейщик провизор маркшейдер
А это слова присутствеют только в ссылках на страницу:
стоматолог
4. Логическое «ИЛИ».
Оно пишется с помощью оператора OR. Обратите внимание: оператор этот должен быть написан заглавными буквами и отделен пробелами с обеих сторон от слов, расположенных перед ним и после него.
Важно знать, что, в отличие от Яндекса, Гугл не поддерживает такой оператор, как скобки.
Запрос: [литейщик OR провизор OR стоматолог OR маркшейдер]
Результаты 1 – 10 из примерно 2 030 000 для литейщик OR провизор OR стоматолог OR маркшейдер
5. Заглавные буквы или строчные?
В отличие от Яндекса Гугл не различает регистр букв. Все буквы воспринимаются как строчные, вне зависимости от того, как их вводили в поисковую строку. Запросы:
[Эйфелева Башня], [Эйфелева башня] и [эйфелева башня]
дадут одинаковые результаты.
Результат поиска на момент написания книги:
Результаты 1 – 10 из примерно 543 000 для Эйфелева Башня.
Результаты 1 – 10 из примерно 543 000 для эйфелева башня.
6. Стоп-слова.
Во вспомогательных инструкциях (хэлпах) написано, что Гугл, подобно большинству поисковых систем, игнорирует стоп-слова. Кроме того, хэлпы утверждают, будто, как и многие другие поисковики, Гугл имеет механизм принудительного включения стоп-слов в результаты поиска. К таким элементам относится большинство артиклей английского языка, союзов и предлогов русского языка.
В реальности ситуация, похоже, складывается иначе.
Тест: вводим по-русски букву [в]
Результат:
Результаты 1 – 10 из примерно 48 600 000 для в.
Вводим по-английски артикль [the]
Результат:
Результаты 1 – 10 из примерно 8 670 000 000 для the.
7. Оператор «Плюс» (+).
Тем не менее, бывают ситуации, когда надо принудительно включить в текст какое-либо слово, которое может иметь варианты написания. В хэлпе Гугла приводится пример с запросом «Star Wars Episode I», где римская единица представляет собой латинскую букву «I» («ай»). Если сделать запрос просто как:
[Star Wars Episode I], —
то результат будет следующий:
Результаты 1 – 10 из примерно 13 200 000 для Star Wars Episode I.
В том числе в выдаче появятся слова
«Episode II», «Episode IV» и т. п.
Если сделать запрос:
[Star Wars Episode +I], —
то результат будет такой:
Результаты 1 – 10 из примерно 9 290 000 для Star Wars Episode +I.
И в него войдут только тексты, содержащие слово «Episode I».
8. Морфология слов.
Гугл не поддерживает морфологию слов. Их изначально следует вводить в нужных формах. Правда, отчасти это компенсируется интеллектуальной системой поиска, которая может найти нужную словоформу в ссылках на страницу. Чтобы проверить утверждение об отсутствии поддержки морфологии, возьмем такое языковое сочетание, по которому можно увидеть все без исключения результаты. А сочетание следующее: «Глоклая куздра».
Тест:
Запрос:
[глоклая куздра]
Результаты 1–4 из примерно 16 для глоклая куздра.
В выдаче три адреса:
1. www.flame.ws/txt/index.php/t737.html
2. www.dom.no/modules.php?name=Forums&file=viewtopic&p=31986&highlight=
3. www.gb.anekdot.ru/vm.html?file=vm&date=1998-08-07
Запрос:
[глоклую куздру]
Результаты 1–1 из 1 для глоклую куздру.
В выдаче один адрес:
gb.anekdot.ru/vm.html?file=vm&date=1998-08-07
Запрос:
[глоклой куздре]
Результат: Не найдено ни одного документа, соответствующего запросу глоклой куздре.
Правда, это не мешает Гуглу иногда выделять по запросу «площадь» слово «площади» как релевантное. Однако подобное встречается на странице выдачи, но не в кэше.
Просто для сравнения приведем результат Яндекса. По всем трем запросам о «глоклой куздре» система дала на момент написания книги одинаковый результат:
Результат поиска: страниц – 13, сайтов – не менее 5.
9. Улучшение запроса во время поиска.
Поскольку Гугл выдает все слова, которые вы вводите в запросе, имеет смысл составлять новые запросы, содержащие те слова, которые вы забыли ввести в начале поиска, но обнаружили в ходе его выполнения в найденных текстах. В ряде случаев это помогает улучшить результат. Подчеркнем особо – это должны быть именно отдельные запросы. Добавление же новых слов к уже имеющемуся списку порой приводит к излишнему сужению диапазона результатов, ведь Гугл будет пытаться выдать документ, в котором содержатся все искомые слова.
10. Исключение слов из запроса. Логическое «НЕ».
Как известно, часто при составлении запроса встречается информационный мусор. Чтобы его удалить, стандартно используется оператор исключения – логическое «НЕ». В Гугле такой оператор представлен знаком «минус». Здесь он идентичен поисковому механизму Яндекса «двойная тильда» («~~»), исключающему слово из всего документа. Используя его, можно исключать из результатов поиска те страницы, которые содержат в тексте определенные слова.
Тест:
Запрос:
[Журавль колодец]
Результаты 1 – 10 из примерно 778 для Журавль колодец.
Запрос:
[Журавль колодец-птица]
Результаты 1 – 10 из примерно 715 для Журавль колодец – птица.
Запрос:
[Журавль —колодец-птица]
Результаты 1 – 10 из примерно 120 000 для Журавль – колодец – птица.
Запрос:
[Журавль – колодец-птица – птиц]
Результаты 1 – 10 из примерно 106 000 для Журавль – колодец – птица – птиц.
Запрос:
[Журавль – колодец – птица – птиц – журавли]
Результаты 1 – 10 из примерно 104 000 для Журавль-колодец-птица-птиц-журавли.
11. Поиск точной фразы.
Найти точную фразу, как мы уже говорили, требуется либо для поиска текста определенного произведения, либо для поиска определенных продуктов или компаний, в которых название или часть описания представляет собой стабильно повторяющееся словосочетание. В отличие от Яндекса, который может менять формы слов, входящих в текст, заключенный в кавычки, Гугл такой способностью не обладает. Мы отмечали, что эта система словоформы вообще не поддерживает.
Чтобы справиться с поиском точной фразы при помощи Гугла, требуется заключить запрос в кавычки (имеются в виду двойные кавычки, которые применяются, например, для выделения прямой речи).
Забавным, но показательным примером может быть задание из учебника русского языка для 7 класса под ред. Н. М. Шанского, где на стр. 45 предлагается разделить текст на абзацы. Автор – М. Шолохов. Произведение не указано. Приведем фрагмент текста:
[ «За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки.»].
Введем этот текст в кавычках в Гугл и получим следующий результат:
Результаты 1 – 10 из примерно 15 для «За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки».
Как выяснилось, этот фрагмент относится к произведению «Тихий дон» (книга четвертая). Курьез же состоит в том, что у М. Шолохова этот текст оказался вообще не разбитым на абзацы.
Гугл воспринимает в качестве знаков, связывающих слова в единую фразу, не только кавычки, но и такие символы, как дефис, слэш (косая черта), точка, знак равенства, апостроф.
Результаты 1 – 10 из примерно 27 400 для мать-и-мачеха.
Результаты 1 – 10 из примерно 27 300 для мать/и/мачеха.
Результаты 1 – 10 из примерно 27 300 для мать=и=мачеха.
Результаты 1 – 10 из примерно 27 300 для мать.и. мачеха.
Результаты 1 – 10 из примерно 27 300 для мать'и'мачеха.
Во всех вышеприведенных случаях первым в выдаче стоит текст, фрагмент которого приведен ниже:
«Мать-и-мачеха (Tussilago farfara) – одно из самых раноцветущих растений: зацветает в… Как лекарственное растение мать-и-мачеха применяется, прежде всего,…».
При этом все три слова:
«мать», «и», «мачеха» —
рассматриваются как отдельные, но стоящие рядом и в этой же самой последовательности.
Интересно, что по запросу:
[мать-и-мачеха] —
оказалось на 100 документов больше, чем по остальным, но если взять это слово в кавычки, то результат уравнивается:
Результаты 1 – 10 из примерно 27 300 для «мать-и-мачеха».
Чтобы прояснить этот казус, введем следующий запрос:
[мать-и-мачеха «мать-и-мачеха»].
В итоге получим:
Результаты 1 – 10 из примерно 27 для мать-и-мачеха – «мать-и-мачеха».
В выдаче появятся тексты такого содержания:
Санкт-Петербургская Федерация Настольного Футбола Матьимачеха. Королев Петр Трушков Кирилл. 2. Экспромт. Гриневич Василий… Матьимачеха – игроки получают по 60 рейтинговых очков; Экспромт – игроки… www.kickerclub.spb.ru/tournaments/2005-09-03.html– 17k.
12. Количество слов в строке поиска.
Во многих источниках встречается информация, согласно которой поисковая строка Гугла вмещает 10 слов или что Гугл проводит поиск лишь по 10 словам. Проведенный нами эксперимент эти данные не подтвердил. Так, введем запрос из 23 слов:
[крупа мука яйца масло соль перец лук макароны молоко хлеб сметана сахар помидоры рубленое мясо фарш говядина майонез салат огурцы гамбургеры булочки сыр]
Результат:
Результаты 1–3 из примерно 5 для крупа мука яйца масло соль перец лук макароны молоко хлеб сметана сахар помидоры рубленое мясо фарш говядина майонез салат огурцы гамбургеры булочки сыр.
Ресторан. Ru | Кулинария | Кулинарные рецепты | Вторые блюда | С…
(салат, помидоры, огурцы, гамбургеры, булочки, сыр, майонез)… (макароны, лук, перец, помидоры, мука, масло, рубленое мясо, мясной бульон, сыр)…
www.restoran.ru/index.phtml?t=1&pid=2516
В КЭШе подчеркнуты все 23 слова, и в тексте они также присутствуют. Если изменить запрос, используя логическое «ИЛИ» вместо логического «И», то результат прогнозируемо меняется, но все слова в выдаче по-прежнему выделены Гуглом.
[крупа OR мука OR яйца OR масло OR соль OR перец OR лук OR макароны OR молоко OR хлеб OR сметана OR сахар OR помидоры OR рубленое OR мясо OR фарш OR говядина OR майонез OR салат OR огурцы OR гамбургеры OR булочки OR сыр]
Результат:
Результаты 1 – 10 из примерно 3 430 000 для крупа OR мука OR яйца OR масло OR соль OR перец OR лук OR макароны OR молоко OR хлеб OR сметана OR сахар OR помидоры OR рубленое OR мясо OR фарш OR говядина OR майонез OR салат OR огурцы OR гамбургеры OR булочки OR сыр.
13. Стемминг (а также wildcard).
Стемминг – возможность усечения слова до его корня. После усечения слова до его корня производится поиск релевантных вариантов слов, производных от этого корня. Другими словами, стемминг позволяет искать все однокоренные слова.
Техника поиска по маске (wildcard) предствавляет собой написание базового слова (или части слова), после которых идет символ маски – «звездочка» (*), заменяющая собой любое возможное продолжение слова. Таким образом, если поисковая машина поддерживает поиск по маске, то ищутся все слова, которые одинаково начинаются. Эта техника особенно удобна, когда вам неизвестно точное написание конкретного слова, либо когда вы хотите включить все возможные варианты слова в свой поиск. Например, когда по запросу
[тарт*]
получают как «тарталетку», так и «тартар».
Так вот, Гугл эти технологии не поддерживает (как, впрочем, и Яндекс). Зато он поддерживает вариант, когда вместо целого слова вводится звездочка.
Например, по запросу:
[красная * площадь]
будет выдано:
«Красная и Манежная площади»,
с подчеркиванием всех этих слов, в том числе буквы «и». В какой-то степени это похоже на поиск с расстоянием между словами, применяемый в Яндексе. По запросу:
[красная * площадь – «красная площадь»] —
будут получены результаты:
«Красная (Семеновская) площадь»,
где слово «Семеновская» не считается релевантным и не подчеркивается Гуглом.
14. Дополнительные операторы.
14.1. Оператор cache:
Поисковая машина хранит версию текста, которая проиндексирована поисковым пауком, в специальном хранилище в формате, называемом кэшем. Кэшированную версию страницы можно извлечь, если оригинальная страница недоступна (например, не работает сервер, на котором она хранится). Кэширо-ванная страница показывается в том виде, в котором она хранится в базе данных поисковой машины, и при показе пользователю сопровождается надписью наверху страницы о том, что это страница из кэша. Там же содержится информация о времени создания кэшированной версии. На странице из кэша ключевые слова запроса подсвечены, причем каждое слово для удобства пользователя подсвечено своим цветом. Например:
«Это сохраненная в кэше G o o g l e копия страницы http://www.kickerclub.spb.ru/tournaments/2005-09–03.html, записанная 4 янв 2006 06:07:09 GMT.».
Можно создать запрос, который сразу будет выдавать кэшированную версию страницы с определенным адресом: Так, запрос:
[cache:www.bstm.ru]
будет сразу выдавать версию страницы www.bstm.ru из кэша, а не проверять ее нынешнее состояние.
Внимание: пробела между оператором cashe: и URL’ом запрашиваемой страницы быть не должно.
Если вы хотите, чтобы ключевые слова на кэшированной версии страницы были подчеркнуты, их надо через пробел указать после оператора cashe: и адреса страницы.
Например:
[cache:www.bstm.ru библиотека].
14.2. Оператор info:
Оператор info: позволяет увидеть информацию, которая известна Гуглу об этой странице.
Например, запрос:
[info:www.bstm.ru]
дает следующий результат:
BSTM – Бизнес-школа технологий менеджмента | Екатеринбург: Новости phpsm, phpsitemanager… Президентская программа. О программе – Стратегический менеджмент – Менеджмент качества – Маркетинг на предприятии…www.bstm.ru/ Google может показать следующую информацию об этом адресе:
Показать сохраненную в Google версию www.bstm.ru
Найти страницы, похожие на www.bstm.ru
Найти страницы, ссылающиеся на www.bstm.ru
Найти страницы на сайте www.bstm.ru
Найти страницы, упоминающие ссылку «www.bstm.ru»
Внимание: пробела между оператором info: и URL’ом запрашиваемой страницы быть не должно.
14.3. Оператор site:
Этот оператор ограничивает поиск конкретным доменом. То есть, если сделать запрос:
[маркетинг разведка site:www.acfor-tc.ru], —
то результаты будут получены со страниц, содержащих слова «маркетинг» и «разведка» именно в домене «acfor-tc.ru», а не в других частях Интернета. Если сделать запрос:
[scip site: ru], —
то будут получены документы, содержащие слово «scip» и расположенные в доменной зоне «.ru».
Внимание: пробела между оператором site: и URL’ом запрашиваемой страницы быть не должно.
14.4. Оператор link:
Этот оператор позволяет увидеть все страницы, которые ссылаются на страницу, по которой сделан запрос. Например, по запросу:
[link:www.livejournal.com/community/kubok/45852.html] —
будут получены известные Гуглу ссылки на статью о поиске через Яндекс, написанную liveuser.
Внимание: пробела между оператором link: и URL’ом запрашиваемой страницы быть не должно.
14.5. Оператор allintitle:
Если запрос начать с оператора allintitle:, что переводится как «все – в заголовке», то Гугл выдаст тексты, в которых все слова запроса содержатся в заголовках (внутри тега Title в HTML).
Например, запрос:
[allintitle: википедия яндекс] —
даст результаты, где слова «википедия» и «яндекс» содержатся внутри тега Title на просмотренных поисковой машиной страницах. На момент написания статьи результат был таким:
Результаты 1–3 из примерно 7 для allintitle: википедия яндекс.
14.6. Оператор intitle:
Показывает страницы, в заголовке которых содержится слово, расположенное непосредственно после опретора intitle:,; все остальные слова запроса могут находиться в любом месте текста. Если поставить оператор intitle: перед каждым словом запроса, это будет эквивалентно использованию оператора allintitle:
[intitle: википедия яндекс].
На момент написания статьи результат был таким:
Результаты 1 – 10 из примерно 888 для intitle: википедия яндекс.
Внимание: пробела между оператором intitle: и последующим словом быть не должно.
14.7. Оператор allinurl:
Если запрос начинается с оператора allinurl:, то поиск ограничивается теми документами, в которых все слова запроса содержатся исключительно в адресе страницы, то есть в URL.
Так, на момент написания статьи для запроса:
[allinurl: narod razvedka] —
результат был таким:
Результаты 1 – 10 из примерно 14 для allinurl: narod razvedka.
Внимание: оператор allinurl: работает лишь со словами, а никак не со служебными фрагментами URL. Такие специальные символы, как слэш или точка, не окажут положительного влияния на результат. Напротив, влияние будет отрицательным, поскольку они могут быть восприняты Гуглом как попытка ввести в запрос точную фразу.
Например, запрос:
[allinurl: narod.razvedka],
равно как и
[allinurl: narod/razvedka] —
результата не дал вообще.
14.8. Оператор inurl:
Слово, написанное слитно с оператором inurl:, будет найдено лишь в адресе страницы Интернета, а остальные слова – в любом месте такой страницы.
Например, для того, чтобы найти слово «разведка „на сайтах, содержащих в адресе сочетание букв «tc“, можно сделать такой запрос:
[inurl: tc razvedka].
Результат на момент написания статьи:
Результаты 1–1 из 1 для inurl: tc razvedka.
Был представлен следующим текстом:
«Otryady-5
Razvedka okazalas' neskol'ko utomitel'noi (obratno shli V lavirovku). Poetomu k pirsu my podoshli sovershenno izmuchennye: no ne stol'ko samoi razvedkoi…. www-lat.rusf.ru/tc/tc08/08otr5.htm».
Если оператор inurl: поставить перед каждым словом запроса, это будет эквивалентно использованию оператора allinurl:.
Внимание: пробела между оператором inurl: и последующим словом быть не должно. Внимание: оператор inurl: работает только со словами и не работает со служебными фрагментами URL. Такие специальные символы, как слэш или точка, не окажут положительного влияния на результат. Влияние будет отрицательным, так как они могут быть восприняты Гуглом как попытка ввести в запрос точную фразу.
Например, запрос
[inurl: tc/razvedka],
равно как и
[inurl: tc.razvedka] —
результата не дал вообще. Результат мог бы быть, если бы в адресе какой-то страницы содержалась точная фраза «tc/razvedka» или «tc.razvedka».
В этом можно убедиться, введя запрос:
[inurl: kubok].
Результаты 1 – 10 из примерно 28 400 для inurl: kubok.
И этот результат начинается с текста:
«Кубок Яндекса. Как искать эффективно
– Вопросы и ответы
– Предложение организаторам соревнований
– Форум
– Кубок в LiveJournal kubok…kubok.yandex.ru/»
По запросу:
[inurl: kubok/45852]
Результаты 1–2 из примерно 44 для inurl: kubok/45852.
И этот результат начинается с текста:
«kubok: Хозяйке на заметку. Хозяйке на заметку. Материал рассчитан на подготовленного читателя, знающего, что такое стоп-слова и операнды, чем ~~ отличается от && и зачем их…www. livejournal.com/community/kubok/45852.html».
14.9. Оператор related:
Этот оператор описывает страницы, которые «похожи» на какую-то конкретную страницу. Так, запрос
[related: it2b.ru]
дает результат:
Результаты: 1 – 10 из приблизительно 29 подобных it2b.ru.
Мы не считаем, что все страницы действительно подобны странице сайта it2b. ru, с точки зрения человека, а не робота. Хотя некоторые из них действительно посвящены схожей тематике.
На самом деле первым в выдаче стоит сайт it2b.ru, который специализируется на вопросах использования технологий разведки для бизнеса. А вот вторым – сайт компании «SW-Trans», предлагающей услуги по перевозке грузов.
Можем предположить, что основанием для сравнения двух сайтов послужило упоминание на ресурсе грузовой компании услуг по охране маршрутов, их сопровождению машинами со спецсигналами, о предусмотренных в таких случаях пропусках и о «решении всех возможных дополнительных проблем, возникающих при транспортировке». Наряду с транспортной компанией, Гугл включил в «подобные» страницы и такие источники, как журнал «Sales/Business (Продажи)», в котором встречается немало публикаций о предпринимательских рисках и о конкурентной разведке, а также компанию «Информзащита», работающую в области обеспечения информационной безопасности.
Внимание: пробела между оператором related: и последующим словом быть не должно.
14.10. Оператор define:
Этот оператор выполняет роль, своего рода, толкового словаря, позволяющего быстро получить определение того слова, которое введено после оператора.
Например:
[define: разведка].
Результат:
Определения разведка в интернете:
совокупность мер для сбора данных о действительном или возможном противнике.
www.examen.ru/db/Examine/catdoc_id/50EFFB02B0ADF8B2C3256A3A003D797D/rootid/9327995FB7A6D40FC3256A02002CE0D5/defacto.html
Интересная особенность оператора define: состоит в его способности искать толкования конкретных выражений. В качестве фразы он понимает все слова, написанные после оператора, в том числе и без кавычек, просто через пробел. Например:
[define: большой взрыв].
Результат:
Определения большой взрыв в интернете:
Большой Взрыв – взрывной процесс в котором, по данным современной науки, наша Вселенная родилась из так называемой космологической сингулярности.
ru.wikipedia.org/wiki/Большой_Взрыв.
Правда, иногда этот оператор может и повеселить, представив материал, в котором мало кто разберется. Например, по запросу
[define: ложка] —
результат будет следующим:
Определения ложка в интернете:
*блесна, основанная на подражании раненой рыбке.
fisherman.com.ua/files/fishsay.php.
А по запросу:
[define: осел] —
результат такой:
Похожие фразы: буриданов осел
Определения осел в интернете:
*строгий, собранный в кучу, материал
astro.rin.ru/htmls/nostradamus/astro1826-5.html.
ВНИМАНИЕ: наличие или отсутствие пробела между оператором define: и последующим словом на результате не сказывается.
14.11. Поиск синонимов
В хэлпе Гугла сказано, что если вы хотите найти тексты, содержащие не только ваши ключевые слова, но и их синонимы, то можно воспользоваться оператором «~».
Нам не удалось найти подтверждения этому заявлению.
Так, мы сравнили два запроса и не нашли разницы:
[~опережающий ~разведка]
Результаты 1 – 10 из примерно 33 100 для ~опережающий ~разведка.
[опережающий разведка]
Результаты 1 – 10 из примерно 33 100 для опережающий разведка.
14.12. Поиск числовых значений
Для тех, кому приходится работать с цифрами, Гугл дал возможность искать диапазоны между числами. Для того чтобы найти все страницы, содержащие числа в неком диапазоне «от – до», надо между этими крайними значениями поставить две точки.
Например, по запросу
[численность населения 1913..1917]
будут выданы страницы:
Народная энциклопедия городов и регионов России. Города. Санкт… Подчиненные поселки городского типа, численность населения на 1.01.2000… Вскоре после начала Первой мировой войны актом от 18 (31) августа 1914 г… rfdata.al.ru/auto/city/18/667.HTM —
с выделенным числом «1914», а также:
Известия Уральского государственного университета № 9(1998…
За 192 года своего существования с 1723 по 1915 гг. численность населения города увеличилась в 28 раз, достигнув 112 тыс. чел. Следует отметить, что город… proceedings.usu.ru/…/0009(03_05-1998)&xsln=showArticle.xslt&id=a14&doc=../content.jsp
с выделенным числом «1915». Подобный пример приведен в хэлпе Гугла на примере цены DVD:
[DVD player $50..$100].
14.13. Кнопка «Мне повезет» (в английском варианте – «I'm Feeling Lucky»)
Кнопка «Мне повезет» расположена на главной странице Гугла. На наш взгляд, это замечательная идея. По этой кнопке система выдает наиболее релевантный, с ее точки зрения, результат. Обычно это помогает при быстром поиске какой-то фактической информации, когда не требуется подробного изучения вопроса. После нажатия кнопки «Мне повезет» вы попадаете непосредственно на сайт, который Гугл предлагает в качестве искомого. Например, запрос по указанной кнопке:
[активные формы] —
открывает непосредственно сайт одноименной консалтинговой компании
http://www.acfor.ru/.