Google

  • 19 дек. 2012 г.
  • 1823 Слова
Введение

Google (МФА [ɡuːɡl][2][3], MWCD /ˈgü-gəl/[4], рус. Гугл) — поисковая система, принадлежащая корпорации Google Inc.
Первая по популярности (84,65 %[5]), обрабатывает 41 млрд 345 млн запросов в месяц (доля рынка 62,4 %).[6][7], индексирует более 8 миллиардов веб-страниц, может находить информацию на 191 языке (c 15 октября 2009).
Поддерживает поиск в документах форматов PDF, RTF,PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других.

1. История создания

Поисковая система Google была создана в качестве учебного проекта студентов Стэнфордского университета Ларри Пейджа и Сергея Брина. Они в 1996 году работали над поисковой системой BackRub, а в 1998 году на её основе создали поисковую систему Google.
Хотя корпорация была основана 4 сентября 1998 года,а домен Google.com зарегистрирован 15 сентября 1997 года, поисковик (с 2005 года) иногда отмечает свой день рождения и в другой день: как 7, так и 27 сентября[8][9].
Название Google произошло от неправильного написания слова Гугол (Googol) Сергеем Брином, которое означает десять в сотой степени — 10100.

2. Индексация сайтов

Поисковый робот Google имеет User Agent — Googlebot (Поисковыйробот), который является основным роботом, сканирующим содержание страницы для поискового индекса. Помимо него существуют ещё несколько специализированных роботов:
• Googlebot-Mobile — робот, индексирующий сайты для мобильных устройств,
• Google Search Appliance (Google) gsa-crawler[10] — поисковой робот нового аппаратно-программного комплекса Search Appliance,
• Googlebot-Image — робот,сканирующий страницы для индекса картинок,
• Mediapartners-Google — робот, сканирующий контент страницы для определения содержания AdSense,
• Adsbot-Google — робот, сканирующий контент для оценки качества целевых страниц AdWords.
Существует теория эффекта песочницы, которая утверждает, что сайты, которые имеют новые доменные имена, частые смены владельцев или нэймсерверов, помещаются в«песочницу» (зону ожидания) и пребывают там, пока механизм Google не сочтёт сайт готовым из неё выйти.
Также существует обратная теория, называющаяся «бонус новичка», в которой при первоначальной индексации сайта, в силу некоторых аспектов (например нескольких ссылок с авторитетных ресурсов), сайту сразу присваивается высокий Page Rank и хорошие места в поисковой выдаче. По истечении некоторого времени,после снятия этого эффекта сайту присваиваются его реальные показатели.[источник не указан 399 дней]

2.1. Проблемы с авторскими правами

KaZaA и Церковь Сайентологии использовали Закон об авторском праве в цифровую эпоху (DMCA), чтобы потребовать от Google удалить ссылки на материалы на их сайтах якобы защищённые авторским правом.[11][12] Google по закону обязан удалить эти ссылки, но вместотого, чтобы убрать результаты поиска, предпочитает связать результаты с жалобами, которые подали эти организации.[12]
New York Times жаловалась на то, что кэширование их содержания поисковым роботом — особенность, используемая поисковиками, в том числе Google Web Search, нарушает авторские права.[13] Google соблюдает стандартные Интернет-приёмы для запросов об отключении кэширования посредствомфайла robots.txt — стандартного механизма, позволяющего администраторам веб-сайта потребовать исключения своего сайта или его части из результатов поиска — или через мета-теги, позволяющие редактору контента указать, можно ли индексировать или архивировать документ и можно ли проходить по ссылкам в документе. Окружной суд США штата Невада постановил, что кэши компании Google не нарушают авторскихправ согласно американскому законодательству в делах Field v. Google и Parker v. Google.[14][15]

3. Алгоритм ранжирования

Мета-тег Keywords не учитывается при ранжировании сайтов.[16]

3.1. PageRank

Google использует алгоритм расчёта авторитетности PageRank. PageRank является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска. PageRank не...
tracking img