скачать рефераты

скачать рефераты

 
 
скачать рефераты скачать рефераты

Меню

Реферат: Яндекс - основные сведения по популярному индексу скачать рефераты

Реферат: Яндекс - основные сведения по популярному индексу

Введение

История компании "Яндекс" началась в 1990 году с разработки поискового

программного обеспечения в компании "Аркадия". За два года работ были созданы

две информационно-поисковые системы - Международная Классификация

Изобретений, 4 и 5 редакция, а также Классификатор Товаров и Услуг. Обе

системы работали под DOS и позволяли проводить поиск, выбирая слова из

заданного словаря, с использованием стандартных логических операторов.

В 1993 году "Аркадия" стала подразделением компании CompTek. В 1993-1994 годы

программные технологии были существенно усовершенствованы благодаря

сотрудничеству с лабораторией Ю. Д. Апресяна (Институт Проблем Передачи

Информации РАН). В частности, словарь, обеспечивающий поиск с учетом

морфологии русского языка, занимал всего 300Кб, то есть целиком грузился в

оперативную память и работал очень быстро. С этого момента пользователь мог

задавать в запросе любые формы слов.

На основе новой технологии в 1994 году был создан "Библейский компьютерный

справочник" (информационно-поисковая система, обеспечивающая работу с

Синодальным переводом Ветхого и Нового Заветов). В 1995 году стартовал проект

"Академическое издание классиков на CD ROM", разрабатываемый совместно с НТЦ

"Информрегистр" и ИМЛИ им. М.Горького РАН при поддержке Роскоминформа. Для

этого проекта была создана универсальная технология "Аргонавт", которая

включала как средства разметки и отображения текстов, так и средства

навигации, а так же различные поиски - и текстовые, и атрибутные. На основе

этой технологии вышло 3 издания - справочник стандартов "Информ - Норматив",

электронное научное издание "А.С. Грибоедов" и "Пушкин. Электронный фонд

русской классической литературы". Также был создан словарь языка Грибоедова.

В начале 1996 года был разработан алгоритм построения гипотез. Отныне

морфологический разбор перестал быть привязан к словарю - если какого-либо

слова в словаре нет, то находятся наиболее похожие на него словарные слова и

по ним строится модель словоизменения.

В это время Интернет в России только начинался...

1. История Yandex.Ru

Официально поисковая машина Yandex.Ru была анонсирована 23 сентября 1997 года

на выставке Softool. Основными отличительными чертами Yandex.Ru на тот момент

были проверка уникальности документов (исключение копий в разных кодировках),

а также ключевые свойства поискового ядра Яndex, а именно: учет морфологии

русского языка (в том числе и поиск по точной словоформе), поиск с учетом

расстояния (в том числе в пределах абзаца, точное словосочетание), и

тщательно разработанный алгоритм оценки релевантности (соответствия ответа

запросу), учитывающий не только количество слов запроса, найденных в тексте,

но и "контрастность" слова (его относительную частоту для данного документа),

расстояние между словами, и положение слова в документе.

Чуть позже в разделе «Сказки» (наблюдения за содержанием русского Интернета)

появилась первая сказка Рунета — «Web – гуманизм или чернуха?». А в разделе

«Числа» — первая оценка объема Рунета, 5 тысяч серверов и 4Гб текстов.

Через два месяца, в ноябре 1997 года, был реализован естественно-языковый

запрос. Отныне к Yandex.Ru можно обращаться просто «по-русски», задавать

длинные запросы, например: «где купить компьютер», «генетически

модифицированные продукты» или «коды международной телефонной связи» и

получать точные ответы. Средняя длина запроса в Yandex.Ru сейчас — 2,7 слова.

В 1997 году она составляла 1,2 слова, тогда пользователи поисковых машин были

приучены к телеграфному стилю.

В 1998 году на Yandex.Ru появилась возможность «найти похожий документ»,

список найденных серверов, поиск в заданном диапазоне дат и сортировка

результатов поиска по времени последнего изменения. За этот год «объем»

Русского Интернета удвоился, что привело к необходимости оптимизации

поисковых механизмов. И тогда, и сейчас (при объеме в 200 Гб) скорость поиска

на Yandex.Ru — доли секунды.

За 1999 год Рунет вырос на порядок, как в объемах текстов, так и в количестве

пользователей. Это был год бурного развития и для Yandex.Ru. Новый поисковый

робот позволил оптимизировать и ускорить обход сайтов Рунета. Сегодня

поисковая база Yandex.Ru вдвое больше, чем у ближайших конкурентов.

Новый робот позволил предоставить пользователям новые возможности – поиск по

разным зонам текста (заголовкам, ссылкам, аннотациям, адресам, подписям к

картинкам), ограничение поиска на группу сайтов, поиск по ссылкам и

изображениям, а также выделять документы на русском языке. Появился поиск в

категориях каталога и впервые в Рунете было введено понятие «индекс

цитирования» — количество ресурсов, ссылающихся на данный.

В течение всего года продолжалась работа по количественному и качественному

анализу Рунета. Был открыт НИНИ-индекс (индекс «Непостоянства Интересов

Населения Интернет»), показывающий динамику изменения интересов пользователей

Интернета. Открылся поисковый Форум и новый сервис — подписка на запрос, то

есть можно оставить свой запрос на Yandex.Ru и регулярно получать по

электронной почте информацию о появлении новых и/или измененных документов,

соответствующих этому запросу. К началу учебного года был открыт «Семейный

Яndex», фильтрация результатов поиска от мата и порнографии.

2. Яндекс — 2000

В этом году образовалась компания "Яндекс". "Яндекс" был учрежден акционерами

CompTek - компании, создавшей и в течение долгого времени развивавшей проект

Яndex. Компания ru-Net Holdings инвестировала 5 миллионов 280 тысяч долларов

и получила в новой компании долю в 35,72%. В число акционеров входят также

менеджмент и ведущие разработчики поисковой системы. Генеральным директором

стал Аркадий Волож.

В новообразованную компанию перешли все права на торговую марку Яndex и сайт

www.yandex.ru, а также на поисковую технологию Яndex и семейство одноименных

программных продуктов. Кроме того, в "Яндекс" был передан недавно

стартовавший проект www.narod.ru.

В апреле на канале НТВ прошла рекламная кампания Яндекса, в которой впервые

был озвучен слоган "Найдется все!".

В июне открытием нового дизайна сайта Yandex.Ru началась "неделя Яндекса",

каждый день которой был посвящен одному из проектов. Тогда были открыты Почта

Яндекса, Яндекс.Новости, Яндекс.Открытки и Яндекс.Закладки, а также

"аскетический Яндекс" - для тех, кто торопится. Завершилась неделя праздником

Яндекса.

В этом же году Яндекс стал искать не только по веб-страницам, но и по

специализированным ("параллельным") массивам данных - новостям и товарам.

Был открыт свой собственный каталог c новым (фасетным) принципом описания

ресурсов. Его концепция и принципы классификации были разработаны

специалистами Яндекса.

3. Яндекс — 2001

Новый 2001-й год Яндекс ознаменовал акцией «Новогоднее обращение Народа

России к Президенту» и переездом в новый офис с собственной серверной.

В этом году Яндекс стал лауреатом Национальной Интел Интернет Премии, получив

призы в следующих номинациях:

Лучший сайт в области «Сетевые сервисы»

Лучший сайт в области «Рубрикаторы, поисковые системы, каталоги товаров и услуг»

Человек Года: Аркадий Волож

Гран-при Российской академии Интернета

Специальный приз прессы (присуждается журналистским сообществом)

Веб Выбирает Вас (результат общего голосования пользователей Рунета)

Две последние номинации - особые. "Специальный приз прессы" присуждается

журналистским сообществом (400 анкет было разослано региональным

журналистам). "Веб Выбирает Вас" - результат общего голосования пользователей

Рунета.

В апреле Яндекс учредил новое интернет-соревнование — Открытый Кубок России

по поиску в интернете. В чемпионате могут принять участие все желающие,

владеющие русским языком и клавиатурой. Никаких ограничений на использование

инструментов поиска нет. Официальный сайт Кубка — kubok.yandex.ru.

Первый розыгрыш Кубка прошел весной. Более 1000 человек состязались за звание

«Человек, который нашел все», и более 60.000 человек наблюдало за играми.

Второй розыгрыш Кубка состоялся осенью, сайт посетило более 100 тысяч

человек.

Летом этого года Яндекс впервые вышел на первое место в Рунете по объему

аудитории, согласно данным исследовательских компаний Комкон-2 и Gallup

Media.

4. Яндекс — 2002

2002-й год Яндекс встретил информационной компанией новой европейской валюты,

за что получил первый в России наличный евро.

Яндексом был опубликован рейтинг потребительских торговых марок «Выбор

интернета 2001».

По решению Совета директоров был приближен срок выхода на самоокупаемость с

первой половины 2003 года на четвертый квартал 2002, в итоге уже в августе

2002 года было достигнуто превышение доходов над расходами, и в ноябре Яндекс

рапортовал о досрочном выходе на самоокупаемость.

Весной Яндекс зафиксировал объем русского интернета, равный одному терабайту

(2 в 40 степени байт).

Летом Яндексу был делегирован домен yandex.com, отобранный у

недобросовестного владельца. Это послужило началом борьбы Яндекса с

киберсквотингом.

«Яндекс» и группа компаний PayCash вывели на рынок новую систему цифровой

наличности Яндекс.Деньги, задачей которых стало создание в российском

интернете универсальной платежной среды.

Был внедрен новый сервис Яндекс.Почты - фильтрации массовых рассылок (bulk

mail).

В октябре на Яндексе был открыт официальный сайт проекта «Фабрика звезд»

(Первый канал) в формате «реальное шоу», таким образом Яндекс опробовал

взаимодействие трех информационных сред: телевидения, телефонии и интернета.

Тогда же стартовал розыгрыш III Открытого Кубка России по поиску в интернете.

Завершением 2002 года стало открытие нового торгового центра - Яндекс.Маркет,

который объединил все разработки Яндекса в сфере электронной коммерции —

Подбери, Товары и Гуру.

5. Яндекс — 2003

2003 — первый Новый год, который Яндекс встретил как самоокупаемая компания.

В этом же году Совет директоров компании "Яндекс" принял решение о выплате

дивидендов – первых в российском интернете.

Яндекс.Почта предоставила пользователям возможность выбора: смотреть или не

смотреть рекламу, освободила миллион неиспользуемых имен (логинов), а во

втором полугодии - удвоила размер почтового ящика и объявила борьбу со спамом

своей приоритетной задачей.

Яндекс научился находить документы не только в формате HTML, но и в форматах

RTF, PDF и DOC, а также заявил, что готов давать каждому жителю страны по

одному ответу в месяц - количество ответов Яндекса на поисковые запросы

превысило 147 миллионов.

На официальном сайте Президента России была запущена поисковая система

Яndex.Site.

По лицензии "Яндекса" был успешно проведен израильский Кубок по поиску в

интернете, организованный Яндексом и компаниями кабельного телевидения.

Летом служба Яндекс.Новости радикально преобразилась. Пользователям был

предложен совершенно новый и оригинальный сервис: автоматическое объединение

содержательно близких новостей в сюжеты и выделение главных тем дня.

Яндекс в очередной раз изменил дизайн главной страницы и страницы выдачи

результатов поиска, но в этот пользователям была предоставлена возможность

протестировать новый дизайн до его окончательного внедрения и высказать свое

мнение.

В октябре прошел традиционный, четвертый по счету, розыгрыш Открытого Кубка

России по поиску в интернете.

Яндекс выпустил новую серию поисковых решений: Яndex.Server, Яndex.Publisher

и Яndex.SDK.

В ноябре служба автоматического размещения контекстных объявлений

Яндекс.Директ перешла на новую модель работы: оплату по кликам.

Яндекс открыл экспорт результатов поиска в формате XML.

Компании «1С», «Никита» и «Яндекс» запустили первую российскую онлайновую

многопользовательскую игру «Сфера».

6. Яндекс — 2004

2004 год принес компании «Яндекс» утроение рекламных оборотов. Основной

движущей силой стала поисковая реклама («Купи слова»), которая составила 80%

оборота.

В этом году существенное внимание было уделено регионам. Проект Яндекс.Города

привлек много новых партнеров. Проведена «регионализация» проектов — Новостей

и Маркета. В 9 городах России прошло 10 семинаров Яндекса, которые посетило

более 1000 слушателей. 100 человек были сертифицированы Яндексом как

специалисты по интернет-рекламе.

Компания «Яндекс» приняла участие в создании Национального корпуса русского

языка и учредила научные стипендии в области автоматической обработки веб-

данных.

Поиск Яндекса научился понимать новые форматы файлов — PDF, DOC, RTF, Flash,

XLS и PPT. Среди новых сервисов стоит отметить поиск по Картам и поиск по

блогам и форумам.

На Яндекс.Почте внедрена защита от спама — Спамооборона и предложен

неограниченный размер почтового ящика.

Новый проект Яндекс.WiFi стимулировал развитие бесплатного беспроводного

доступа в интернет. За полгода Яндекс.WiFi стал крупнейшей сетью хот-спотов

России, к ней подключилось более 50-и участников.

7. Результаты поиска

После того, как вы задали запрос, Яндекс выведет список ссылок на документы,

наиболее точно ему соответствующие. На этой странице результатов вы

обнаружите некоторые специальные обозначения и ссылки, предназначенные

облегчить просмотр и сортировку найденных страниц. Ниже приведен общий вид

страницы результатов.

1. Поисковая форма. Главный ее элемент - строка запроса. При желании можно

искать только в результатах предыдущего поиска ("искать в найденном"). Можно

также задать запрос по любому из источников информации ("Рунет", "Новости",

"Товары", "Энциклопедии", "Картинки").

2. Статистика поиска: число найденных документов и частота заданных в запросе

слов. По ссылке "страниц" можно перейти на несгруппированную по серверам

выдачу.

3. Рубрики каталога . По нажатию на ссылку происходит переход в

соответствующий раздел каталога (выводится только при точном соответствии

запросу).

4. Результаты поиска по вебу. Для каждого документа выдается следующая

информация: заголовок - ссылка на ресурс, [Показать найденные слова] -

переход на "подсвеченный" документ, в котором контекст запроса выделен

стрелочками, поиск похожего документа и, если найденный сайт описан в

каталоге, переход в рубрику каталога. Кроме этого, информация о размере,

кодировке и, дате документа, его URL.

5. Переход на следующие страницы результата. Сортировка по убыванию дат.

6. "Колдунщик запросов". Здесь даются советы и предложения по уточнению

вашего запроса. Можно сузить поиск по рубрике каталога или по региону.

7. Популярные находки наших пользователей - ссылки на документы (не с первой

страницы результатов!), выбранные пользователями по этому запросу (выводится

только при точном соответствии).

Реферат: Яндекс - основные сведения по популярному индексу

8. Возможность поискать в других русскоязычных поисковых машинах.

9. Результат поиска в новостных лентах информационных агентств (выводится

только при точном соответствии запросу). При высоком соответствии и

актуальности эта секция может оказаться над результатами поиска по вебу.

10. Ссылки на прочие службы Яндекса.

11. Результат поиска в энциклопедических статьях (выводится только при точном

соответствии запросу).

12. Результат поиска в базе товарных предложений магазинов (выводится только

Страницы: 1, 2, 3