Информационный поиск. Архитектура web-поиска

Техносфера Mail.ru Group, МГУ им. М.В. Ломоносова. Курс «Современные методы и средства построения систем информационного поиска».
Лекция №8 «Архитектура web-поиска. Текстовое ранжирование».
Лектор — Алексей Воропаев.

Логическая схема поисковой машины. Поисковый кластер. Индексация. Булев поиск. Вычисление веса. Коэффициент Жаккара. Частотная матрица. Модель «мешка слов». Частота термина. Логарифмическое взвешивание. Документная частота. IDF. Документы как векторы. Методы оптимизации текстового ранжирования. Термины с большим IDF. Документы с большим количеством терминов из запроса. Статические веса, общий вес. Эшелоны. Кластеризация индекса. Параметрические индексы и зоны. Поля (числовые зоны). Индексы для зон. Компактность вхождения. Вероятностный поиск. Использование языковых моделей при поиске. Варианты сравнения моделей. Правдоподобие запроса и документа. Сравнение моделей. Обратная связь по релевантности. Бинарная вероятностная модель. Байесовы сети в задаче ранжирования.

Другие лекции курса | https://www.youtube.com/playlist?list=PLrCZzMib1e9rIikWB2NlBUF1z7HvaO_IO
Наш видеоканал | http://www.youtube.com/user/TPMGTU?sub_confirmation=1
Официальный сайт Технопарка | https://tech-mail.ru/
Официальный сайт Техносферы | https://sfera-mail.ru/
Технопарк в ВКонтакте | http://vk.com/tpmailru
Техносфера в ВКонтакте | https://vk.com/tsmailru
Блог на Хабре | http://habrahabr.ru/company/mailru/

#ТЕХНОПАРК
#ТЕХНОСФЕРА

x