024. Малый ШАД — Частотные словари и законы распределения лингвистических данных — Ольга Ляшевская
Ольга Ляшевская, кандидат филологических наук, профессор Школы лингвистики НИУ ВШЭ, старший научный сотрудник отдела корпусной лингвистики и лингвистической поэтики Института русского языка им. В.В.Виноградова РАН, разработчик Национального корпуса русского языка.
Частотные словари используются в самых разных областях — от разработки компьютерно-лингвистических систем до преподавания иностранных языков, от установления авторства произведения до составления лингвистических игр. Как составить частотный словарь? Какие параметры исходного корпуса текстов нужно учесть? Как интерпретировать данные частотного словаря? Как отличается распределение имен собственных и нарицательных, распределение простых и синтаксических N-граммов? Об этом и многом другом вы узнаете на лекции.
Лекция пройдет в рамках академического проекта Яндекса для школьников — Малого ШАДа. Малый ШАД — лекторий для старшеклассников, которым интересны информационные технологии. Занятия лектория, посвящённые информатике, математике, лингвистике и смежным областям знаний ведут преподаватели лучших вузов и школ страны, учёные и специалисты IT-компаний. Подробнее о лектории можно узнать https://academy.yandex.ru/events/m/mshad15/