009. Малый ШАД — Корпусные исследования языка — Владимир Селегей

Владимир Селегей, директор по лингвистическим исследованиям компании ABBYY, заведующий кафедрами компьютерной лингвистики РГГУ и МФТИ, председатель оргкомитета конференции по компьютерной лингвистике «Диалог».

В современной лингвистике самые важные методы исследования языка связаны с использованием текстовых корпусов — больших и очень больших коллекций текстов, которые помогают лингвистам выявлять новые факты о языке и проверять предположения о тех или иных аспектах его устройства и использования.

Корпусные методы — важнейшие инструменты компьютерной лингвистики. Именно они помогают компьютерным системам учиться решать большинство практических задач по анализу языка. Таким образом, языковые корпуса нужны всем — и поэтому очень важно создавать и использовать их правильно, чтобы результаты были надежными. Обо всём этом и пойдет речь в лекции.