Билеты к экзамену
- Векторное представление слов. Модель word2vec
- Векторное представление слов. Модель GloVe
- Векторное представление слов. Матричная факторизация
- Задача классификации текстов. Базовая постановка задачи классификации по тональности. Модель мешка слов для классификации текстов. Tf idf взвешивание
- Задача классификации. Базовые подходы к аугментации текстов. Фреймворк EDA, обратный перевод
- Фреймворк fast text для классификации текстов и для векторного представления слов
- Сверточные сети для классификации текстов
- Задача языкового моделирования. Счетные языковые модели. Преобразование Лапласа
- Задача языкового моделирования. Нейросетевая языковая модель Bengio.
- Задача языкового моделирования. Рекуррентные нейронные сети
- Генерация текста с помощью языковых моделей. Жадный подход (greedy search). Лучевой поиск (beam search)
- Генерация текста с помощью языковых моделей. Перплексия
- Задача теггирования последовательности. Извлечение именованных сущнностей. Методы оценки качества
- Задача машинного перевода. Модель Трансформер
- Перенос обучения в обработке текстов. Модель BERT
- Перенос обучения в обработке текстов. Модель GPT2 (или GPT3)
- Task oriented chat bots. Intent detection, slot filling. Базовые подходы
- Модели свободного диалога. Генеративный подход
- Модели свободного диалога. Подход на основе информационного поиска
- Вопросно-ответные системы. Задача SQuAD. Базовые подходы к решению
- Сжатие предобученных моделей. Прунинг и квантизация
- Сжатие предобученных моделей. Дистилляция. Модель DistilBERT
- Потомки модели BERT. RoBERTa, ELECTRA, ALBERT
- Экстрактивная суммаризация. Алгоритм TextRank
- Абстрактивная суммаризация. Модели BART и T5
- Меры качества в seq2seq задачах. BLEU, ROUGE
- Четыре сценария использования модели BERT
- Zero shot подходы к классификации текстов
- Методы машинного чтения для извлечения именованных сущностей
- Template-based методы для извлечения именованных сущностей
- Задача и методы извлечения отношений
- Перенос обучение между языками. Мультиязычные модели
- Адверсальные атаки, исследование устойчивости языковых моделей.
- Типы адверсальных атак (черный, серый, белый ящики)
- Уровни адверсальных атак (символы, слова, предложения)
- Какие инструменты для работы с английским языком вы знаете?
- Какие инструменты для работы с русским языком вы знаете?