Анализатор мнений в онлайн-медиа

Задача
Существует ли свободное мнение? А действительно ли оно свободное? Ученые в социальных науках работают над моделями динамической эволюции мнений, но проверять их невообразимо сложно - порою ресурсы исследователей достаточны лишь на то чтобы посадить 30 человек в одну комнату, заставить их спорить и записывать в книжечку всё, что происходит.

У нас родилась закономерная идея: мы живем в эпоху больших данных и нескончаемых холиваров, почему бы не взять лучшее из обоих миров? Технологии из мира анализа больших данных и Natural Language Processing и тысячи и тысячи комментариев и постов из социальных сетей! Мы предлагаем помочь исследователям и с помощью современных подходов NLP разработать анализатор мнений в дискуссиях в онлайн социальных сетях.
Кураторы
Сергей Березин
Инженер-исследователь,
МФТИ, лаборатория бизнес-решений на основе ИИ
Алексей Медведев
Исследователь,
Université Catholique de Louvain, ICTEAM
Что вы узнаете?
Natural Language Processing
В процессе работы вы познакомитесь с современными подходами в Natural Language Processing: техниками автоматического тематического анализа текстов, языковыми моделями на основе нейросетей и методами кластерного анализа.

Развертывание моделей машинного обучения
Если позволит время, сможете сделать простой веб интерфейс для анализатора и опубликовать его на бесплатной хостинг платформе Heroku.
Требуемые навыки
Знание Python, Jupyter, scikit-learn. Общее представление о машинном обучении и о том, с чем его едят. Опыт щупания Tensorflow (Keras), PyTorch. Круто если Элмо, Берт и Эрни знакомы тебе не только из передачи "Улица Сезам".