Зимняя IT-школа CompTech

Генетическое зельеварение

Задача
В этом проекте тебе предстоит создать генетический алгоритм генерации полезных признаков для таблиц с числовыми данными. Алгоритм будет реализован на языке python с использованием фреймворка DEAP. Алгоритм должен создавать признаки, улучшающие результаты работы линейной модели классификации.
Куратор
Никита Радеев
Machine Learning Engineer,
Новосибирский Исследовательский центр
ООО "Техкомпания Хуавей"
https://t.me/rdvnkt
https://vk.com/alyambr
rdvnkt@yandex.ru
Чему ты научишься?
Изучишь метод генетической оптимизации
Получишь опыт исследований в области машинного обучения
Узнаешь рецепт зелья богатства
Требуемые навыки
  • Python
  • Базовое знание ML (достаточно знаний для табличных данных)
  • Опыт работы с библиотеками для ML (scikit-learn, pandas, numpy, sklearn, seaborn и т.п.)
  • Знакомство с генетическими алгоритмами будет приятным бонусом
Дополнительные материалы
  • Книга «Генетические алгоритмы на Python» Эйял Вирсански
  • Smith, M., Bull, L., 2003. Feature Construction and Selection Using Genetic Programming and a Genetic Algorithm. https://doi.org/10.1007/3-540-36599-0_21
  • Tran, B., Xue, B., Zhang, M., 2019. Genetic Programming for Multiple-Feature Construction on High-Dimensional Classification. Pattern Recognition 93. https://doi.org/10.1016/j.patcog.2019.05.006
  • Tran, B., Xue, B., Zhang, M., 2016. Genetic programming for feature construction and selection in classification on high-dimensional data. Memetic Comp. 8, 3–15. https://doi.org/10.1007/s12293-015-0173-y