Материалы для студентов цифровой кафедры МИРЭА x РНИМУ.
Документ Demo.Rmd содержит пример последовательной работы с данными с целью построения модели. В отличии от исследовательского подхода в документе рассматривается меньшее число операций по изучению данных – оставлены необходимые для принятия решений операции. Оптимизируется подход к выбору итоговой конфигурации модели. Внимание уделяется диагностике качества модели.
Это далеко не все интересные датасеты, однако, их отливает достаточно большое число предикторов и четкость задачи.
Regression
Classification
- Heart Attack Analysis & Prediction Dataset – использован в Demo
- Fetal Health Classification
- Gene expression dataset (Golub et al.)
- Mushroom Dataset (Binary Classification)
Imaging data
Sequence
NLP
Longitude
Research / Data visualisation