Skip to content

exxyyf/practicum

Repository files navigation

Portfolio

Здесь собраны некоторые из реализованных мной проектов:

Название проекта / Project title Описание / Description Технологии / Technologies
Предсказание температуры стали / Temperature of steel prediction Processing and analyzing raw production data from sensors to predict steel temperature. After processing on data, different gradient boosting models were trained to achieve MAE, which would justify the application of machine learning in the field.

Обработка сырых данных, градиентный бустинг

Raw Data processing, gradient boosting

Pandas, Seaborn, Numpy, Catboost, LightGBM, Scikit-Learn
Предсказание возраста / Age prediction Создание модели компьютерного зрения для предсказания возраста покупателя по его фотографии. Определение возраста клиентов позволит получить дополнительную информацию для рекомендаций товаров, а также поможет контролировать продажу товаров с возрастными ограничениями.

Training of CNN model for customers' age prediction. It is intended helping the retailer to control the sell of age restricted products and gather analytics by taking anonymous pictures of clients and their purchases near cash desk.
Обработка изображений, нейронные сети

Image processing, Neural networks

Tensorflow, Keras, Numpy, Pandas
Определение стоимости авто / Car price prediction Исследование рынка автомобилей с пробегом для создания быстрой модели, определяющей рыночную стоимость автомобиля, для привлечения клиентов в мобильное приложение по размещению объявлений о продаже авто.

Analysis of second-hand cars market and ML training for prediction of car's current market price for mobile application (used cars marketplace).
Исследовательский анализ данных, подготовка данных для машинного обучения, задача регрессии, бустинг

Exploratory Data Analysis, Data Processing, Regression, Boosting

Pandas, Seaborn, Matplotlib, LightGBM, CatBoost, Scikit-Learn
Модерация комментариев / Comment moderation Использование размеченного датасета с комментариями к википедии для определения токсичных комментариев и отправки их на модерацию.

Usage of marked dataset (wiki comments) and model training for toxic comments moderation on forum.
Обработка естественного языка

Natural Language Processing

Tensorflow, nltk, BERT, huggingfaces, NumPy, LightGBM, CatBoost, Scikit-Learn, Pandas, Seaborn, Matplotlib
Исследование технологического процесса очистки золота / Study of gold recovery process Исследование и обработка сырых производственных данных для улучшения эффективности восстановления золота из руды.

Study and processing of raw data on gold recovery for improvement of gold production efficiency.
Анализ сырых данных, регрессия, кастомные метрики

Raw data analysis, regression, custom metrics

Natural Language Processing

Scipy, NumPy, Scikit-Learn, Pandas, Seaborn, Matplotlib
Прогнозирование заказов такси / Taxi demand prediction Анализ данных временных рядов и создание модели для предсказания пиковой нагрузки по заказам такси в аэропортах для дополнительного привлечения водителей.

Time series data analysis and model creation for prediction of high-demand airport taxi orders, so that company could engage more drivers.
Анализ временных рядов, регрессия

Time series data analysis, regression

Statsmodels, Pandas, NumPy, Scikit-Learn, LightGBM, CatBoost

About

Study projects

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published