Курс Machine Learning для людей
- Online
- Для початківців
- Data Science / Machine learning / AI
![]() |
|
| Навчальний центр: | Data Loves Academy |
|---|---|
| Формат: | Курс |
| Мова викладання: | Ukrainian |
| Тривалість навчання: | 8 місяців |
| Початок курсу: | 28.04.2026 |
| Вартість навчання: | Уточнюйте |
Навчитеся будувати рішення з використанням моделей машинного навчання з допомогою Python для табличних і текстових даних. Зможете підбирати класну модель для даних і розумієте, як пріоритезувати експерименти в ході дослідження. В кінці ви будете мати оформлене резюме, портфоліо, LinkedIn, пройдете тестову співбесіду та будете розуміти, якими мають бути ваші покрокові дії аби досягнути своєї мети: знайти роботу в IT в напрямку Machine Learning або почати використовувати ML в своєї поточній роботі.
Програма курсу
Модуль 0. Основи Python для Data Science
- Змінні, типи даних та базові операції з числами й рядками
- Структури даних: списки, словники, кортежі та їх практичне застосування
- Умовні конструкції та цикли для автоматизації обробки даних
- Функції: створення, параметри та організація коду
- Ключові бібліотеки: NumPy, Pandas, Matplotlib для роботи з даними та візуалізацією
Модуль 1. Вступ до Data Science
Світ штучного інтелекту
- Що таке машинне навчання та як навчаються моделі
- Навігація в світі методів машинного навчання
- Процес розв'язку Data Science задач та інструменти для DS рішень
Дослідницький Аналіз Даних
- З чого почати дослідницький аналіз даних
- Обробка відсутніх значень та аналіз викидів
- Аналіз залежностей між категоріальними змінними
Бонусний модуль. Контроль версій коду. Git
- Що таке Git та чому він такий популярний. Встановлення і конфігурація
- Команди: робота з репозиторієм
- Гілки, pull-ріквести, merge та кращі практики коміту коду
- GUI, історія комітів та що не варто комітити
Модуль 2. Навчання з учителем
Лінійна та поліноміальна регресія. Методи оцінки точності прогностичної моделі
- Тестування статистичних гіпотез
- Підведення до задачі лінійної регресії
- Статистичні методи перевірки на гаусовість
- ЦГТ і пошук змінних-кандидатів для побудови лін. регресії
- Поняття лінії та пошук найкращої лінії, яка описує дані
- Вступ до лінійної алгебри. Робота з матрицями і векторами
- Математичне формулювання задачі лінійної регресії
- Припущення лін. регресії. Метод найменших квадратів
- Вимірювання якості регресійної моделі
- Градієнтний спуск для задачі лінійної регресії
- Лінійна регресія багатьох змінних. Виявлення статистичної значущості коефіцієнтів
- Використання категоріальних змінних у моделі машинного навчання
- Удосконалення моделі
Задача класифікації. Логістична регресія. Принцип роботи та методи оцінки якості
- Задачі класифікації. Математичне формулювання логістичної регресії
- Моделювання поліноміальної регресії
- Методи регуляризації в машинному навчанні
Розв'язок ML задачі step-by-step
- Задача класифікації з Scikit-Learn. Завантаження даних з Kaggle. Заповнення пропущених значень
- Масштабування числових ознак
- Навчання логістичної регресії в scikit-learn та оцінка якості класифікатора
- Класифікація нового значення. Збереження і завантаження моделі. Sklearn Pipelines
Стратегії вирішення дисбалансу класів у машинному навчанні
- Проблема дисбалансу класів. Random oversampling, undersampling та метод SMOTE
- Метод Adasyn, зв'язки Томека і комбінування oversampling з undersampling
Мультикласова та мультизначна класифікація
- Ансамблі моделей. Базові техніки
- Задачі мультикласової і мультизначної (multi-label) класифікації
- Вимірювання якості мультикласової класифікації. Приклад мультиклас і мультилейбл класифікації на даних
Дерева прийняття рішень
- Вступ до дерев прийняття рішень
- Принцип побудови дерев прийняття рішень
- Вибір критерія розбиття в процесі побудови дерева
- Умови зупинки в побудові дерева. Prunning. Як витягнути конкретні правила з дерева
- Майстер-клас з перенесення коду з jupyter notebook у Python модуль
- Навчання Decision Trees на практиці
Методи ансамблювання. Кросвалідація
- Метод крос-валідації для покращення якості моделі
- Оптимізація гіперпараметрів
- Класифікатор kNN (k-найближчих сусідів)
- Ансамблі моделей. Базові техніки
- Використання просунутих методів ансамблювання: Stacking та Bagging + MK з аналізом помилок класифікації
- Просунуті методи побудови ансамблів
- Алгоритми бустингу. Adaboost
- Градієнтний бустинг. XGBoost, LightGBM. Вибір алгоритму під задачу
- Демо використання бустингових моделей. Тюнінг гіперпараметрів з hyperopt
Аналіз часових рядів
- Вступ в аналіз часових рядів. Компоненти часових рядів
- Аналіз якості передбачень часових рядів. Автокореляція і часткова автокореляція в часових рядах
- Поняття стаціонарності. Знайомство з базовим функціоналом бібліотеки Darts
- Методи прогнозування часових рядів та їх застосування. Бейзлайн моделі для часових рядів. Exponential smoothing
- Моделі ARIMA/SARIMAX та Theta
- Facebook Prophet, RNN/LSTM, трансформери для прогнозування time series. Розгляд часових рядів з іншою природою
- Backtesting і аналіз помилок в аналізі часових рядів
Модуль 3. Навчання без учителя
Алгоритми кластеризації
- Вступ до алгоритмів кластеризації у Machine Learning
- KMeans: принцип роботи алгоритму та як визначити оптимальну кількість кластерів
- Ієрархічна кластеризація
- Метод кластеризації DBSCAN. Silhouette метрика для оцінки якості кластеризації
Методи пониження розмірності
- Вступ до пониження розмірностей даних у машинному навчанні
- Принцип роботи PCA
- Прикладне використання PCA. Візуалізація, зниження шуму, стиснення зображення та аналіз даних за допомогою PCA
- Побудова PCA вручну. Нелінійний алгоритм t-SNE
Основи побудови рекомендаційних систем
- Collaborative Filtering і принципи побудови рек. систем
- Рек. системи з fastai
Mini-term проєкт після 3-го модуля
Продемонструєте всі набуті навички з EDA, препроцесингу, вибору метрик, моделювання та інтерпретації результатів.
Модуль 4. Deep Learning & NLP
Вступ у NLP
- Вступ до Natural Language Processing
- Основи класифікації тексту
- Попередня обробка тексту та навчання ML моделі для класифікації
- Аналіз якості класифікації тексту
- Векторизація тексту за допомогою TF-IDF
Парсинг та аналіз тексту
- Робота з HTML та веб-сторінками. Парсинг та аналіз вакансій
- Принцип роботи PПобудова WordCloud. Очищення тексту з ChatGPTCA
- N-грами для аналізу мови
Вступ у Deep Learning
- Вступ до нейронних мереж
- Вступ у PyTorch. Backpropagation
- Будуємо першу нейронну мережу з PyTorch
- Feed-forward Neural Networks
Глибоке навчання для моделювання послідовностей
- Моделювання послідовностей. Принцип роботи рекурентних нейронних мереж
- Як влаштована RNN всередині
- Критерії дизайну рекурентних нейронних мереж
- RNN з 0: задача і кодування вхідних даних
- RNN з 0: тренування моделі
- Процес роботи з RNN "по-дорослому": обробка моделі на простих даних і дебаг моделі
- Тренування та аналіз моделі з PyTorch RNN-cell
- Розпаралелювання обробки послідовностей у нейронних мережах. Архітектура трансформера
Модуль 5. Основи деплойменту
- Вступ до MLOps
- Що необхідно врахувати після готовності моделі
- Способи розгортання ML моделі
- Практичний гайд з деплою ML-моделі на Streamlit
Модуль 6. Створення додатків на основі LLMів
- Алгоритм створення додатків з використанням мовних моделей
- Використання LLMів з бібліотекою Langchain: Промпти і ланцюги
- Langchain Agents
- Робота з пам'яттю в Langchain
- Моделі Hugging Face: Порівняння мовних моделей в Langchain
- Побудова додатку з використанням Retrieval Augmented Generation (RAG)
- Майстер клас "Побудова мультиагентних систем з LangGraph"
Модуль 7. Працевлаштування
- Як створити ексклюзивне резюме
- LinkedIn, який працює на вас
- Оформлення WOW-портфоліо для Data Science спеціаліста
- Огляд платформи для пошуку роботи Djinni. Реєстрація. Пошук вакансій
- Лайфхаки успішного проходження співбесід
- 250+ питань до технічної співбесіди з відповідями
- Гайд "Платформи для пошуку фріланс-проєктів і фултайм роботи в Україні і країнах Європи"
Додатковий модуль SQL
Основи SQL та Реляційних баз даних
- Що таке SQL та реляційна база даних?
- Термінологія, Зв'язки та Діалекти в SQL
- Синтаксис SQL
- Як користуватись SQL Practice. Приклади найпростіших запитів
Практика роботи з даними в SQL
- Запити з однієї бази. Фільтрація
- Робота з рядками та датами
- Домашнє завдання №1 на практику SQL
- Робота з JOINs: Пояснення та перші приклади
- Використання JOIN та CASE WHEN
- Об'єднання за допомогою UNION
- Домашнє завдання №2 на практику SQL
Підключення до бази даних в Python
- Завантаження бази даних локально
- SQL-скрипт та SQL Client
- Підключення до бази в Python: connection, cursor
- Домашнє завдання №3 Python + SQL
- Читання даних за допомогою Pandas
- INSERT, DELETE, UPDATE та close connection
- Classicmodel database (orders)
- Бонус. SQL in Pandas
- Домашнє завдання №4 Pandas + SQL
Фінальний проєкт
- Студенти обирають цікавий для себе набір даних
- Роблять дослідження, візуалізацію даних
- Створюють інтерактивні дашборди
- Використовують SQL, Python, BI-інструмент
- Роблять оформлення за рекомендаціями
Особливості курсу
- Продумана проєктно-орієнтована програма, після якої дійсно можна працевлаштуватись на позицію Machine Learning Engineer в ІТ
- Короткі уроки до 30 хв з практикою після кожного невеликого блоку
- Зручна платформа: всі уроки, домашки, тести і перевірки ДЗ в одному місці
- Супровід на кожному етапі
- Практика на даних як В РЕАЛЬНІЙ РОБОТІ - НЕіграшкові набори даних. Це основний недолік більшості курсів, що люди вчаться на іграшкових даних, а потім в реальному житті нічого не можуть зробити. В мене не так
- 2 рази на тиждень QA зідзвони для обговорення питань та прибирання блокерів
- За курс ви розв'яжете більше 23х повноцінних ML задач в лекціях і в ДЗ й отримаєте ДУЖЕ детальний розбір
- Окремий модуль з працевлаштування - все, що потрібно знати, аби знайти роботу
- Сертифікат про проходження курсу
Викладачі курсу
Ганна Пилєва - Senior Machine Learning Engineer, Consultant
Категорії курсу
Читайте нас в Telegram, щоб не пропустити анонси нових курсів.
