- Регистрация
- 26.05.2022
- Сообщения
- 23 592
- Реакции
- 55
- Баллы
- 48
Профессия Data Scientist [2022]
OTUS
Мария Тихонова, Антон Витвицкий
Освойте новое направление и станьте востребованным специалистом!
Кто такой Data Scientist?
Data Science - это сфера, связанная с обучением умных моделей, которые учатся находить закономерности в данных и выявлять зависимости.
Data Scientist - тот самый супергерой, который обучает эти модели и с их помощью делает полезные для бизнеса выводы и прогнозы.
Что даст вам этот курс?
Профессия Data Scientist - это плавное погружение в мир Data Science. В результате обучения вы познакомитесь со всеми необходимыми инструментами, чтобы стать востребованным специалистом. По итогу вы сможете выбрать наиболее интересное направление для дальнейшего развития: классический ML, нейронные сети, компьютерное зрение, NLP (Natural Language Processing), рекомендательные системы, графовые методы.
Вы освоите:
1. Математическую базу. Вы научитесь применять математический анализ, линейную алгебру, теорию вероятности и статистику для задач анализа данных и машинного обучения,
2. Работу с Python и библиотеками NumPy, Sklearn, SciPy, Pandas, Matplotlib и многими другими,
3. Построение моделей машинного обучения,
4. Работу с нейронными сетями с использованием PyTorch и PyTorch Lightning,
5. Основы работы с компьютерным зрением,
6. Основы работы с NLP.
На кого рассчитан курс?
1. Новички, кто хочет войти в сферу Data Science с нуля,
2. Аналитики,
3. Программисты на любых языках.
Содержание
Модуль 1 - Математика для DS + Программирование на Python + Python для ML
Тема 1. Введение в математику для DS (M)
Тема 2. Матрицы (M)
Тема 3. Диагонализация матрицы (M)
Тема 4. Собственные числа и собственные значения матрицы (M)
Тема 5. Матричные разложения: SVD, ALS (M)
Тема 6. Производные матриц (M)
Тема 7. Настройка окружения для работы. Базовые типы и структуры данных. Управление потоком (P)
Тема 8. Работа с функциями и данными (P)
Тема 9. Git, shell (P)
Тема 10. Основы ООП (P)
Тема 11. Продвинутый ООП (P)
Тема 12. Модули и импорты (P)
Тема 13. Тесты (P)
Тема 14. Знакомство со встроенными модулями (P)
Тема 15. Файлы и сеть (P)
Тема 16. Дифферецируемость. Функции многих переменных. производная и градиент. (M)
Тема 17. Дифференцирование и оптимизация функций (M)
Тема 18. МНК и ММП (M)
Тема 19. Случайные события, вероятность (M)
Тема 20. Случайные величины и их моделирование (M)
Тема 21. Проверка гипотез (M)
Тема 22. Проверка гипотез в А/В тестировании (M)
Тема 23. Основы NumPy (PML)
Тема 24. Основы Pandas (PML)
Тема 25. Визуализация данных (PML)
Модуль 2 - Основы Машинного обучения
Тема 26. Занятие «Введение в машинное обучение»
Тема 27. Занятие «Exploratory Data Analysis and Preprocessing» (EDA)
Тема 28. Задача регрессии. Линейная регрессия.
Тема 29. Линейная регрессия. Градиентный спуск.
Тема 30. Задача классификации. Метод ближайших соседей
Тема 31. Логистическая регрессия
Тема 32. Деревья решений
Тема 33. Ансамбли моделей
Тема 34. Градиентный бустинг
Модуль 3 - Продвинутые методы классического ML (ML) + Deep Learning I. Знакомство с нейронными сетями (DL)
Тема 35. Метод опорных векторов (ML)
Тема 36. Методы уменьшения размерности (ML)
Тема 37. Обучение без учителя. K-means, иерархическая кластеризация DBSCAN (ML)
Тема 38. Поиск аномалий в данных (ML)
Тема 39. Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей (ML)
Тема 40. Алгоритмы на графах (ML)
Тема 41. Введение в нейронные сети и глубокое обучение (DL)
Тема 42. Линейная и логистическая регрессия на PyTorch (DL)
Тема 43. Переобучение и регуляризация (DL)
Тема 44. Взрыв и затухание градиента (DL)
Тема 45. Адаптивные методы градиентного спуска (DL)
Тема 46. Автокодировщики и автокодирование (DL)
Модуль 4 - Анализ временных рядов (ВР) + Рекомендательные системы (РС) + Deep Learning II. Сверточные нейронные сети и компьютерное зрение (DL)
Тема 47. Анализ временных рядов. Часть 1: Постановка задачи, простейшие методы. ARIMA-модель (ВР)
Тема 48. Анализ временных рядов Часть 3: Кластеризация временных рядов (ищем связанные котировки акций) (ВР)
Тема 49. Анализ временных рядов. Часть 2: Извлечение признаков и применение моделей машинного обучения. Автоматическое прогнозирование (ВР)
Тема 50. Знакомство со сверточными нейронными сетями (DL)
Тема 51. Эволюция сверточных сетей: AlexNet->,EfficientNet (DL)
Тема 52. Подготовка и аугментация данных (DL)
Тема 53. Object detection (DL)
Тема 54. Сегментация (DL)
Тема 55. Pose estimation (DL)
Тема 56. Face recognition (DL)
Тема 57. Методы оптимизации инференса сетей (DL)
Тема 58. GANs 1. Фреймворк, условная генерация и super-resolution (DL)
Тема 59. GANs 2. Обзор архитектур (DL)
Тема 60. Рекомендательные системы. Часть 2: Контентная фильтрация, гибридные подходы. Ассоциативные правила (РС)
Тема 61. Рекомендательные системы. Коллаборативная фильтрация (РС)
Тема 62. Рекомендательные системы. Продвинутые алгоритмы SVD и ALS (РС)
Тема 63. Рекомендательные системы. Часть 2: Контентная фильтрация, гибридные подходы. Ассоциативные правила (РС)
Тема 64. Практическое занятие по рекомендательным системам. Surpsise (РС)
Тема 65. Learning2Rank (РС)
Модуль 5 - Natural Language Processing (NLP) + Reinforcement Learning (RL)
Тема 66. Парсинг данных (NLP)
Тема 67. Анализ текстовых данных. Часть 1: Предобработка и токенизация (NLP)
Тема 68. Анализ текстовых данных. Часть 2: Векторные представления слов, работа с предобученными эмбеддингами (NLP)
Тема 69. Языковые модели (NLP)
Тема 70. Машинный перевод и seq2seq (NLP)
Тема 71. Transformers и trasfer learing (NLP)
Тема 72. Практическое занятие: решаем задачи NLP с помощью трансформеров (NLP)
Тема 73. Question-Answering (NLP)
Тема 74. Topic Modeling (NLP)
Тема 75. Введение в обучение с подкреплением (RL)
Тема 76. Multi-armed bandits для оптимизации AB тестирования, от теории - сразу в бой (RL)
Тема 77. Практическое занятие: Multi-armed bandits в ecommerce: search оптимизация (RL)
Тема 78. Markov Decision Process, Value function, Bellman equation (RL)
Тема 79. Value iteration, Policy iteration (RL)
Тема 80. Практическое занятие: медицинский кейс Markov Chain Monte Carlo (RL)
Тема 81. Temporal Difference (TD) и Q-learning (RL)
Тема 82. SARSA и Практическое занятие: финансовый кейс TD и Q-learning (RL)
Тема 83. Q&A (RL)
Модуль 6 - Проектная работа
Тема 84. Выбор темы проектной работы
Тема 85. Консультация по проектам
Тема 86. Защита проектов
Продажник
OTUS
Мария Тихонова, Антон Витвицкий
Освойте новое направление и станьте востребованным специалистом!
Кто такой Data Scientist?
Data Science - это сфера, связанная с обучением умных моделей, которые учатся находить закономерности в данных и выявлять зависимости.
Data Scientist - тот самый супергерой, который обучает эти модели и с их помощью делает полезные для бизнеса выводы и прогнозы.
Что даст вам этот курс?
Профессия Data Scientist - это плавное погружение в мир Data Science. В результате обучения вы познакомитесь со всеми необходимыми инструментами, чтобы стать востребованным специалистом. По итогу вы сможете выбрать наиболее интересное направление для дальнейшего развития: классический ML, нейронные сети, компьютерное зрение, NLP (Natural Language Processing), рекомендательные системы, графовые методы.
Вы освоите:
1. Математическую базу. Вы научитесь применять математический анализ, линейную алгебру, теорию вероятности и статистику для задач анализа данных и машинного обучения,
2. Работу с Python и библиотеками NumPy, Sklearn, SciPy, Pandas, Matplotlib и многими другими,
3. Построение моделей машинного обучения,
4. Работу с нейронными сетями с использованием PyTorch и PyTorch Lightning,
5. Основы работы с компьютерным зрением,
6. Основы работы с NLP.
На кого рассчитан курс?
1. Новички, кто хочет войти в сферу Data Science с нуля,
2. Аналитики,
3. Программисты на любых языках.
Содержание
Модуль 1 - Математика для DS + Программирование на Python + Python для ML
Тема 1. Введение в математику для DS (M)
Тема 2. Матрицы (M)
Тема 3. Диагонализация матрицы (M)
Тема 4. Собственные числа и собственные значения матрицы (M)
Тема 5. Матричные разложения: SVD, ALS (M)
Тема 6. Производные матриц (M)
Тема 7. Настройка окружения для работы. Базовые типы и структуры данных. Управление потоком (P)
Тема 8. Работа с функциями и данными (P)
Тема 9. Git, shell (P)
Тема 10. Основы ООП (P)
Тема 11. Продвинутый ООП (P)
Тема 12. Модули и импорты (P)
Тема 13. Тесты (P)
Тема 14. Знакомство со встроенными модулями (P)
Тема 15. Файлы и сеть (P)
Тема 16. Дифферецируемость. Функции многих переменных. производная и градиент. (M)
Тема 17. Дифференцирование и оптимизация функций (M)
Тема 18. МНК и ММП (M)
Тема 19. Случайные события, вероятность (M)
Тема 20. Случайные величины и их моделирование (M)
Тема 21. Проверка гипотез (M)
Тема 22. Проверка гипотез в А/В тестировании (M)
Тема 23. Основы NumPy (PML)
Тема 24. Основы Pandas (PML)
Тема 25. Визуализация данных (PML)
Модуль 2 - Основы Машинного обучения
Тема 26. Занятие «Введение в машинное обучение»
Тема 27. Занятие «Exploratory Data Analysis and Preprocessing» (EDA)
Тема 28. Задача регрессии. Линейная регрессия.
Тема 29. Линейная регрессия. Градиентный спуск.
Тема 30. Задача классификации. Метод ближайших соседей
Тема 31. Логистическая регрессия
Тема 32. Деревья решений
Тема 33. Ансамбли моделей
Тема 34. Градиентный бустинг
Модуль 3 - Продвинутые методы классического ML (ML) + Deep Learning I. Знакомство с нейронными сетями (DL)
Тема 35. Метод опорных векторов (ML)
Тема 36. Методы уменьшения размерности (ML)
Тема 37. Обучение без учителя. K-means, иерархическая кластеризация DBSCAN (ML)
Тема 38. Поиск аномалий в данных (ML)
Тема 39. Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей (ML)
Тема 40. Алгоритмы на графах (ML)
Тема 41. Введение в нейронные сети и глубокое обучение (DL)
Тема 42. Линейная и логистическая регрессия на PyTorch (DL)
Тема 43. Переобучение и регуляризация (DL)
Тема 44. Взрыв и затухание градиента (DL)
Тема 45. Адаптивные методы градиентного спуска (DL)
Тема 46. Автокодировщики и автокодирование (DL)
Модуль 4 - Анализ временных рядов (ВР) + Рекомендательные системы (РС) + Deep Learning II. Сверточные нейронные сети и компьютерное зрение (DL)
Тема 47. Анализ временных рядов. Часть 1: Постановка задачи, простейшие методы. ARIMA-модель (ВР)
Тема 48. Анализ временных рядов Часть 3: Кластеризация временных рядов (ищем связанные котировки акций) (ВР)
Тема 49. Анализ временных рядов. Часть 2: Извлечение признаков и применение моделей машинного обучения. Автоматическое прогнозирование (ВР)
Тема 50. Знакомство со сверточными нейронными сетями (DL)
Тема 51. Эволюция сверточных сетей: AlexNet->,EfficientNet (DL)
Тема 52. Подготовка и аугментация данных (DL)
Тема 53. Object detection (DL)
Тема 54. Сегментация (DL)
Тема 55. Pose estimation (DL)
Тема 56. Face recognition (DL)
Тема 57. Методы оптимизации инференса сетей (DL)
Тема 58. GANs 1. Фреймворк, условная генерация и super-resolution (DL)
Тема 59. GANs 2. Обзор архитектур (DL)
Тема 60. Рекомендательные системы. Часть 2: Контентная фильтрация, гибридные подходы. Ассоциативные правила (РС)
Тема 61. Рекомендательные системы. Коллаборативная фильтрация (РС)
Тема 62. Рекомендательные системы. Продвинутые алгоритмы SVD и ALS (РС)
Тема 63. Рекомендательные системы. Часть 2: Контентная фильтрация, гибридные подходы. Ассоциативные правила (РС)
Тема 64. Практическое занятие по рекомендательным системам. Surpsise (РС)
Тема 65. Learning2Rank (РС)
Модуль 5 - Natural Language Processing (NLP) + Reinforcement Learning (RL)
Тема 66. Парсинг данных (NLP)
Тема 67. Анализ текстовых данных. Часть 1: Предобработка и токенизация (NLP)
Тема 68. Анализ текстовых данных. Часть 2: Векторные представления слов, работа с предобученными эмбеддингами (NLP)
Тема 69. Языковые модели (NLP)
Тема 70. Машинный перевод и seq2seq (NLP)
Тема 71. Transformers и trasfer learing (NLP)
Тема 72. Практическое занятие: решаем задачи NLP с помощью трансформеров (NLP)
Тема 73. Question-Answering (NLP)
Тема 74. Topic Modeling (NLP)
Тема 75. Введение в обучение с подкреплением (RL)
Тема 76. Multi-armed bandits для оптимизации AB тестирования, от теории - сразу в бой (RL)
Тема 77. Практическое занятие: Multi-armed bandits в ecommerce: search оптимизация (RL)
Тема 78. Markov Decision Process, Value function, Bellman equation (RL)
Тема 79. Value iteration, Policy iteration (RL)
Тема 80. Практическое занятие: медицинский кейс Markov Chain Monte Carlo (RL)
Тема 81. Temporal Difference (TD) и Q-learning (RL)
Тема 82. SARSA и Практическое занятие: финансовый кейс TD и Q-learning (RL)
Тема 83. Q&A (RL)
Модуль 6 - Проектная работа
Тема 84. Выбор темы проектной работы
Тема 85. Консультация по проектам
Тема 86. Защита проектов
Продажник