HARVARD CS50 — «Обучение» — Лекция 4: Искусственный Интеллект с Python на русском
Практический Курс по Python:
Stepik: https://stepik.org/a/126242
Udemy: https://www.udemy.com/course/avecoder-advanced-python/?referralCode=270C5D0661A966B53743
Аве, Кодер!
Это легендарный Гарвардский курс CS50 на русском языке: основы искусственного интеллекта с Python.
В этой лекции: линейная и логистическая регрессия, классификация, обучение с и без учителя, а также принципы обучения с подкреплением — Q обучение, жадный эпсилон алгоритм и обучение ИИ агента игре в Nim.
Тайм-коды:
0:00 машинное обучение learning
1:14 Тип обучения 1) машинное обучение с учителем (контролируемое обучение) supervised learning
2:06 задача классификации classification
8:13 алгоритм метод ближайших соседей nearest-neighbor classification
10:30 алгоритм классификация по ближайшему соседу k-ближайших соседей k-nearest-neighbor classification
11:43 ряд различных подходов к машинному обучению
13:13 техника линейная регрессия
23:23 правило обучения персептрона perceptron learning rule настройка весов входных параметров. Жесткий порог hard threshold
31:39 логистическая регрессия. Мягкий порог soft threshold
33:23 метод опорных векторов support vector machines
36:10 разделяющая гиперплоскость с максимальным зазором maximum margin separator
39:20 задача регрессия regression
41:57 оценка гипотез evaluation hypotheses
42:42 минимизация функции потерь loss function
43:31 двоичная функция потерь 0-1 loss function
46:25 потери L1 L1 loss function
48:28 потери L2 L2 loss function
49:45 проблема переобучения (переподгонка) overfitting
53:05 борьба с переобучением: 1) регуляризация regularization
56:25 2) перекрёстная проверка удержанием holdout cross-valudation
58:23 3) k-кратная перекрёстная проверка k-fold cross-validation
1:00:00 реализация. библиотека scikit-learn
1:02:20 код banknotes0. py
1:03:18 разделение набора данных на 1)обучающий и 2) тестовый
1:06:20 запуск программы модели: персептрона, классификатор опорных векторов, k-соседей
1:08:38 код banknotes1. py
1:09:59 Тип обучения 2) обучение с подкреплением reinforcement learning
1:13:18 Марковский процесс принятия решений Markov decision process
1:20:00 модель Q-обучение Q-learning
1:27:55 жадная политика принятия решений Greedy decision -making
1:29:40 исследование против эксплуатации explore vs exploit
1:30:25 E-жадный алгоритм E-greedy
1:32:23 игра Nim
1:34:12 код play. py
1:37:40 аппроксимация функции function approximation
1:38:45 Тип обучения 3) обучение без учителя unsupervised learning. Задача кластеризации
1:40:21 метод кластеризация k-средних (k-means clustering)
История Технологий:
https://www.youtube.com/c/АвеТех
______________________
Аве Кодер!
Меня зовут V и я кодер. Я экспортирую из Англии: актуальные туториалы, computer science, брейнхаки, лайфхаки, здоровье кодера, тревэл он нью левэл, английский для кодера, как кодеру не помереть с голоду, юмор и многое другое.
Так что ставь императорский палец вверх, подписывайся и бей в колокол!