Набор в группу для практического изучения Data Analysis и Machine Learning

Добрый день, друзья!

Прошлой осенью мы провели совместные курсы обучения анализу данных (Data Analysis). Сегодня мы анонсируем еще один совместный обучающий проект в рамках нашего клуба, в котором основное внимание будет уделено практике.

Итак, мы хотим собрать группу ориентировочно в 10-20 человек, которые смогут потренироваться анализу данных и машинному обучению на практических примерах, взятых из соревнований Kaggle. Для начала мы займемся задачей Forest Cover Type Prediction, но вполне возможно, что попробуем и что-нибудь еще вроде Титаника.

В рамках занятий мы будем практиковаться в очистке и трансформации данных, учиться их анализировать с помощью различных статистических методов, выделять важные фичи и создавать новые, строить классификационные и предсказательные модели и измерять их эффективность. Наша цель — углубить свои знания и научиться чему-то новому друг у друга, а также прорваться на верхние места в соревновании 🙂

Как мы планируем работать

Мы будем встречаться каждую неделю в каком-нибудь антикафе (или другом помещении) на несколько часов для совместного обсуждения задачи и обмена опытом. Место и время встреч будет указано позже. Между этими встречами каждый будет пробовать что-то дома и отправлять свои результаты на Kaggle. Координация — по скайпу.

Двигаться будем постепенно. Каждое отдельное занятие (по крайней мере ряд занятий) будет посвящены тому или иному шагу построения модели: очистка, feature selection/extraction, построение модели, оценка результатов, построение ансамблей и т.д.

Требования к участникам

К сожалению, на этот раз к участию приглашаются люди с определенным базовым набором знаний и серьезной мотивацией к работе.

Для участия требуется:

  1. Знание матстатистики хотя бы на базовом уровне: пройденный курс в вузе, или онлайн, или другой тип самообучения. Вас не должны пугать ни матожидание, ни нормальное распределение, ни графики.
  2. Базовые знания R и анализа данных (либо Python в применении к анализу данных): пройденный курс или книга, в идеале — практический опыт хотя бы на уровне простых лабораторных работ. Вы должны хотя бы немного уметь программировать на R/Python и знать базовые команды и пакеты.
  3. Знания в Machine Learning будут плюсом. В идеале вы должны знать базовые методы обучения для классификации и регрессии, такие как различные типы регрессий, Decision Trees, Random Forest.
  4. Крайне желателен ноутбук с предустановленными R и RStudio для работы в группе.
  5. Большое желание 🙂

Заявки на участие

В связи с ограничением по количеству участников в группе и определенными базовыми требованиями к участниками мы вынуждены провести отбор в группу.

Заявки на участие просьба оставлять здесь:

Мы сообщим всем, кто попадет в группу, где и когда будет первая оффлайн-встреча. Не стесняйтесь оставлять заявку — мы еще не знаем, сколько будет желающих и какого они будут уровня, поэтому сложно спрогнозировать, где именно пройдет нижняя планка отбора.

Реклама
Набор в группу для практического изучения Data Analysis и Machine Learning

Материалы девятой встречи

17 мая в Харькове прошла девятая встреча клуба. Между восьмой и девятой встречами прошло много времени — почти 4 месяца. За это время мы успели познакомиться с харьковскими энтузиастами в сфере робототехники и хакерами из хакерспейса. Они-то и составили основную часть нашей программы на эту встречу. И Ботеон, и KHackerSpace приглашают к себе других энтузиастов по интересам. Узнать больше о них можно на их официальном сайтах или страничках ВК:

Ботеон: официальный сайт, страничка VK
KHackerSpace: официальный сайт, страничка VK

Когда смотришь на то, чего за довольно короткое время добились эти ребята, хочется и самим двигаться дальше 🙂 Поэтому уже очень скоро мы анонсируем интересную практическую программу по анализу данных и машинному обучению для всех желающих. Следите за обновлениями!

Если вы вдруг не смогли прийти, то у вас есть возможность посмотреть видеозаписи докладов.

Доклад Дианы Стрелец об особенностях программирования роботов с демонстрацией робота-собаки, а также презентация центра робототехники Ботеон:

Презентация харьковского KHackerSpace от Александра Семченкова:

Доклад Богдана Колчигина о нечеткой логике:

Материалы девятой встречи