Набор в группу для практического изучения Data Analysis и Machine Learning

Добрый день, друзья!

Прошлой осенью мы провели совместные курсы обучения анализу данных (Data Analysis). Сегодня мы анонсируем еще один совместный обучающий проект в рамках нашего клуба, в котором основное внимание будет уделено практике.

Итак, мы хотим собрать группу ориентировочно в 10-20 человек, которые смогут потренироваться анализу данных и машинному обучению на практических примерах, взятых из соревнований Kaggle. Для начала мы займемся задачей Forest Cover Type Prediction, но вполне возможно, что попробуем и что-нибудь еще вроде Титаника.

В рамках занятий мы будем практиковаться в очистке и трансформации данных, учиться их анализировать с помощью различных статистических методов, выделять важные фичи и создавать новые, строить классификационные и предсказательные модели и измерять их эффективность. Наша цель — углубить свои знания и научиться чему-то новому друг у друга, а также прорваться на верхние места в соревновании 🙂

Как мы планируем работать

Мы будем встречаться каждую неделю в каком-нибудь антикафе (или другом помещении) на несколько часов для совместного обсуждения задачи и обмена опытом. Место и время встреч будет указано позже. Между этими встречами каждый будет пробовать что-то дома и отправлять свои результаты на Kaggle. Координация — по скайпу.

Двигаться будем постепенно. Каждое отдельное занятие (по крайней мере ряд занятий) будет посвящены тому или иному шагу построения модели: очистка, feature selection/extraction, построение модели, оценка результатов, построение ансамблей и т.д.

Требования к участникам

К сожалению, на этот раз к участию приглашаются люди с определенным базовым набором знаний и серьезной мотивацией к работе.

Для участия требуется:

  1. Знание матстатистики хотя бы на базовом уровне: пройденный курс в вузе, или онлайн, или другой тип самообучения. Вас не должны пугать ни матожидание, ни нормальное распределение, ни графики.
  2. Базовые знания R и анализа данных (либо Python в применении к анализу данных): пройденный курс или книга, в идеале — практический опыт хотя бы на уровне простых лабораторных работ. Вы должны хотя бы немного уметь программировать на R/Python и знать базовые команды и пакеты.
  3. Знания в Machine Learning будут плюсом. В идеале вы должны знать базовые методы обучения для классификации и регрессии, такие как различные типы регрессий, Decision Trees, Random Forest.
  4. Крайне желателен ноутбук с предустановленными R и RStudio для работы в группе.
  5. Большое желание 🙂

Заявки на участие

В связи с ограничением по количеству участников в группе и определенными базовыми требованиями к участниками мы вынуждены провести отбор в группу.

Заявки на участие просьба оставлять здесь:

Мы сообщим всем, кто попадет в группу, где и когда будет первая оффлайн-встреча. Не стесняйтесь оставлять заявку — мы еще не знаем, сколько будет желающих и какого они будут уровня, поэтому сложно спрогнозировать, где именно пройдет нижняя планка отбора.

Реклама
Набор в группу для практического изучения Data Analysis и Machine Learning

Набор в группу для практического изучения Data Analysis и Machine Learning: Один комментарий

  1. на coursera с 1 декабря стартовала специализация «Data Science» https://www.coursera.org/specialization/jhudatascience/1 от Johns Hopkins University. Специализация включает в себя 9 последовательных взаимосвязанных курсов + Capstone project. Capstone платный и чтобы его «открыть» нужно использовать Signature track заплатив за все курсы 470$

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s