Ваши запросы
Посещенные страницы

К сожалению, ничего не найдено.

Попробуйте переформулировать запрос.

Какие алгоритмы и структуры данных нужно освоить начинающему специалисту по Data Science

Tproger
04.03.2020
7 мин
977
Редакция «КОРУС Консалтинг»
Редакция «КОРУС Консалтинг»
Автор
Data Science – обширная сфера, поэтому начинающим специалистам может быть сложно понять, что им нужно изучать. На какие алгоритмы и структуры данных нужно обратить внимание в первую очередь, рассказывает Александр Зенькович, руководитель проектов департамента аналитических решений ГК «КОРУС Консалтинг».

Начинающему data scientist’у необходимо определиться с ближайшей целью своего развития:

  1. Применение своих навыков в прикладных задачах.
  2. Экспериментальные и в большей степени научные задачи, участие в конкурсах на платформе Kaggle, анализ идей цифровых гигантов.

В первом случае нужно обладать знаниями моделей регрессии (линейная, градиентный спуск, полиномиальная, логистическая, регуляризованные регрессии, метод опорных векторов, деревья принятия решений), методах понижения размерности, ансамблевых методах (бэггинг, бустинг), моделей классификации и кластеризации.

Для этого стоит изучить библиотеки NumPy, Pandas, SciPy, Sklearn, Matplotlib, XGBoost, LightGBM, после чего специалисту открыты двери для решения задач в ритейл-, телеком- и банковской сферах.

Если в приоритете экспериментальные задачи, помимо всего вышесказанного нужно разобраться в библиотеках NLP, Keras, TensorFlow, Theano, проанализировать множество видео-, аудиоданных, собрав различные датасеты, например, с изображениями котиков. Это откроет потенциальную возможность разработать нечто крутое, что потом купит Apple или Facebook.

Вне зависимости от того, какая цель будет выбрана, начинающий специалист должен владеть основами аналитики, статистики и математики. А в фундаментальных знаниях – Python и R, базовые навыки работы в Linux, Excel и, конечно же, SQL, потому что иногда проще написать две строчки select-а, чем ломать голову, как минимизировать количество циклов над датасетом.

Источник: Tproger  

Материал оказался полезным?
Оставьте почту и мы пришлем его в формате .pdf
Получить  материал
Материал оказался полезным? Материал оказался полезным?
Заявка отправлена
Заявка отправлена

Спасибо за заявку! Мы рассмотрим ее в ближайшее время и обязательно свяжемся с вами по телефону или email.

Документ отправлен
Заявка отправлена

Документ уже отправлен на вашу почту,
 и вы сможете ознакомиться с ним в удобное для вас время.

Запрос отправлен
Заявка отправлена

Ваш запрос на материалы мероприятия отправлен.