Ru
En

Новые образовательные стратегии в современном информационном пространстве

New Educational Strategies in Modern Information Space - 2021

Тербушева Е.А.

РГПУ им. А.И. Герцена

г. Санкт-Петербург

terbushevae@gmail.com

 

Обзор необходимых навыков для будущих специалистов в области анализа данных

 

В статье рассматриваются требования, предъявляемые к специалистам по анализу данных на рынке труда. Результаты могут быть использованы для проектирования содержания обучения анализу данных студентов различных направлений.

 

Terbusheva E.A.

HSPU

St. Petersburg, Russia

 

An overview of the required skills for future data analysts

 

The article discusses the requirements for data analysts in the labor market. The results can be used in the development of data analysis curricula for students of various specialties.

 

Анализ накапливаемых в связи с глобальной цифровизацией данных позволяет обнаруживать сбои и закономерности, принимать на их основе более эффективные решения в различных областях. Например, в области образования сбор и анализ данных об учебном процессе способствуют персонализации обучения путем создания интеллектуальных систем обучения (систем адаптивного обучения, систем с индивидуальными инструкциями) или самостоятельного построения преподавателями индивидуальных траекторий обучения [1, 2, 3].

 

Постепенно способность работать с данными своей предметной области и анализировать их становится важной компетенцией для многих специалистов. Становится востребованной подготовка кадров, способных к анализу данных. Согласно совместному исследованию hh.ru и академии больших данных от Mail.ru Group в 2019 году вакансий в области анализа данных стало больше в 9,6 раза, чем в 2015 году [6].

 

Проанализируем рынок труда с целью определить современное развитие аналитики в РФ, потребность в специалистах по анализу данных и предъявляемые к ним требования. Сбор вакансий осуществлялся отдельно по ключевым словам “Аналитик”, “Анализ данных”, “Data mining”, “Машинное обучение” и “Big data” c помощью открытого проекта [5]. Дальнейший анализ выполнялся с помощью библиотек Python. Data mining является отдельным направлением в области информационных технологий, которое переводится как интеллектуальный анализ данных и изучает способы обнаружения скрытых закономерностей на основе данных. Машинное обучение и большие данные являются смежными с интеллектуальным анализом данных областями. Число обнаруженных на сайте hh.ru вакансий по каждому запросу за один месяц 2021 года в регионе Москва приведено в таблице 1.

 

Таблица 1 – Число вакансий на hh.ru

Оставить комментарий:

По ключевым словам “Data mining” было обнаружено 372 вакансии. Различных компаний, которые ищут таких специалистов, меньше – 176. В описании каждой вакансии есть отдельная графа ключевых навыков, ожидаемых от соискателя. Анализ указанных ключевых навыков помогает обнаружить реальные используемые знания и технологии для решения задач анализа данных на современном этапе. Топ-10 ключевых навыков, которые наиболее часто встречаются в найденных вакансиях, приведены на рисунке 1.

Рисунок 1  ̶  Ключевые навыки специалиста по Data mining

 

Наиболее востребованные навыки можно разделить на несколько категорий:

  • Data mining
  • Языки программирования (часто – Python, реже C++, Java, VBA)
  • Базы данных (SQL, Oracle, MS SQL Server)
  • Математическая статистика
  • Операционные системы (Linux)
  • Иностранный язык (английский)

 

Для понимания, что скрывается под первым навыком, рассмотрим выделяемые задачи в области интеллектуального анализа данных на основе онтологии области Data Mining [4], включающую в себя онтологию типов данных, онтологию основных сущностей и онтологию исследований в области DM. Понятие “Задача DM” относится к основным сущностям DM, а таксономия задач на основе типов данных представлена на рисунке 2.

Рисунок 2 – Таксономия задач Data mining

 

Ключевые навыки для вакансий, найденных по другим приведенным запросам схожи. Представление ключевых навыков отобранных специалистов с помощью диаграммы Эйлера-Венна (рис. 3), отображающей пересечения по навыкам для исследуемых вакансий, позволяет провести сравнительный анализ по областям.

Рисунок 3 – Частые навыки в вакансиях специалистов по анализу данных

 

Основными отличиями являются: вакансии по запросу “Анализ данных” и “Аналитик” предполагают более широкий, чем Data mining, спектр деятельности (например, сюда относятся специалисты, владеющие статистическим анализом и визуализацией данных в Excel, также как и специалисты, которые могут моделировать бизнес-процессы с помощью специализированных инструментов); вакансии по запросу “Вig data” предполагают также владение технологиями работы с большими данными, т. е. такими, которые невозможно обработать с помощью одного ПК (как Hadoop, spark, облачные технологии) и навыки управления проектами.

 

При подготовке специалистов к анализу данных цифровой среды необходимо учитывать приведенные ключевые навыки, являющиеся актуальными для решения реальных практических задач.

 

Работа выполнена в рамках государственного задания при финансовой поддержке Минобрнауки России (проект № FSZN-2020-0027).

 

Литература:

  1. Scherzinger F., Singla A., Wolf V., Backenköhler M. Data-Driven Approach Towards a Personalized Curriculum. In: Proceedings of The 11th International Conference on Educational Data Mining (EDM2018). 2018.
  2. Zhaorui Chen, Carrie Demmans, CSCLRec:Personalized Recommendation of Forum Posts to SupportSocio-collaborative Learning. In: Proceedings of The 13th International Conference on Educational Data Mining (EDM). 2020, pp. 364 – 373.
  3. Zhimin Qi. Personalized Distance Education System Based on Data Mining. International Journal of Emerging Technologies in Learning (iJET). 2018. Vol. 13, № 07 (2018).
  4. The OntoDM ontology. URL: http://ontodm.com/doku.php
  5. Автоматизация поиска и анализа вакансий hh.ru. URL: https://github.com/capitanov/hh_research
  6. Специалисты по Data Science: основные навыки и спрос работодателей. URL: https://hh.ru/article/27128