Новые образовательные стратегии в современном информационном пространстве

New Educational Strategies in Modern Information Space - 2022

Ru
En

Уженцева А.В.

Сибирский государственный университет телекоммуникаций и информатики (СибГУТИ)

г. Новосибирск

 

Кунц Е.Ю.

Сибирский государственный университет телекоммуникаций и информатики (СибГУТИ)

г. Новосибирск

 

Полетайкин А.Н.

Кубанский государственный университет (КубГУ)

г. Краснодар

 

 

Методы и подходы к классификации образовательных данных

 

В статье рассмотрена проблема необходимости перехода организаций к цифровому взаимодействию. Продемонстрирована необходимость удобного и оперативного доступа к документам в университете. Предложена идея разработки специального классификатора образовательных данных (ОД). Рассмотрены основные методы и подходы, применяемые для классификации данных. Показана их работоспособность относительно классификации ОД разных классов в контексте задачи организации фонда оценочных средств (ФОС). Выполнена апробация предложенных подходов в приложении к классификации ОД в Сибирском государственном техническом университете телекоммуникаций и информатики (СибГУТИ).

 

Uzhentseva A.V.

SibSUTIS

Novosibirsk, Russia

Kunts E.Yu.

SibSUTIS

Novosibirsk, Russia

Poletaikin A.N.

KubSU

Krasnodar, Russia

 

Methods and approaches to classification of educational data

 

The article considers the problem of the need for organizations to transition to digital interaction. The necessity of convenient and prompt access to documents at the university is demonstrated. The idea of developing a special classifier of educational data is proposed. The main methods and approaches used for data classification are considered. Their efficiency is shown with respect to the classification of educational data of different classes in the context of the task of organizing a fund of evaluation funds. The proposed approaches were tested in the appendix to the classification of educational data in SibSUTIS.

 

В настоящее время очень актуален вопрос цифровой трансформации. В том числе это касается и университетов. Непрерывная систематизация и поиск электронных документов требует значительных временных затрат. В условиях постоянного развития информационных технологий становится понятно, что значительно лучшим решением будет поручить эту задачу информационной системе (ИС), так называемому электронному архиву. Стоит отметить, что подобные системы, предусматривая функцию поиска, позволяют искать по категориям. В связи с этим возникает потребность в применении эффективной классификации ОД.

 

Под ОД в статье понимаются данные, используемые в образовательной деятельности и порождаемые образовательной деятельностью, и в первую очередь её результаты. В качестве примеров ОД можно выделить различные контрольно-измерительные материалы (КИМ), учебно-методическую базу, компетенции, и т.д.

 

Следствием неопределённости ОД является невозможность априори предсказать структуру результатов обучения в предельной форме компетентностной модели, технологию достижения сформированности компетенций и необходимые для этого условия (ресурсы). В современном вузе ОД образуют сложную многопараметрическую систему и их сложно классифицировать традиционным способом. Таким образом, рассматриваемая в статье проблема актуальна. В качестве объекта в данном исследовании выступает классификация данных. Предмет исследования – методы и подходы к классификации данных и проблема их адаптации к классификации ОД.

 

Цель данной статьи – выбор наиболее подходящего метода классификации ОД и разработка интерфейсного решения для системы-классификатора ОД.

Также выделим задачи, которые необходимо решить для достижения цели статьи: 1) изучение проблемы необходимости организации оперативного доступа к ОД; 2) изучение методов и подходов к классификации ОД; 3) проверка гипотезы об удобстве применения возможных вариантов специфической классификации ОД; 4) разработка интерфейсного решения для ИС классификации ОД.

 

В отношении университетов сформулировано требование о переводе не менее 80% документации в электронный формат. Об этом говорится в «Стратегии цифровой трансформации отрасли науки и высшего образования», а именно в её проекте «Цифровой университет» [1]. Одним из вариантов решения данной проблемы является применение одного из уже существующих классификаторов. Уже представленные на рынке системы вполне могут применяться к классификации документированных ОД. Однако они не специализируются на образовательном контенте, в связи с чем требуют доработки и настройки. В настоящий момент не существует готового решения, которое бы могло без дополнительной адаптации быть внедрено в вузе. Это связано с тем, что для классификации ОД в полной мере не подходит ни одна из существующих классификаций [1]. Также одним из возможных вариантов является самостоятельная разработка классификатора. Данная разработка позволит значительно облегчить процесс поиска и актуализации информации преподавателями, занимающимися формированием оценочных средств (ОС), не затрачивая при этом время на предварительную настройку и адаптацию системы под данные, с которыми они работают. Предполагается, что пользователями системы будут преподаватели, вовлечённые в процесс формирования ФОС, а также сотрудники университета, создающие документы, которые должны использоваться в процессе организации ФОС.

 

Рассмотрим методы и подходы, применяемые в классификации данных. Начнём непосредственно с того, что такое классификация и зачем она нужна. С точки зрения А.А. Казанцева, М.В. Прохорова и П.С. Худяковой [2] классификация, например, текстовых данных – это процесс разделения множества входных документов на классы, где каждый документ может принадлежать как минимум к одному классу. А.И. Стрелец, А.А. Орлов и др. [3] говорят о трёх подходах к классификации данных: вручную; с помощью написания правил, основанных на регулярных выражениях; и с использованием машинного обучения. Классификация вручную может быть очень точной, но её основной недостаток в том, что этот подход не может использоваться для больших данных с соблюдением корректных сроков. Второй предложенный подход даёт возможность работать с большими данными, но для него необходимо нести трудозатраты по написанию и постоянной актуализации правил. Кроме того, этот подход требует от специалиста, занимающегося формулировкой правил, глубокого знания образцов каждого класса. Это тоже требует значительных временны́х затрат. Подход, основанный на машинном обучении, предпочтительнее первых двух в связи с тем, что алгоритмы обучаются самостоятельно и самое большое, что требуется от специалиста – разметить учебный набор данных.

 

Т.В. Батура [4] предлагает следующую классификацию. В качестве укрупнённых групп методов ею выделяются: вероятностные, линейные, метрические, логические, логистическая регрессия и методы на основе искусственных нейронных сетей (НС). Представим примеры методов, относящихся к каждой из групп, в таблице 1.

 

Таблица 1 – Методы классификации [4]

После рассмотрения существующих методов классификации, представим на рис. 1 специфическую классификацию [1], разработанную на основе запатентованной схемы организации ФОС [5]. В табл. 2 представлен фрагмент классификационной группировки ОД в соответствии с этой классификацией.

Рисунок 1 – Специфическая классификация, подходящая для систематизации ОД [1]

 

Таблица 2 – Пример классификации документов в соответствии со специфической классификацией

Рассмотрим, как показали себя рассмотренные выше методы классификации при их применении на практике. Классы ОД определялись в соответствии с классификацией, предложенной на рисунке 1. Результат проведённого исследования корректности работы методов при классификации ОД представлен в таблице 3.

 

Таблица 3 – Результаты бинарной классификации ОД с использованием специфической классификации и методов машинного обучения (на пересечении бинарные оценки успешности применения методов)

Как видно из таблицы 3, применительно к классификации ОД, наиболее пригодным для классификации ОД на практике показал себя метод НБК. Хуже всех с ОД сработали метод дискриминантного анализа, а также метод опорных векторов.

 

На рис. 2-3 для наглядности показаны макеты будущей системы, а именно страницы, связанные с действиями преподавателя.

Рисунок 2 – Страница поиска документа

Рисунок 3 – Выдача документов в результате поиска

 

Таким образом, в статье рассмотрена проблема трудности выбора метода классификации ОД, позволяющего корректно упорядочивать документы, необходимые для формирования ОС. Предложено авторское решение проблемы, представлены возможные методы и подходы для решения задачи классификации. Также был предложен вариант классификации, который в качестве примера может быть применён к данным в системе. Показаны результаты работы каждого метода с некоторой выборкой ОД и на основе этих сведений определён наиболее пригодный для поставленной задачи классификации метод НБК. Также предложено решение в виде автоматизированной поисковой ИС, дающей возможность оперативно находить любые документы, которые существуют в системе, либо в сети. Результаты, представленные в статье, рекомендуются к дальнейшему развитию с целью разработки ИС, минимизирующей риски использования неактуальной или не достоверной информации при формировании ОС.

 

Литература:

1. Кунц, Е. Ю. Классификация образовательных данных цифрового фонда оценочных средств / Е. Ю. Кунц, А. Н. Полетайкин // Информатизация образования и методика электронного обучения: цифровые технологии в образовании: Матер. V Междун. науч. конф. В 2-х частях, Красноярск: СФУ, 2021. – С. 176-181.

2. Казанцев А.А., Прохоров М.В., Худякова П.С. Обзор подходов к классификации текстов актуальными методами // Экономика и качество систем связи. – 2021. – №1 (19).

3. Стрелец А. И., Иванников В.С., Орлов А.А., Атавина А.В. Методы классификации текстовых данных по темам // Международный журнал гуманитарных и естественных наук. – 2019. – № 6-1. – С. 74-76.

4. Батура Т.В. Методы автоматической классификации текстов // Программные продукты и системы / Software & Systems. – 2017. – №1(30). – С. 85-99.

5. Патент на промышленный образец RU 120352. Схема организации цифрового фонда оценочных средств основной профессиональной образовательной программы / А.Н. Полетайкин, Н.В. Кулешова, Е.Ю. Кунц, В.В. Подколзин; Заяв. и правообл. ФГБОУ ВО «Кубанский государственный университет» // Бюл. № 7-2020. URL: https://www1.fips.ru/registers-doc-view/fips_servlet?DB=RUDE&DocNumber=120352&TypeFile=html

Оставить комментарий: