Прямой доступ к перепискам россиян хотят дать полиции - чем опасна такая инициатива
09:30
Ефрейтор из Качугского округа погиб в зоне проведения СВО
16:58
Спикер ЗС и руководители парламентских фракций прокомментировали послание главы Приангарья
16:41
Прокуратура взяла на контроль смертельное ДТП в Баяндаевском районе
16:22
Запрет майнинга позволил разгрузить энергосистему Иркутской области - Кобзев
16:21
18-летний водитель погиб, двое пострадали в жестком ДТП в Баяндаевском районе
16:17
В незаконной миграции обвиняют начальника одного из отделов УМВД в Ангарске
16:17
Александр Сидоренко из Усть-Кута героически погиб в зоне СВО
16:13
Кобзев призвал крупный бизнес пойти навстречу Приангарью на фоне сильного дефицита бюджета
16:11
С погибшим бойцом СВО простились в Усть-Куте
16:09
Полицейские оперативно раскрыли кражу велосипеда в Байкальске
16:09
Более 15 тысяч заявок поступило на национальный чемпионат творческих компетенций "АртМастерс"
16:05
Около 130 призывников отправились на военную службу из Иркутской области
15:55
В Братске сотрудница банка поверила “инвесторам” и лишилась 1,3 млн рублей
15:49
Снова снег и сильный "минус" ночью - погода в Иркутской области 17 апреля
15:28
Работникам котельной Балаганского района задолжали около 158 тысяч по зарплате
15:00

Ученые проверили ГигаЧат на знания в области математики и компьютерных наук

18 марта, 17:52
Общество
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук pxhere.com
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук
Фото: pxhere.com
Нашли опечатку?
Ctrl+Enter

IrkutskMedia, 18 марта. Нейросеть Сбера ГигаЧат (12+) сдала экзамен по направлению "Математика и компьютерные науки". В ходе аттестационного испытания, проведенного на базе Сколтеха, работа модели была оценена аттестационной комиссией на оценку "4" ("хорошо").

Аттестация проходила в два этапа. Сначала модель прошла тестирование на 500 вопросах закрытого типа в формате MMLU, которые были разработаны преподавателями Сколтеха. Они охватывали девять тем в области компьютерных наук: алгоритмы и структуры данных, базы данных, кибербезопасность, программное обеспечение, программирование, сети и оборудование, специализированное ПО, управление и искусственный интеллект. Средний показатель правильных ответов модели на вопросы составил 76,9%.

Второй этап — очный экзамен с участием аттестационной комиссии, состоящей из восьми докторов технических и физико-математических наук. Эксперты комиссии выбрали три билета из 45, по которым проводили оценку знаний нейросети. Каждый билет содержал два задания — теоретическое и практическое. Все задачи были разработаны специально для этого испытания и отсутствовали в открытых базах, что исключало возможность поиска готовых ответов и требовало от нейросети применения реальных знаний. Для объективной оценки глубины компетенций эксперты не только проверяли ответы, но и задавали уточняющие вопросы, просили объяснить ход рассуждений и анализировали работу модели с нестандартными формулировками. 

Оценка проводилась по профильному принципу: например, при оценке ответов модели на задания по программированию решающий голос принадлежал соответствующему эксперту. Применение весовых коэффициентов позволило обеспечить максимальную объективность аттестации. По итогам очного экзамена модель набрала 7 из 10 баллов по шкале Сколтеха.

233940
14
48
Игра "Вордли" — угадай слово!