Последнее больше не отнимут - в Госдуме продумывают послабления для всех должников
18:40
Президент РФ наградил губернатора Иркутской области орденом Дружбы
22:48
Игорь Кобзев вручил государственные награды жителям Иркутской области
21:43
В условиях обледенения прошел испытательный полет МС-21 над Белым морем
21:05
Обзор самых популярных новостей за 30 марта
21:00
В Иркутске прошли съемки двух фильмов проекта "Тыловики" о подвигах связистов
18:57
Официально назвали дату общегородского субботника в Иркутске
18:48
Депутаты думы решают острые вопросы иркутян при содействии администрации
18:31
Виктор Пинский: Среди кандидатов от "Единой России" значительную часть составят участники СВО
18:05
Строительство жилья в Иркутской области за год подскочило на 20%
18:04
Семь бывших мигрантов доставили в военком Иркутской области для постановки на учет
17:48
Авито: R&D-центры помогают компаниям исследовать новейшие технологии с момента их появления
17:05
10 млн за выходные: аферисты устроили "зачистку" счетов жителей Приангарья
16:55
"Внезапный удар для всех": Сибирский Конор выбыл из шоу "Титаны. Битва сезонов"
16:54
Жители Иркутской области пожаловались на сбой в работе мессенджера МАХ
16:53
Жительница Усть-Кута потушила пожар в квартире подручными средствами
16:39

Ученые проверили ГигаЧат на знания в области математики и компьютерных наук

18 марта, 17:52
Общество
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук pxhere.com
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук
Фото: pxhere.com
Нашли опечатку?
Ctrl+Enter

IrkutskMedia, 18 марта. Нейросеть Сбера ГигаЧат (12+) сдала экзамен по направлению "Математика и компьютерные науки". В ходе аттестационного испытания, проведенного на базе Сколтеха, работа модели была оценена аттестационной комиссией на оценку "4" ("хорошо").

Аттестация проходила в два этапа. Сначала модель прошла тестирование на 500 вопросах закрытого типа в формате MMLU, которые были разработаны преподавателями Сколтеха. Они охватывали девять тем в области компьютерных наук: алгоритмы и структуры данных, базы данных, кибербезопасность, программное обеспечение, программирование, сети и оборудование, специализированное ПО, управление и искусственный интеллект. Средний показатель правильных ответов модели на вопросы составил 76,9%.

Второй этап — очный экзамен с участием аттестационной комиссии, состоящей из восьми докторов технических и физико-математических наук. Эксперты комиссии выбрали три билета из 45, по которым проводили оценку знаний нейросети. Каждый билет содержал два задания — теоретическое и практическое. Все задачи были разработаны специально для этого испытания и отсутствовали в открытых базах, что исключало возможность поиска готовых ответов и требовало от нейросети применения реальных знаний. Для объективной оценки глубины компетенций эксперты не только проверяли ответы, но и задавали уточняющие вопросы, просили объяснить ход рассуждений и анализировали работу модели с нестандартными формулировками. 

Оценка проводилась по профильному принципу: например, при оценке ответов модели на задания по программированию решающий голос принадлежал соответствующему эксперту. Применение весовых коэффициентов позволило обеспечить максимальную объективность аттестации. По итогам очного экзамена модель набрала 7 из 10 баллов по шкале Сколтеха.

233940
14
48