Ярмарка, концерт и 50-метровый флаг: как отметили День России в Иркутске
12 июня, 16:29
Трое человек погибли и пятеро пострадали: сводка ДТП за сутки в Приангарье
18:48
Работодателей опять "прижали": нюансы зачисления зарплаты в 2026 году - важные детали
18:40
Фура перевернулась на Култукском тракте - на дороге скопилась пробка
18:36
Аварийное отключение электричества произошло в нескольких районах Иркутска и Шелехова
18:12
Водитель ВАЗ сбил 3-летнюю девочку в Ангарске
16:32
Синоптики предупредили о ливнях и шквалистом ветре в Иркутской области 14 июня
15:21
От +14 до +29°С с осадками: капризная погода ждет Иркутскую область 14 июня
14:25
Заслуженного врача из Иркутской области наградили орденом Александра Невского
13:21
Ветераны СВО из "Героев Приангарья" провели встречи с участниками "Зарницы 2.0"
13:16
Без остановки сердца: в Иркутске впервые имплантировали клапан ребенку через прокол
11:59
Житель Братска напал на комиссионный магазин с игрушечным пистолетом
11:46
Электричество частично отключилось в Октябрьском районе Иркутска
10:52
Балкон квартиры в Ангарске вспыхнул из-за непотушенного окурка с верхнего этажа
10:52
До +25ºС ожидается в Иркутске в субботу, 13 июня
10:31
Ждёт ли россиян снижение пенсионного возраста? - В Госдуме рассматривают законопроект
09:30

Ученые проверили ГигаЧат на знания в области математики и компьютерных наук

18 марта, 17:52
Общество
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук pxhere.com
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук
Фото: pxhere.com
Нашли опечатку?
Ctrl+Enter

IrkutskMedia, 18 марта. Нейросеть Сбера ГигаЧат (12+) сдала экзамен по направлению "Математика и компьютерные науки". В ходе аттестационного испытания, проведенного на базе Сколтеха, работа модели была оценена аттестационной комиссией на оценку "4" ("хорошо").

Аттестация проходила в два этапа. Сначала модель прошла тестирование на 500 вопросах закрытого типа в формате MMLU, которые были разработаны преподавателями Сколтеха. Они охватывали девять тем в области компьютерных наук: алгоритмы и структуры данных, базы данных, кибербезопасность, программное обеспечение, программирование, сети и оборудование, специализированное ПО, управление и искусственный интеллект. Средний показатель правильных ответов модели на вопросы составил 76,9%.

Второй этап — очный экзамен с участием аттестационной комиссии, состоящей из восьми докторов технических и физико-математических наук. Эксперты комиссии выбрали три билета из 45, по которым проводили оценку знаний нейросети. Каждый билет содержал два задания — теоретическое и практическое. Все задачи были разработаны специально для этого испытания и отсутствовали в открытых базах, что исключало возможность поиска готовых ответов и требовало от нейросети применения реальных знаний. Для объективной оценки глубины компетенций эксперты не только проверяли ответы, но и задавали уточняющие вопросы, просили объяснить ход рассуждений и анализировали работу модели с нестандартными формулировками. 

Оценка проводилась по профильному принципу: например, при оценке ответов модели на задания по программированию решающий голос принадлежал соответствующему эксперту. Применение весовых коэффициентов позволило обеспечить максимальную объективность аттестации. По итогам очного экзамена модель набрала 7 из 10 баллов по шкале Сколтеха.

233940
14
48