Тесты для оценки интеллекта ИИ назвали бессмысленными

24 июля 2024, 16:34

Фото: Изображение Midjourney.

Технологические компании активно разрабатывают всё более мощные инструменты искусственного интеллекта (ИИ), демонстрируя их эффективность с помощью тестов, известных как AI benchmarks. Однако эксперты утверждают, что они не отражают реальные возможности ИИ.

Например, генеральный директор Google заявил, что новая модель Gemini набрала 90% на тесте Massive Multitask Language Understanding (MMLU), а глава Meta* Марк Цукерберг — что их модель Llama достигла 82% на том же тесте.

Проблема в том, что эти тесты не показывают, на какие вопросы ИИ может надежно ответить, и когда его можно безопасно использовать вместо обращения к экспертам-людям. По словам Мартина Сапа, доцента Университета Карнеги-Меллона, тесты не отражают реальных возможностей ИИ и могут вводить в заблуждение, особенно в областях, связанных с высокими рисками, таких как здравоохранение и право.

Эксперты утверждают, что многие из используемых тестов низкого качества и были созданы для оценки более простых систем. Это может привести к неправильным выводам о возможностях современных ИИ моделей, таких как Gemini и Llama.

Несмотря на это, компании продолжают использовать такие тесты для демонстрации своих достижений, что, в свою очередь, рождает мифы о сверхвозможностях ИИ и их дальнейшем развитии.

* Запрещенная в России организация

#Светлана Павлова #Новости #Наука #Технологии #Здравоохранение #Все материалы авторов #Искусственный интеллект #Gemini

Подпишитесь

Сетевое издание «Новая Хакасия.online». Средство массовой информации зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций,
регистрационный номер серия ЭЛ № ФС 77-76824 от 24 сентября 2019 г.

Учредитель: ООО «ПремьерМедиаИнвест»

Главный редактор: Егоров Александр Игоревич

Телефон: +7 (499) 110-58-85

Электронный адрес: newkhakasiya@yandex.ru / ooopremmediainvest@gmail.com

Адрес редакции: 109 044, Москва г, вн. тер. г. муниципальный округ Таганский, ул. Воронцовская, д. 20, этаж 2, ком. 14

Отдел продаж: +7 (391) 295 14-37

Редакционные правила

Политика конфиденциальности