Поддержать команду Зеркала
Беларусы на войне
  1. СМИ заявили, что в Беларуси находятся 360 тысяч российских солдат, которые готовы «напасть на НАТО». Литовская разведка прокомментировала
  2. В разборках Беларуси и Литвы из-за калия наметился весьма неожиданный поворот. Рассказываем, что заявили в Вильнюсе
  3. «Украинцы должны понять, что их место в России». Очередная порция заявлений кремлевских чиновников раскрыла истинные цели войны РФ
  4. Виктор Бабарико ответил на вопрос: «Лукашенко — диктатор?»
  5. «Дáвите людей, дáвите, но все никак не задáвите». Почему силовиков так задел флешмоб с красной помадой — мнение
  6. Освобожденные и вывезенные в Украину беларусские политзаключенные приехали в Варшаву
  7. Почему Виктор Бабарико отказывается отвечать на вопросы о Крыме? Это нежелание или политическая позиция? Спросили аналитика
  8. Привел Лукашенко к власти, затем стал его противником и написал одну из лучших книг об этом политике. История Александра Федуты
  9. «Растет продолжительность жизни». Чиновники оперативно по цепочке утверждают пенсионное изменение
  10. «Сложнейший вопрос». Украинский журналист спросил у Виктора Бабарико, чей Крым, — что он ответил
  11. «Ребята, надо уметь признавать поражение». Лукашенко рассказал о «прагматичных предложениях», которые передал Коулу
  12. «Стоимость уходит все дальше от отметки в 2000 долларов». Что происходит на рынке недвижимости в Минске


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.