
Разбираемся в GPT-4o: Лучший ли это ИИ или просто хорошо обученная модель?
#GPTэкспертиза: Модель GPT-4o — это лучший или худший ИИ?
Спойлер:
По этому ЕГЭ GPT-4o считается одной из сильнейших моделей. Однако нюанс: все вопросы и ответы доступны нейронке заранее. ИИ просто запоминает ответы, а не размышляет над вопросами.
Результаты этого бенчмарка разительно отличаются: средний человек набирает 96% правильных ответов, а лучшая модель ИИ - всего 32%. Лидер - Claude 3.5 Sonnet от Anthropic, а у GPT-4o результат в три раза хуже.
Вывод: громкие заявления о "сверх разумности" ИИ-моделей правдивы, но частично. Во многих несложных вопросах, требующих реального мышления, все модели до сих пор значительно уступают человеческому мозгу.
Вы верите, что ИИ превзойдет человеческий мозг?























