Диагноз для ИИ: исследование Microsoft показало, что чат-боты страдают «цифровой шизофренией» при долгом общении

Microsoft Research и Salesforce впервые масштабно проверили, как меняется качество ответов ИИ в зависимости от длины диалога. Проанализировав 200 тысяч бесед с GPT-4.1, Gemini 2.5 Pro, Claude 3.7 Sonnet и DeepSeek R1, они получили неожиданные цифры: если короткие запросы модели отрабатывают почти идеально, то в длинных разговорах точность падает на треть. Причём проблема оказалась общей для всех систем — даже тех, которые позиционируются как самые умные

Опубликовано

в

,

от

Метки: