Исследования показывают, что большие языковые модели по-прежнему испытывают трудности с выполнением простых задач, таких как определение времени.