Забудьте про AGI—провідні моделі ШІ все ще мають проблеми з математикою
Коротко
MATHVISTA, створений на основі понад 6000 анотованих точок даних від Sahara AI, тестує моделі штучного інтелекту на багатомодальне математичне мислення. GPT-4V набрав 49,9%, що є найвищим результатом серед 12 протестованих моделей, але все ще на 10,4 відсоткових пункти нижче за людську продуктивність. Дослідники кажуть, що прогрес у напрямку до штучного загального інтелекту (AGI) триває.
Decrypt·03-18 12:10
