Біржовий світ 1 січня повідомляє, що з настанням 2026 року у галузі безпеки ШІ відбувся перший вагомий бенчмарк-тест. LISABench сьогодні оголосив про запуск оцінювання за перший квартал 2026 року, метою якого є визначити найпередовіші моделі ШІ у сфері виявлення вразливостей у смарт-контрактах Web3 через практичне тестування. Крім того, LISABench одночасно проводить активність з голосування та прогнозування з нагородами. Цей тестовий склад вражає своєю розкішшю, зібравши передові моделі KIMI K2 (Moonshot AI), DeepSeek V3.2 (Глибоке дослідження), QWen 3 30b-a3b (Alibaba Cloud), GLM 4.6 (Zhituo AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google) та Claude 4.5 Sonnet (Anthropic), сім найкращих передових моделей у світі (Frontier Models), які змагаються між собою. Наразі відкрито голосування для прогнозування переможця у Q1. Також, кодова база стандартів оцінювання LISABench вже опублікована на GitHub для ознайомлення та відтворення розробниками.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
LISABench 2026 — перший тест року, сім провідних моделей штучного інтелекту змагаються за звання короля виявлення вразливостей Web3
Біржовий світ 1 січня повідомляє, що з настанням 2026 року у галузі безпеки ШІ відбувся перший вагомий бенчмарк-тест. LISABench сьогодні оголосив про запуск оцінювання за перший квартал 2026 року, метою якого є визначити найпередовіші моделі ШІ у сфері виявлення вразливостей у смарт-контрактах Web3 через практичне тестування. Крім того, LISABench одночасно проводить активність з голосування та прогнозування з нагородами. Цей тестовий склад вражає своєю розкішшю, зібравши передові моделі KIMI K2 (Moonshot AI), DeepSeek V3.2 (Глибоке дослідження), QWen 3 30b-a3b (Alibaba Cloud), GLM 4.6 (Zhituo AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google) та Claude 4.5 Sonnet (Anthropic), сім найкращих передових моделей у світі (Frontier Models), які змагаються між собою. Наразі відкрито голосування для прогнозування переможця у Q1. Також, кодова база стандартів оцінювання LISABench вже опублікована на GitHub для ознайомлення та відтворення розробниками.