Як заявив Ян Лекун у нещодавньому інтерв’ю, великі мовні моделі не можуть спричинити штучний загальний інтелект, попри свою цінність, адже вони не мають здатності передбачати наслідки дій і планувати в абстрактному просторі — можливостей, необхідних для справжнього міркування на рівні людини. Лекун підкреслив, що успіх LLM базується на дискретній природі мови, але реальний світ є безперервним і високовимірним: він вимагає від моделей розуміння фізичної причинності, а не просто прогнозування наступного токена.
Лекун пропонує як альтернативу Joint Embedding Predictive Architecture (JEPA), яка прогнозує майбутні стани в простірі семантичних репрезентацій, а не відтворює окремі пікселі. Стаття за березень 2026 року про LeWorldModel продемонструвала потенціал JEPA: модель із 15-мільйонним параметром досягла 96% успішності на задачах керування та прискорила планування до 50 разів, не потребуючи масивних наборів даних для попереднього навчання.