Google запускає чипи TPU восьмого покоління з покращеним показником ціна/продуктивність, розділяє навчання та інференс

Повідомлення Gate News, 22 квітня — Google Cloud оголосила про випуск своїх чипів TPU (Tensor Processing Unit) восьмого покоління власної розробки 22 квітня. Новий лінійний ряд включає TPU 8t, створені спеціально для задач AI-навчання, і TPU 8i, оптимізовані для робочих навантажень AI-інференсу. Обидва чипи стануть доступними пізніше цього року. Google також представила нові інструменти для створення AI-агентів і оголосила $750 мільйонний фонд для стимулювання впровадження корпоративного AI.

TPU 8t забезпечує 2,8 раза продуктивності попереднього TPU Google Ironwood попри ту саму цінову категорію. TPU 8i підвищує продуктивність на 80% порівняно з попередником і включає архітектуру статичної оперативної пам’яті з довільним доступом (SRAM), щоб забезпечити “економічно ефективну масштабовану пропускну здатність і низьку затримку, дозволяючи мільйонам агентів працювати одночасно”, — за словами генерального директора Сундара Пічаї. Порівняно з Ironwood, обидва TPU 8t і TPU 8i досягають більш ніж дворазової ефективності за продуктивністю на ват: TPU 8t покращує показник на 124%, а TPU 8i — на 117%. Google оптимізувала енергоефективність у всьому технологічному стеку та інтегрувала системи динамічного керування потужністю, які регулюють споживання залежно від реального попиту.

Клієнтські моделі Google тепер обробляють понад 160 мільярдів токенів за хвилину через прямі виклики API клієнтів, що більше ніж 100 мільярдів минулого кварталу. Тепер AI створює 75% усього нового коду в Google, тоді як восени минулого року цей показник становив 50%. Gemini Enterprise, корпоративна пропозиція Google, зросла на 40% квартал до кварталу в оплачуваних щомісячно активних користувачах. Компанія очікує інвестувати трохи більше половини свого бюджету обчислень машинного навчання в хмарні сервіси до 2026 року, щоб краще обслуговувати хмарних клієнтів і партнерів. Google також розширює співпрацю з Broadcom, щоб розробляти та постачати власні чипи TPU для майбутніх поколінь, оскільки великі технологічні компанії шукають альтернативи дорогим і таким, що мають обмеження постачання, GPU від NVIDIA та AMD.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

AI-агент для виявлення вразливостей від 360 знаходить майже 1 000 експлойтів для zero-day, конкуруючи з Mythos

AI-агент із керуванням від 360 Digital Security заявляє, що знайшов приблизно 1 000 нових вразливостей, зокрема в Office та OpenClaw; AI тепер є основою для виявлення та підготовки ланцюжків експлойтів, конкуруючи з Mythos. Анотація: У звіті, на який посилається Bloomberg, зазначено, що AI-керований агент із виявлення вразливостей 360 Digital Security Group упродовж останніх місяців визначив майже 1 000 раніше невідомих вразливостей, зокрема в Microsoft Office та у фреймворку OpenClaw. Компанія стверджує, що AI перетворився на основний рушій для виявлення вразливостей, і оголосила про AI-інструмент, який прискорить побудову ланцюжків експлойтів. Бенінказа описує 360 як конкурента Mythos від Anthropic на основі огляду компанії, зробленого Natto Thoughts, за її китайськомовними оголошеннями.

GateNews3хв. тому

Юйфань Чжан розкриває повні технічні специфікації DeepSeek V4: 1,6T параметрів, 384 експерти з 6 активаціями

Повідомлення Gate News, 22 квітня — аспірант Принстонського університету Юйфань Чжан розкрив повні технічні характеристики DeepSeek V4 у X після попереднього анонсу 19 квітня. V4 має загалом 1,6 трильйона параметрів і полегшений варіант V4-Lite, який містить 285 мільярдів параметрів. Модель використовує механізм уваги DSA2

GateNews1год тому

Генеральний директор Anthropic їде до Білого дому на «прорив криги»: зустріч із начальником апарату, Бессентом для обговорення Mythos

The Wall Street Journal повідомляє, що генеральний директор Anthropic Амодеї 17.04 провів закриту зустріч із Білим домом, зосередившись на межах національної безпеки та відповідальному розгортанні Mythos; Білий дім заявив, що зустріч була конструктивною, а ринок сприймає це як розмороження відносин. Ключова суперечність полягає в тому, що військові хочуть, щоб Claude використовували для всіх законних цілей, тоді як Anthropic наполягає на власному розсуді щодо політики прийнятного використання. Обидві сторони заявили, що продовжать діалог, і що вони ще раз обговорять це перед запуском Mythos у травні.

ChainNewsAbmedia2год тому

Google Ironwood TPU: у 10 разів вища продуктивність + чотири партнери протистоять Nvidia

Згідно з поглибленим звітом Bloomberg і офіційним оголошенням Google, 22 квітня Google офіційно розширила лінійку власних AI-чипів: спеціалізований для інференсу Ironwood (сьоме покоління TPU) повністю доступний у Google Cloud, а також одночасно запущено проєкти спільного проєктування наступного покоління з партнерами Broadcom, MediaTek, Marvell та Intel. Мета — через позитивний вплив ланцюга постачання з кастомізованими чипами напряму кинути виклик домінуванню Nvidia на ринку обчислювальної потужності для AI. Ironwood: сьоме покоління TPU, уперше — чіп, призначений саме для інференсу Ironwood — це продукт сьомого покоління серії Google TPU, а також перший чіп, спеціально створений для інференсу в межах стратегії «розділення навчання та інференсу». Розкриті Google характеристики: пікова продуктивність на одному чипі становить T

ChainNewsAbmedia2год тому

DeepSeek веде переговори про перший раунд зовнішнього фінансування, оцінка 20 мільярдів доларів США: новий рекорд оцінки для AI у Китаї

Згідно з повідомленням Bloomberg від 22 квітня (з посиланням на The Information у ексклюзиві), китайський AI-стартап DeepSeek веде переговори про перший раунд зовнішнього фінансування, а його оцінка становить 20 млрд доларів. Це перший випадок, коли DeepSeek з моменту заснування у 2023 році виходить на зовнішні збори коштів; раніше його повністю фінансував усередині кількісно-орієнтований хедж-фонд High-Flyer Capital Management. Оцінка в 20 млрд доларів також є віхою для китайських AI-стартапів — уперше вони виходять у «нижню половину» діапазону «оцінка понад 100 млрд доларів». Обсяг фінансування та ціль використання коштів DeepSeek шукає щонайменше 300 млн доларів у першому раунді фінансування; оцінка в 20 млрд доларів удвічі перевищує раніше розкриту 17 квітня The Information оцінку «понад 10 млрд доларів»

ChainNewsAbmedia2год тому

Google запускає інструменти для агентів ШІ, щоб допомогти підприємствам автоматизувати завдання

Google розкриває інструменти для створення агентів ШІ, щоб автоматизувати завдання, відстежувати прогрес і керувати робочими процесами через окремі вхідні скриньки агентів, разом із оновленнями для Workspace та баченням того, що агенти ШІ змінять щоденні робочі ритуали співробітників. Анотація: Google представила інструменти для створення агентів ШІ для автоматизації завдань, моніторингу їхнього прогресу та оптимізації робочих процесів, сигналізуючи про оновлення Workspace і майбутнє, у якому агенти ШІ перетворять щоденну роботу.

GateNews2год тому
Прокоментувати
0/400
Немає коментарів