Повідомлення Gate News, 23 квітня — Дослідники Google, зокрема Хе Каймінг і Сіє Сайнгін, опублікували статтю, в якій представили Vision Banana — універсальну модель розуміння зору, створену шляхом легкого інструктивного доопрацювання (instruction fine-tuning) моделі для генерації зображень Nano Banana Pro (Gemini 3 Pro Image) компанії. Ключова інновація уніфікує виходи всіх задач зору як RGB-зображення, даючи змогу виконувати сегментацію, оцінювання глибини та прогнозування нормалей поверхні через генерацію зображень без спеціалізованих архітектур чи функцій втрат.
У семантичній сегментації Vision Banana перевершила спеціалізовану модель SAM 3 на 4,7 відсоткового пункту на Cityscapes; у сегментації за виразом (referring expression segmentation) вона випередила SAM 3 Agent. Однак у задачах сегментації екземплярів вона відставала від SAM 3. Для 3D-завдань метричне оцінювання глибини досягло 0,929 середньої точності на чотирьох стандартних наборах даних, перевищивши 0,918 Depth Anything V3, використовуючи лише синтетичні дані без реальної інформації про глибину або параметрів камери під час інференсу. Оцінювання нормалей поверхні досягло результатів на рівні найсучасніших у трьох внутрішніх бенчмарках.
Доопрацювання передбачало мінімальні дані з задач зору, змішані з початковим тренуванням генерації зображень, що зберегло здатність моделі до генерації — продуктивність відповідала оригінальній Nano Banana Pro в тестах якості генерації. У статті пропонується, що попереднє навчання (pretraining) генерації зображень у візії подібне до попереднього навчання генерації тексту в мові: моделі вчаться внутрішнім представленням, потрібним для розуміння зображень, під час генерації, а інструктивне доопрацювання лише вивільняє цю здатність.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
Компанію з даних для ШІ Mercor обкладено принаймні 7 колективними позовами через витік даних, комп’ютерний нагляд
Повідомлення Gate News, 23 квітня — компанія з розмітки даних для ШІ Mercor, оцінена в $10 мільярд і базується в Сан-Франциско, протягом останніх тижнів стикається щонайменше з сімома колективними позовами через витоки даних від сторонніх осіб. Компанія співпрацює з клієнтами, зокрема OpenAI, Anthropic і Meta, надаючи дані з фідбеком для навчання моделей ШІ через найманих працівників. Витеклі дані включають відеоінтерв’ю підрядників, біометричні дані обличчя та скриншоти з комп’ютерів.
Позови, подані у вівторок у Північній Каліфорнії, стверджують, що Mercor зібрала дані для перевірки фону претендентів на роботу та передала їх партнерам, порушивши федеральні нормативні акти. Позивачі також звинувачують компанію в моніторингу комп’ютерів підрядників і передачі даних клієнтам, використанні відеоінтерв’ю для навчання моделей ШІ та навчанні клієнтських моделей матеріалам, які потенційно належать іншим компаніям. Mercor заперечує ці звинувачення, заявляючи, що дотримується всіх застосовних законів, і найняла сторонніх експертів з цифрової криміналістики для розслідування інциденту.
Девід Беввіно-Берв, колишній співробітник Goldman Sachs і один із позивачів, стверджує, що під час роботи в Mercor він бачив фінансові моделі та підказки (prompts), що містили маркери інституційних терміналів даних і реальні імена контрагентів, що вказує на наявність запатентованої інформації з інших фірм. Інший позивач, Тхітипун Срінарамвонг, стверджує, що керівники проєктів заохочували працівників використовувати реальні дані зі своїх основних робочих місць лише з анонімізацією, і що рецензенти критикували його подання як "занадто короткі та надто нечіткі", коли він навмисно приховував чутливу інформацію. Mercor вимагає від підрядників встановити програмне забезпечення для знімків екрана Insightful, яке працівники кажуть, може робити скриншоти щохвилини. Беввіно-Берв повідомляє, що Insightful зафіксував зображення приблизно 240 заявок, включно з його банківським рахунком і порталами медичного страхування, без попереднього повідомлення про те, що моніторинг поширюватиметься на роботу, яка виходить за межі діяльності, пов’язаної з Mercor.
Meta призупинила партнерство з Mercor і розпочала розслідування. У 2025 році Mercor залучала 30,000 підрядників.
GateNews21хв. тому
SpaceX оцінює загальний доступний ринок у $28,5 трлн: $26,5 трлн надходитимуть із сектора AI
Повідомлення Gate News, 23 квітня — SpaceX оцінює свій загальний доступний ринок (TAM) у $28,5 трлн, згідно з внутрішніми документами. Компанія прогнозує, що понад 90% ринку, приблизно $26,5 трлн, припадатиме на штучний інтелект.
Enterprise AI, як очікується, становитиме більшість можливостей ринку AI, представляючи приблизно $22,7 трлн від загального TAM.
GateNews57хв. тому
«Біблія Навального» Naval запускає AI-фонд USVC, роздрібні інвестори також можуть інвестувати до біржового розміщення в OpenAI, Anthropic
Силіконової долини відомий інвестор Naval, у межах власного фонду AngelList нещодавно запустив новий фонд під назвою USVC, який робить акцент на тому, що звичайні інвестори також можуть опосередковано долучатися до популярних непублічних технологічних компаній, починаючи з мінімального порогу в 500 доларів США: OpenAI, Anthropic, xAI, Vercel, Crusoe, Sierra та Legora.
Офіційно його упакували як «інвестування в компанії майбутнього до того, як усе стане очевидним» і наголошують, що це фонд, відкритий для всіх інвесторів, без необхідності мати статус кваліфікованого інвестора; таким чином вони намагаються перетворити венчурні активи, які раніше були доступні лише багатим і «своїм» у колі, на продукт, до якого можуть дотягнутися й роздрібні інвестори.
500 доларів США — цього достатньо, щоб інвестувати в ранні AI-компанії
Ключовий наратив USVC дуже прямолінійний: коли все більше зіркових стартапів обирають залишатися в приватному ринку протягом тривалого часу, справжній вибуховий ріст оцінки, як правило, відбувається в I
ChainNewsAbmedia1год тому
Tesla придбає компанію з апаратного забезпечення для ШІ за суму до $2 Billion
Повідомлення Gate News, 23 квітня — Tesla оголосила 23 квітня, що погодилася придбати компанію з апаратного забезпечення для штучного інтелекту за суму до $2 мільярда в звичайних акціях Tesla та у вигляді нагород за акціями.
Приблизно $1.8 billion
GateNews1год тому
Провідні юридичні фірми беруть понад дві тисячі доларів США за годину, судові документи були викриті «AI-галюцинаціями та суцільними помилками»
Американська провідна юридична фірма Sullivan & Cromwell подала до суду в Манхеттенській справі про банкрутство Саллівана — Кренвела — визнала, що в судових документах, поданих у цій справі, було близько тридцяти місць із помилками, сфабрикованими прикладами та вигаданими нормами, і принесла судді вибачення. Незважаючи на високі погодинні ставки та внутрішні політики навчання, під час фактичної підготовки не було належним чином впроваджено перевірку, і ця подія знову викликала дискусії щодо використання AI в юридичній сфері та етичної відповідальності.
ChainNewsAbmedia1год тому
DeepSeek відкриває TileKernels з відкритим кодом: бібліотека GPU-ядр для тренування й інференсу великих моделей
Повідомлення Gate News, 23 квітня — DeepSeek відкрив вихідний код TileKernels під ліцензією MIT: бібліотека GPU-ядр для обчислень, написана на TileLang для тренування та інференсу великих мовних моделей. TileLang — це предметно-орієнтована мова, розроблена командою tile-ai для вираження високопродуктивних GPU-ядр у
GateNews1год тому