ゲートニュースのメッセージ、4月23日 — Googleの研究者、He Kaiming と Xie Saining を含むが、Vision Banana を紹介する論文を発表した。Vision Banana は、同社の Nano Banana Pro (Gemini 3 Pro Image) の画像生成モデルを対象に、軽量な指示(インストラクション)のファインチューニングを行って作られた汎用の視覚理解モデル。主な革新は、すべての視覚タスクの出力をRGB画像として統一し、タスク固有のアーキテクチャや損失関数を使わずに画像生成によってセグメンテーション、奥行き推定、表面法線の予測を可能にする点にある。
意味セグメンテーションでは、Vision Banana は Cityscapes で専門モデル SAM 3 を 4.7 パーセントポイント上回った。指示表現セグメンテーションでは、SAM 3 Agent を上回った。だが、インスタンスセグメンテーションでは SAM 3 に遅れをとった。3D タスクでは、指標となる奥行き推定で、4つの標準データセット全体にわたり平均精度 0.929 を達成し、推論時に実際の奥行き情報やカメラパラメータを使わず、合成データのみで Depth Anything V3 の 0.918 を上回った。表面法線推定は、3つの屋内ベンチマークで最先端の結果を達成した。
ファインチューニングでは、元の画像生成学習に最小限の視覚タスクデータを混ぜるだけで、モデルの生成能力を維持した。生成品質テストでは、性能は元の Nano Banana Pro と一致した。論文は、視覚における画像生成の事前学習は、言語におけるテキスト生成の事前学習と並行していると提案する。つまり、モデルは生成中に画像理解に必要な内部表現を学び、指示のファインチューニングはその能力を解放するだけだという。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
データ侵害をめぐりAIデータ企業Mercorが少なくとも7件の集団訴訟に直面、コンピュータ監視
ゲート・ニュース 4月23日 — AIデータのラベリング企業Mercorは、$10 billionの評価額を持ち、サンフランシスコに本社を置く。同社は、近数週間で少なくとも7件の集団訴訟に直面しており、第三者によるデータ侵害をめぐるものだ。MercorはOpenAI、Anthropic、Metaを含む顧客と協業しており、委託作業者を通じてAIトレーニング用のフィードバックデータを提供している。漏えいしたデータには、委託先の動画インタビュー、顔のバイオメトリクスデータ、そしてコンピュータのスクリーンショットが含まれる。
GateNews21分前
スペースX、総計可能市場を28.5兆ドルと見積もり、AI分野からは26.5Tドル
ゲートニュース(4月23日)— スペースXは、社内資料によると、総計可能市場((TAM))を28.5兆ドルと見積もっている。同社は、市場の90%超、約26.5兆ドルが人工知能からもたらされると見込んでいる。
エンタープライズAIは、AI市場機会の大半を占めると予想されており、総計可能市場(TAM)のうち約22.7兆ドルに相当する。
GateNews57分前
『ナヴァル宝典』Naval が AI ファンド USVC を発表、個人投資家も上場前に OpenAI、Anthropic へ投資可能
シリコンバレーの著名投資家であるNavalが率いるAngelListは近日、新たなファンド名「USVC」を立ち上げ、一般投資家も最低500ドルという低いハードルで、間接的にOpenAI、Anthropic、xAI、Vercel、Crusoe、Sierra、そしてLegoraなどの人気の未上場テクノロジー企業に参加できることを打ち出している。
公式ではこれを「すべてが明らかになる前に、未来を形づくる企業に投資する」として包み込み、これはすべての投資家に開放された、適格投資家の資格を必要としないファンドであると強調している。富裕層や業界の内輪だけが過去に独占していたベンチャー投資資産を、一般の投資家にも手が届く商品へと変えようとしている。
500ドルで初期のAI企業に投資可能
USVCの中核となる物語は非常に明快だ。より多くのスター級スタートアップが長期間プライベート市場にとどまるようになり、本当に爆発的なバリュエーションの成長が起きるのは、往々にしてI
ChainNewsAbmedia1時間前
テスラ、最大$2 BillionでAIハードウェア企業を買収へ
Gate Newsのメッセージ、4月23日 — テスラは4月23日、人工知能(AI)ハードウェア企業を最大$2 billionのテスラ普通株式および株式報酬の形で買収することに合意したと発表しました。
約$1.8 billion
GateNews1時間前
一流法律事務所の時間単価は2,000ドル超、法廷文書で「AIの幻覚、誤りの連発」が暴露される
米国の一流法律事務所サリバン・クロンウェルが、マンハッタンの破産案件で提出した裁判書類に、約30件のAI生成ミス、虚偽の事例、捏造された条文が含まれていたとして、裁判官に謝罪した。高額な時間単価と社内の研修ポリシーがあるにもかかわらず、実際の準備段階で監査が徹底されていなかったため、この件は改めて、法律分野におけるAIの利用と倫理的責任についての議論を呼び起こした。
ChainNewsAbmedia1時間前
DeepSeekがオープンソース化、TileKernels:大規模モデルの学習と推論のためのGPUカーネルライブラリ
Gate Newsのメッセージ、4月23日 — DeepSeekはMITライセンスのもとでTileKernelsをオープンソース化しました。TileKernelsは、大規模言語モデルの学習と推論のためにTileLangで書かれたGPUカーネルライブラリです。TileLangは、tile-aiチームによって開発された、Pythonで高性能なGPUカーネルを記述するためのドメイン固有言語であり、
GateNews1時間前