DeepSeek のデータ漏えい警報は否定されました。特別なトークンがマルチテナント侵害ではなくモデルの記憶を呼び起こします

DEEPSEEK-5.01%

Beatingのモニタリングによると、最近のバイラルな主張として、DeepSeekのチャットボックスに <|begin_of_sentence|> のような特殊トークンを入力すると、他のユーザーの会話が露出し得るとされる、P0レベルのマルチテナント分離の失敗だとする内容が拡散しました。実際には、この現象はデータの分離とは無関係です。このようなトークンでトリガーされると、モデルは学習時のフォーマットに従うパターンに入り、自身の記憶とシステムプロンプトに基づいて、創作された対話を生成します。これは他のセッションからリアルタイムで取得するものではありません。これは訓練データ抽出であり、DeepSeek固有のものではなく、すべての大規模言語モデルに共通する脆弱性です。Google DeepMindは2023年に、特殊な入力によってGPTやPaLMから学習データを抽出できることを示す研究を公表しました。ICLR 2025のMagpie論文は、この仕組みを直接活用しています。漏えいした内容に「今日の日付」が含まれているという主張は、マルチテナント分離の失敗を証明するものではありません。DeepSeekはシステムプロンプトに現在の日付を含めており、モデルは自然にそれを生成された出力へ取り込むためです。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし