La seguridad de la IA no es algo único para todos; es muy específico culturalmente. Me encontré con este documento de LinguaSafe y realmente destaca algo importante para cualquiera que construya IA para una audiencia global. Simplemente traducir un mensaje dañino del inglés puede ser un jailbreak efectivo. El mismo mensaje que es "seguro" en inglés se convierte en "inseguro" en otros idiomas, por lo que necesita datos nativos reales para detectar estos problemas.
8.06K