AI欺诈与AI防护之间的军备竞赛

人工智能使生成令人信服的网络钓鱼电子邮件、虚假职位列表和深度伪造招聘视频变得微不足道。现在网络安全公司正在部署自己的AI来对抗——结果好坏参半。NordVPN最近推出了欺诈检测功能,使用机器学习实时分析可疑消息和链接。问题是它是否能够可靠地检测针对用户的AI工具。

时机很重要。随着生成AI的成熟,在线诈骗的复杂性大幅增加。虚假职位招聘现在附带精良的求职信、逼真的公司档案和针对目标工作历史的个性化参考。简单的基于关键字的过滤器已不再足够。

NordVPN欺诈检查器实际上做什么

该功能通过分析URL、电子邮件和消息的元数据和内容来工作。当用户标记某些内容为可疑时,检查器会针对已知威胁模式数据库运行它,同时应用语言模型分析来识别欺骗意图、不匹配的细节和操纵策略。

与早期的基于规则的系统不同,NordVPN的方法使用一种对抗性训练形式——它接受了AI生成诈骗的例子训练,这意味着它已经看到这些工具产生的模式。这在理论上是一个优势,但创造了自己的军备竞赛动态:随着诈骗生成器的改进,检测工具必须重新训练以保持步伐。

针对AI生成招聘诈骗的测试

针对高级招聘诈骗的真实测试——由大型语言模型生成并针对专业人士的那种——显示了细致的图景。对于直接的网络钓鱼尝试,该工具表现良好,正确标记可疑链接和不可信的发件人详情。挑战来自更复杂的例子。

AI生成的招聘诈骗越来越多地冒充真实公司、引用真实员工并使用可信的职位描述。在这些情况下,欺诈检查器的准确度下降,特别是当欺诈接触通过LinkedIn或具有干净发件人信誉的电子邮件服务等合法平台路由时。

这是一个已知的限制:当诈骗者使用信任的基础设施时,AI检测工具会遇到困难。使用真实公司电子邮件域名、引用真实职位发布并提供到合法视频会议服务的会议链接的虚假招聘人员可以绕过自动过滤器,无论其有多复杂。

没有检测器能解决的限制

任何诈骗检测系统的根本挑战是相同的使欺诈成为可能的AI能力也使检测更加困难。生成令人信服的人类文本的语言模型也生成在标准真实性指标上评分良好的文本。检测工具需要依赖行为信号——时间模式、异常请求序列、与已知欺诈网络的交叉引用——而不是仅内容。

NordVPN的工具在行为分析中显示了希望,正确识别了多个通过内容审查但展示可疑链接结构或在对话早期要求敏感信息的诈骗。这表明AI诈骗检测最可防守的策略是查看整个对话中的模式,而不是分离分析任何单个消息。

对网络安全的更广泛影响

这个测试说明的是网络安全行业进入了一个AI对抗AI的冲突将成为威胁景观永久特征的阶段。最有利位置来防御AI生成欺诈的公司是那些拥有最大真实诈骗示例训练数据集的公司——一个已建立安全公司相对于新进入者的数据优势。

同时用户不应将任何单个工具视为明确的保护。最佳方法结合自动检测与个人验证习惯:独立确认招聘人员身份、警惕任何异常快速进行的过程,并将财务信息或个人文件请求视为无论检查器说什么都早期红旗的关系。

这里更广泛的故事是技术民主化向两个方向切割。AI使复杂欺诈对低技能攻击者可访问并使检测工具更加能力强大。防御目前不是向前冲——而是保持步伐。

本文基于ZDNET的报告。读原始文章

Originally published on zdnet.com