基于RoBERTa-BiGRU-eKAN的AI生成水印文本检测模型研究
作者:许鑫,刘冬,蔚海燕
关键字:AI生成文本,水印,eKAN,RoBERTa,SynthID
摘要:针对AI生成文本的快速精准识别问题,使用HC3数据集、SynthID水印生成算法和Gemma2-2B-it模型生成了包含人类撰写、AI生成、AI生成水印文本3种类别的AI生成水印检测文本数据集,并提出了基于一种RoBERTa-BiGRU-eKAN的高效AI生成水印文本检测模型。该模型首先使用RoBERTa对输入文本进行编码转换和文本语义特征的抽取,然后使用BiGRU进行特征的长距离归纳提炼,最后使用eKAN进行高效准确分类。通过文本长度、词性标注等维度对比分析,发现人类撰写文本长度较短且语言表达更加生动,语法结构也更为复杂。检测结果表明,提出的模型在AI生成水印文本检测中准确率、精准率、召回率和F1值分别达到了96.39%、96.40%、96.41%和96.39%。
原文链接:点击访问