推特上总是充满有趣的话题,“话题标签(SlashTag)符号#”后面跟随的短语,往往不是字面上的意思,有时总是充满挖苦性意味。人们的冷幽默或者会
让电脑找不到南北,有两位电脑专家进行了一项研究,教会电脑分辨出推特话题标签字面背后的挖苦性意味,或许将来能够帮助推特进行更准确的社交趋势统计分
析。
研究论文标题为《推特上的上下文挖苦意味侦测(Contextualized Sarcasm Detection on Twitter)》,研究者称他们通过让计算机进行机器学习,掌握通常用于进行挖苦的关键因子,比如含有“明显(clearly)”,“吃惊(shocked)”“赞叹(gasp)”强调情感的用词“真的(really)”的话题标签往往都蕴藏挖苦意味。计算机还会分析关联因子来判断话题是否别有深意,比如地理位置,年龄,性别,甚至用户的历史交流记录也会被作为分析依据。据研究者称,通过各种关联因子的分析,计算机判断话题标签是否具有挖苦意味的准确率已经达到了85%。而且一个有趣的事实是,字面上包含“#sarcasm”的话题标签通常并不是真的具有挖苦意味,而是通常用来强调以下事实或者进行自嘲。
那么如果计算机会判断出挖苦意味,或许也能够善加利用向人们开玩笑,变得具有幽默感。设想下,或许以后的笑话都是计算机生成的,那样网络段子手是不是真该失业了?
未经允许不得转载:陈丹的博客 » 段子手的危机:计算机能成功分辨话题标签的讽刺口吻