据外媒报道,无论是想要理解你在搜索栏中输入的内容还是在邮件中检测垃圾信息,文本自动处理已经在网络中得到广泛运用。然而,如何开发一套快速、高效的文本分类系统却成为了AI(人工智能)研究人员在近些年来面临的一项挑战,这也是Facebook AI研究团队(FAIR)开始开发fastText的原因。现在,FAIR决定在这一项目中作出进一步的努力–宣布fastText开源。
FastText是一个旨在协助创建文本表达和分类的可伸缩解决方案的资料库。它最主要的一个优势是适用于非常大的数据库、某种深度神经网络–其中一种经常被拿来解决文本分类问题的解决方案,这意味着它能用于协助文本处理。FAIR指出,深度学习方法通常都需要缓慢的训练和测试才能实现。
FastText能够在几秒钟或几分钟内完成某一个大型数据库的培训。类似于它这样的系统已经在网络的垃圾邮件过滤中得到运用,相信伴随着fastText的开源,像Siri、Google Now等这样的语音助手将能更有效地对自然语言展开解析。
FAIR表示,将fastText开源化是团队与社区合作共享承诺的一部分。另外,他们还将在fastText上分享它们自己的研究成果,希望能借此帮助那些想要改善其应用的开发人员。
FastText源代码,请戳这里。
未经允许不得转载:陈丹的博客 » Facebook人工智能研究团队宣布fastText开源化