2022网安创业新锐50强诞生,博特智能成独一入选的内容安全企业
内容安全痛点诞生新蓝海
平台对展示用户内容负责任,内容审核风险控制,内容监督、内容巡查等环节成了互联网企业的生死线,如今已是整个互联网行业公认的生存之基。
近年来内容安全事件的高发,特别是在app领域,也证明了行业中内容安全风险控制仍存在缺口。内容型、社交型、电商型等不同行业的企业品宣内容频频“翻车”。
不仅如此,甚至还存在低俗营销、等高危内容风险。随着互联网内容越发繁杂且海量,以及市场与行业升级之后,信息传播的媒介与形态越来越多样化,传统的人工审核方式已经不能从容应对内容安全危机了。
人工审核效率低、成本高、主观成分高、评判标准不统一等等。其本身有着天然缺陷,仅人工成本不断提高这一项就让企业犯难。有企业曾透露,一人一天审核4万条信息,日均100万数据,光审核人力成本就要200万以上。而且图片、视频、音频等形式的海量内容爆发,又给人工审核带来了新的挑战。
海量内容,如何系统化提升内容安全风险控制能力与审核效率?
如何对涉政、涉恐、广告等高危内容风险扼杀在审核环节?
高危内容的“漏网之鱼”又该如何进行常态化的信息巡查与清理?
可以说,互联网企业都将AI审核技术作为主要突破点,内容管控、风险监控与处理、节省人力成本与提升运营效率则是直接的硬核需求。
近年来,愈演愈烈的内容风险问题,已成了制约行业发展的痛点,同时也让智能内容处理市场成了新的蓝海赛道。
稿件审核的自然语言处理
自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。
稿件审核智能化的错敏检测
对于政务部门来说,发布的内容不准确会危及到其公信力;对于企业来说,敏感内容容易触及企业红线或违反广告法;对于媒体机构来说,差错内容甚至可能对公众造成误导。这意味着在发出之前的校对工作任务量多,且对准确率要求高,对敏感词汇要求较多,传统人工校对已难以负荷如此庞大繁杂的文稿数量。
随着互联网、机器学习以及自然语言处理的发展,智能文本纠错技术应运而生。但随着用户对文本纠错系统的要求提升,市面上一些基础的文本纠错系统仍不能满足一些用户需求。
稿件审核的状态
1.Submitted to Journal(已投稿): 目前通常在线投稿或电子邮件投稿,投稿后显示的状态是Submitted to Journal,这个状态投稿后自然形成,无需处理。
2.With editor(选择编辑): 如果投稿时作者没有要求选择编辑,就先到主编那里,主编会分派给别的编辑。这当中就会有另两个状态:
① Editor assigned 编辑分派
② Editor Declined Invitation 编辑拒绝邀请,这时主编将该文章重新分派给其它编辑。
3.Reviewer(s) invited(邀请审稿人): 说明编辑已接手处理,正在邀请审稿人中。有时该过程会持续很长时间,如果其中原因是编辑一直没有找到合适的审稿人,这时投稿者可以向编辑推荐审稿人。
4.Under review(审稿中):审稿人的意见已上传,说明审稿人已接受审稿,正在审稿中,这应该是一个漫长的等待(期刊通常会限定审稿人审稿时间,一般为一个月左右)。如果被邀请审稿人不想审,编辑会重新邀请别的审稿人。
5.required review completed(审稿结束,等待处理):审稿结束,等编辑处理,该过程短则几天,长则无期,可以一段时间后可以去email催一催编辑。
6.Decision in Process(正在处理审稿意见):到了这一步就快要有结果了,编辑开始考虑是给修改还是直接拒,很少能直接接受。