共享反垃圾先进技术
在中国互联网协会行业自律工作委员会的指导下,由百度贴吧发起并联合开心网、搜狐社区、网易论坛、腾讯论坛、天涯、猫扑、凤凰论坛、西祠胡同网、京探网、19楼空间等社区平台共同参与的“反垃圾信息网络社区联盟” 日前宣告成立。联盟成员间将本着开放原则,共享反垃圾信息最新技术成果、采取共建垃圾信息特征数据库、设立共通的垃圾信息投诉举报通道等举措,向网络社区垃圾信息宣战。
据CNNIC最新统计数据,38%的网民在网络上有经常访问社区论坛的行为。社区论坛已成为网民获取信息、沟通交流最重要的平台之一。正因为如此,网络社区也成为不法分子争夺眼球的主要阵地,垃圾广告、不良交易和欺诈等信息的出现严重影响了网民的上网体验。一直以来,各大社区网站投入了大量人力及技术资源,用于处理此类信息。
“反垃圾信息网络社区联盟”的成立,意味着各大社区将联手打响一场垃圾信息围歼战。联盟将建立一个垃圾信息特征数据库,由联盟全体成员共同参与维护和建设。联盟成员对其平台中出现的垃圾信息的特征,包括URL、图片、电话等数据,进行提取后加入到数据库中,以帮助联盟其他成员快速识别处理雷同的垃圾信息,提升垃圾信息的处理效率。
来自百度贴吧的数据显示,恶意群发推广类的垃圾信息大约占到了社区垃圾信息总量的85%以上,且此类信息常常被同时发布至成百上千个社区论坛。未来通过采取上述举措,这些内容雷同的垃圾信息将很容易被识别并被快速删除,大大降低其存活率,同时减少各大平台的治理成本。
此外,联盟还表示,联盟成员之间将不定期分享垃圾信息治理的最新技术成果,以帮助联盟成员同步提升垃圾信息治理综合实力。并且,针对广大网民,联盟将建立共通的垃圾信息投诉和举报通道,并敦促联盟成员及时处理相应投诉和举报。
随着联盟的成立,各大网络社区对抗垃圾信息的最新举措和技术成果得以向外界披露。据了解,当前网络社区业界对垃圾信息的治理普遍分为技术策略、关键词过滤、人工审核和用户投诉几大机制。开心网通过增加验证次数,甚至关闭注册地址的方式限制“马甲”用户恶意灌水。天涯社区实施重点监管巡查,可以对IP及ID实现批量注销处理;在搜狐社区,庞大的人工审核团队能24小时不间断对社区言论进行监控,可以做到不漏删、不误删、不积压;在西祠社区,通过关键词的检索和过滤,可以直接筛除与色情、暴力、非法等相关的垃圾信息;而对于用户投诉,联盟成员都建立了绿色通道,保证快速、准确响应。
作为联盟的发起者,百度贴吧的反垃圾信息技术尤为引人注目。截至目前,贴吧已建立了包括机器识别、特殊事件处理、人工协同以及垃圾信息警示等机制在内的立体网络。针对爆吧、大批量垃圾信息发送者,贴吧拥有一套完整的预警机制,能够自动响应并做出相应的防御部署。而在信息验证方面,贴吧拥有独创的“神兽”和“静止蛙技术”,通过开启超级验证码和关闭对旧帖子的回复等功能,有效整治了垃圾信息。数据显示,贴吧日均清除垃圾信息100万条,垃圾信息量占总信息量的比例不足1%,居于全球网络社区领先水平。
在互联网上,同一行业联合起来对抗有害信息的情况并不多见,此前主要出现在反垃圾邮件领域。互联网业界知名人士刘兴亮分析,尽管在“单兵作战”时代,各大网络社区已经有完整成熟的反垃圾信息体系,但在协同防治方面很难共享资源和技术,阻碍了打击效率的进一步提升。反垃圾社区联盟成立后,掌握先进处理技术的百度贴吧等大型社区如能率先开放共享技术策略,将推动整个社区行业反垃圾处理技术壁垒的降低,为有效降低垃圾信息存活率、净化互联网空气带来深远影响。