5月25日,由国家质量监督检验检疫总局、国家标准化管理委员会、新华通讯社联合攻关的“中文新闻信息技术标准”正式发布,并在全国范围内推广应用。该标准的推出,标志着我国新闻行业第一部国家标准诞生。
“孤岛”之困
一直以来,我国各新闻单位对信息的分类、处理有不同的标准和方式。 比如,同一稿件在A单位被作为经济类,而在B单位被作为政治类;对新闻的分类和描述、作者、签发时间、主要内容、文件格式等,各新闻单位不尽相同。这就对计算机的自动识别入库造成很大障碍,“有100个新闻单位,就有100种标准”。
这种“百花齐放”的局面致使各单位各自为政,无法实现数据的大量交流,造成信息重复生产或得不到挖掘利用等弊端,形成“孤岛”之困。
2003年11月,由新华社牵头,中央主要新闻单位联合攻关的“中文新闻信息技术标准”课题获科技部批准立项,并被列入国家“十五”重大科技专项。2005年11月7日,该课题通过了科技部和国家标准化管理委员会的验收,标志着我国新闻行业第一部国家标准诞生。
给新闻贴上“标签”
“中文新闻信息技术标准”课题组领导小组副组长孙宝传介绍,该标准共分两部分,一是《中文新闻信息分类与代码》,二是《中文新闻信息置标语言》,两者既独立成标又相互依存。前者是制ㄍ骋坏男挛判畔⒎掷啾曜迹苊馔黄寮诓煌ノ环掷嗖煌那樾巍6院笳叨裕帽晔且恢指袷剑纸性荩褪歉挛盘媳昵辛苏飧霰昵┘扑慊湍茏远侗鸨嫒稀?br> 新闻是一种信息,而标签是新闻的附加信息,是“信息的信息”。标签的内容可以包括管理元数据、描述元数据、权力元数据和物理元数据,能够规范描述新闻的标题、作者、稿件状态、紧急度、处理优先级、摘要、关键词、数据类型、版权情况等。
有了置标语言和相关软件,计算机能够对文字、图片、图形、音频、视频等不同格式的数据包自动识别处理,把稿件各归其类,便于查询使用。
如此,新闻信息实现了从无序到有序,从非结构化到结构化的转变,多媒体新闻信息能够在通讯社、报社、广播电台、电视台、网站以及新闻信息用户之间共享和交换。
中国工程院院士李幼平评价,当前互联网的应用还停留在网民搜索、挖掘网页,要实现“网页找网民”的语义网,就要发明某种内容定位工具,置标语言和分类标准是走向语义网的必经桥梁。
标准推广任重道远
如今,标准制定已尘埃落定,孙宝传认为,标准实施的前景是光明的,但要想真正推广开来任务还很艰巨。
当谈到如何做好标准的推广时,孙宝传表示,一是要加紧宣传,因为当前人们的标准意识还很淡薄,甚至有些媒体的领导认为“新闻需要什么标准”。这种认识上的差距只能慢慢改善。二是要有单位带头去用。标准只有用了才有意义,在使用中还可以不断发展与完善。“谁用谁得益”,让标准的使用者从中受益。三是需要相关软件和工具的支持,为了最大程度减少新闻工作者的劳动量,就要开发出相应的智能软件。四是要有一个科学的发展机制。新闻是一个充满变化的行业,标准也要与时俱进,要设立常设机构,对标准不断发展和升级。
孙宝传表示,这两项标准是具有前瞻性、跨媒体和创新性的新闻信息技术标准,可以满足覆盖全球华语国家和地区新闻媒体多样化的需求,适应新闻行业数字化、网络化、多媒体化的技术发展方向,为我国新闻产业的发展奠定了坚实的基础。标准的推广应用,将对新闻信息资源的交换、整合和挖掘起到巨大的促进作用,从而增强中文新闻信息在海外的核心竞争力。
来源: 中国创新网-中国高新技术产业导报
作者:实习记者 马勇 (责任编辑:魏喆) |