6月28日下午,“2020北京数据开放创新应用大赛--科技战疫·大数据公益挑战赛”举办了线上颁奖会,百分点认知智能实验室荣获“疫情期间网民情绪识别”算法赛道亚军,同时在“疫情对北京社会经济影响分析”方案赛中百分点获评优秀作品奖。
本次大赛由北京市经济和信息化局、中国计算机学会大数据专家委员会联合主办,北京市大数据中心、北京市政交通一卡通有限公司、DataFountain等联合承办,致力于吸纳大数据产业顶尖社会资源,充分释放专业人才智慧资源,助力疫情防控和疫情之后的经济社会恢复工作,推动北京市政府数据开放。
No.1披荆斩棘,百分点荣获大赛亚军
大赛自2月启动,分两个阶段进行,第一阶段在大数据竞赛平台上提交算法模型进行在线PK,第二阶段进行答辩评审和颁奖,全部比赛于6月底顺利结束,最终有5623支队伍、6807人参赛,提交作品达到20336个。
经过专家评审,百分点认知智能实验室荣获“疫情期间网民情绪识别”算法赛道的亚军,该赛道总共有2049支队伍参加。
在颁奖会上,工信部科技司副司长朱秀梅代表工信部科技司对竞赛成果表示了肯定,并表示会鼓励相关部门及时总结经验,将此次竞赛成果用于支持北京市的各项工作中。
No.2疫情期间网民情绪识别
本赛题由中国中文信息学会信息检索专业委员会联合组织,主要为了帮助政府掌握真实社会舆论情况,科学高效地做好防控宣传和舆情引导工作,特此针对疫情相关话题开展网民情绪识别的任务。
具体的赛题任务是给定微博ID和微博内容,设计算法对微博内容进行情绪识别,判断微博内容是积极的、消极的还是中性的。同时本赛题也是第二十六届全国信息检索学术会议(The 26th China Conference on Information Retrieval, CCIR 2020)评测大赛赛题 。
在竞赛过程中,百分点认知智能实验室分析出了此次赛题的三个挑战,首先是文本情绪的分类标准较为模糊,且文本字段中有较多干扰;其次图片特征和时间戳特征需要集成到模型中;除此技术方面的挑战之外,此任务为文本分类典型任务,竞争非常激烈。
对此,百分点认知智能实验室经过尝试各种方法,采用了融合对抗训练、Post-Train、F1适应优化和模型集成等众多策略的算法方案,最终脱颖而出。
No.3用数据智能助力政府“科技战役”
本赛题属于自然语言处理领域,是百分点认知智能实验室的重点研究方向。
百分点认知智能实验室于2018年成立,致力成为公司认知智能核心技术的引擎。实验室围绕前瞻性基础技术研究、智能化应用产品研发、项目服务支持和人才培养四个方面展开工作,聚焦“自然语言处理、知识图谱和智能交互”等核心技术的创新突破,将技术研究和应用探索相结合,提升百分点在认知智能核心技术领域的领先地位,研发行业落地的认知智能应用产品。
在情感分析领域,实验室基于前沿的自然语言处理技术和实际的算法,支持舆情洞察系统落地,探索出了一套高精准、可定制、可干预的智能分析框架,为客户提供了高效的预警研判服务。
在媒体审校领域,实验室自主研发了百分点智能媒体审校系统,辅助内容审校者有效发现问题,系统对人名职务、语录口号等校对平均准确率达95%以上,基础字词校对准确率达90%以上。
在智能翻译领域,实验室打造了工业级的神经机器翻译系统——百分点智能翻译系统,其构建了上亿航天、航空、船舶、电子、兵器等领域行业术语库和记忆库,为客户提供本地化、行业化和定制化的翻译服务。
在智能问答领域,通过智能对话机器人系统,为客户灵活、便捷地定制支持语音、文字交互的智能对话系统,实现知识性问答、任务处理和闲聊等智能化人机交互,系统可广泛应用于智能办公、智能客服、智能政务等场景。
在大赛后,百分点还会把此次科技创新成果快速转化为应用实践,为政府和企业疫情防控、复工复产和后续经济社会发展提供解决方案。
未来,百分点将继续深耕数字政府领域,做数字政府建设的赋能者,在数字政府领域构建完善的技术产品和解决方案体系,利用大数据全栈技术和NLP、知识图谱、智能交互等认知智能技术,辅助政府进行决策,提升政府的现代化治理水平。