方正阿帕比荣获第九届数博会两项大奖
8 月 21 日-8 月 25 日,第九届中国数字出版博览会暨中国数字内容服务大会(以下简称“数博会”)在京举办,六大展区数十家参展商共同为大众展示我国数字出版领域的新业态、新成果,献礼祖国七十华诞。
8 月 23 日,在本届数博会的颁奖典礼上,方正阿帕比凭借着在数字出版领域的重要贡献以及在展会中亮眼的表现,荣获“2018-2019 年度数字出版创新技术”以及“优秀展示单位”两项大奖。
8 月 23 日,在本届数博会的颁奖典礼上,方正阿帕比凭借着在数字出版领域的重要贡献以及在展会中亮眼的表现,荣获“2018-2019 年度数字出版创新技术”以及“优秀展示单位”两项大奖。
方正阿帕比荣获第九届中国数字出版博览会“2018-2019 年度数字出版创新技术”图为获奖奖牌和荣誉证书
方正阿帕比荣获第九届中国数字出版博览会“优秀展示单位”图为获奖奖牌和荣誉证书
荣誉是表扬,是肯定,更是对未来的激励
没有哪个行业是一成不变的,科技的发展为个人的生活和工作带来了太多的便利和捷径,但对企业来讲,每一次的科技创新带来的都是挑战。科技的浪潮下,考验的就是企业的创新力和对市场方向的把控力。
知识是永恒的,但知识的承载工具却是随着时间而改变的,从龟背竹简到纸质书籍是知识传承的一次伟大创举,而从纸质书籍到计算机则是一次划时代的革命。当今的知识服务,要求的已经不单是知识的存储,而是要求知识的智能化整合,精准的输出到应用。
方正阿帕比智能问答技术
随着数字化技术的发展,各大出版社已经陆续出版了大量的数字图书。这些数字图书具有内容系统性、全面性、权威性等特点,是人类各种知
识的系统性阐述,如何快速的从书中查找到用户感兴趣的知识或问题答案,是摆在数字出版领域的一个难题。本技术采用深度学习技术对图书内容进行阅读理解,在此基础上对用户提出的问题进行逻辑推理和解答。
智能问答技术大概分为三类:一是以文本特征为基础的早期智能问答, 该技术需要人工定义文本特征,缺乏对语义层次的学习能力,答案的准确率低。二是基于知识库的问答技术,该技术依赖知识库的准确性和全面性,建立知识库是一个复杂的工程,投入成本较高。三是基于文本理解的问答技术,该技术通过基于 AI 阅读理解技术的图书内容问答技术, 该技术优点是投入成本低,不需要太多的人工干预,搜索的答案比较全面,相相对于基于知识库的问答技术来说,该技术逻辑推理能力弱,答案的准确性受限于文本的质量等。
基于图书内容阅读理解的问答技术的大概步骤如下: 一、对图书内容进行版面理解和文本提取;
二、图书文本内容进行 AI 阅读理解,提取语义特征;
三、对用户的问题进行理解,理解用户的意图和问题的类型,形成语义特征;
四、进行语义特征匹配,从图书内容中提取答案并进行推理; 五、以自然语言的方式进行答案合成并返回给用户。
对图书内容进行版面理解用到了深度学习相关技术,理解图书排版布局、版心位置、段落关系、文本顺序、图文位置、表格公式等信息,正确的还原图书的内容。
智能问答技术大概分为三类:一是以文本特征为基础的早期智能问答, 该技术需要人工定义文本特征,缺乏对语义层次的学习能力,答案的准确率低。二是基于知识库的问答技术,该技术依赖知识库的准确性和全面性,建立知识库是一个复杂的工程,投入成本较高。三是基于文本理解的问答技术,该技术通过基于 AI 阅读理解技术的图书内容问答技术, 该技术优点是投入成本低,不需要太多的人工干预,搜索的答案比较全面,相相对于基于知识库的问答技术来说,该技术逻辑推理能力弱,答案的准确性受限于文本的质量等。
基于图书内容阅读理解的问答技术的大概步骤如下: 一、对图书内容进行版面理解和文本提取;
二、图书文本内容进行 AI 阅读理解,提取语义特征;
三、对用户的问题进行理解,理解用户的意图和问题的类型,形成语义特征;
四、进行语义特征匹配,从图书内容中提取答案并进行推理; 五、以自然语言的方式进行答案合成并返回给用户。
对图书内容进行版面理解用到了深度学习相关技术,理解图书排版布局、版心位置、段落关系、文本顺序、图文位置、表格公式等信息,正确的还原图书的内容。
图书内容阅读理解用到了深度学习的字嵌入、词嵌入等模型,使用 BERT 网络模型进行文本特征提取。对用户问题的理解方面,需要用到知识库对用户提问的问题进行同义词、近义词、缩写词、上下位词等进行扩展, 对用户提问问题进行分类,准确理解用户的意图。
该技术已经应用在新闻出版研究院研究的版权知识问答项目系统上,该系统集成了出版社正规出版的 10 万本图书,通过阅读理解技术能够从10 万本图书正文中搜索到用户需要的答案,节省用户查找答案的时间, 发挥图书作为知识的载体的作用,发挥作者和编辑的创造价值,挖掘人类知识的价值等。
智能化,数字出版的未来
随着科技的进步,人们获取内容的方式也变得丰富起来,多样化的文化传播方式满足不同人群的需求。科技是在不断进步的,知识服务的智能化早已是大势所趋,而这对拥有强大内容生产运作能力和强有力科技支撑的的方正阿帕比而言,这是一次良机。用科技的力量推动文化深远传播,实现终端的智能化、多元化阅读。方正阿帕比已经为建设全新的知识服务产业链做好准备。