随着信息技术的不断发展,人工智能技术的应用领域不断扩大,现如今人工智能技术已经被应用在了图书馆中。作为计算机科学分支的人工智能技术,其主要参照的是人的思维和行为,并将其作用于计算机系统中,让计算机来开展推理、学习以及规划等活动以达到帮助人类解决复杂问题的目的。人工智能技术的实用性相当强,其研究的符号代表的是具体知识,将其应用在图书馆工作中,能够实现图书馆的智能化发展。
目前云计算、云制造、物联网、大数据、AI、区块链等技术的迅速发展以及图书馆数字化建设的不断推进,图书馆的馆藏资源建设和科研活动中产生的数据增长迅速,种类繁多、数量巨大。从浩瀚无际的数据海洋中发现潜在的、有价值的知识,是当下图书馆建设的重要工作。
然而,虽然各行业拥有大量的数据,但仍缺乏有用的知识。由于这些海量数据十分复杂,且具有不完整、高维、异种、模糊和随机等非传统特点,无法使用传统的数据分析工具和技术进行处理,图书馆在拥有资源的同时,缺乏与时俱进的资源管理与挖掘分析技术,很难发挥数据资源的价值。而用户面在对海量的信息资源的时候,得到的知识不多,由于学科资源的交叉,各个学科之间存在壁垒,让用户在知识获取与创新的路上举步维艰。
创新服务平台是基于6亿元数据,12亿引文数据,500万知识节点,提供知识发现,挖掘知识点之间的深度关联,对知识点进行评价分析;对海量数据进行大数据分析,挖掘数据之间不同纬度的关联性,辅助用户资料搜集查找与科研方向定位;从知识点挖掘到知识点脉络挖掘,通过跨学科知识关系分析,为用户提供创新思维的服务平台。辅助图书馆创建更好的知识服务平台。
(1) 包含元数据、引文数据、知识节点等类型数据:
资源数据覆盖6亿元数据,12亿引文数据,500万知识节点,覆盖图书、期刊、学位论文、会议论文等10多种文献类型,数据总量达到5亿条,每年保持更新。
(2) 知识深度挖掘形成观点库
深度加工知识文献,对文献内容观点深度标引,形成独特的观点库。
(3) 海量资源挖掘分析,挖掘多维度数据关联
创新服务平台是一个数据分析引擎,提供多维度可视化分析结果,评价统计分析、交叉引用分析、多主题对比分析。
(4) 知识点脉络挖掘,提供创新服务
从知识点挖掘到知识脉络的挖掘,通过跨学科知识关系分析,为用户提供创新思维的服务平台。
(1) 检索全、准、智能化:
统一检索,在保证资源查全、查准的前提下,提供智能化检索。
l 资源全面检索:多种类型资源全面检索。覆盖图书、期刊、学位论文、会议论文等10多种文献类型,数据总量达到5亿条。机器加人工方式对照链接约15亿的引文关系库,揭示文献与文献间的内在规律。
l 准确定位检索内容:提供多种精确检索的辅助检索方式,基础检索快速锁定检索主题范围;高级检索明确检索条件,快速匹配检索条件聚合检索结果;10个维度的分面筛选快速缩小检索范围,精准搜索结果;检索结果智能匹配,期刊匹配、机构名称匹配、上位词检索、下位词检索、同义词检索、近义词检索等。
l 智能化检索:利用知识关联形成知识图谱,检索结果通过关联关系排序与聚合,形成不同机构、不同学科、不同领域检索的千人千面。多维度的关联推荐信息,引导用户快速找到相关知识点与发散新思维。
l 多维度排序规则:支持用户偏好排序。
(2) 个性化检索:
面对海量资源,资料查询花费了我们大量的时间和精力。分析查询过程,基本是主题检索,关联筛选,再关联筛选,直到检索到符合条件的结果为准。创新服务平台,通过大数据挖掘技术,将知识点与知识点、与机构、人、学科等维度进行关联,形成知识图谱。对每一次的检索结果都进行关联查询与结果聚合,针对不同知识脉络形成不同的知识检索网络,个性化知识检索。相关推荐也紧密关联推荐,为用户检索节省时间,提高效率,快速获取高价值的检索信息。
(3) 知识发现
图 1 知识发现过程
创新服务平台通过对海量的数据资源通过图示过程进行知识挖掘,形成知识评价:知识关联、可视化分析结果等。
用户通过平台检索提交需求,平台后台会进行数据处理,知识发现的结果以检索结果的形式呈现给用户,让用户通过平台,即可对海量资源进行知识发现。
(4) 大数据分析:
创新服务平台依托于海量数据资源,对检索主题提供多维度的学术专业分析,为科研学者提供分析参考。
l 支持期刊、作者、机构、主题词维度检索大数据分析。
l 检索分析主题词:提供多维度统计,相关学者、学术成果、被引次数等维度统计;提供高被引主题、3年内主题变化分析、关系拓扑图等图表分析,并注有分析结果。
l 检索分析作者:提供对历年成果统计、发文量对比、学者人均发文量年均被引量、学科偏好、3年内学科分布、历年各类文献产出比、关系拓扑图等多方面的图表分析与结果分析。
l 检索分析期刊:提供期刊发文机构分布、期刊与期刊被引分析、引证报告、高被引作者、高被引机构、高被引期刊、关系拓扑图等多方面的图表分析与结果分析,
l 检索分析机构:提供对历年成果统计、发文量对比、机构均发文量年均被引量、学科偏好、3年内学科分布、历年各类文献产出比、关系拓扑图等多方面的图表分析与结果分析。
(5) 思维创新:
创新服务平台通过对知识点与知识之间关联关系的挖掘,通过聚类、回归等算法,实现了对知识脉络的挖掘。通过跨学科的知识交叉关联关系与知识脉络的挖掘,提取知识观点,为用户提供创新思维。
思维创新提供:
l 创新知识点检索,通过时间、来源文献、学科分类、主题词、情感等分面维度精准筛选。
l 创新知识点实时展示提取观点动态、热门主题墙、情感对比图表分析、影响力指数图表分析。
l 经典创新模块,各个学科的创新内容获取。
(6) 开放服务:
秉承着阿帕比智慧、开放、共享的理念,创新服务平台提供对外开放的API接口。通过平台申请获取API权限,可以调用系统开放的知识发现、大数据分析、创新服务等模块相关接口,元数据调用接口,计算接口。
创新服务平台,基于海量的数据资源与大数据挖掘技术,运用人工智能算法对海量资源进行知识挖掘与创新发现。
为用户解决:
² 为因没有大量数据而无法进行知识发现、成果验证的科研学者提供了一个平台。
² 为花费大量时间寻找科研课题却发现前人早已有先进研究成果,却浪费了选题查资料的宝贵时间的学者,提供一个快速、全面、精准、智能、个性化的检索平台。
² 为科研创新者提供一个创新知识点检索、获取创新内容的平台。
² 为科研实验提供数据支持。
² 为科研实验资源利用提供平台支持。
² 为研究数据利用提供挖掘与分析技术的支持。
为图书馆提供:
² 提供基于专业数据的资源与服务
² 定制图书馆个性化资源服务平台
² 利用平台对海量专业数据进行管理与挖掘,为学者提供专业领域的知识发现、大数据分析与思维创新服务。
² 开放接口,提供专业数据资源,提供分析与挖掘的服务能力。