《数字资产视角下阅读报告的生产与利用.docx》由会员分享,可在线阅读,更多相关《数字资产视角下阅读报告的生产与利用.docx(4页珍藏版)》请在第一文库网上搜索。
1、数领帮角TW魏解步与利用根据数字中国发展报告(2023年)1(以下简称报告显示:我国的数据资源价值正在加快释放开放的有效数据集由8398个增至近25万个。各地积极探索数据治理规则,培育数据要素市场,促进数据流通交易和开发利用。”报告同时也提出未来要推进数据资源高效利用,加快激发数据要素活力的展望,主要强调了“推动数据资源的高效流动创新数据要素开发利用机制模式打破数据孤岛,释放数据红利,推动公共数据、个人数据等良性互动、融合应用”。报告还特别指出,文化产业要与新一代信息技术相互融合,加快推进图书馆等文化资源的数字化,提供方便快捷、资源共享的全国公共文化数字资源服务。在我国产业信息化发展升级的过程
2、中,伴陵云计算、区块链、5G等新的技术形态而释放的大数据,具有极高的开发利用价值。因为大数据是人们社会活动的痕迹,逸藏着若干个体的价值便向与行为特点及其个体间的隐含关系,大数据还可以将人们在不同平台中的痕迹重新整合、汇集,实现个人信息的全方位重构2),以便实现“数据画像。图书馆在业界和学界都对大数据时代困书馆的发展走向进行了相应的实践,并且开展了多方面的深入研究。数字图书馆建设或者图书馆智慧化升级议题伴随信息技术不断发展,巳经成为图情学术界不争的热点,大部分图书馆已开始尝试。这既是图书馆应对信息化时代挑战的必要举措,也是在数字时代为用户提供精准服务的重要依靠。魏大威等认为智慧图书馆转型一个重要
3、的目标就是从资源内容中提取信息价值,区块链技术在智慧图书馆数字资源管理中可以发挥重要作用,印把可无限复制的图书馆数字资源转化成可单一标识和可追踪的数字资产块,并对上逑数字资源的内容进行封装注册、分布式存储、知识加工、调度和侵权跟踪溯源等全流程管理服务3。单纯从数字资产的概念而言,其是指数字资源的资产化,由相应主体所拥有的,预期可能会产生一定经济效益的数字资源。就现状来看,大多数数字资产在于其所具备的文化价值。图书馆可以被数字化的内容包括图书馆馆蔬的各类文化实体资产、各类数据库资产、图书馆用户行为统计等,还有学者提出图书馆虚拟数智人4的设想,也可被视为数字资产的一部分。孙锐等则认为图书馆中的文献
4、资产元数据才是图书馆对文献资产进行管理的基础51从图书馆数字资源现状来看,经过20余年的数字图书馆建设,不论公共图书馆还是高校图书馆,都积累了海量的数字资源。1998年,康奈尔大学巳经基于查询分析开发了网络个性化图书推荐系统MyIibrary,可以将图书馆新到资源和各类通知发送绐读者。刁羽和薛红结合高校图书馆用户使用电子资源的行为数据和问卷调查收集的用户满意度情况,利用随机森林法构建了用户电子资源满意度画像模型61但这些数字资源仍然局限于为馆藏服务,因此被学者视作彼此之间缺乏联系,成为相对独立的“孤岛本研究立足学者已经获得的研究成果,聚焦图书馆阅读报告数据输出形式,以数字资产的视角对阅读报告生
5、产与利用的现状进行再思考。1作为数字资产的阅读报告数字资产是区块捱技术和加密技术得以应用后的一种具体实践,通过NFT(Non-FUngibIeToken,非同质化代币)的加密,数字资产具备了唯一性、独1无二和不可复制的特点。区块链技术能够给数字内容提供唯一性保证,保护内容生产者的权益。图书馆的数字资源也可利用区块林技术被封装成为虚拟数字资产,并实现资产登记、存储和持有。从阅读报告的生成来看,每一家图书馆的用户使用数据都具有可溯源性,可为读者提供精准服务,限为重要的不仅在千它是对用户过去行为的总结,而是对未来行动的预测。1.1 阅读报告的数据价值尼葛洛庞蒂在其数字化生存中曾经设想过这样的一种场景
6、:有一个界面代理人二这个人可以阅读地球上每一种报纸、每一家通讯社的消息,掌握所有广播电视的内容,然后把资料组合成个人化的摘要,这种报纸每天只制作一个独一无二的版本团。现在,大数据结合算法的应用,已然将尼氏的颈言变为现实。谢耘耕等在研究人工智能应用对图书出版发行的影响时提到世界知名的出版集团利用大数据和算法,精准捕捉到用户信息,并且能够挖掘用户的社交关系,对用户阅读时间、阅读轨迹、点赞、评论、收藏等指标进行分析,建立用户需求数据库,进而实现精准营销,同时也可以基于用户以往的阅读兴趣,向消费者自动化推荐书单8卜Mayer认为大数据可以被视作信息资产,但需要新的处理模式,比如更强的决策力、洞察发现力
7、和流程优化能力对其进行加工,才能使这些数据集合成为海量、高增长率和多样化的信息资产。也就是说,大数据本身并无意义,只是通过现代化的信息技术实现海量数据集,只有对大数据进行深层次的加工,才能挖掘用户的价值倾向和行为特征。从阅读报告所反映出的数据加工方式来看,各高校所选取的指标分类维度具有高度的相似性,比如借回次数最多的书籍、借阅量最多的读者、进馆次数最多的读者等。这些数据的呈现,能够从一定层面反映当代大学生使用图书馆的总体特征,对高校图书馆进行管培或者改善服务具有参考价值。厦门大学图书馆自2013年开始为学生提供关于个人图书馆使用记录的电子账户,每个学生毕业后还可以永久登录圉时光”,并在上面看到
8、自己与图书馆的交集,该项目在2016年获得国际图联(IF1A)大会“营销奖”的二等奖,这个项目至今仍在为学生提供服务。1.2 阅读报告的算法使用阅读这种行为为什么需要被人了解?阅读是伴陵文字的产生而出现的一种人类行为,既可以完全私人化,也可以群体进行。在大数据时代,人们的借阅行为会被记录下来,但其阅读效果并不能被跟踪。18世纪,塞缪尔约翰逊列出了几种读书的方式:苦读(提笔)、熟读(寻找某些信息)、好奇心驱动的阅读(专注在一本小说中)和倚单的阅读(浏览和略读)91阅读报告是基于大数据生成的对阅读用户的整体特征的数据呈现,这些数据无法体现个体购买、阅读某些书籍或者进出图书馆空间的具体动机,需要使用
9、相应的算法来推导读者未来可能发生的阅读行为。算法作为一种新的连接方式,不仅可以勾连外在物理世界人类的内心世界,更体现了存在于用户和实体之间的价值关系。喻国明等认为算法可以被视为一种“新媒介”,是技术社会的底层基础,其作用是通过一系列社会关系的联络、匹配与调适,重新形塑用户认知并整合社会10。阅读报告所积累的大量读者数据是基于对群体的特征描述,如果想对用户提供更有针对性的服务,需要利用算法技术完善个体的使用行为轨迹,并预测其走势。具体而言,即通过算法推荐技术满足用户的个性化需求,以缓解信息过我的压力,实现人找信息到“信息找人”的模式变化111。算法并非刚刚出现的技术,可以肯定的是这种技术经过几十
10、年的更新迭代,处理数据的能力更为强大。1989年,在笫一届KDD专题讨论会上,数据库知识发现(KDD)就念被首次采用,即从大量、不完整、有噪声、模糊合随机的数据中提取隐含在其中的有价值的信息和知识的过程。这个就念强调知识是数据发现的最终产品,旗之而产生的各类数据挖掘软件也得到了广泛使用,用户也对数据挖掘所发现的知识有所期待,进而诞生了个性化推荐系统。推荐系统是用户地位日益提高的结果,尤其是在电子商务平台,推荐系统能够带来肉眼可见的商业利益。但现实情况是,算法技术的应用依托于对数据资源的掌握和强大的运算能力,带要资金和技术的支持,高校图书馆一般不具有这种规模的平台,因此对于所收集到的数据,只能进
11、行初步的整理和呈现。尽管高校图书馆纸本数量和数据库中数据存量的规模根据学校不同有大有小,但这些馆藏纸本和数据基本属于有限资源,加之用户在经过图书馆所举办的信息检索培训后都已经具有一定的信息检索技能,对自己所要使用的数据资源相对清晰,所以高校图书馆不存在数据增量超过应用软件的负载范围而导致的1信息过栽”问题,算法技术也就没有发挥其优势的空间了。李民等对国内116所“211工程1院校的图书馆网站进行了访问,他们发现所有这些高校给用户提供的都是非个性化的推荐服务,包括热门检索、借阅排行等信息12J。陈国青等人在研究大数据和小数据之间存在的信息不对称关系时指出,只有那些具象的、丰富的、细节的、情景化的
12、体验和感知,才能帮助刻画人们的心理和人格,解构模式和因果13,也就是使用实例和数据相结合的方式,从整体出发,进而探索局部个例,以对个体行为动机探寻,达到局部映射整体、个例诠数据的效果。有的高校尝试速立,优秀大学生读者阅读清单”案例数据库14,以学科专业进行划分,选择专业名次在全年级排名前30%的优秀大学生,调取他们曾经阅读的文献信息资源目录清单,并辅以面对面访谈,确认他们所阅读的文献资源与他们专业学习之间的关系,然后将清单和馆藏数据一并进行数据集成,最终形成“优秀大学生阅读清单数据库,以供其他读者参考。1.3 阅读报告的展示意义类似个人书架可以展示自己的书籍存储量和阅读品味,图书馆阅读报告中的
13、馆藏数量和种类、新进购置书籍数量、进出馆人数等数据,也郎具有1定的展示作用。首先,回读数据具有可展示性。就现有资料来看,图书馆数据已应用的领域十分广泛,比较典型的使用场景即做成可供展示的数据可视化信息,不仅显示实时到馆人数、借阅数量,还可以将阅读报告设计成直观的可视化图表在图书馆内进行展示,西雅图公共图书馆的MakingviSib1ethe1nviSib1e”项目在21世纪初已经开展并实施,即通过6个1CD屏幕组成的大屏幕来展示各类动态数据15。其次,同读数据报告本身具有新闻性。媒体对于能够成为新闻的信息有着严格的要求,其中包括时新性、真实性、重要性、在地性等具体指标。每年各个机构最新公布的阅
14、读数据,基本符合上述特性,从而成为各级媒体报道的焦点。在读秀的报纸类目中以“阅读报告”为标题,可以搜索到1431篇相关报道,发布在不同级别的纸质媒体上。既有面向专业领域发行的,如图书馆报中国出版传媒商报等,也有党报党刊,如人民日报光明日报等,还有各级都市报,如新京报半岛都市报等。上述媒体对阅读报告数据的报道,是对全民阅读推进现状的公开展示,对报告所涉及的具体的城市、图书馆都能起到正面宣传效果。最后,同读报告数据具有反应动态变化趋势的直观性。人民日报分别在2011年8月报道上海首次发布市民阅读现状报告数字化阅读喜忧参半,2023年4月报道上海全民阅读调查报告公布。以2023年的报道为例,2023
15、年度上海全民阅读调查报告中的数据显示“上海市民综合网读率(纸质阅读和数字阅读)较高,达97.04%,高出2019年全国国民同读调查15.94个百分点,其中,纸质阅读率达96.05%,高出全国平均水平36.75个百分点;数字阅读率为99.52%,高出全国平均水平20.22个百分点这些数字直观反映了上海市民综合阅读率在全国所处的位置,并且具有相应的权威性。2阅读报告的深度使用场景不论是公共图书馆还是学校图书馆,推出阅读报告的目的绝不应止步于告知读者或者进行宣传,应当在可能存在的条件限制中,结合算法技术,深度挖掘阅读报告中的数据价值,为何读报告开发更多的使用场景。2.1 让书籍成为媒介通过浏览图书馆
16、后台的借阅数据,在增加图书流动率的同时提商图书的互动性。书籍本身就是一种传播媒介,是凝结人类智慧的载体。不仅如此,书籍还可以成为读者交流互动的介质。Naomi首重分析了阅读的社交属性,其以Kind1e阅读器中的1流行高亮”功能举例,每个读者都能看到其他读者所做的标记,这是一种对用户与其他读者,甚至是作者进行“对话”的鼓励,在其看来,注释印时话:S.:忒修斯之船一书出版之际,宣称.向电子书宣战,其在图书内容编排上加入了许多不同颜色的笔所做的标注,另外,书页间还夹杂着信件、便签、照片、卡片、明信片等小物件,这种在印刷文字之外增加互动实物的编排即是将书籍视作印刷社交媒体的探索。尽管事实证明,(S.:忒修斯之船之后,很少再有出版社进行过类似的尝试,但在学校图书馆中,图书的读者群体都是不同时段的在校生,相对稳定,不妨挑选1些流通率高的图书,进行试点,比如建