《省域空间治理数字化平台——跨部门空间地址数据关联工具建设需求.docx》由会员分享,可在线阅读,更多相关《省域空间治理数字化平台——跨部门空间地址数据关联工具建设需求.docx(13页珍藏版)》请在第一文库网上搜索。
1、省域空间治理数字化平台一一跨部门空间地址数据关联工具建设需求一、项目背景随着我省一体化智能化公共数据平台、省域空间治理数字化平台的不断建设和推广,原有的空间地址已经无法满足各部门应用需求。在此背景下,空间地址信息作为最核心的空间数据资源和时空基础设施之一,需要按照全省一盘棋理念,以工具全省通用共享为目标,建设跨部门空间地址数据关联工具,加大空间地址建设统筹力度,不断提升空间地址数据质量,破解空间地址质量不高、更新困难、服务低效等难题,为各部门提供统一的地址服务,推进省域治理能力现代化建设。二、项目内容及要求(-)建设范围省域空间治理数字化平台一一跨部门空间地址数据关联工具的建设覆盖XX省11个
2、地市的市域建设范围,其中空间地址类型包括院落地址、楼栋地址、户室地址、农村地址、重点关注场所。(1)院落地址主要指各城市建成区内的住宅小区、学校、医院、政府单位、工厂、商厦等地址,主要由门牌地址+院落/商厦名称组成。(2)楼栋地址一般出现在院落场景中,由院落地址+楼栋号组成,楼栋号后缀用一般使用“栋”、“号楼”、“幢”、“座”表示。(3)户室地址一般出现在院落楼栋中,由楼栋地址+单元号+户室号组成。单元号后缀一般用“单元”或“号”表示,户室号后缀一般用“室”、“房”表示。(4)农村地址针对的是城中村、自然村、行政村场景,由街路巷和门牌号组成,街路巷记录门牌所在的村组名称(自然村/行政村),门牌
3、号记录门牌编号,包括主号和支号。(5)POI数据针对的是政府部门在日常管理工作中所常用的、重点关注的政府机关、事业单位、医院学校、重点公服设施等。如“XX省自然资源厅”、“XX大学”、“杭州市第一人民医院”等。(二)具体建设内容及要求1、空间地址规范制定在充分遵循相关国家标准、行业标准和地方标准的基础上,结合XX省实际情况,制定空间地址规范体系,定义空间地址结构、空间地址编码、空间地址服务规范、PO1入库及服务规范等内容,规范相关术语、地址模型、地址描述、编码规则、服务方式等内容,为本期项目空间地址库的建立提供标准规范基础。2、空间地址治理与建库针对XX省范围,以民政、自然资源等部门已有地址数
4、据为基础,以乙方社会企业源地址为补充,通过自动化为主、人工为辅的方式开展院落级/楼栋级/户室级多源地址融合建库,包括存量地址评估、地址数据预处理、多源地址增量融合、地址规范性治理、地址空间性治理,做到描述规范、位置准确、名称统一,形成全省空间地址成果库。(1)存量地址评估收集民政、自然资源等部门已有地址数据,从数据类型、地址结构完整性、规范性、准确性等多个维度对地址数据进行综合评估,初步确定地址特征,摸底地址数据质量。1)通过地址类型统计,分析存量地址的详细程度和整体分布情况;2)通过地址结构完整性评估,分析地址在层级结构上存在的缺失、重复、错乱等问题;3)通过地址规范性评估,分析各类全半角、
5、大小写、乱码、多余字符等非标准写法的问题;4)通过地址准确性评估,分析地址存在街道路名错误描述、位置错误、旧地址等问题。(2)地址预处理预处理是空间地址治理中的基础环节,能实现对存量地址的分词、排重、分流、以及无效地址处理等。1)空间地址分词基于深度学习的空间地址大数据智能分词技术,对存量空间地址的文本结构进行自动化解析,基于分词结果提取空间地址中的关键字作为主体信息,作为识别空间地址级别和治理建库的重要依据。2)空间地址压缩排重通过语义分析、相似度分析等,对存量空间地址描述同一地点的空间地址进行排重和唯一性处理,实现空间地址的压缩排重。3)空间地址分流通过空间地址主体信息将空间地址分流成城镇
6、空间地址和农村空间地址,有效提升空间地址治理的效率与质量。4)无效空间地址处理存量空间地址中包含一些无效空间地址或无法正常使用的空间地址,通过识别空间地址状态标识、主体提取等方式将无主体信息的垃圾空间地址标记为无效空间地址。(3)多源地址融合将政府部门已有地址与乙方社会企业地址进行关联碰撞,识别政府部门地址缺失部分,包括聚合排重、关联碰撞、融合运营等,补充完善小区院落级、楼栋级、户室级地址,标签区分地址数据来源。1)多源地址聚合排重基于分词算法、匹配算法、社会企业地址能力,对民政、自然资源等政府部门地址按照AOI/楼栋逐级聚合,剔除重复地址,并形成地址间上下级关系。2)多源地址关联碰撞将自然资
7、源等政府部门地址、社会企业数据与民政地址进行关联,一方面可从关联关系中挖掘语义别名,另一方面可从未完全关联地址中中开展增量识别,识别出疑似缺失的数据,同时标记关联级别、业务地址类型等。3)多源地址融合运营对多源地址融合和关联结果进行人工运营,包括算法迭代运营和人工运营。通过分析融合关联结果优化关联匹配能力,提高自动化关联率。在此基础上对融合关联结果进行人工关联作业和结果核实等工作,保证应融尽融。(4)规范性治理按照空间地址规范对多源地址融合结果进行规范化治理,包括格式规范化、冗余信息剔除、地址元素修复、地址命名归一等,保障地址的标准化、规范化描述。1)格式规范化针对地址中存在各种繁简体、全半角
8、、大小写等格式不规范、特殊符号等问题进行处理。2)冗余信息剔除地址中的描述信息冗余,导致地址元素杂乱,影响地址元素结构,对特殊后缀、邮编、无意义词等后缀进行剔除。3)地址元素修复针对地址信息结构错乱、行政区划/街道/小区等信息错误、缺失等问题,通过地址属性信息校验、地址元素关系挖掘、相似度分析等手段开展错误地址元素修改和缺失地址元素补充等修复工作。4)地址命名归一对地址数据从整体一致性的维度进行修复和归一,解决如同一AOI对应多个街道/门牌号或者楼栋单元后缀不一致等一致性问题。(5)空间性治理以自动化挖掘为主,人工内业核实为辅的方式,开展已有坐标校验、缺失坐标补充,基于社会企业的地址挖掘,为地
9、址赋予空间坐标,其中城市建成区地址不低于小区院落级坐标(根据企业地址实际情况,尽可能完善到楼栋级、户室级地址)、农村地址不低于村级坐标精度。1)已有坐标检查针对地址本身携带坐标信息的,利用坐标检查工具进行校验,保证坐标的准确性。2)缺失坐标补充针对缺失的坐标,基于已有遥感影像、电子地图等空间数据以及社会企业自有地址,通过大数据匹配算法挖掘相应的坐标,针对自动化手段无法覆盖的地址,采用人工内业判别与核实,补充缺失的坐标信息。(6)成果质检入库制定数据质量检查规则和质检项,针对治理后的地址进行数据质量检查,包括属性检查、坐标检查等。对质检通过后的地址成果数据进行入库,数据成果格式为GDBo其中属性
10、检查包括空值检查、唯一性检查、字段规范化检查、层级关系检查、一致性检查、数据重复性检查和结构完整性检查。坐标检查主要是依据坐标精度的要求,检查坐标位置的正确性,保障地址描述级别与坐标级别的一致性。3、PO1数据整理收集、归纳、整理PO1的名称、位置等信息,数据来源于乙方社会企业自有数据、公开互联网情报以及民政、公安、大数据等政府部门提供的重点Po1相关数据,同时区分POI数据来源,用于补充地址搜索服务的覆盖度,提升搜索效果。数据成果格式为GDBo4、空间地址管理服务模块建设基于空间地址数据成果,融合乙方社会企业积累的海量语义地址能力,构建空间地址管理服务模块,一方面实现空间地址成果管理与多维度
11、成果展示,另一方面为各部门提供可用、管用、好用的空间地址工具能力。(1)空间地址数据管理通过空间地址数据管理实现地址数据的接入导出、地址元素管理、元数据管理和地址成果管理,支持数据库接入、文件导入、接口调用等多种数据接入方式,支持DB、Exce1、CSV、SHP.GDB等多种数据格式,通过空间地址的启用时间、新增时间、变更时间、灭失时间和标签约束记录空间地址的状态,追溯空间地址的变化和时空演变,支持空间地址数据的历史版本管理,实现空间地址数据的生命周期管理。(2)空间地址成果展示通过空间地址成果看板对空间地址库成果进行多维度统计和展示,方便掌握全省空间地址资源家底,为省域空间地址服务和更新提供
12、支撑。(3)空间地址资源服务基于空间地址成果,融合海量语义空间地址训练样本以及工业级空间地址智能分词和匹配能力,发布空间地址资源服务,支持AP1接口方式和嵌入界面组件方式提供给第三方调用,具体包括:地理编码服务:将结构化的地址文本描述转换成经纬度坐标,返回该地址的坐标信息和空间位置,支持一次传入IOOO条以上地址数据。逆向地理编码服务:将经纬度坐标转换成对应的地址描述信息,包括对应点附近的道路、兴趣点、院落等,帮助用户将空间坐标转换为更易于理解的地址信息。智能输入提示服务:根据输入的小区名称、道路门牌(包括但不限于支持拼音、多音字、别名、首字母等联想)等,实时计算并提示多个推荐地址及地址描述。
13、同时智能输入提示服务可自动学习用户输入习惯,不断优化输入提示效果,帮助用户快速、精准定位到想要查询的内容。关键字搜索服务:通过兴趣点、地址类型、道路、街道等关键字进行搜索,找到对应的地址名称和坐标。空间查询服务:在指定的区域内搜索空间地址信息,支持根据行政区划/街道或自定义绘制搜索范围,绘制方式包括圆形、矩形、多边形等多种,支持自定义设置缓冲区范围进行空间查询。综合查询服务:通过指定的空间范围,结合地址类型、关键字、道路等空间地址描述进行查询。空间地址结构展示:支持将查询得到的地址按照标准地址层级结构进行展示,包括省、市、区、街道、道路、门牌号、院落、楼栋、单元、楼层、户室等。空间地址类型查询
14、:根据输入地址查询展示地址不同级别类型。地址标准化服务:针对输入地址进行分词和结构化分析,输出该地址的标准描述。地址规范化服务:针对输入地址中的特殊符号、字母大小写、阿拉伯数字、全角转半角进行处理,使地址描述规范。地址关联服务:将各类业务地址与标准地址库成果进行匹配,通过地址分词、相似度分析、主体提取等手段,实现标准地址与业务地址关联。问题数据反馈服务:对接省一体化智能化公共数据平台,提供问题数据反馈服务接口,支持用户对日常使用过程中对发现的存疑地址、缺失、灭失等问题数据进行反馈,填写问题数据类型、名称、地址、位置等相关信息,实现问题地址数据上报反馈。(4)空间地址服务管控基于省域空间治理数字
15、化平台(省国土空间基础信息平台),实现应用注册、服务申请、服务审核对接集成,并支持地址服务运行状态和使用情况监控、运维管理等,异常及时报警,保障地址服务正常稳定运行。5、空间地址库更新建立常态化、政企双循环的空间地址协同更新机制。通过地址增量更新识别、基于乙方社会企业源的地址变化挖掘等多渠道驱动,及时发现地址新增、变更、灭失等变化线索,通过对多源变化线索的排重、治理,实现空间地址数据以及相关服务更新,夯实空间地址库的鲜活性和服务能力。空间地址库每半年更新一次。(1)数据变化线索发现基于已有地址源的更新线索:基于民政、自然资源等部门地址,每半年一次将增量地址与已有空间地址库进行相似度分析、地址匹
16、配等关联碰撞,识别新增、变更、灭失等地址变化线索。基于乙方社会企业源的数据更新线索:基于乙方社会企业地址源自有地址,每半年一次将企业数据与己有空间地址库进行相似度分析、地址匹配等关联碰撞,识别新增、变更、灭失等数据变化线索。(2)数据更新对挖掘的多源地址变化线索,进行线索差分处理,包括过滤垃圾、重复、无效线索,按照地址规范对线索层级摆放正确并挖掘线索坐标,实现空间地址数据数据更新。(3)地址服务更新基于更新后的空间地址数据成果,同步更新地址索引和各类地址服务接口,实现地址服务同步更新。6、POiMSr针对用户在使用搜索服务过程中反馈的问题POI数据,提供问题POI审核、编辑、更新等功能,实现PO1的更新,保