《政务数据标签.docx》由会员分享,可在线阅读,更多相关《政务数据标签.docx(10页珍藏版)》请在第一文库网上搜索。
1、1 .政务数据标签本质属性1.1. 数1.1.1. 属性类 数据来源:委办局(住房城乡建设委、司法局、住房公积金管 理中心、工商局、市城市管理委、民政局、安监局、水务局、 公安局、质监局、城管执法局、文化局、地税局、交通委、通 信管理局)、互联网、内部系统、第三方 数据类别:经济、政治、军事、文化、资源、能源、生物、交 通、旅游、环境、工业、农业、商业、教育、科技、质量、食 品、医疗、就业、人力资源、社会民生、公共安全、信息技术 数据性质:状态类、明细类 开放性:无条件共享、有条件共享、不共享、开放 更新频率:实时、日、天、周、月、年、不定期、一次性 数据类型:数据库、文本、图片、音频、视频
2、应用领域:反恐维稳、证照、信用、五证合一、政务审批、城 市运行 主体:数、企、人、房、车、物1.1. 2.特征类,数据质量:优、良、差数据量:KB级别、MB级别、GB级别、TB级别、PB级别、ZB 级别敏感性:敏感、普通,数据日期:最早开始时间、最近更新时间1.2. 企1. 2.1.属性类企业性质:国有企业、三资企业(其中:中外合作企业、中 外合资企业、外商独资企业)、集体企业、私营企业行业分类:1 .农、林、牧、渔业2 .采矿业3 .制造业4 .电力、热力、燃气及水的生产和供应业5 .环境和公共设施管理业6 .建筑业7 .交通运输、仓储业和邮政业8 .信息传输、计算机服务和软件业9 .批发和
3、零售业10 .住宿、餐饮业IL金融、保险业12 .房地产业13 .租赁和商务服务业14 .科学研究、技术服务和地质勘查业15 .水利、环境和公共设施管理业16 .居民服务和其他服务业17 .教育18 .卫生、社会保障和社会服务业19 .文化、体育、娱乐业20 .综合(含投资类、主业不明显)21 .其它是否集团企业:是、否1. 2. 2.特征类环境影响分类:环保型、污染性企业规模:大型、中型、小型、微型1.3.人1. 3.1.属性类 性别:男、女、未知的性别、未说明的性别(GB/T 2261. 1-2003) 学历:小学、初中、中专/高中、专科、本科、硕士、博士 户籍:农业户口、非农业户口 职业
4、:(GB/T 6565-2015)第一大类:国家机关、党群组织、企业、事业单位负责人;第二大类:专业技术人员;第三大类:办事人员和有关人员;第四大类:商业、服务业人员;第五大类:农、林、牧、渔、水利业生产人员;第六大类:生产、运输设备操作人员及有关人员;第七大类:军人;第八大类:不便分类的其他从业人员。注:上班族、自由职业者、无业游民、其他 婚姻状况:未婚、已婚(初婚、再婚、复婚)、丧偶、离婚、未说明的婚姻状况。1. 3. 2.特征类1 年龄段:2 .童年:0岁6岁(1)婴儿期0-3周月;(2)小儿期4周月一2、5岁;(3)幼儿期2、5岁后一6岁;3 .少年:7岁17岁(1)启蒙期7岁一10岁
5、;(2)逆反期11岁一14岁;(3)成长期成岁一17岁;4 .青年:18岁一40岁(1)青春期1828岁;(2)成熟期2940岁;5 .中年:4165岁壮实期壮一48岁;(2)稳健期4955岁;(3)调整期56-65岁;6 .老年:66岁以后初老期初一期岁;(2)中老期7384岁;(3)年老期85岁以后; 收入水平:低、一般、中、高 是否有车:有车、无车 是否有房:有房、无房 是否有孩子:有、无 孩子性别:男、女、未知的性别、未说明的性别(GB/T2261. 1-2003)1.4.房1. 4.1.属性类 建设时间:具体年份 用途:商用、家用 产权:商品房、经济适用房、房改房商品房:按照商品房性
6、质购买的房屋经济适用房:按照经济适用住房性质购买的房屋按照回迁 房性质购买的房屋部分通过集资建房性质购买的房屋房改房:按照房改政策购买的房屋(包括:成本价购买、标 准价购买及标准价优惠产权购买)部分通过集资建房性质购 买的房屋 区域:(所在城市的区县,以北京为例)东城、西城、朝阳、 海淀、丰台、石景山、通州、昌平、大兴、亦庄、开发区、顺 义、房山、门头沟、平谷、怀柔、密云、延庆、燕郊、香河 地铁:1号线、2号线、4号线、5号线、6号线、7号线、8号线、9号线、10号线、13号线、14号线(东段)、14号线(西 段)、15号线、16号线、八通线、亦庄线、昌平线、房山线、 机场线1. 4. 2.特
7、征类 面积范围:50平以下、50-70平、70-90平、90T10平、110 平-130 平、130T50 平、150-200 平、200 平以上户型:一室、二室、三室、四室、五室以上1.5.车1. 5.1.属性类 排量:LOL 以下、1.0-1.2L L3T.5L、L 6L、1.8-2.3L2. 4-3. 0L、3. OL 以上品牌:奥迪、阿斯顿马丁、阿尔法罗密欧、艾康尼克、ABT、 lpina宝马、奔驰、本田、别克、标致、比亚迪、宝骏、奔 腾、宝沃、北京、北汽绅宝、北汽幻速、比速汽车、北汽新能 源、北汽威旺、北汽制造、北汽道达、保时捷、宾利、巴博斯、 长城、长安汽车、长安欧尚、长安轻型车、
8、昌河、成功汽车、 长江EV、大众、DS、东南、道奇、东风、东风风行、东风风 神、东风启辰、东风风度、东风风光、东风小康、Datsun Dacia 电咖汽车、丰田、福特、菲亚特、福田、法拉利、福迪、风诺、 福汽启腾、Faraday Future观致、广汽传祺、广汽吉奥、Genesis. GMC、哈弗、海马、华泰、华泰新能源、华颂、红旗、 汉腾、哈飞、黄海、海格、华骐、Icona,吉利、江淮、Jeep、 捷豹、金杯、江铃、江铃集团轻汽、江铃集团新能源、金龙、 金旅、九龙、君马汽车、凯迪拉克、克莱斯勒、凯翼、开瑞、 康迪全球鹰电动汽车、卡威、卡升、科尼赛克、KTM雷克萨 斯、铃木、雷诺、路虎、林肯、
9、陆风、力帆、猎豹汽车、理念、 领克、陆地方舟、雷丁、劳斯莱斯、兰博基尼、路特斯、领志、 朗世、莲花汽车、LucidMotors马自达、MG、MINI、玛莎拉 蒂、迈凯伦、明君汽车、摩根、纳智捷、讴歌、欧朗、帕加尼、 起亚、奇瑞、前途、奇点汽车、日产、荣威、如虎、Rimac 斯柯达、三菱、斯巴鲁、smart双龙、SWM斯威汽车、上汽 大通、思铭、首望、世爵、TESLA、腾势汽车、泰克鲁斯腾 风、沃尔沃、五菱、五十铃、潍柴、WE丫、蔚来、威兹曼、WMotors、 瓦滋汽车、雪佛兰、现代、雪铁龙、西雅特、英菲尼迪、一汽、 野马汽车、永源、依维柯、云度、御捷、众泰、中华、中兴汽 车、知豆、之诺 车型:
10、微型车、小型车、紧凑型车、中型车、中大型车、豪华 车、SUV.跨界车、MPV、跑车 结构:两厢车、三厢车、旅行车、掀背车、软顶敞篷车、硬顶 敞篷车 能源:汽油、柴油、油电混合、电动 进气:涡轮增压、机械增压、自然吸气变速箱:自动、手动国别:德国、美国、韩国、中国、日本、法国、英国、意大利1.5. 2.特征类 用途:家用、商用、其他 价格范围:5万以下、5-8万、8T2万、12-18万、18-25万、 25-35万、35万以上 特色:只加93号油、ESP、导航、倒车影像、全景天窗、儿童 乘坐、7人乘坐、四轮驱动、日行灯、非承载式车身1.6. 物1. 6.1.属性类 管理设备: 感知设备:(传感器
11、) 位置:桥梁、道路、环境,采集频率:毫秒级、秒级、分钟级、小时级、天级、不定期、 其他1. 6. 2.特征类设备状态:正常运行、未运行、已损坏、未知2.政务数据标签建设方案2. 1.标签库ID实体标签类别标签类型类型描述标签名称父ID1数属性类SJLY数据来源委办局-12数属性类SJLY数据来源住房城乡建设委13数属性类SJLY数据来源司法局12. 2.标签形成标签作为大数据的根基,它完美地抽象出一个实体对象的信息 全貌,从GLDM模型的整个分层机构来看,数据标签的形成主要在 贴源层和整合层。从贴源层形成“数据”的标签,这个主要对于来源数据表而言, 从宏观角度轻而易懂对数据状况就行概述,形成数据层面的标签 库。通过GLDM模型在原子层对数据进行最细粒度拆分、细化,通 过数据校核、整理汇聚到整合层,形成数据较全、准性性较高、 维度较细的实体信息数据(人、企、房、车、物),然后通过对 实体进行标签运算,形成实体数据的标签库,从而为以后的数据 挖掘或者分析奠定基础。