求职简历模板大数据开发工程师_002.docx

上传人:lao****ou 文档编号:293828 上传时间:2023-07-29 格式:DOCX 页数:3 大小:23.49KB
下载 相关 举报
求职简历模板大数据开发工程师_002.docx_第1页
第1页 / 共3页
求职简历模板大数据开发工程师_002.docx_第2页
第2页 / 共3页
求职简历模板大数据开发工程师_002.docx_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《求职简历模板大数据开发工程师_002.docx》由会员分享,可在线阅读,更多相关《求职简历模板大数据开发工程师_002.docx(3页珍藏版)》请在第一文库网上搜索。

1、年龄:XXX邮箱:xxxxxxx手机:XXXXXXXXXXxxxxxxx大学I本科I男应聘职位大数据开发工程师期望薪资:面议一个人证书全国大学英语六级考试(CET-6)469分.就职经历2016.7至2019.2就职于XXXXXX股份有限公司,职位为大数据开发工程师。个人能力 熟练使用Java,Sca1a,Pythor1等编程语言。 熟悉She11脚本语言,经常在1inux环境下编写各类脚本。 熟练Hadoop相关知识,能够熟练搭建Hadoop分布式集群。 熟练使用Hive与Mysq1等关系型数据库,了解HiVe优化相关知识。 熟练使用HBase存储数据,了解rowKey设计等HBase优化方

2、法。 熟练使用RediS数据库存储数据,能够将RediS数据库应用到业务中。 熟练使用日asticSearch存储数据,了解日asticSearch索引建立等知识,熟练使用Kibana调度EIaStiCSearCh数据库C 熟练使用SqOOp,Kafka,FIUme等数据传输工具。 了解ZookeePer相关知识,能够熟练使用Zookeeper0 熟练使用Spark及其组件,经常使用Spark对数据进行统计与分析。 熟练使用Azkaban定时调度任务。 了解OoZie相关知识,熟练使用Oozie定时调度任务。项目经历项目一:香哈离线数据仓库搭建与基本指标获取项目简述:针对用户登录、点击、浏览等

3、行为以及自营电商业务每日产生的离线数据,进行数据清洗、分类以及统计。离线数据导入HiVe数据仓库的过程涉及到了FIume1Sqoop的使用与调优,数据统计过程中涉及到了维度退化,宽表与拉链表的构建与调整。最终实现了对用户留存率,转化率等重要指标的获取。项目架构:F1ume;Sqoop;Mysq1;Hdfs;Hive;Spark;Azkaban;主要负责:1、根据日志数据对应用日活,周活,月活数据进行统计,统计七日内日活变化情况。2、分析用户日活数据,对用户留存、沉默、唤醒、流失与召回情况进行统计。3、统计每日上传作品的名称,类别等明细信息。4、获取自营电商每日订单流水,对订单信息进行统计。5、

4、建立用户行为明细表,统计用户的每日浏览、收藏等行为信息,并统计用户活跃度。6、建立用户行为宽表,统计用户的每日浏览、收藏等行为信息。7、建立基于行为数据与用户基本信息的用户画像。8、计算每日普通用户升级为会员用户的转化率。技术要点:1、使用JaVa语言编写F1Ume拦截器,清洗日志数据中的不完整数据与时间错误数据,并分流日志数据到不同的ChanneI。2、使用SqoOP传输自营电商业务数据,保存到hdfs。3、使用JaVa语言编写UDF函数,对日志公共字段进行解析,编写UDTF函数,解析日志具体事件字段。4、通过Spark-sq1保存解析后的日志数据到数据仓库。5、使用SParkRDD操作对解

5、析后日志数据进行脱敏C6、建立用户行为明细表(每日全量),根据用户对作品行为数据,使用Spark-Sq1统计用户偏好指标,结合用户所在地区等信息建立用户画像。7、使用AZkaban调度系统,定时执行任务。项目二:香哈美食推荐系统项目简述:采用每日用户行为明细数据作为原始数据集,将用户对作品的行为转化为评分数据,根据作品的每日评分与评分有效期统计作品的综合评分。通过Spark-M1Iib计算基于Item-CF的作品推荐列表C项目架构:MongoDB;EIasticSearch;Redis1Spark;Azkaban主要负责:1、通过SPark-Sq1读取每日用户行为明细数据,计算用户评分数据以及

6、作品每日平均评分数据。2、统计评分有效期内作品的每日平均评分,构建用户与作品的评分矩阵。3、通过Item-CF计算得到每日推荐作品列表。4、根据作品形式将推荐列表存入MongoDB05、使用Azkaban定时调度业务系统。技术要点:1、使用Sca1a语言编写用户行为明细数据的解析工具类,并建立与业务指标相关的样例类。2、使用Spark-sq1以及SparkRDD操作对解析后的用户行为明细数据进行统计,得到评分数据.3、划分评分数据的训练集与测试集。4、通过Spark-M1Iib的A1S算法得到用户对产品的预测评分矩阵。5、根据用户评分矩阵计算产品间的相似度矩阵,并存储到HBaSe。6、根据作品

7、的余弦相似度以及用户评分计算针对用户的每日推荐列表,保存入EIasticSearch以及MongoDB07、通过相似度矩阵得到相似作品推荐列表,并存入EIaStiCSearCh与MongnDB08、使用Azkaban定时调度系统。项目三:香哈广告点击黑名单统计系统项目简述:实时获取广告业务日志信息以及用户行为日志信息。通过Redis数据库存储广告日志信息,使用SPark分析广告点击日志,统计用户点击次数,广告的点击通过率,并实时更新广告点击用户黑名单。项目架构:Kafka;Spark;Redis;Mysq1主要负责:Ix通过Kafka集群实时获取广告的点击日志数据。2、通过SParkRDD操作实时统计各页面各广告的点击数量。3、根据用户点击量等指标实时更新广告点击黑名单.技术要点:1、使用kafka集群实时获取广告点击日志数据。2、通过SPark-Streaming实时消费Kafka中数据,并通过RDD操作清洗错误时间戳数据。3、利用RediS建立广告点击黑名单表,并实时更新。4、SparkRDD操作统计广告点击信息,通过Spark-streaming缓存广告业务数据到Redis数据库,利用Redis对广告业务信息进行去重。5、通过SPark-Streaming读取RediS数据库中广告点击黑名单,过滤黑名单用户点击数据。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 汇报材料

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服