刘勇通过电脑显示屏讲解数据分析图 扫一扫看视频 在购物网站看了一件衣服,当再次进入该网站时,“猜你喜欢”会推荐和这件衣服相似款式与风格的衣服;在视频网站看了几个视频,网站首页出现的,大多是和这几个视频同类的视频。而这些现象只是大数据在日常生活中的简单应用。
随着互联网和信息行业的高速发展,大数据越来越引起人们的关注,相关从业人员的工作也令人好奇。5月7日,记者来到宝鸡市大数据产业园,跟随数据分析师刘勇,体验了这一新职业。
学美术的数据分析师
当天上午9时许,在位于产业园的宝鸡阳光网络技术有限公司,记者见到了刘勇。他是公司负责人,也是一名数据分析师。
刘勇是“80后”,凤翔县人,大学学的是美术教育,从事过平面设计、网页设计、网站制作、服务器运维等工作。随着大数据时代的来临,刘勇认识到了数据的价值,3年前,他在无锡考取了数据分析师资格证书,步入了大数据行业。
“目前的数据分析师,基本都是自学的。”刘勇介绍,我国高校从三年前才开设大数据本科专业,真正专业对口的第一批学生还没走上工作岗位。现在从业的数据分析师,教育背景多元化,像他就是学美术的,他们公司其他数据分析师,有学农业的,还有学金融的“海归”等,大家都是出于兴趣爱好,跨专业自学相关知识与技能的。
“数据分析师究竟是干什么的?”对于记者的疑问,刘勇说,数据分析师就是对数据进行采集、清洗、挖掘,最后分析数据,得出结论与报告,为用户决策提供建议。
随后,记者体验了数据清洗工作。刘勇给记者提供了一批格式各异的数据,有Excel、文本文档、图片等格式,让记者删掉重复的数据,统一整理成Excel格式的。“听起来不难。”记者信心满满地开始了。十几分钟后,一行行数据看得人眼睛都花了。一个小时后,重复枯燥的整理过程,让记者有些焦头烂额。而本应该在一个小时内完成的整理任务,也只完成了一小部分。
让人们生活更便捷
刘勇给记者介绍了他们正在进行的一个数据分析业务。某品牌充电宝想优化企业在浙江的仓储物流布局,并提供了他们在浙江的销售数据、仓储物流布局数据等作为数据源,这样刘勇他们就省去了采集数据这一环节。从去年12月开始,刘勇和同事用了近2个月时间清洗数据,他们删除重复的、没用的数据,挑出有用的数据进行整理,建立SQL数据库,通过各种图表、动态图等,掌握数据的实时变化。比如该企业物流车的行进路线、到了哪个仓库、取了多少货等。从2月底开始,他们开始进行数据可视化,目前完成了大半部分内容。等数据可视化完成后,他们将分析数据,算出最合理的仓储物流布局,即该企业在浙江建几个仓库、建在什么地方等,给该企业提供分析报告,从而实现降低成本的目的。
对于市民来说,“猜你喜欢”等商品推送是常见的大数据应用方式。刘勇表示,人们访问购物网站时,浏览信息被存在电脑或手机缓存中,当你再次打开这个网站时,网站可以读取了解你之前看的商品,根据你的喜好、习惯等,精准推送你感兴趣的商品。另外就是你输入的字词,数据会被记录下来,当你再次打出同样字母时,会快速匹配到常用的字词。我们的衣食住行、日常工作生活与网络紧密相连,时刻产生各种数据。数据分析师面对海量数据,分析解读,得出规律,让人们的生活更加便捷、智能。