日期:2024-04-25 19:15:54作者:人气:0
大家好!关于分析用哪个看数据好用的认知或许还有所欠缺,但是不要担心,今天我将为大家整理一些与分析用哪个看数据好用相关的详细资料和专业文章,希望能够帮助大家更好地理解和应用。
2012年的时候我们说r是学术界的主流,但是现在python正在慢慢取代r在学术界的地位。不知道是不是因为大数据时代的到来。
python与r相比速度要快。python可以直接处理上g的数据;r不行,r分析数据时需要先通过数据库把大数据转化为小数据(通过groupby)才能交给r做分析,因此r不可能直接分析行为详单,只能分析统计结果。所以有人说:python=r+sql/hive,并不是没有道理的。
python的一个最明显的优势在于其胶水语言的特性,很多书里也都会提到这一点,一些底层用c写的算法封装在python包里后性能非常高效
(python的数据挖掘包orange canve
中的决策树分析50万用户10秒出结果,用r几个小时也出不来,8g内存全部占满)。但是,凡事都不绝对,如果r矢量化编程做得好的话(有点小难度),会
使r的速度和程序的长度都有显著性提升。
r的优势在于有包罗万象的统计函数可以调用,特别是在时间序列分析方面,无论是经典还是前沿的方法都有相应的包直接使用。
相比之下,python之前在这方面贫乏不少。但是,现在python有了
pandas。pandas提供了一组标准的时间序列处理工具和数据算法。因此,你可以高效处理非常大的时间序列,轻松地进行切片/切块、聚合、对定期
/不定期的时间序列进行重采样等。可能你已经猜到了,这些工具中大部分都对金融和经济数据尤为有用,但你当然也可以用它们来分析服务器日志数据。于是,近
年来,由于python有不断改良的库(主要是pandas),使其成为数据处理任务的一大替代方案。
做过几个实验:
1. 用python实现了一个统计方法,其中用到了ctypes,multiprocess。
之后一个项目要做方法比较,又用回r,发现一些bioconductor上的包已经默认用parallel了。(但那个包还是很慢,一下子把所有线程都用掉了,导致整个电脑使用不能,看网页非常卡~)
2. 用python pandas做了一些数据整理工作,类似数据库,两三个表来回查、匹配。感觉还是很方便的。虽然这些工作r也能做,但估计会慢点,毕竟几十万行的条目了。
3. 用python matplotlib画图。pyplot作图的方式和r差异很大,r是一条命令画点东
西,pylot是准备好了以后一起出来。pyplot的颜色选择有点尴尬,默认颜色比较少,之后可用html的颜色,但是名字太长了~。pyplot
的legend比r 好用多了,算是半自动化了。pyplot画出来后可以自由拉升缩放,然后再保存为图片,这点比r好用。
总的来说python是一套比较平衡的语言,各方面都可以,无论是对其他语言的调用,和数据源的连接、读取,对系统的操作,还是正则表达和文字处
理,python都有着明显优势。
而r是在统计方面比较突出。但是数据分析其实不仅仅是统计,前期的数据收集,数据处理,数据抽样,数据聚类,以及比较复杂的数据挖掘算法,数据建模等等
这些任务,只要是100m以上的数据,r都很难胜任,但是python却基本胜任。
结合其在通用编程方面的强大实力,我们完全可以只使用python这一种语言去构建以数据为中心的应用程序。
但世上本没有最好的软件或程序,也鲜有人能把单一语言挖掘运用到极致。尤其是很多人早先学了r,现在完全不用又舍不得,所以对于想要学以致用的人来说,如果能把r和python相结合,就更好不过了。
1.excel
作为一个入门级工具,excel是快速分析数据的理想工具,也能创建供内部使用的数据图,但是excel在颜色、线条和样式上可选择的范围有限,这也意味着用excel很难制作出能符合专业出版物和网站需要的数据图。但是作为一个高效的内部沟通工具,excel应当是你百宝箱中必备的工具之一。
2.csv/json
csv(逗号分隔值)和json(javascript对象注释)虽然并不是真正的可视化工具,但却是常见的数据格式。你必须理解他们的结构,并懂得如何从这些文件中导入或者导出数据。以下将要介绍的所有数据可视化工具都支持csv、json中至少一种格式。
3.googlechartapi
googlechartapi工具集中取消了静态图片功能,目前只提供动态图表工具。能够在所有支持svgcanvas和vml的浏览器中使用,但是googlechart的一个大问题是:图表在客户端生成,这意味着那些不支持javascript的设备将无法使用,此外也无法离线使用或者将结果另存其他格式,之前的静态图片就不存在这个问题。
4.flot
flot是一个优秀的线框图表库,支持所有支持canvas的浏览器(目前主流的浏览器如火狐、ie、chrome等都支持)。
数据分析这个岗位可以说很宽泛很杂,从数据录入员到行业分析师专家都可以认为是数据分析,甚至一些搞数据挖掘、人工智能的都可以包括到数据分析的范畴里,但是这些工作所做的事情却相差甚远,当然待遇也天壤之别。所以大家在应聘时不要只看岗位名称,重要的是看看清岗位职责和要求。言归正传,咱们谈谈如何学习数据分析。
一、知识技能
1、学科知识:从数据分析涉及到的专业知识点上看,他包含的比较多,包含但不仅限于以下学科:
(1)统计学:参数检验、非参检验、回归分析……等
(2)数学:线性代数、微积分等
(3)社会学:主要是一些社会学量化统计的知识,如问卷调查与统计分析;还有就是一些社会学的知识,这些对于从事营销类的数据分析人员比较有帮助
(4)经济金融:如果是从事这个行业的数据分析人员,经济金融知识是必须的,这里就不多说了
(5)计算机:从事数据分析工作的人必须了解你使用的数据是怎么处理出来的,要了解数据库的结构和基本原理,同时如果条件充足的话,你还能有足够的能力从数据库里提取你需要的数据(比如使用sql进行查询),这种提取数据分析原材料的能力是每个数据从业者必备的。此外,如果要想走的更远,还要能掌握一些编程能力,从而借住一些专业的数据分析工具,帮助你完成工作。
这些专业知识不是一时半会能够全面掌握的,学习的唯一捷径就是看书、看视频讲解,看权威的书籍、看全面的知识。学习基础知识没有一蹴即就的方法,因为基础,所以学起来会比较枯燥、比较漫长。如何你想在数据分析方面有长远的发展,希望你能在基础知识上长期坚持的学习下去。
2、软件操作:从事数据分析方面的工作必备的工具是什么,我大致罗列以下几类:
(1)分析报告类:microsoft office软件(excel、word、powerpoint、visio……)、水晶易表等,如果连excel表格基本的处理操作都不会,连ppt报告都不会做,那我只好说离数据分析的岗位还差的很远。
(2)专业数据分析软件:office并不是全部,要从在数据分析方面做的比较好,你必须会用(至少要了解)一些比较常用的专业数据分析软件工具,比如spss、sas、r、matlab等等,这些软件可以很好地帮助我们完成专业性的算法或模型分析。
(3)辅助工具:比如思维导图软件(如mindmanager、mindmapper等)也可以很好地帮助我们整理分析思路。
在此需要说明的一点是:软件只是帮助我们完成任务的工具。并不是我们只要学好的软件操作就能很好地完成任务,因为与操作相比,如何解释最后的结果要重要的多。即使软件操作的再熟,如果看不懂结果,那跟不会才做没有两样。而看看懂结果就需要扎实的专业知识才行。
主要从以下几个方面分析:
一新产品的竞争情报分析、产品敏捷测试等都需要数据分析,后期产品迭代优化还是需要数据分析,采集用户行为、习惯、评价等数据;
二用户流量、促销、顾客关系管理等需要数据分析;
三是公司数据制定和标准建设、各部门数据打通,数据化管理等工作需要数据分析;
四是数据情报和数据预测。
从以上四个方面看商业分析能力和业务知识能力就显得尤为重要,这个时候是考验分析师的业务理解能力及通过数据为企业解决实际问题的能力了。比如分析师的分析流程、分析思维、分析技能、展示说服能力。可以考虑进这方面专业的公司,或者运气好碰到有经验的老师带你一段时间,像我运气不错刚进了决明就碰到了老师带我,进步的很快,所以现在基本把这一套搞得很熟练了。
关于分析用哪个看数据好用和分析用哪个看数据好用的介绍已经到此结束,希望你能从中找到所需的信息。如果你还想进一步了解这方面的知识,请继续关注本站,我们将持续更新相关内容。
Copyright 2009-2025 【卡其体育】 版权所有 滇ICP备2022001660号-353 |
声明: 文章来自网络,版权归原作者所有,如有侵权,请联系邮箱:2567502773@qq.com