新足迹

 找回密码
 注册

精华好帖回顾

· 海鲜焗饭&忌廉南瓜汤 (2007-12-15) 紫雪花 · 墨尔本一日游 (2010-5-8) dickson
· 我爱猫,宝宝也爱猫 (2008-6-15) qiqi_vic · 更新啦~挡雨板挡泥板到了!宝宝也长大了!途锐入手快2月了,发些图片外加一些改装。 (2013-8-26) popxiaoyu
Advertisement
Advertisement
123
返回列表 发新帖
楼主:chainray

[IT] 有用R做数据分析的吗? [复制链接]

发表于 2015-12-21 23:55 |显示全部楼层
此文章由 yabyzq 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 yabyzq 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 yabyzq 于 2015-12-22 01:00 编辑

R的好处是能用非常简短的代码做数据分析。SQL只是获取数据而已,MS BI是偏向于reporting,新的power bi有部分visual,dashboard功能,SAS简单来说是SQL+R,但不好上手, tableau最多是SQL + Power BI +advanced excel,用熟练了比excel快,好用。纯粹reporting用crystal + excel + powerbi/tableau 就可以了,有钱上sap,cognos,不见得更好用。趋势是数据分析,所以学好R和SAS,Python还是有用的。貌似乱七八糟扯了一大推

评分

参与人数 1积分 +5 收起 理由
daomeidan1234 + 5 高手阿,有空会会

查看全部评分

Advertisement
Advertisement

发表于 2015-12-21 23:58 |显示全部楼层
此文章由 yabyzq 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 yabyzq 所有!转贴必须注明作者、出处和本声明,并保持内容完整
whoisit 发表于 2015-12-21 23:42
您觉得未来从事Data Scince的话硕士读统计好还是CS/IT好?数学方面的知识需不需要学到很高深的比如Stochas ...

硕士cs好赚钱。话说data science你除非很上进,还是读个phd比较好,否则怎么叫data scientist呢。有pm,growth hacker潜质的可以无视

发表于 2015-12-22 00:00 来自手机 |显示全部楼层
此文章由 cnnworld 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 cnnworld 所有!转贴必须注明作者、出处和本声明,并保持内容完整
whoisit 发表于 2015-12-21 23:42
您觉得未来从事Data Scince的话硕士读统计好还是CS/IT好?数学方面的知识需不需要学到很高深的比如Stochas ...

it: 会python,sql,尤其sql要炉火纯青
data mining:懂各种流行的supervised models,以及聚类模型,比如boosting 和bagging啦,了解svm,random forest,决策树之间的一些细节和区别,懂L1 L2 reguralization
编程:能看懂些编程代码,比如.net java之类的,主要用于一些底层编程实现,一般不是你来做,但需要懂些,比如java中间件,hadoop map reduce之类的,知道面相对象怎么回事
os:懂些shell编程,会自动化脚本,熟悉基本linux操作:比如加个用户拉,定制个任务啦,会用vim编辑个文本啦
数据库:懂各大数据库的基本操作:mysql,sql server,oracle,no-sql等,知道优缺点,熟悉各种云端产品比如aws,google cloud,会用脚本操作这些
统计: 基本的ab test,懂实验设计,知道sample size计算,会two way anova 分析,懂将数据降纬的几种方法,标准化数据,了解概率和统计基本知识,可以看懂前面dm模型中的统计证明


基本以上是ds的技术要求,其他都是业务上的经验了,一般cs和统计科班出来的,或多或少对上面都有些了解,只是深浅不同,技术上深浅和经验上多寡产生了区别,不过以上我说的,能通的基本哪儿都不愁工作




评分

参与人数 3积分 +8 收起 理由
flydragon68 + 2 感谢分享
jeunesse2 + 2 感谢分享
jantorget + 4 感谢分享

查看全部评分

发表于 2015-12-22 00:06 |显示全部楼层
此文章由 yabyzq 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 yabyzq 所有!转贴必须注明作者、出处和本声明,并保持内容完整
cnnworld 发表于 2015-12-22 01:00
it: 会python,sql,尤其sql要炉火纯青
data mining:懂各种流行的supervised models,以及聚类模型,比 ...

ls说得不错,具体可以去quora看,记得有张map找不到了,话说很多还是一知半解啊。。
https://www.quora.com/How-can-I-become-a-data-scientist-1

发表于 2015-12-22 21:41 |显示全部楼层
此文章由 whoisit 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 whoisit 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 whoisit 于 2016-1-2 21:14 编辑
cnnworld 发表于 2015-12-22 01:00
it: 会python,sql,尤其sql要炉火纯青
data mining:懂各种流行的supervised models,以及聚类模型,比 ...


谢谢解答.是不是就是说没有必要读一个统计master吗?

发表于 2015-12-22 22:00 |显示全部楼层
此文章由 libai0915 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 libai0915 所有!转贴必须注明作者、出处和本声明,并保持内容完整
chainray 发表于 2015-9-12 23:10
能举个栗子吗?比如用R的什么功能,采集的样本?

学到了很多,用了decision tree,random forest之类的模型
Advertisement
Advertisement

发表于 2015-12-23 08:17 |显示全部楼层
此文章由 xji 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xji 所有!转贴必须注明作者、出处和本声明,并保持内容完整
R比普通SQL工具或SAS比更突出的优势在于庞大的三方工具库,特别是数据挖掘,统计和金融建模工具。这些工具普通SQL工具甚至SAS都没有。但是你说的MS BI应该包含一些常见的建模库,肯定不如R支持的全面,不过很多R里面的工具你们不一定用得到。R里面还有很多HTML,XML parser,还有库支持网络下载,这些SQL或SAS都没有。不过你们也不一定用得到。

R的问题在于第一它的处理能力有限,所有东西都在内存中进行,如果你要对一个10G的文件做简单处理,可能要分批load到内存,这一点不如数据库或SAS方便。第二是它的learning curve。如果团队只有SQL和SAS经验,要全面转到R需要重新学习,对于一些非IT出身的分析人员,可能有难度,不是每个人都那么愿意投入的。现有的东西很难重用,很多东西都要重做。第三是R是开源的,换言之就是企业支持不一定好。比如用Oracle或MS或SAS,有什么问题技术支持比较全面,用R出问题可能就没那么好支持了。当然,也有一些企业级R应用可以用。

就我的经验而言,如果要考虑从SQL或SAS或MS BI转到R,你要看你现在的应用或将来的应用在各个平台上的支持利弊。不要去问R有什么是其他工具不具备的。这个问题不好。一来每个平台总会有东西是其他平台不具备的,但如果你的企业用不到有啥意义?二来,换平台,纯技术功能上支持程度总是容易搞清楚的,更多的是我之前说的非功能因素,比如资金,技术支持,学习难度,移植难度等。这些有时候比功能更重要啊。

评分

参与人数 2积分 +13 收起 理由
daomeidan1234 + 5 用 R cluster
chainray + 8

查看全部评分

发表于 2015-12-23 08:40 |显示全部楼层
此文章由 Bessy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Bessy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
试一下 微软的 Revolution R, 就会感觉 SQL工具处理能力有限了。

发表于 2015-12-28 23:13 |显示全部楼层
此文章由 gozh2005 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 gozh2005 所有!转贴必须注明作者、出处和本声明,并保持内容完整
做这个和做full stack编程哪个钱景好呢?感觉做data有不少高工资的活15万以上,做developer15万是high end不过机会多不少了,而且会web也容易自己找点contract吧。

发表于 2017-3-27 09:31 |显示全部楼层
此文章由 jantorget 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jantorget 所有!转贴必须注明作者、出处和本声明,并保持内容完整
cnnworld 发表于 2015-12-22 01:00
it: 会python,sql,尤其sql要炉火纯青
data mining:懂各种流行的supervised models,以及聚类模型,比 ...

请问,如果对数据这一行没有实际工作经验,但又想转入这行。 去读个machine learning 的PHD,有实际帮助吗?

个人对机器学习比较感兴趣,想回学校读书。 但不知,读出来后对找工作是否有帮助。

发表于 2017-3-27 11:20 |显示全部楼层
此文章由 terran_empire 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 terran_empire 所有!转贴必须注明作者、出处和本声明,并保持内容完整
I thought R just an uni assignment tool.....
Advertisement
Advertisement

发表于 2017-3-27 11:57 |显示全部楼层
此文章由 baiii 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 baiii 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jantorget 发表于 2017-3-27 10:31
请问,如果对数据这一行没有实际工作经验,但又想转入这行。 去读个machine learning 的PHD,有实际帮助 ...

没帮助,除非你打算走学术道路

发表于 2017-3-27 12:00 来自手机 |显示全部楼层
此文章由 30phy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 30phy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
马克

发表于 2017-3-27 12:03 来自手机 |显示全部楼层
此文章由 30phy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 30phy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
马克

发表于 2017-3-27 12:18 |显示全部楼层
此文章由 deepnorth2 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 deepnorth2 所有!转贴必须注明作者、出处和本声明,并保持内容完整
chainray 发表于 2015-9-6 21:20
你们用到R的什么功能是SQL做不了的?

Please use SQL to conduct a Markov Chain Monte Carlo analysis for a logistic regression which can be easily handled by R.

发表于 2017-3-27 12:43 |显示全部楼层
此文章由 daomeidan1234 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 daomeidan1234 所有!转贴必须注明作者、出处和本声明,并保持内容完整
xji 发表于 2015-12-23 09:17
R比普通SQL工具或SAS比更突出的优势在于庞大的三方工具库,特别是数据挖掘,统计和金融建模工具。这些工具 ...

需要跟你学习学习R
与其插一腿,不如插一嘴。
Advertisement
Advertisement

发表于 2017-3-27 20:00 |显示全部楼层
此文章由 birdbirdhh 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 birdbirdhh 所有!转贴必须注明作者、出处和本声明,并保持内容完整
有高手对比下R和Stata么

发表于 2017-3-27 22:33 |显示全部楼层
此文章由 yabyzq 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 yabyzq 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jantorget 发表于 2017-3-27 10:31
请问,如果对数据这一行没有实际工作经验,但又想转入这行。 去读个machine learning 的PHD,有实际帮助 ...

当然有帮助啦,但phd不是这么容易进和毕业的。顶级cmu之类的出来都是被flag抢的,知道一个出来就50+。但是很多都是CS/SE的本,没有经验不会编程可能太吃力了吧。

发表于 2017-4-13 14:05 |显示全部楼层
此文章由 jantorget 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jantorget 所有!转贴必须注明作者、出处和本声明,并保持内容完整
yabyzq 发表于 2017-3-27 22:33
当然有帮助啦,但phd不是这么容易进和毕业的。顶级cmu之类的出来都是被flag抢的,知道一个出来就50+。但 ...

编程不是问题。 数学是个问题。。。

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部