输入后,回车搜索
文章分类
求关注
Display Pagerank
关注微博:
订阅文章:
文章归档
链接—性别不详

‘0.数据分析’ 分类下的所有文章

数据分析实务,分析师的日常功课。

很早就在书本上知道定性研究里的焦点小组座谈,对里面的单面镜很是好奇,最近有机会看了一眼焦点小组座谈会的庐山真面目。
阅读全文 »

周末呆在家里,做一个文章专题,分享给大家!

原文链接http://www.upperplus.cn/up-special/shu

熟女经济和半熟社会——手机人@2011

文/刘向清

电力的兴起,让更多的城市与乡村居住者们,轻按开关便可以驱赶黑夜,“电”,点亮的是家庭、城市、街道,日出而作、日落而息的大自然规律嘎然而止,生活从此有了崭新的面貌,就是“卖单儿”(东北话:看风景)也是万家灯火,街灯璀璨。

阅读全文 »

第一次基本回归之后,R方还相当小,可解释的部分不多,残差里还有很多函数,现在需要把这些函数从残差里找出来。
在SPSS点了很久之后,手累了,而SPSS的Syntax功能又相当弱,循环里只能跑描述,不能跑回归,于是想到用Stata。
假定在数据文件里已经有了edu这个变量,我需要做的是,找出edu的各个变式(也就是edu的各种初级函数),然后用基本回归方程的残差对这些变式的两两组合、三三组合甚至四四组合做回归,找到显著的项。
以三三组合为例,下边的这个do文件可以实现:
阅读全文 »

姚晨骑驴骑了半年多过去了,杨幂也“神奇”了半年了,分类信息网站现在变成个什么样子了?

阅读全文 »

网购这么火,那网民们每天都在什么时候浏览购物网站呢?

研究发现,这个时间是早上十点和晚上八点。十点,刚刚开始上班,还没着手工作或者刚刚处理完昨天遗留的任务,先网购一把!下班到家干点什么呢?先看看购物网站上有什么好东西再说。

有趣的是,女性在上午和下午这两个时间点浏览网站的比例差不多,而男性则不同,他们白天看的不多,晚上再使劲儿看,还是男人热爱工作,沉得住气!

(数据来源:第一象限

 

从大三开始到毕业三个月的现在,我一直处于实习或者试用的状态,辗转多个公司,终于选了最小的那一个,也就是我现在供职的企业,一家刚刚起步的咨询公司,专注于移动互联网相关的行业。

在这段迷茫的时间里,博客很少更新。一方面是因为飘泊不定,另一方面总是想憋一篇长文出来,但事实上我写博客也跟便秘一个样子,生憋基本只能把屎烂在肚子里。思前想后,偶有所得时记录一下更有意义,并且可以历久弥新。

今天的所得是数据分析中清洗数据的一些小零碎,算不得经验,行家看起来肯定会嗤之以鼻,但对于我,一个数据菜鸟,却是一笔宝贵的财富。

数据清洗有两个层面:一是变量层面,一是Case层面(能有这样的想法,多半是由于SPSS的设计,它有一个Variable视图和一个Data视图),以变量为核心,再进一步检查Case。

1.变量层面

(1)针对每一个变量,检查它的Type

许多网络问卷回收的数据会把数值型的变量做成字符串型,字符串不能计算,要改回来。

(2)检查变量的Measure

阅读全文 »

经常看到一些报告中的数据图表特别专业,能够把许多数据放到一张图里,旧数据呀、新数据呀、变动百分比呀等等都能体现出来(就像下图),可自己做的图总是那么简单和丑陋。

一番探索之后,终于找到了做法,so,Google is good.

貌似在Excel 2003版本插入图的时候可以先设定插入什么样的图,而在Excel 2007里,改变了这个思路,需要先把图做出来,然后修改样式。

Step 1:输入数据,注意横纵坐标的位置。 阅读全文 »

这篇文章,想跟大家分享我使用word带通配符的查找替换功能的一些心得。

之前做过一份问卷,放在了不同的平台上。放在搜狐上的问卷,收回来数据就傻了眼。

阅读全文 »