‘0.数据分析’ 分类下的所有文章
数据分析实务,分析师的日常功课。
很早就在书本上知道定性研究里的焦点小组座谈,对里面的单面镜很是好奇,最近有机会看了一眼焦点小组座谈会的庐山真面目。
阅读全文 »
周末呆在家里,做一个文章专题,分享给大家!
原文链接http://www.upperplus.cn/up-special/shu
熟女经济和半熟社会——手机人@2011
文/刘向清
电力的兴起,让更多的城市与乡村居住者们,轻按开关便可以驱赶黑夜,“电”,点亮的是家庭、城市、街道,日出而作、日落而息的大自然规律嘎然而止,生活从此有了崭新的面貌,就是“卖单儿”(东北话:看风景)也是万家灯火,街灯璀璨。
第一次基本回归之后,R方还相当小,可解释的部分不多,残差里还有很多函数,现在需要把这些函数从残差里找出来。
在SPSS点了很久之后,手累了,而SPSS的Syntax功能又相当弱,循环里只能跑描述,不能跑回归,于是想到用Stata。
假定在数据文件里已经有了edu这个变量,我需要做的是,找出edu的各个变式(也就是edu的各种初级函数),然后用基本回归方程的残差对这些变式的两两组合、三三组合甚至四四组合做回归,找到显著的项。
以三三组合为例,下边的这个do文件可以实现:
阅读全文 »
网购这么火,那网民们每天都在什么时候浏览购物网站呢?

研究发现,这个时间是早上十点和晚上八点。十点,刚刚开始上班,还没着手工作或者刚刚处理完昨天遗留的任务,先网购一把!下班到家干点什么呢?先看看购物网站上有什么好东西再说。
有趣的是,女性在上午和下午这两个时间点浏览网站的比例差不多,而男性则不同,他们白天看的不多,晚上再使劲儿看,还是男人热爱工作,沉得住气!
(数据来源:第一象限)
从大三开始到毕业三个月的现在,我一直处于实习或者试用的状态,辗转多个公司,终于选了最小的那一个,也就是我现在供职的企业,一家刚刚起步的咨询公司,专注于移动互联网相关的行业。
在这段迷茫的时间里,博客很少更新。一方面是因为飘泊不定,另一方面总是想憋一篇长文出来,但事实上我写博客也跟便秘一个样子,生憋基本只能把屎烂在肚子里。思前想后,偶有所得时记录一下更有意义,并且可以历久弥新。
今天的所得是数据分析中清洗数据的一些小零碎,算不得经验,行家看起来肯定会嗤之以鼻,但对于我,一个数据菜鸟,却是一笔宝贵的财富。
数据清洗有两个层面:一是变量层面,一是Case层面(能有这样的想法,多半是由于SPSS的设计,它有一个Variable视图和一个Data视图),以变量为核心,再进一步检查Case。
1.变量层面
(1)针对每一个变量,检查它的Type
许多网络问卷回收的数据会把数值型的变量做成字符串型,字符串不能计算,要改回来。

(2)检查变量的Measure
经常看到一些报告中的数据图表特别专业,能够把许多数据放到一张图里,旧数据呀、新数据呀、变动百分比呀等等都能体现出来(就像下图),可自己做的图总是那么简单和丑陋。

一番探索之后,终于找到了做法,so,Google is good.
貌似在Excel 2003版本插入图的时候可以先设定插入什么样的图,而在Excel 2007里,改变了这个思路,需要先把图做出来,然后修改样式。
Step 1:输入数据,注意横纵坐标的位置。 阅读全文 »

