应用统计学 第2章 数据与数据收集

发布于:2021-07-26 06:09:10

第2章 数据与数据搜集

1

主要内容和学*目标
2.1 2.2 数据(理解) 数据的收集(掌握)

2

2.1

数据

2.1.1数据的测量尺度 2.1.2统计数据的常用类型

3

2.1.1 数据的测量尺度 统计研究的任务之一就是要对数据进行 处理和分析,而对数据进行处理与分析的前 提就是要对数量进行计量,而要对数据进行 计量,就要确定数据的计量尺度。按照对客 观事物测度的程度或精确水*来划分,可将 计量尺度从低级到高级、由粗略到精确分为 定类尺度、定序尺度、定距尺度、定比尺度 四种。

4

1.定类尺度
统计标志 定类尺度又称列名尺度或列名水 *,它是按照某种属性对客观事物 进行*行分类或分组的一种测度, 主要用于非参数的统计推断。它是 对事物的一种最粗略、计量精度最 低或最基本的测度,是其他计量尺 度的基础,其主要特征体现为: (1)只能区分事物的类别,但无 法比较类间的大小。 (2)对事物的区分必须符合穷尽 和互斥的要求。 (3)对其进行分析的统计量主要 是频数或频率。 不 变 标 志 可 变 变 量 标 志

( )

数 量 标 志

品 质 标 志 定 比 尺 度 定 序 尺 度 定 类 尺 度
5

差 距 尺 度

2.定序尺度
定序尺度又称顺序尺度或有序水*,它是对事物之间等级 或顺序差别的一种测度。其计量精度要优于定类尺度。它不 仅可以测度类别差,而且还可以测度次序差,并可比较大小。

3.定距尺度
定距尺度又称间隔尺度或间隔水*,它是对事物类别或次 序之间间距进行的一种测度。它是一种较定类尺度和定序尺 度更为高级,更为精确的一种计量尺度。其主要特征体现为: (1)不仅能区分事物的类别、进行排序、比较大小, 而且可以精确地计量大小的差异,即可以进行加减运算,但 不能计算乘除。 (2)没有绝对零点,即可以以任意一个零为起点。这 里的“零”表示一个数值,即“0”水*,而不表示“没有” 或“不存在”。

6

4.定比尺度
定比尺度又称比率尺度或比较水*,它是对事物之 间比值的一种测度,可用于参数与非参数统计推断。虽 然它与定距尺度同属于一个等级的计量尺度,但其功能 要比定距尺度强一些,其主要特征体现为: (1)除能区分类别、排序、比较大小、求出大小差异、 可采用加减运算以外,还可以进行乘除运算。 (2)具有绝对零点,即“0”表示“没有”或“不存在”。 可见,定比尺度中的“0”是个没有意义的数值。 (3)所有统计量均可对其进行分析。 上述四种计量尺度对客观事物的度量层次是由低级 到高级、由粗略到精确逐步递进的。高层次的计量尺度 可以度量低层次计量尺度,但不能反过来。

7

2.1.2

统计数据的常用类型

原始数据与次级数据 品质型数据与数值型数据 截面数据与时序数据

8

原始数据与次级数据
从统计数据获取途径来看,搜集数据的工作通常
有两类: 1、原始数据或称第一手数据:是对现象进行实验 与观察,直接取得所需要的数据。 2、次级数据或称第二手数据:是通过查阅或询

问获得他人已经加工、整理的可使用的现存数据。

9

原始数据的来源
调查 观测 实验

次级数据的来源
统计年鉴 有*诳 相关网站

10

品质型数据与数值型数据
品质型数据是用于反映每一个体属性的标签或者
名称。品质型数据由定类尺度和定序尺度来计量, 对于品质型数据,统计分析是极其有限的,通常 只是通过记录每一品质分类中观察值的比例来汇 总。

数值型数据是表示大小或多少的数值。数值型
数据既可以用定距尺度也可以用定比尺度度量, 可直接使用数学方法处理,得到有意义的结果。

11

统计标志

品质型数据、 数值型数据与 数据的测量尺 度之间的关系:

不 变 标 志

可 变 变 量 标 志

( )

数( 据数 )值 型

数 量 标 志 定 比 尺 度

数 (品 据 品质 ) 质标 型志 定 序 尺 度 定 类 尺 度
12

差 距 尺 度

截面数据与时序数据
截面数据搜集的是在同一时间对同一总体内

不同单位的数量进行观测而获得的数据。
时序数据是时间序列数据的简称,是指在不 同的时间对同一总体的数量进行观察而获得 的数据。

13

统计数据的类型

按获取途经

按表现和用途

按时间状况

原 始 数 据

次 级 数 据

品 质 型 数 据

数 值 型 数 据

截 面 数 据

时 序 数 据

14

2.2. 数据的收集

2.2.1原始数据的收集 2.2.2次级数据的收集

15

2.2.1

原始数据的收集

1、统计调查的概念 2、统计调查的方式 3、统计调查方案 4、统计调查工具

5、统计调查误差
16

1、统计调查的概念 统计调查是根据统计研究的目的和任务,在对

统计工作内容和程序作出通盘考虑和安排的基
础上,运用科学的方式与方法,有计划、有组 织地向各总体单位搜集资料的过程。 与一般调查相比,其特点在于调查对象是在调 查之前已经确定,是根据已设计的统计指标体 系搜集资料。
17

2、统计调查的方式

统计报表制度 普 查 抽样调查 重点调查

典型调查
18

统计报表制度
概念:是按照国家有关法规规定,自上而下统一布臵, 自下而上逐级提供基本统计数据的一种调查方式。 目的:收集宏观经济统计资料

特点:所收集的数据比较完整准确
所收集的数据涵盖国情国力和国家宏观决策方面 主要适用于国企、事业单位以及国家机关和团体

19

统计报表及其统计信息资料传递路径
国家统计局 省、市统计局 国务院 省、市政府
方 针

地、市统计局
县(旗)、区统计局 企、事业单位统计 统计台帐 原始记录

地、市政府
县(旗)、区政府 厂长办公室

政 策

20

普 查
概念:是为某一特定目的而专门组织的一次性

全面调查方式。
目的:为了收集有关国情国力的基本统计数据 为国家制定有关政策或措施提供依据 特点:是一次性或周期性的 需要规定统一的标准时间 普查数据全面、系统、准确、可靠 该方法适用面比较窄
21

普查的特点:
①普查通常是一次性的或周期性的。 ②普查一般需要规定统一的标准调查时间,以保证普查 结果的准确性,避免调查数据的重复与遗漏。 ③普查的数据一般比较准确,标准化程序也较高。因此, 它可以为其他调查方式提供基本的参照依据。特别是与抽 样调查的数据资料相互验证,以提高调查质量,保证调查 精度在合理的范畴之内。 ④普查适用的范围比较狭窄,只能调查一些最基本的、最 一般的现象。
22

抽样调查
概念:是为某一特定目的而专门组织的一种非全面调查 类型:概率型抽样和非概率型抽样. 目的:概率型抽样主要是为了推断总体的数量特征

非概率型抽样主要是为了了解总体的基本情况
特点:经济性好、时效性强、适用面广、准确性高 例如…… 海宁公众科学素养调查;……
23

重点调查
概念:从全部总体单位中选择少数重点单位进行调查

是指在所要调查的数量特征上占有很大比重的单位。 所要调查单位标志的标志值占总体标志值总和有很大比重 的单位

特点:属于非概率型抽样调查

目的: 为了了解总体的基本情况
24

典型调查
概念:从全部总体单位中选择一个或几个有代表性
的单位(典型单位)进行深入细致调查 具有所研究问题的本质属性或特征的单位 类型:解剖麻雀式和划类选典式 特点:属于非概率型抽样调查

目的:为了描述或揭示事物的本质或规律
25

调查方式小结
定期统计报表制度——制度化的经常性调查 全面调查 普查 调查方式 非全面调查 (抽 样 调 查 ) 非概率抽样 方便调查 (概 率 )抽 样 调 查 判断调查 典型调查 重点调查 专门组织的一次性调查

图2-2

调查方式

26

3、调查方案的设计
调查方案应包括的内容: 1、确定调查目的 2、确定调查对象和调查单位 3、确定调查项目

4、确定调查时间和调查期限
5、明确调查方式和调查方法 6、制定调查的组织实施计划
27

我国2008年第二次经济普查的调查方案

? 调查目的:“全面调查了解中国第二产业和第
三产业的发展规模及布局;了解产业组织、产业结 构、产业技术的现状以及各生产要素构成;摸清各 类企业和单位能源消耗基本情况;建立健全覆盖国 民经济各行业的基本单位名录库、基础信息数据库 和统计电子地理信息系统,为制定中长期发展规划 提供基础信息。”

28

全国经济普查条例规定,经济普查分别在逢3、逢8 的年份实施。每五年进行一次经济普查,主要是为了 满足编制国民经济发展五年规划的需要。一方面分析

判断普查年份所在期五年规划的执行情况,另一方面
为制定下一个五年规划提供基础数据。

29

? 调查对象: “是中华人民共和国境内(不包括 港、澳、台地区)从事第二、第三产业活动的 全部法人单位、产业活动单位和个体经营户”。 ? 调查单位:是每一个企事业单位、组织和个体 经营户。 ? 调查项目:单位基本属性、从业人员、财务状 况、生产经营情况、生产能力、原材料和能源 消耗、科技活动,等等。

30

? 调查时间: 标准时点时2008年12月31日
时期资料为2008年度

? 调查期限:2008年12月底前为准备阶段 2009年1月至5月为填报阶段 2009年2月至8月为数据处理和上报阶段
2009年9月至2009年年底为数据评估和发布阶段

? 调查方式:对法人单位、产业活动单位采用普查的方式;对
个体经营户采用普查辅以典型调查等方式

? 调查方法:具体收集数据一律采用访问调查调查法

? 再如……
31

4、统计调查工具

调查表 调查问卷

32

调查表的设计
调查表在结构上一般由表头、表体、表外附加组成

?表头是调查表的名称,用来说明调查的内容、被调查

单位的名称和经济性质等。
?表体是调查表的主要部分,列示调查的具体项目。

?表外附加通常由填表人签名、填报日期、填表说明等

内容组成。
33

调查表的形式:单一 一览表 单一表每份只登记一个调查单位的资料。在调查项目 较多时使用单一表,便于分类和整理。

一览表的样式——表2—1
一览表每份可登记多个调查单位的资料,却不能容纳 较多的调查内容。适用于调查项目不多的调查,便于 资料的对比和汇总。

单一表的样式——表2—2

34

调查问卷的设计 问卷设计的一般问题 问题的设计 问卷整体的设计

35

问卷设计的一般问题
设计的问卷要求: ①主题突出,问题相互关联; ②用语准确规范,易于被调查者接受; ③问题形式多样,易懂易答; ④易于设计整理和分析。

36

问卷的结构: 一般由开头部分、甄别部分、主体部分和背 景部分组成。
?开头部分

:包括标题、开场白、填表说明和问卷编号

等内容。
?甄别部分:

是对被调查者进行筛选,确定合格的被调

查者,从而满足调查研究的需要。
?主体部分:调查者根据调查的目的所设计的一系列问

题、备选答案、指导语、说明以及码表等。
37

?

背景部分:是有关被调查者的一些背景资料,如 性别、年龄、职业、*均月收入、*均月花费、 家庭常住人口、婚姻状况等。

?

调查过程记录:

例如……

38

问题的设计
(1)对变量(特征)之间的相互关系的猜想,是成功地设计 问卷的关键之一; (2)预先考虑到数据处理的方法,也会影响问卷问题的设臵; (3)凡是不能获得诚实回答的问题,都不应设臵在问卷中; (4)对“怀疑得不到诚实回答”的问题,应当在问卷的不同位 臵,设臵相同、相*、相反的问题,以求相互验证;

(5)对单选问题:备选答案必须是一个空间的完整划分,不应 当是两个空间(层面)的混淆;
(6)依据研究的目标,确定所需要收集的数据,从而确定设臵 哪些问题;
39

(7)但对于多选题,备选答案可以交叉,也可以处于不同层面;
(8)无论对多选题还是单选题,任何一个备选答 重含义; 案都不能有多

(9)无论对多选题还是单选题,备选答案之间不能有包含关系; (10)问题设计用词要准确,用语要含义明确; (11)问题的不同提法,可能导致不同的回答结果; (12)对于得不到诚实回答而又必须了解的数据,可以通过变换问 题的提法来获得相应的数据,或者通过了解相对数据来判断总 体的情况; (13)问卷设计一定要通过小规模访谈来修改。

40

问卷整体的设计
(1)编问卷的程序
(2)问卷整体外观设计 (3)引言和指导语设计 (4)标题内问题的排列原则 (5)信息传递方式和问卷设计

41

5、统计调查误差
统计调查误差:调查结果所得的统计数据与总体客观真 值之间的差异。
登记性误差 人为的因素造成的 误差 抽样本身固有的 抽样误差 其误差无法消除 其误差可 努力消除

系统性误差

随机抽样的随机因素使样本各单位结构对总体各单位 结构的代表性差别,而引起的样本指标与全及指标 之间的绝对离差的随机性的代表性误差。
42

2.2.2次级数据的收集 1、官方统计网站的次级数据 2、商业与会计数据提供的次级数据 3、中国部门统计与行政记录的次级数据 4、专为研究提供的次级数据 5、统计推算的次级数据
43

1、官方统计网站的次级数据
(1)世界各国政府统计局的次级数据 (2)联邦统计局的次级数据 (3)联合国统计机构的次级数据

(4)世界银行的次级数据
(5)OECD提供的次级数据 (6)国际货币基金组织的次级数据 (7)中国国家统计局的次级数据

44

2. 商业与会计数据提供的次级数据

XBRL—财务报表分析者福音

XBRL (eXtensible Business Reporting Language,可扩展商业报告语言)

45

【现有财务报告系统过程】

企业

交易数据库

会计数据库

外部财务报告 纳税申报

分析

内部控制报告 财务报表

运营报告

46

【现有财务软件系统交互】

系统A

AB系统接口

系统B

AC系统接口

BC系统接口

BD系统接口

AD系统接口

系统C

CD系统接口

系统D

47

财务报告披露弊端
? ? ? ? ? ? ? ? ? ? 问题1:编制报表复杂,效率低下 问题2:报告模式单一 问题3:阅读者使用的是被加工以后的信息 问题4:信息披露不充分 问题5:信息披露滞后严重 问题6:不能适应财务准则的转换 问题7:不能适应世界会计制度发展的步伐 问题8:报告格式不统一 问题9:系统技术落后,与IT发展不协调 问题10:报告呈报格式弊端明显
思考
总体来说,导致困境和弊端的主要原因是什么? 48

过 程 内 容 时 间 规 则 方 式

? 信息披露不充分
财务报告提供的多是财务信息,实际上,财务报 告分析更多的是非财务分析! 1、战略 2、竞争 3、产业 4、会计 5、财务 6、前景 7、估值

非财务的 定性分析

?

仅是中间环节, 很少一部分

?

定量分析 ——数据处理

而且,前部分往往是决定性、关键性的作用!
49

怎么办?

50

?上海证券交易所XBRL Online http://listxbrl.sse.com.cn/ssexbrl/companyInfoAction.do

?深圳证券交易所XBRL上市公司服务*台 http://xbrl.cninfo.com.cn/XBRL/index.jsp

51

【XBRL财务报告系统过程】

企业

交易数据库

会计数据库

互联网/内联网

分析

内部控制报告 财务报表

运营报告

外部财务报告 纳税申报

52

【XBRL下财务软件系统交互】

系统A

A-XBRL 系统接口

B-XBRL 系统接口

系统B

互联网/内联网

系统C

C-XBRL 系统接口

D-XBRL 系统接口

系统D

思考

为什么XBRL能解决当前报告系统问题?

53

【XBRL对分析者的影响】
相关方 XBRL预期影响

财务 报表 分析 者

1.以标准化和预设的格式获取公司财 务信息; 2.更加快捷、有效地搜集公司的相关 数据; 3.可瞬时从多家公司选择数据进行比 较和分析; 4.可利用更强大的软件工具分析、比 较和评价财务信息 5.对公司的财务业绩提供更快、更清 楚、更深刻和更确切的观点。
54

3、中国部门统计与行政记录的次级数据
各个部门统计资料是了解该部门各个方面情况的最好 的资料来源。通过行政记录取得的数据源的获取有许 多困难,如何联通部门数据,将行政记录用于统计目 的 ,有许多事要做。

4、专为研究提供的次级数据
有出色的专为研究提供的次级数据的公司或网站。

5、统计推算的次级数据
在研究社会经济现象的过程中,遇到既无法收集到 次级资料,也无法通过观察获取原始数据,可能需要 利用现象之间的各种关系进行统计推算来获得数据。
55

End of Chapter 2

56


相关推荐

最新更新

猜你喜欢