V.G. 季米里亚索夫喀山创新大学(IEUP),私立高等教育机构
概率论与数理统计
实验室工作坊
目录
导言 ... 3 方法和实例解析 ... 5 自我解决任务。... 14 个人作业 ... 14 实验室工作 2 相关性和回归分析16 方法和实例解析 ... 16 自我解决任务。... 28 个人作业 ... 28
引言
本实验手册是为 38.03.01 "经济学 "方向的学生在学习 "概率论与数理统计 "学科时开设实验课和组织独立作业而设计的。本手册是根据 "概率论与数理统计 "学科的工作计划,按照联邦高等教育国家教育标准的要求编写的。
掌握 "概率论与数理统计 "这门学科的目的是形成概率论与数理统计领域的知识、技能和 能力体系,这是解决经济和数学问题所必需的。掌握这门学科的主要目标是:
形成概率论和数理统计的概念装置;
掌握借助概率论和数理统计要素解决经济和数学问题的方法;
形成解决问题和解释所获结果的技能。
实验讲习班包含 2 个关于 "概率论与数理统计 "学科的实验作业,并附有详细的实施过程说明和独立完成的任务。实验课在计算机上使用 MS Excel 进行。建议以 2-3 人为一组,在一台计算机上分析典型任务。然后,每个学生独立完成任务。工作的变量由学分簿的最后一位数字决定。根据完成任务的结果撰写实验室工作报告。报告内容包括独立完成实验任务的情况。报告提交给教师并附有简短的答辩。
上交实验室工作报告后,学生将被退回继续学习,为临时认证做准备,并有机会在临时认证中展示对相关能力要素的掌握情况。
实验课期间必须严格遵守以下安全规则。
一般安全要求:
所有在室内工作的学生都必须遵守这一规定。
小心对待计算机设备。
不慌不忙地进出办公室,不要接触办公桌和设备。
未经教师许可,不得移动设备。
计算机实验室中的伤害危险:
设备接通电源时。
电磁辐射
开课前的安全要求:
按照老师的指示进入教室,遵守课堂秩序和纪律。
除非得到老师的指示,否则不要打开设备。
上课期间的安全要求:
在电脑上工作时,要保持正确的姿势:坐姿要端正,不要懒散,将肩胛骨靠在椅背上,头部略微前倾;前臂应放在桌面上;视线应与屏幕中心保持一致。
保持眼睛与屏幕的距离(50-70 厘米)。
每对着显示器工作 30 分钟,就做一次眼保健操。
请勿触摸连接电缆的接头。
请勿触摸电源线和接地装置。
请勿触摸屏幕或显示器背面。
请勿将书籍、光盘或笔记本放在显示器或键盘上。
不要在湿衣服或湿手的情况下工作。
不得从事教师未指定的工作。
向老师报告工作中发现的任何不足。
紧急情况下的安全要求:
如果有烧焦的气味,应立即停止工作并通知老师。
不要试图自己纠正错误,应向老师报告。
实验室工作 1
抽样及其特点
方法和实例分析
示例 1
以下是各服务中心智能手机屏幕维修价格的样本:
255
,
360
,
965
,
125
,
450
,
630
,
450
,
650
,
250
,
630
,
400
,
500
,
320
,
999
,
550
,
630
,
499
255
,
360
,
965
,
125
,
450
,
630
,
450
,
650
,
250
,
630
,
400
,
500
,
320
,
999
,
550
,
630
,
499
255,360,965,125,450,630,450,650,250,630,400,500,320,999,550,630,499 255,360,965,125,450,630,450,650,250,630,400,500,320,999,550,630,499 。使用 MS Excel 工具和工具查找:
样本量;
样本量;
算术平均数;
时尚
中位数;
方差和均方差(标准差)。
决定
让我们把这个样本输入 MS Excel 电子表格。
统计样本是从要研究的全部对象(总体)中选出的特定数量的对象。
样本量是指样本中的项目数。 要确定样本的体积,我们需要先确定样本元素的个数。为此,请在为该值分配的单元格中输入符号"=",并从提供的函数列表中选择 ACCOUNT 函数。
然后用选择项选择单元格:
并按回车键。该样本中的元素数为 17,这就是样本数。
1
2
变体系列
2
5
5
2
5
5
255 \mathbf{2 5 5}
3
6
0
3
6
0
360 \mathbf{3 6 0}
3
4
样本量
=
=
= =
17
1
2 Вариационный ряд 255 360
3
4 Объем выборки = 17 | 1 | | | |
| :--- | :--- | ---: | ---: |
| 2 | Вариационный ряд | $\mathbf{2 5 5}$ | $\mathbf{3 6 0}$ |
| 3 | | | |
| 4 | Объем выборки $=$ | 17 | |
样本容量是样本元素的最大值和最小值之差。因此,为了确定抽样范围,必须找出样本元素的最大值和最小值。在为最大值预留的单元格中输入符号"=",然后从建议的函数列表中选择 MAX 函数。
然后用选择项选择单元格:
并按回车键。该样本的最大值为 999。
1 | 1 | | | |
| :--- | :--- | ---: | ---: |
在为最小值预留的单元格中输入符号"=",并从提供的函数列表中选择 MIN 函数。
然后用选择项选择单元格:
4
A
B
C
D
E
F
G
H
I
J
K
L
M
N
0
P
Q
R
1
2
变体系列
255
360
965
125
450
630
450
650
250
630
400
500
320
999
550
630
4991
3
4
样本量
=
=
= =
17
5
最大值 =
999
6
最小值 =
=MIN
2:R2
7
取样范围
=
=
= =
MIN
编号
[数
2]; ...
联合算术 =
4 A B C D E F G H I J K L M N 0 P Q R
1
2 Вариационный ряд 255 360 965 125 450 630 450 650 250 630 400 500 320 999 550 630 4991
3
4 Объем выборки = 17
5 Максимальное значение = 999
6 Минимальное значение = =МИН 2:R2
7 Размах выборки = МИН число [чис 2]; ...
Соеднее арифметическое = | 4 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | 0 | P | Q | R |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| 1 | | | | | | | | | | | | | | | | | | |
| 2 | Вариационный ряд | 255 | 360 | 965 | 125 | 450 | 630 | 450 | 650 | 250 | 630 | 400 | 500 | 320 | 999 | 550 | 630 | 4991 |
| 3 | | | | | | | | | | | | | | | | | | |
| 4 | Объем выборки $=$ | 17 | | | | | | | | | | | | | | | | |
| 5 | Максимальное значение = | 999 | | | | | | | | | | | | | | | | |
| 6 | Минимальное значение = | =МИН | 2:R2 | | | | | | | | | | | | | | | |
| 7 | Размах выборки $=$ | МИН | число | [чис | 2]; ... | | | | | | | | | | | | | |
| | Соеднее арифметическое = | | | | | | | | | | | | | | | | | |
然后按 Enter 键。该样本的最小值为 125 。
2
变体系列
255
360
96
3
4
样本量
=
=
= =
17
5
最大值
=
=
= =
999
6
最小值
=
=
= =
125
-
2 Вариационный ряд 255 360 96
3
4 Объем выборки = 17
5 Максимальное значение = 999
6 Минимальное значение = 125
- | 2 | Вариационный ряд | 255 | 360 | 96 |
| :--- | :--- | ---: | ---: | ---: |
| 3 | | | | |
| 4 | Объем выборки $=$ | 17 | | |
| 5 | Максимальное значение $=$ | 999 | | |
| 6 | Минимальное значение $=$ | 125 | | |
| | - | | | |
要确定范围,请用最大值减去最小值。在为跨度分配的单元格中输入"=",选择具有最大值的单元格,输入"-",选择具有最小值的单元格,然后按 Enter 键。
4
A
B
C
1
2
变体系列
255
36
3
4
样本量 =
17
5
最大值 =
999
6
最小值 =
125
7
取样范围 =
=B5-B6
4 A B C
1
2 Вариационный ряд 255 36
3
4 Объем выборки = 17
5 Максимальное значение = 999
6 Минимальное значение = 125
7 Размах выборки = =B5-B6 | 4 | A | B | C |
| :---: | :---: | :---: | :---: |
| 1 | | | |
| 2 | Вариационный ряд | 255 | 36 |
| 3 | | | |
| 4 | Объем выборки = | 17 | |
| 5 | Максимальное значение = | 999 | |
| 6 | Минимальное значение = | 125 | |
| 7 | Размах выборки = | =B5-B6 | |
该样本的传播范围为 874。
变体系列
255
样本量
=
=
= =
17
最大值
=
=
= =
999
最小值
=
=
= =
125
取样范围
=
=
= =
874
P
Вариационный ряд 255
Объем выборки = 17
Максимальное значение = 999
Минимальное значение = 125
Размах выборки = 874
P | Вариационный ряд | 255 |
| :--- | ---: |
| | |
| Объем выборки $=$ | 17 |
| Максимальное значение $=$ | 999 |
| Минимальное значение $=$ | 125 |
| Размах выборки $=$ | 874 |
| P | |
样本的算术平均数是这些数字之和除以其数量(样本量)的商。MS Excel 中有一个特殊函数 SRZNACH 可用于确定算术平均数,请从建议的函数列表中选择该函数、
选择样本值范围
并按回车键。该样本的平均值为 509.6。
变体系列
255
3
6
0
3
6
0
360 \mathbf{3 6 0}
样本量
=
=
= =
17
最大值
=
=
= =
999
最小值
=
=
= =
125
取样范围
=
=
= =
874
算术平均数
=
=
= =
509,6
Вариационный ряд 255 360
Объем выборки = 17
Максимальное значение = 999
Минимальное значение = 125
Размах выборки = 874
Среднее арифметическое = 509,6
| Вариационный ряд | 255 | $\mathbf{3 6 0}$ |
| :--- | ---: | ---: |
| | | |
| Объем выборки $=$ | 17 | |
| Максимальное значение $=$ | 999 | |
| Минимальное значение $=$ | 125 | |
| Размах выборки $=$ | 874 | |
| Среднее арифметическое $=$ | 509,6 | |
| | | |
一个数列的模式是这个数列中出现频率最高的数字。要确定该样本的模式,请从建议的函数列表中选择 MODA 函数。
然后必须用选择项选择单元格:
4
A
B
C
D
E
F
G
H
I
J
K
L
M
N
0
P
Q
R
1
2
变体系列
- 255
360
965
125
450
630
450
650
250
630
400
500
320
999
550
630
4991
3
4
样本量 =
17
5
最大值 =
999
6
最小值 =
125
7
取样范围 =
874
8
算术平均数 =
509,6
9
时尚 =.
= 模式
(B2: H
10
中位数 =
MOD
码
1; [chi
-2];
4
4 A B C D E F G H I J K L M N 0 P Q R
1
2 Вариационный ряд - 255 360 965 125 450 630 450 650 250 630 400 500 320 999 550 630 4991
3
4 Объем выборки = 17
5 Максимальное значение = 999
6 Минимальное значение = 125
7 Размах выборки = 874
8 Среднее арифметическое = 509,6
9 Мода = =МОД (B2: H
10 Медиана = МОД (числ 1; [чи -2];
4 | 4 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | 0 | P | Q | R |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| 1 | | | | | | | | | | | | | | | | | | |
| 2 | Вариационный ряд | - 255 | 360 | 965 | 125 | 450 | 630 | 450 | 650 | 250 | 630 | 400 | 500 | 320 | 999 | 550 | 630 | 4991 |
| 3 | | | | | | | | | | | | | | | | | | |
| 4 | Объем выборки = | 17 | | | | | | | | | | | | | | | | |
| 5 | Максимальное значение = | 999 | | | | | | | | | | | | | | | | |
| 6 | Минимальное значение = | 125 | | | | | | | | | | | | | | | | |
| 7 | Размах выборки = | 874 | | | | | | | | | | | | | | | | |
| 8 | Среднее арифметическое = | 509,6 | | | | | | | | | | | | | | | | |
| 9 | Мода = | =МОД | (B2: H | | | | | | | | | | | | | | | |
| 10 | Медиана = | МОД | (числ | 1; [чи | -2]; | | | | | | | | | | | | | |
| 4 | | | | | | | | | | | | | | | | | | |
并按回车键。该样本的模式为 630。
变体系列
255
3
6
0
3
6
0
360 \mathbf{3 6 0}
9।
样本量
=
=
= =
17
最大值
=
=
= =
999
最小值
=
=
= =
125
取样范围
=
=
= =
874
算术平均数
=
=
= =
509,6
时尚
=
=
= =
630
中位数
=
=
= =
Вариационный ряд 255 360 9।
Объем выборки = 17
Максимальное значение = 999
Минимальное значение = 125
Размах выборки = 874
Среднее арифметическое = 509,6
Мода = 630
Медиана = | | | | |
| :--- | ---: | ---: | ---: |
| Вариационный ряд | 255 | $\mathbf{3 6 0}$ | 9। |
| | | | |
| Объем выборки $=$ | 17 | | |
| Максимальное значение $=$ | 999 | | |
| Минимальное значение $=$ | 125 | | |
| Размах выборки $=$ | 874 | | |
| Среднее арифметическое $=$ | 509,6 | | |
| Мода $=$ | 630 | | |
| Медиана $=$ | | | |
事实上,数值 630 比本系列中任何其他数值都更为常见。 当项目不重复时,样本中可能没有模式。在这种情况下,相应单元格中将显示数值 N/A(无数据):
反之,如果采样中有多个元素的重复率相同(不止一个),则可能存在不止一个模态。在这种情况下,建议使用函数 MODA.NSC,它返回一个模态值数组。为了清楚起见,我们将样本的最后一个元素改为 450。
4
A
B
C
D
E
F
G
H
I
J
K
L
M
N
0
P
Q
R
1
2
变体系列
255
360
965
125
450
630
450
650
250
630
400
500
320
999
550
630
450
3
4 A B C D E F G H I J K L M N 0 P Q R
1
2 Вариационный ряд 255 360 965 125 450 630 450 650 250 630 400 500 320 999 550 630 450
3 | 4 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | 0 | P | Q | R |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| 1 | | | | | | | | | | | | | | | | | | |
| 2 | Вариационный ряд | 255 | 360 | 965 | 125 | 450 | 630 | 450 | 650 | 250 | 630 | 400 | 500 | 320 | 999 | 550 | 630 | 450 |
| 3 | | | | | | | | | | | | | | | | | | |
MODA.NSC 功能适用于垂直数据范围,而对于水平数据范围,则需要使用 TRANSP 转置功能。
这将导致模式值只出现在一个单元格中:
变体系列
255
样本量
=
=
= =
17
最大值
=
=
= =
999
最小值
=
=
= =
125
取样范围
=
=
= =
874
算术平均数
=
=
= =
506,7
时尚
=
=
= =
450
Вариационный ряд 255
Объем выборки = 17
Максимальное значение = 999
Минимальное значение = 125
Размах выборки = 874
Среднее арифметическое = 506,7
Мода = 450 | | |
| :--- | ---: |
| Вариационный ряд | 255 |
| | |
| Объем выборки $=$ | 17 |
| Максимальное значение $=$ | 999 |
| Минимальное значение $=$ | 125 |
| Размах выборки $=$ | 874 |
| Среднее арифметическое $=$ | 506,7 |
| Мода $=$ | 450 |
要获得一个数组,应选择一个单元格区域,将自动填充光标从获得的模式值连续拖动到指定数据数组的大小,按 F2 键,然后同时按 Ctrl+Shift+Enter 三个键。这样,我们将得到一个数组,其中用数字填充的单元格数量将与时尚值的数量一致。
我们发现该样本有两种模式:450 和 630。事实上,将样本的最后一个值从 499 改为 450 后,项目 630 和 450 开始以同样的频率重复出现:各重复 3 次。因此,该样本有两种模式。 5.奇数有序数列的中位数是最后写在中间的那个数。偶数成员的有序数列的中位数是写在中间的两个数的算术平均数。要确定一个数列(样本)的中位数,MS Excel 有 MEDIAN 函数。
之前我们已经返回了 450 至 499 之间最后一个采样元素的值。在建议的函数列表中选择 MEDIANA 函数,选择采样元素的范围、
4
A
B
C
D
E
F
G
H
I
J
K
L
M
N
0
P
Q
R
1
2
变体系列
- 255
360
965
125
450
630
450
650
250
630
400
500
320
999
550
630
4991
3
4
样本量 =
17
5
最大值 =
999
6
最小值 =
125
7
取样范围
=
=
= =
874
8
算术平均数 =
509,6
9
时尚 =.
630
10
中位数 =
=MEDI
AHA(
:R2|
11
MEAD
AHA(
Slo1;
编号
4 A B C D E F G H I J K L M N 0 P Q R
1
2 Вариационный ряд - 255 360 965 125 450 630 450 650 250 630 400 500 320 999 550 630 4991
3
4 Объем выборки = 17
5 Максимальное значение = 999
6 Минимальное значение = 125
7 Размах выборки = 874
8 Среднее арифметическое = 509,6
9 Мода = 630
10 Медиана = =МЕДИ AHA( :R2|
11 МЕД AHA( сло1; число | 4 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | 0 | P | Q | R |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| 1 | | | | | | | | | | | | | | | | | | |
| 2 | Вариационный ряд | - 255 | 360 | 965 | 125 | 450 | 630 | 450 | 650 | 250 | 630 | 400 | 500 | 320 | 999 | 550 | 630 | 4991 |
| 3 | | | | | | | | | | | | | | | | | | |
| 4 | Объем выборки = | 17 | | | | | | | | | | | | | | | | |
| 5 | Максимальное значение = | 999 | | | | | | | | | | | | | | | | |
| 6 | Минимальное значение = | 125 | | | | | | | | | | | | | | | | |
| 7 | Размах выборки $=$ | 874 | | | | | | | | | | | | | | | | |
| 8 | Среднее арифметическое = | 509,6 | | | | | | | | | | | | | | | | |
| 9 | Мода = | 630 | | | | | | | | | | | | | | | | |
| 10 | Медиана = | =МЕДИ | AHA( | :R2\| | | | | | | | | | | | | | | |
| 11 | | МЕД | AHA( | сло1; | число | | | | | | | | | | | | | |
按回车键。该样本的中位数为 499。
变体系列
255
360
样本量
=
=
= =
17
最大值
=
=
= =
999
最小值
=
=
= =
125
取样范围
=
=
= =
874
算术平均数
=
=
= =
时尚
=
=
= =
509,6
中位数
=
=
= =
630
499
Вариационный ряд 255
360
Объем выборки = 17
Максимальное значение = 999
Минимальное значение = 125
Размах выборки = 874
Среднее арифметическое =
Мода = 509,6
Медиана = 630
499 | | |
| :--- | ---: |
| | |
| Вариационный ряд | 255 |
| | 360 |
| Объем выборки $=$ | 17 |
| Максимальное значение $=$ | 999 |
| Минимальное значение $=$ | 125 |
| Размах выборки $=$ | 874 |
| Среднее арифметическое $=$ | |
| Мода $=$ | 509,6 |
| Медиана $=$ | 630 |
| | 499 |
样本方差是一组数据(样本项目)的分布或离散程度的度量。其计算公式如下
与平均值的偏差除以比样本项目数少一个的数:
∑
(
x
−
x
¯
)
2
(
n
−
1
)
.
∑
(
x
−
x
¯
)
2
(
n
−
1
)
.
(sum(x-( bar(x)))^(2))/((n-1)). \frac{\sum(x-\bar{x})^{2}}{(n-1)} .
要确定 MS Excel 中的方差,有一个函数 DISP.B、
选择取样元素的范围,然后按 Enter 键。
该样本的方差值为 54344.63。
变体系列
255
样本量
=
=
= =
17
最大值
=
=
= =
999
最小值
=
=
= =
125
取样范围
=
=
= =
874
算术平均数
=
=
= =
509,6
时尚
=
=
= =
630
中位数
=
=
= =
499
分散
=
=
= =
54344,63
Вариационный ряд 255
Объем выборки = 17
Максимальное значение = 999
Минимальное значение = 125
Размах выборки = 874
Среднее арифметическое = 509,6
Мода = 630
Медиана = 499
Дисперсия = 54344,63 | Вариационный ряд | 255 |
| :--- | ---: |
| | |
| Объем выборки $=$ | 17 |
| Максимальное значение $=$ | 999 |
| Минимальное значение $=$ | 125 |
| Размах выборки $=$ | 874 |
| Среднее арифметическое $=$ | 509,6 |
| Мода $=$ | 630 |
| Медиана $=$ | 499 |
| Дисперсия $=$ | 54344,63 |
与样本离散度不同的是,离散度的平方和除以数值序列的元素总数(即总体的数量):
∑
(
x
−
x
¯
)
2
n
∑
(
x
−
x
¯
)
2
n
(sum(x-( bar(x)))^(2))/(n) \frac{\sum(x-\bar{x})^{2}}{n}
方差本身不如方差根对数据分析更有参考价值,因为方差根是由项目值偏离均值的平方得出的。方差根称为均方差(或标准差),它提供了数据相对于均值的变化的真实测量。要确定均方偏差,只需计算方差根即可。为此,请在建议的函数列表中选择根函数、
我们选择离散值作为函数参数。
4
A
B
C
1
2
变体系列
255
360
3
4
样本量 =
17
5
最大值 =
999
6
最小值 =
125
7
取样范围 =
874
8
算术平均数 =
509,6
9
时尚 =.
630
10
中位数 =
499
11
分散 =
[54344,63]
12
平均二次偏差
=
=
= =
=KOPEH
13
KOPEHb
islo)
4 A B C
1
2 Вариационный ряд 255 360
3
4 Объем выборки = 17
5 Максимальное значение = 999
6 Минимальное значение = 125
7 Размах выборки = 874
8 Среднее арифметическое = 509,6
9 Мода = 630
10 Медиана = 499
11 Дисперсия = [54344,63]
12 Среднее квадр.отклонение = =KOPEH
13 KOPEHb исло) | 4 | A | B | C |
| :---: | :---: | :---: | :---: |
| 1 | | | |
| 2 | Вариационный ряд | 255 | 360 |
| 3 | | | |
| 4 | Объем выборки = | 17 | |
| 5 | Максимальное значение = | 999 | |
| 6 | Минимальное значение = | 125 | |
| 7 | Размах выборки = | 874 | |
| 8 | Среднее арифметическое = | 509,6 | |
| 9 | Мода = | 630 | |
| 10 | Медиана = | 499 | |
| 11 | Дисперсия = | [54344,63] | |
| 12 | Среднее квадр.отклонение $=$ | =KOPEH | |
| 13 | | KOPEHb | исло) |
然后按回车键。平均平方差为 233.1。
L...mp....
分散
=
=
= =
54344,6
?
平均二次偏差
=
=
= =
233,1
L...мп.... Дисперсия = 54344,6
? Среднее квадр.отклонение = 233,1 | L...мп.... | Дисперсия $=$ | 54344,6 |
| :--- | :--- | ---: |
| ? | Среднее квадр.отклонение $=$ | 233,1 |
您也可以使用该函数来确定样本的标准差 STANDOTKLON.B,以及总体的标准差 STANDOTKLON.D。
解题练习
任务 1.给出不同保险公司的保险索赔样本:
88
90
51
85
58
105
77
89
100
109
77
83
92
77
44
81
50
77
80
47
88 90 51 85 58 105 77 89 100 109
77 83 92 77 44 81 50 77 80 47 | 88 | 90 | 51 | 85 | 58 | 105 | 77 | 89 | 100 | 109 |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| 77 | 83 | 92 | 77 | 44 | 81 | 50 | 77 | 80 | 47 |
借助 MS Excel 工具和手段进行查找:
样本量;
样本量;
算术平均数;
时尚
中位数;
方差和均方差(标准差)。
个人任务
任务 1
使用 MS Excel 工具和手段进行查找(表 1):
样本量;
样本量;
算术平均数;
时尚
中位数;
方差和均方差(标准差)。
表 1
变量编号
取样
0
107
78
101
89
150
69
35
47
38
122
97
52
69
94
92
146
74
140
1
14
14
25
20
9
23
14
17
10
9
19
20
5
16
7
7
14
18
19
-9
-20
-9
-10
-1
10
1
9
-14
20
-2
25
-7
3
19
13
21
Номер варианта Выборка
0 107 78 101 89 150 69 35 47 38
122 97 52 69 94 92 146 74 140
1 14 14 25 20 9 23 14 17 10
9 19 20 5 16 7 7 14 18
19 -9 -20 -9 -10 -1 10 1 9
-14 20 -2 25 -7 3 19 13 21 | Номер варианта | Выборка | | | | | | | | | |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| 0 | 107 | 78 | 101 | 89 | 150 | 69 | 35 | 47 | 38 | |
| | 122 | 97 | 52 | 69 | 94 | 92 | 146 | 74 | 140 | |
| 1 | 14 | 14 | 25 | 20 | 9 | 23 | 14 | 17 | 10 | |
| | 9 | 19 | 20 | 5 | 16 | 7 | 7 | 14 | 18 | |
| | 19 | -9 | -20 | -9 | -10 | -1 | 10 | 1 | 9 | |
| | -14 | 20 | -2 | 25 | -7 | 3 | 19 | 13 | 21 | |
3
11
4
-1
18
47
13
40
47
33
4
16
27
5
6
-3
24
32
28
4
15
19
10
14
10
20
19
20
11
11
15
12
14
12
10
16
19
11
5
8
12
10
13
11
10
12
9
3
1
10
15
6
13
1
1
8
11
6
153
66
30
175
133
120
116
197
173
182
113
147
172
131
134
76
117
34
7
36
71
55
60
75
40
71
61
46
42
73
12
67
69
43
23
16
28
8
10
26
5
5
27
23
33
14
28
-10
30
-10
5
-4
12
28
47
32
9
-2
-9
-4
-3
-2
3
0
0
-10
-10
-3
-9
-2
-8
-4
5
5
1
3 11 4 -1 18 47 13 40 47 33
4 16 27 5 6 -3 24 32 28
4 15 19 10 14 10 20 19 20 11
11 15 12 14 12 10 16 19 11
5 8 12 10 13 11 10 12 9 3
1 10 15 6 13 1 1 8 11
6 153 66 30 175 133 120 116 197 173
182 113 147 172 131 134 76 117 34
7 36 71 55 60 75 40 71 61 46
42 73 12 67 69 43 23 16 28
8 10 26 5 5 27 23 33 14 28
-10 30 -10 5 -4 12 28 47 32
9 -2 -9 -4 -3 -2 3 0 0 -10
-10 -3 -9 -2 -8 -4 5 5 1 | 3 | 11 | 4 | -1 | 18 | 47 | 13 | 40 | 47 | 33 |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| | 4 | 16 | 27 | 5 | 6 | -3 | 24 | 32 | 28 |
| 4 | 15 | 19 | 10 | 14 | 10 | 20 | 19 | 20 | 11 |
| | 11 | 15 | 12 | 14 | 12 | 10 | 16 | 19 | 11 |
| 5 | 8 | 12 | 10 | 13 | 11 | 10 | 12 | 9 | 3 |
| | 1 | 10 | 15 | 6 | 13 | 1 | 1 | 8 | 11 |
| 6 | 153 | 66 | 30 | 175 | 133 | 120 | 116 | 197 | 173 |
| | 182 | 113 | 147 | 172 | 131 | 134 | 76 | 117 | 34 |
| 7 | 36 | 71 | 55 | 60 | 75 | 40 | 71 | 61 | 46 |
| | 42 | 73 | 12 | 67 | 69 | 43 | 23 | 16 | 28 |
| 8 | 10 | 26 | 5 | 5 | 27 | 23 | 33 | 14 | 28 |
| | -10 | 30 | -10 | 5 | -4 | 12 | 28 | 47 | 32 |
| 9 | -2 | -9 | -4 | -3 | -2 | 3 | 0 | 0 | -10 |
| | -10 | -3 | -9 | -2 | -8 | -4 | 5 | 5 | 1 |
实验室工作 2
相关性和回归分析
方法和实例分析
示例 2
表 2 列出了有关保险公司评级和每月保险支付次数的统计数据。
表 2
№
评级
投保活动
1
3,8
350
2
3,9
400
3
4,1
520
4
5,0
621
5
4,9
600
6
2,8
300
7
3,7
320
8
4,4
400
9
2,9
315
10
3,5
300
11
4,5
515
12
4,8
560
13
3,5
360
14
4,7
600
15
4,6
580
16
3,1
400
17
2,7
320
18
4,0
520
19
2,9
215
№ Рейтинг Страховые случаи
1 3,8 350
2 3,9 400
3 4,1 520
4 5,0 621
5 4,9 600
6 2,8 300
7 3,7 320
8 4,4 400
9 2,9 315
10 3,5 300
11 4,5 515
12 4,8 560
13 3,5 360
14 4,7 600
15 4,6 580
16 3,1 400
17 2,7 320
18 4,0 520
19 2,9 215 | № | Рейтинг | Страховые случаи |
| :---: | :---: | :---: |
| 1 | 3,8 | 350 |
| 2 | 3,9 | 400 |
| 3 | 4,1 | 520 |
| 4 | 5,0 | 621 |
| 5 | 4,9 | 600 |
| 6 | 2,8 | 300 |
| 7 | 3,7 | 320 |
| 8 | 4,4 | 400 |
| 9 | 2,9 | 315 |
| 10 | 3,5 | 300 |
| 11 | 4,5 | 515 |
| 12 | 4,8 | 560 |
| 13 | 3,5 | 360 |
| 14 | 4,7 | 600 |
| 15 | 4,6 | 580 |
| 16 | 3,1 | 400 |
| 17 | 2,7 | 320 |
| 18 | 4,0 | 520 |
| 19 | 2,9 | 215 |
使用 MS Excel 工具和手段:
以确定相关系数;
来确定协方差;
确定线性回归的参数:直线的角度系数和沿 OY 轴的偏移;
在图表上显示点云并绘制线性趋势线;
通过改变趋势线的参数来观察非线性依赖关系下的趋势线;
在图上显示线性回归方程和判定系数。
决定
相关系数(皮尔逊相关系数)衡量两个变量之间线性关系的强度和方向,计算公式为
∑
(
x
−
x
¯
)
(
y
−
y
¯
)
∑
(
x
−
x
¯
)
2
(
y
−
y
¯
)
2
.
∑
(
x
−
x
¯
)
(
y
−
y
¯
)
∑
(
x
−
x
¯
)
2
(
y
−
y
¯
)
2
.
(sum(x-( bar(x)))(y-( bar(y))))/(sqrt(sum(x- bar(x))^(2)(y- bar(y))^(2))). \frac{\sum(x-\bar{x})(y-\bar{y})}{\sqrt{\sum(x-\bar{x})^{2}(y-\bar{y})^{2}}} .
相关系数可估算出观测值与最能描述其线性关系的直线的接近程度。
相关系数的测量范围为-1 至 +1,没有测量单位(无量纲)。相关系数的模数越大,一个参数对另一个参数的依赖性就越强。符号表示一个变量是否随着另一个变量的增大而增大(直接相关,正号),或者一个变量是否随着另一个变量的增大而减小(反向相关,负号)。
相关系数的值显示了各点与直线的接近程度。具体而言,如果相关系数等于 +1 或 -1 ,则直线上的所有点都存在绝对(函数)相关(实际上不太可能);如果相关系数近似等于 0,则不存在线性相关(尽管可能存在非线性关系)。相关性越接近极端点(
±
1
±
1
+-1 \pm 1 ),线性关系的程度就越大。
要在 MS Excel 中确定相关系数,请将原始数据输入相应的单元格区域:
A
В
С
1
N
评级
投保活动
2
1
3,8
350
3
2
3
,
9
3
,
9
3,9 \mathbf{3 , 9}
400
4
3
4,1
520
5
4
5,0
600
6
5
4,9
610
7
6
2,8
250
8
7
3,7
450
9
8
4,4
450
10
9
2,9
280
11
10
3,5
320
12
11
4,5
515
13
12
4,8
560
14
13
3,5
360
15
14
4,7
600
16
15
4,6
580
17
16
3,1
400
18
17
2,7
320
19
18
4,0
520
20
19
2,9
335
21
A В С
1 N Рейтинг Страховые случаи
2 1 3,8 350
3 2 3,9 400
4 3 4,1 520
5 4 5,0 600
6 5 4,9 610
7 6 2,8 250
8 7 3,7 450
9 8 4,4 450
10 9 2,9 280
11 10 3,5 320
12 11 4,5 515
13 12 4,8 560
14 13 3,5 360
15 14 4,7 600
16 15 4,6 580
17 16 3,1 400
18 17 2,7 320
19 18 4,0 520
20 19 2,9 335
21 | | A | В | С |
| :---: | :---: | :---: | :---: |
| 1 | N | Рейтинг | Страховые случаи |
| 2 | 1 | 3,8 | 350 |
| 3 | 2 | $\mathbf{3 , 9}$ | 400 |
| 4 | 3 | 4,1 | 520 |
| 5 | 4 | 5,0 | 600 |
| 6 | 5 | 4,9 | 610 |
| 7 | 6 | 2,8 | 250 |
| 8 | 7 | 3,7 | 450 |
| 9 | 8 | 4,4 | 450 |
| 10 | 9 | 2,9 | 280 |
| 11 | 10 | 3,5 | 320 |
| 12 | 11 | 4,5 | 515 |
| 13 | 12 | 4,8 | 560 |
| 14 | 13 | 3,5 | 360 |
| 15 | 14 | 4,7 | 600 |
| 16 | 15 | 4,6 | 580 |
| 17 | 16 | 3,1 | 400 |
| 18 | 17 | 2,7 | 320 |
| 19 | 18 | 4,0 | 520 |
| 20 | 19 | 2,9 | 335 |
| 21 | | | |
在为相关系数数值预留的单元格中输入符号"=",然后从函数列表中选择 CORREL。
该函数有两个数据数组作为参数。在我们的例子中,第一个数组是公司评级(第二列),第二个数组是保险索赔次数(第三列)。选择 B 列,输入";",选择 C 列,按 Enter 键。
4
A
B
c
D
E
F
6
1
N
评级
保险案例
2
1
3,8
350
相关系数
CORREL(?
20;c
3
2
3,9
400
狸猫换太子
=
=
= =
Korrep̆
nal;
4
3
4,1
520
直线的角度系数
=
=
= =
5
4
5,0
600
脚跟沿轴线移动
6
5
4,9
610
7
6
2,8
250
8
7
3,7
450
9
8
4,4
450
10
9
2,9
280
11
10
3,5
320
12
11
4,5
515
13
12
4,8
560
14
13
3,5
360
15
14
4,7
600
16
15
4,6
580
17
16
3,1
400
18
17
2,7
320
19
18
4,0
520
19
2,9
4 A B c D E F 6
1 N Рейтинг Cтраховые случап
2 1 3,8 350 коэффпциент корреляции КоРРЕЛ( 20;c
3 2 3,9 400 ковархачия = Kорреп̆ nal;
4 3 4,1 520 Угповой коэффициент прямой =
5 4 5,0 600 Сдвиг пямой по оси оү =
6 5 4,9 610
7 6 2,8 250
8 7 3,7 450
9 8 4,4 450
10 9 2,9 280
11 10 3,5 320
12 11 4,5 515
13 12 4,8 560
14 13 3,5 360
15 14 4,7 600
16 15 4,6 580
17 16 3,1 400
18 17 2,7 320
19 18 4,0 520
19 2,9 | 4 | A | B | c | D | E | F | 6 |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| 1 | N | Рейтинг | Cтраховые случап | | | | |
| 2 | 1 | 3,8 | 350 | коэффпциент корреляции | КоРРЕЛ( | 20;c | |
| 3 | 2 | 3,9 | 400 | ковархачия $=$ | Kорреп̆ | nal; | |
| 4 | 3 | 4,1 | 520 | Угповой коэффициент прямой $=$ | | | |
| 5 | 4 | 5,0 | 600 | Сдвиг пямой по оси оү = | | | |
| 6 | 5 | 4,9 | 610 | | | | |
| 7 | 6 | 2,8 | 250 | | | | |
| 8 | 7 | 3,7 | 450 | | | | |
| 9 | 8 | 4,4 | 450 | | | | |
| 10 | 9 | 2,9 | 280 | | | | |
| 11 | 10 | 3,5 | 320 | | | | |
| 12 | 11 | 4,5 | 515 | | | | |
| 13 | 12 | 4,8 | 560 | | | | |
| 14 | 13 | 3,5 | 360 | | | | |
| 15 | 14 | 4,7 | 600 | | | | |
| 16 | 15 | 4,6 | 580 | | | | |
| 17 | 16 | 3,1 | 400 | | | | |
| 18 | 17 | 2,7 | 320 | | | | |
| 19 | 18 | 4,0 | 520 | | | | |
| | 19 | 2,9 | | | | | |
我们得出,这种情况下的相关系数等于 0.92。
相关系数
=
=
= =
0,9200143
协方差
=
=
= = 。
直线的角度系数
=
=
= =
Коэффициент корреляции = 0,9200143
Ковариация =
Угловой коэффициент прямой = | Коэффициент корреляции $=$ | 0,9200143 | |
| ---: | ---: | ---: |
| Ковариация $=$ | | |
| Угловой коэффициент прямой $=$ | | |
相关系数可以用切多克量表来估算(表 3)。
表 3
相关系数
.
绝对值。
.
Коэффициент корреляции по
абсолютной величине | Коэффициент корреляции по |
| :---: |
| абсолютной величине |
口译
达 0.3
孱弱
0
,
3
−
0
,
5
0
,
3
−
0
,
5
0,3-0,5 0,3-0,5
温和派
0
,
5
−
0
,
7
0
,
5
−
0
,
7
0,5-0,7 0,5-0,7
显眼的
0
,
7
−
0
,
9
0
,
7
−
0
,
9
0,7-0,9 0,7-0,9
高
0
,
9
−
1
,
0
0
,
9
−
1
,
0
0,9-1,0 0,9-1,0
非常高
"Коэффициент корреляции по
абсолютной величине" Интерпретация
до 0,3 слабая
0,3-0,5 умеренная
0,5-0,7 заметная
0,7-0,9 высокая
0,9-1,0 весьма высокая | Коэффициент корреляции по <br> абсолютной величине | Интерпретация |
| :---: | :---: |
| до 0,3 | слабая |
| $0,3-0,5$ | умеренная |
| $0,5-0,7$ | заметная |
| $0,7-0,9$ | высокая |
| $0,9-1,0$ | весьма высокая |
得出的相关系数表明,保险公司评级与保险赔付次数之间存在高度相关性。相关系数的正向符号表明了这些参数之间的直接依赖关系。 2.协方差是两个量之间线性关系的度量。协方差的含义与相关系数相同--它显示两个量之间是否存在线性关系。但与相关系数不同的是,协方差从 -1 到 1 不等,它取决于量的测量单位和比例。协方差的符号表示所考虑的数值之间的线性关系类型:如果是正数,则表示这种关系是直接的(随着一个数值的增长,另一个数值也随之增长);如果协方差是负数,则表示这种关系是反向的(随着一个数值的增长,另一个数值也随之下降)。当协方差为
=
0
=
0
=0 =0 时,变量之间没有线性关系。相关性和协方差的主要区别在于 "可扩展性"。协方差是绝对单位,而相关性是相对单位。例如,可以说 "利润为 20000 卢布",也可以说 "利润为
5
%
»
5
%
»
5%» 5 \% » » "。在实践中,在这种特殊情况下使用更方便的方法。样本协方差用公式计算:
1
n
∑
i
=
1
n
(
x
i
−
x
¯
)
(
y
i
−
y
¯
)
1
n
∑
i
=
1
n
x
i
−
x
¯
y
i
−
y
¯
(1)/(n)sum_(i=1)^(n)(x_(i)-( bar(x)))(y_(i)-( bar(y))) \frac{1}{n} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)
如果考虑的是一般人群而不是样本,则使用该公式进行计算:
1
n
−
1
∑
i
=
1
n
(
x
i
−
x
¯
)
(
y
i
−
y
¯
)
.
1
n
−
1
∑
i
=
1
n
x
i
−
x
¯
y
i
−
y
¯
.
(1)/(n-1)sum_(i=1)^(n)(x_(i)-( bar(x)))(y_(i)-( bar(y))). \frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right) .
在 MS Excel 中,在输入协方差数值的单元格中输入符号"=",然后从函数列表中选择 COVARIATION.B(对于一般人群选择 COVARIATION.D)。
该函数有两个数据数组作为参数。在我们的例子中,第一个数组是公司评级(第二列),第二个数组是保险索赔次数(第三列)。选择 B 列,输入";",选择 C 列,按 Enter 键。
4
A
B
C
D
E
F
G
1
N
评级
保险事件
2
1
3,8
350
相关系数 =
0,9200143
3
2
3,9
400
协方差 =.
=COVARIA
(
;C2:C20
4
3
4,1
520
直线的角度系数 =
科沃尔。
P(
矩阵
5
4
5,0
600
OY 轴后移 =
6
5
4,9
610
7
6
2,8
250
8
7
3,7
450
9
8
4,4
450
10
9
2,9
280
11
10
3,5
320
12
11
4,5
515
13
12
4,8
560
14
13
3,5
360
15
14
4,7
600
16
15
4,6
580
17
16
3,1
400
18
17
2,7
320
19
18
4,0
520
20
19
2,9
335
4 A B C D E F G
1 N Рейтинг Страховые случаи|
2 1 3,8 350 Коэффициент корреляции = 0,9200143
3 2 3,9 400 Ковариация = =КОВАРИА ( ;C2:C20
4 3 4,1 520 Угловой коэффициент прямой = КОВАРИАL P( массив
5 4 5,0 600 Сдвиг пямой по оси OY =
6 5 4,9 610
7 6 2,8 250
8 7 3,7 450
9 8 4,4 450
10 9 2,9 280
11 10 3,5 320
12 11 4,5 515
13 12 4,8 560
14 13 3,5 360
15 14 4,7 600
16 15 4,6 580
17 16 3,1 400
18 17 2,7 320
19 18 4,0 520
20 19 2,9 335 | 4 | A | B | C | D | E | F | G |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| 1 | N | Рейтинг | Страховые случаи\| | | | | |
| 2 | 1 | 3,8 | 350 | Коэффициент корреляции = | 0,9200143 | | |
| 3 | 2 | 3,9 | 400 | Ковариация = | =КОВАРИА | ( | ;C2:C20 |
| 4 | 3 | 4,1 | 520 | Угловой коэффициент прямой = | КОВАРИАL | P( | массив |
| 5 | 4 | 5,0 | 600 | Сдвиг пямой по оси OY = | | | |
| 6 | 5 | 4,9 | 610 | | | | |
| 7 | 6 | 2,8 | 250 | | | | |
| 8 | 7 | 3,7 | 450 | | | | |
| 9 | 8 | 4,4 | 450 | | | | |
| 10 | 9 | 2,9 | 280 | | | | |
| 11 | 10 | 3,5 | 320 | | | | |
| 12 | 11 | 4,5 | 515 | | | | |
| 13 | 12 | 4,8 | 560 | | | | |
| 14 | 13 | 3,5 | 360 | | | | |
| 15 | 14 | 4,7 | 600 | | | | |
| 16 | 15 | 4,6 | 580 | | | | |
| 17 | 16 | 3,1 | 400 | | | | |
| 18 | 17 | 2,7 | 320 | | | | |
| 19 | 18 | 4,0 | 520 | | | | |
| 20 | 19 | 2,9 | 335 | | | | |
协方差为 83.17。
相关系数
=
=
= =
0,9200143
协方差
=
=
= = 。
83,167398
直线的角度系数
=
=
= =
OY 轴的脚跟移动
=
=
= =
Коэффициент корреляции = 0,9200143
Ковариация = 83,167398
Угловой коэффициент прямой =
Сдвиг пямой по оси ОY = | Коэффициент корреляции $=$ | 0,9200143 |
| ---: | ---: |
| Ковариация $=$ | 83,167398 |
| Угловой коэффициент прямой $=$ | |
| Сдвиг пямой по оси ОY $=$ | |
确定线性回归参数:直线的角度系数和沿 OY 轴的偏移。
线性回归图形的角度系数使用 NACLON 函数确定。在为角度系数数值预留的单元格中输入符号"=",然后在函数列表中选择 NACLON。
4
A
B
C
1
N
评级
投保活动
2
1
3,8
350
3
2
3,9
400
4
3
4,1
520
5
4
5,0
600
6
5
4,9
610
7
6
2,8
250
8
7
3,7
450
9
8
4,4
450
10
9
2,9
280
11
10
3,5
320
12
11
4,5
515
13
12
4,8
560
14
13
3,5
360
15
14
4,7
600
16
15
4,6
580
17
16
3,1
400
18
17
2,7
320
19
18
4,0
520
20
19
2,9
335
21
22
23
4 A B C
1 N Рейтинг Страховые случаи
2 1 3,8 350
3 2 3,9 400
4 3 4,1 520
5 4 5,0 600
6 5 4,9 610
7 6 2,8 250
8 7 3,7 450
9 8 4,4 450
10 9 2,9 280
11 10 3,5 320
12 11 4,5 515
13 12 4,8 560
14 13 3,5 360
15 14 4,7 600
16 15 4,6 580
17 16 3,1 400
18 17 2,7 320
19 18 4,0 520
20 19 2,9 335
21
22
23 | 4 | A | B | C |
| :---: | :---: | :---: | :---: |
| 1 | N | Рейтинг | Страховые случаи |
| 2 | 1 | 3,8 | 350 |
| 3 | 2 | 3,9 | 400 |
| 4 | 3 | 4,1 | 520 |
| 5 | 4 | 5,0 | 600 |
| 6 | 5 | 4,9 | 610 |
| 7 | 6 | 2,8 | 250 |
| 8 | 7 | 3,7 | 450 |
| 9 | 8 | 4,4 | 450 |
| 10 | 9 | 2,9 | 280 |
| 11 | 10 | 3,5 | 320 |
| 12 | 11 | 4,5 | 515 |
| 13 | 12 | 4,8 | 560 |
| 14 | 13 | 3,5 | 360 |
| 15 | 14 | 4,7 | 600 |
| 16 | 15 | 4,6 | 580 |
| 17 | 16 | 3,1 | 400 |
| 18 | 17 | 2,7 | 320 |
| 19 | 18 | 4,0 | 520 |
| 20 | 19 | 2,9 | 335 |
| 21 | | | |
| 22 | | | |
| 23 | | | |
此函数的参数是两个数据数组,但对于此函数,首先输入 OY 轴上的递延值数组,然后输入 OX 轴上的递延数据数组。在我们的例子中,第一个数组是保险索赔数量(第三列),第二个数组是公司评级(第二列)。选择 C 列,输入";",选择 B 列,按回车键。
回归方程直线的角度系数为 142.35 。
相关系数
=
=
= =
0,9200143
协方差
=
=
= = 。
83,167398
直线的角度系数
=
=
= =
142,34792
沿
OY
=
OY
=
OY= \mathrm{OY}= 轴移动直线
Коэффициент корреляции = 0,9200143
Ковариация = 83,167398
Угловой коэффициент прямой = 142,34792
Сдвиг прямой по оси OY= | Коэффициент корреляции $=$ | 0,9200143 |
| ---: | ---: |
| Ковариация $=$ | 83,167398 |
| Угловой коэффициент прямой $=$ | 142,34792 |
| Сдвиг прямой по оси $\mathrm{OY}=$ | |
沿 OY 轴回归线的移动系数也是通过同样方法确定的。为此,请在为偏移系数数值分配的单元格中输入符号"=",并在函数列表中选择 SHIFT。
该函数的参数是两个数据数组:对于该函数,首先输入在 OY 轴上递延的数值数组,然后输入在 OX 轴上递延的数据数组。在我们的例子中,第一个数组是投保事件数(第三列),第二个数组是投保事件数(第二列)。
array - 公司评级(第二栏)。选择 C 栏,输入";",选择 B 栏并按 Enter 键。
4
A
B
C
D
E
F
1
N
评级
投保活动
2
1
3,8
350
相关系数 =
0,9200143
3
2
3,9
400
协方差 =.
83,167398
4
3
4,1
520
直线的角度系数
=
=
= =
142,34792
5
4
5,0
600
沿 OY 轴的直线移动 =
=OTPE3OK(C2
,
6
5
4,9
610
7
6
2,8
250
8
7
3,7
450
9
8
4,4
450
10
9
2,9
280
11
10
3,5
320
12
11
4,5
515
13
12
4,8
560
14
13
3,5
360
15
14
4,7
600
16
15
4,6
580
17
16
3,1
400
18
17
2,7
320
19
18
4,0
520
20
19
2,9
335
4 A B C D E F
1 N Рейтинг Страховые случаи
2 1 3,8 350 Коэффициент корреляции = 0,9200143
3 2 3,9 400 Ковариация = 83,167398
4 3 4,1 520 Угловой коэффициент прямой = 142,34792
5 4 5,0 600 Сдвиг прямой по оси OY = =OTPE3OK(C2 ,
6 5 4,9 610
7 6 2,8 250
8 7 3,7 450
9 8 4,4 450
10 9 2,9 280
11 10 3,5 320
12 11 4,5 515
13 12 4,8 560
14 13 3,5 360
15 14 4,7 600
16 15 4,6 580
17 16 3,1 400
18 17 2,7 320
19 18 4,0 520
20 19 2,9 335 | 4 | A | B | C | D | E | F | |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| 1 | N | Рейтинг | Страховые случаи | | | | |
| 2 | 1 | 3,8 | 350 | Коэффициент корреляции = | 0,9200143 | | |
| 3 | 2 | 3,9 | 400 | Ковариация = | 83,167398 | | |
| 4 | 3 | 4,1 | 520 | Угловой коэффициент прямой $=$ | 142,34792 | | |
| 5 | 4 | 5,0 | 600 | Сдвиг прямой по оси OY = | =OTPE3OK(C2 | , | |
| 6 | 5 | 4,9 | 610 | | | | |
| 7 | 6 | 2,8 | 250 | | | | |
| 8 | 7 | 3,7 | 450 | | | | |
| 9 | 8 | 4,4 | 450 | | | | |
| 10 | 9 | 2,9 | 280 | | | | |
| 11 | 10 | 3,5 | 320 | | | | |
| 12 | 11 | 4,5 | 515 | | | | |
| 13 | 12 | 4,8 | 560 | | | | |
| 14 | 13 | 3,5 | 360 | | | | |
| 15 | 14 | 4,7 | 600 | | | | |
| 16 | 15 | 4,6 | 580 | | | | |
| 17 | 16 | 3,1 | 400 | | | | |
| 18 | 17 | 2,7 | 320 | | | | |
| 19 | 18 | 4,0 | 520 | | | | |
| 20 | 19 | 2,9 | 335 | | | | |
线性回归方程沿 OY 轴的线性移动等于-109.0。
相关系数
=
=
= =
0,9200143
协方差
=
=
= = 。
83,167398
直线的角度系数
=
=
= =
142,34792
沿
OY
=
OY
=
OY= \mathrm{OY}= 轴移动直线
−
109
,
0022
−
109
,
0022
-109,0022 -109,0022
Коэффициент корреляции = 0,9200143
Ковариация = 83,167398
Угловой коэффициент прямой = 142,34792
Сдвиг прямой по оси OY= -109,0022 | Коэффициент корреляции $=$ | 0,9200143 |
| ---: | ---: |
| Ковариация $=$ | 83,167398 |
| Угловой коэффициент прямой $=$ | 142,34792 |
| Сдвиг прямой по оси $\mathrm{OY}=$ | $-109,0022$ |
在图表上显示点云并绘制趋势线。
在图表中,我们将把保险公司评级值放在 OX 轴上,把保险支付次数放在 OY 轴上。要在图表上显示点云,我们需要 a) 用鼠标选择两列中的数据范围;
4
A
В
С
1
N
评级
投保活动
2
1
3,8
350
3
2
3,9
400
4
3
4,1
520
5
4
5,0
600
6
5
4,9
610
7
6
2,8
250
8
7
3,7
450
9
8
4,4
450
10
9
2,9
280
11
10
3,5
320
12
11
4,5
515
13
12
4,8
560
14
13
3,5
360
15
14
4,7
600
16
15
4,6
580
17
16
3,1
400
18
17
2,7
320
19
18
4,0
520
20
19
2,9
335
2
4 A В С
1 N Рейтинг Страховые случаи
2 1 3,8 350
3 2 3,9 400
4 3 4,1 520
5 4 5,0 600
6 5 4,9 610
7 6 2,8 250
8 7 3,7 450
9 8 4,4 450
10 9 2,9 280
11 10 3,5 320
12 11 4,5 515
13 12 4,8 560
14 13 3,5 360
15 14 4,7 600
16 15 4,6 580
17 16 3,1 400
18 17 2,7 320
19 18 4,0 520
20 19 2,9 335
2 | 4 | A | В | С |
| :---: | :---: | :---: | :---: |
| 1 | N | Рейтинг | Страховые случаи |
| 2 | 1 | 3,8 | 350 |
| 3 | 2 | 3,9 | 400 |
| 4 | 3 | 4,1 | 520 |
| 5 | 4 | 5,0 | 600 |
| 6 | 5 | 4,9 | 610 |
| 7 | 6 | 2,8 | 250 |
| 8 | 7 | 3,7 | 450 |
| 9 | 8 | 4,4 | 450 |
| 10 | 9 | 2,9 | 280 |
| 11 | 10 | 3,5 | 320 |
| 12 | 11 | 4,5 | 515 |
| 13 | 12 | 4,8 | 560 |
| 14 | 13 | 3,5 | 360 |
| 15 | 14 | 4,7 | 600 |
| 16 | 15 | 4,6 | 580 |
| 17 | 16 | 3,1 | 400 |
| 18 | 17 | 2,7 | 320 |
| 19 | 18 | 4,0 | 520 |
| 20 | 19 | 2,9 | 335 |
| 2 | | | |
b) 在 "插入 "选项卡的 "图表 "部分,选择 "点图"。
将显示默认设置的图表。
要添加趋势线(显示线性回归方程的图形),请左键单击其中一个
点,然后按下鼠标右键。在右键菜单中选择 "添加趋势线"。
将出现一条线段,显示指定参数之间的线性关系。
按下相应参数上的鼠标键,即可更改图表参数:名称、比例尺、图例。 5.要更改趋势线参数,请右键单击图形(线段),在右键菜单中选择 "趋势线格式":
在窗口右侧打开的菜单中,您可以将所考虑的两个值的依赖性从线性关系改为非线性关 系,并评估云点位于一条或另一条趋势线上的准确程度。
6.要在图表中显示线性回归方程和决定系数,必须在趋势线格式设置中勾选复选框:"在图表上显示方程 "和 "在图表上显示近似可靠性值 (R^2)"。
图表名称
决定系数等于皮尔逊相关系数的平方。通常,它被认为是反映描述模型变量之间关系的回归模型质量的主要指标。它表明在所建模型的帮助下,可以解释观察到的变量中的哪一部分变异,也就是说,决定系数的值决定了在结果属性的总变异中,因因素属性的影响而产生的变化所占的份额(百分比)。与相关系数一样,它的取值范围在 0 到 1 之间。在本例中,决定系数为 0.85 (
=
85
%
=
85
%
=85% =85 \% )。因此,
85
%
85
%
85% 85 \% 保险公司评级的变化取决于保险支付的次数。
任务 2.表 4 列出了一项城市居民调查结果的样本:智商高低是否取决于看电视的时长。
表 4
№
IQ
电视,小时/周。
1
80
28
2
90
10
3
115
3
4
98
15
5
125
8
6
74
32
7
140
1
8
86
21
9
95
15
10
102
9
11
114
15
№ IQ Телевизор, ч./нед.
1 80 28
2 90 10
3 115 3
4 98 15
5 125 8
6 74 32
7 140 1
8 86 21
9 95 15
10 102 9
11 114 15 | № | IQ | Телевизор, ч./нед. |
| :---: | :---: | :---: |
| 1 | 80 | 28 |
| 2 | 90 | 10 |
| 3 | 115 | 3 |
| 4 | 98 | 15 |
| 5 | 125 | 8 |
| 6 | 74 | 32 |
| 7 | 140 | 1 |
| 8 | 86 | 21 |
| 9 | 95 | 15 |
| 10 | 102 | 9 |
| 11 | 114 | 15 |
使用 MS Excel 工具和手段:
以确定相关系数;
来确定协方差;
确定线性回归的参数:直线的角度系数和沿 OY 轴的偏移;
在图表上显示点云并绘制线性趋势图;
通过改变趋势线的参数来观察非线性依赖关系下的趋势线;
在图上显示线性回归方程和判定系数。
个人任务
任务 2
表 5 列出了一项城市居民调查结果的样本:智商高低是否取决于阅读书籍的时数。
使用 MS Excel 工具和手段:
以确定相关系数;
来确定协方差;
确定线性回归的参数:直线的角度系数和沿 OY 轴的偏移;
在图表上显示点云并绘制线性趋势图;
通过改变趋势线的参数来观察非线性依赖关系下的趋势线;
在图上显示线性回归方程和判定系数。
表 5
变量编号
取样
0
N
12
电视,小时/周
1
80
28
2
90
10
3
115
3
4
98
15
5
125
8
6
74
32
7
140
1
8
86
21
9
95
15
10
102
9
11
114
15
1
N
IQ
书籍,小时/周
1
80
7
2
90
5
3
115
40
4
98
15
5
125
32
6
74
1
7
140
55
8
86
10
9
95
7
2
N
12
书籍,小时/周
1
80
7
2
90
5
3
115
40
4
98
15
5
125
32
6
74
1
7
140
55
8
86
10
9
95
10
102
25
Номер варианта Выборка
0 N 12 Телевизор, ч/нед
1 80 28
2 90 10
3 115 3
4 98 15
5 125 8
6 74 32
7 140 1
8 86 21
9 95 15
10 102 9
11 114 15
1 N IQ Книги, ч/нед
1 80 7
2 90 5
3 115 40
4 98 15
5 125 32
6 74 1
7 140 55
8 86 10
9 95 7
2 N 12 Книги, ч/нед
1 80 7
2 90 5
3 115 40
4 98 15
5 125 32
6 74 1
7 140 55
8 86 10
9 95
10 102 25 | Номер варианта | Выборка | | |
| :---: | :---: | :---: | :---: |
| 0 | N | 12 | Телевизор, ч/нед |
| | 1 | 80 | 28 |
| | 2 | 90 | 10 |
| | 3 | 115 | 3 |
| | 4 | 98 | 15 |
| | 5 | 125 | 8 |
| | 6 | 74 | 32 |
| | 7 | 140 | 1 |
| | 8 | 86 | 21 |
| | 9 | 95 | 15 |
| | 10 | 102 | 9 |
| | 11 | 114 | 15 |
| 1 | N | IQ | Книги, ч/нед |
| | 1 | 80 | 7 |
| | 2 | 90 | 5 |
| | 3 | 115 | 40 |
| | 4 | 98 | 15 |
| | 5 | 125 | 32 |
| | 6 | 74 | 1 |
| | 7 | 140 | 55 |
| | 8 | 86 | 10 |
| | 9 | 95 | 7 |
| 2 | N | 12 | Книги, ч/нед |
| | 1 | 80 | 7 |
| | 2 | 90 | 5 |
| | 3 | 115 | 40 |
| | 4 | 98 | 15 |
| | 5 | 125 | 32 |
| | 6 | 74 | 1 |
| | 7 | 140 | 55 |
| | 8 | 86 | 10 |
| | 9 | 95 | |
| | 10 | 102 | 25 |
N
1 Q
书籍,小时/周
1
79
8
2
92
5
3
112
33
4
98
15
5
125
32
3
6
74
2
7
140
50
8
83
10
9
95
9
10
102
25
11
114
28
N
1 Q
书籍,小时/周
1
79
8
2
92
5
3
112
33
4
4
98
15
5
125
32
6
74
2
7
140
50
8
83
10
5
N
1 Q
书籍,小时/周
1
79
8
2
92
5
3
112
33
4
98
15
5
125
32
6
74
2
7
140
50
8
83
10
9
95
9
10
102
25
6
N
10
书籍,小时/周
1
140
50
2
112
33
3
125
32
4
114
28
5
102
25
6
98
15
7
83
10
8
95
9
9
79
8
N 1 Q Книги, ч/нед
1 79 8
2 92 5
3 112 33
4 98 15
5 125 32
3 6 74 2
7 140 50
8 83 10
9 95 9
10 102 25
11 114 28
N 1 Q Книги, ч/нед
1 79 8
2 92 5
3 112 33
4 4 98 15
5 125 32
6 74 2
7 140 50
8 83 10
5 N 1 Q Книги, ч/нед
1 79 8
2 92 5
3 112 33
4 98 15
5 125 32
6 74 2
7 140 50
8 83 10
9 95 9
10 102 25
6 N 10 Книги, ч/нед
1 140 50
2 112 33
3 125 32
4 114 28
5 102 25
6 98 15
7 83 10
8 95 9
9 79 8 | | N | 1 Q | Книги, ч/нед |
| :---: | :---: | :---: | :---: |
| | 1 | 79 | 8 |
| | 2 | 92 | 5 |
| | 3 | 112 | 33 |
| | 4 | 98 | 15 |
| | 5 | 125 | 32 |
| 3 | 6 | 74 | 2 |
| | 7 | 140 | 50 |
| | 8 | 83 | 10 |
| | 9 | 95 | 9 |
| | 10 | 102 | 25 |
| | 11 | 114 | 28 |
| | N | 1 Q | Книги, ч/нед |
| | 1 | 79 | 8 |
| | 2 | 92 | 5 |
| | 3 | 112 | 33 |
| 4 | 4 | 98 | 15 |
| | 5 | 125 | 32 |
| | 6 | 74 | 2 |
| | 7 | 140 | 50 |
| | 8 | 83 | 10 |
| 5 | N | 1 Q | Книги, ч/нед |
| | 1 | 79 | 8 |
| | 2 | 92 | 5 |
| | 3 | 112 | 33 |
| | 4 | 98 | 15 |
| | 5 | 125 | 32 |
| | 6 | 74 | 2 |
| | 7 | 140 | 50 |
| | 8 | 83 | 10 |
| | 9 | 95 | 9 |
| | 10 | 102 | 25 |
| 6 | N | 10 | Книги, ч/нед |
| | 1 | 140 | 50 |
| | 2 | 112 | 33 |
| | 3 | 125 | 32 |
| | 4 | 114 | 28 |
| | 5 | 102 | 25 |
| | 6 | 98 | 15 |
| | 7 | 83 | 10 |
| | 8 | 95 | 9 |
| | 9 | 79 | 8 |
N
IQ
书籍,小时/周
1
140
50
2
112
33
3
125
32
4
114
28
5
102
25
7
6
98
15
7
83
10
8
95
9
9
79
8
10
92
5
11
74
2
N
IQ
书籍,小时/周
1
74
2
2
79
8
3
83
10
4
92
5
8
5
95
9
6
98
15
7
102
25
8
112
33
9
114
28
10
125
32
9
N
IQ
书籍,小时/周
1
74
2
2
79
8
3
83
10
4
92
5
5
95
9
6
98
15
7
102
25
8
112
33
9
114
28
N IQ Книги, ч/нед
1 140 50
2 112 33
3 125 32
4 114 28
5 102 25
7 6 98 15
7 83 10
8 95 9
9 79 8
10 92 5
11 74 2
N IQ Книги, ч/нед
1 74 2
2 79 8
3 83 10
4 92 5
8 5 95 9
6 98 15
7 102 25
8 112 33
9 114 28
10 125 32
9 N IQ Книги, ч/нед
1 74 2
2 79 8
3 83 10
4 92 5
5 95 9
6 98 15
7 102 25
8 112 33
9 114 28 | | N | IQ | Книги, ч/нед |
| :---: | :---: | :---: | :---: |
| | 1 | 140 | 50 |
| | 2 | 112 | 33 |
| | 3 | 125 | 32 |
| | 4 | 114 | 28 |
| | 5 | 102 | 25 |
| 7 | 6 | 98 | 15 |
| | 7 | 83 | 10 |
| | 8 | 95 | 9 |
| | 9 | 79 | 8 |
| | 10 | 92 | 5 |
| | 11 | 74 | 2 |
| | N | IQ | Книги, ч/нед |
| | 1 | 74 | 2 |
| | 2 | 79 | 8 |
| | 3 | 83 | 10 |
| | 4 | 92 | 5 |
| 8 | 5 | 95 | 9 |
| | 6 | 98 | 15 |
| | 7 | 102 | 25 |
| | 8 | 112 | 33 |
| | 9 | 114 | 28 |
| | 10 | 125 | 32 |
| 9 | N | IQ | Книги, ч/нед |
| | 1 | 74 | 2 |
| | 2 | 79 | 8 |
| | 3 | 83 | 10 |
| | 4 | 92 | 5 |
| | 5 | 95 | 9 |
| | 6 | 98 | 15 |
| | 7 | 102 | 25 |
| | 8 | 112 | 33 |
| | 9 | 114 | 28 |