这是用户在 2024-9-24 15:56 为 https://app.immersivetranslate.com/pdf-pro/ea81fe91-ae36-49a7-9bab-ac04860e89cb 保存的双语快照页面,由 沉浸式翻译 提供双语支持。了解如何保存?

확를변 수 오 이산핵뮬분포  测定变量Oh,离散核骡分布

Copyright (©) Beum-Jo Park
版权所有 (©) Beum-Jo Park

Contents 内容

제1절 확률변수 第一节 随机变量

제2절 이산확률변수의 확률분포 第二节 离散随机变量的概率分布
제3절 이산확률변수의 기댓값 第三节 离散随机变量的期望值
제4절 두 이산확률변수의 분포 第四节 两个离散随机变量的分布
제5절 공분산과 상관계수 第五节 协方差和相关系数
제6절 이항분포 第 6 节 二项式分布
제7절 기하분포 第 7 节 几何分布
제8절 포아송분포 第 8 节 泊松分布
  • 사례분석 5 최적 투자를 위한 기준 : a.s.(almost surely)의
    案例分析5 最优投资的标准:as(几乎肯定)
개념과 켈리 기준 概念和凯利标准
확률변수란 임의실험의 결과에 실숫값을 대응시켜 주는 함수이며, 흔히 X , Y X , Y X,YX, Y 혹은 Z Z ZZ 와 같은 영문 대문자로 표현한다.
随机变量是一个将实际值与随机实验结果相对应的函数,通常是 X , Y X , Y X,YX, Y 或者 Z Z ZZ 用大写字母表示,例如。
컴퓨터 공장에서 생산한 두 대의 제품에 대한 불량품 여부를 판정하는 임의실험을 하였다 고 하자. 이 경우 표본공간은 다음과 같다.
假设进行了一项随机实验来确定计算机工厂生产的两种产品是否有缺陷。在这种情况下,样本空间如下。
Ω = { D D , D N , N D , N N } D : 불량품, N : 정상품 Ω = { D D , D N , N D , N N } D :  불량품,  N :  정상품  {:[Omega={DD","DN","ND","NN}],[D:" 불량품, "N:" 정상품 "]:}\begin{aligned} & \Omega=\{D D, D N, N D, N N\} \\ & D: \text { 불량품, } N: \text { 정상품 } \end{aligned}
만일 X X XX 가 불량품의 수를 나타내는 변수라면 임의실험의 결과에 실숫값 ( 0 , 1 , 2 ) ( 0 , 1 , 2 ) (0,1,2)(0,1,2) 을 대응시켜 주는 함수가 되며, 이때 X X XX 는 확률변수이다. 불량품의 수를 나타내는 확률변수 X X XX 는 특정한 수 치 x = 0 , x = 1 , x = 2 x = 0 , x = 1 , x = 2 x=0,x=1,x=2x=0, x=1, x=2 를 갖게 된다. 앞으로 영문 대문자는 변수를, 영문 소문자는 변수가 취하 는 특정한 실숫값을 나타내는 것으로 한다. 함수의 개념에 의하면 확률변수란 정의역이 표본 공간 ( Ω ) ( Ω ) (Omega)(\Omega) 이고 치역이 실숫값 ( R ) ( R ) (R)(R) 인 함수이다.
应该 X X XX 如果 是代表缺陷产品数量的变量,则随机实验的结果将具有真实值。 ( 0 , 1 , 2 ) ( 0 , 1 , 2 ) (0,1,2)(0,1,2) 它变成了一个函数,对应于 X X XX 是一个随机变量。代表缺陷产品数量的随机变量 X X XX 是一个具体的数字 x = 0 , x = 1 , x = 2 x = 0 , x = 1 , x = 2 x=0,x=1,x=2x=0, x=1, x=2 你将会有今后,大写英文字母将代表变量,小写英文字母将代表变量所取的具体实数。根据函数的概念,随机变量的定义域就是样本空间。 ( Ω ) ( Ω ) (Omega)(\Omega) 并且范围是一个真实值 ( R ) ( R ) (R)(R) 是一个函数。

제1절 확룰변수 第一节 或然变量

만일 X X XX 가 불량품의 수를 나타내는 변수라면 임의실험의 결과에 실숫값 ( 0 , 1 , 2 ) ( 0 , 1 , 2 ) (0,1,2)(0,1,2) 을 대응시켜 주는 함수가 되며, 이때 X X XX 는 확률변수이다. 불량품의 수를 나타내는 확률변수 X X XX 는 특정한 수 치 x = 0 , x = 1 , x = 2 x = 0 , x = 1 , x = 2 x=0,x=1,x=2x=0, x=1, x=2 를 갖게 된다. 앞으로 영문 대문자는 변수를, 영문 소문자는 변수가 취하 는 특정한 실숫값을 나타내는 것으로 한다. 함수의 개념에 의하면 확률변수란 정의역이 표본 공간 ( Ω ) ( Ω ) (Omega)(\Omega) 이고 치역이 실숫값 ( R ) ( R ) (R)(R) 인 함수이다.
应该 X X XX 如果 是代表缺陷产品数量的变量,则随机实验的结果具有实值。 ( 0 , 1 , 2 ) ( 0 , 1 , 2 ) (0,1,2)(0,1,2) 它变成了一个函数,对应于 X X XX 是一个随机变量。代表缺陷产品数量的随机变量 X X XX 是一个具体的数字 x = 0 , x = 1 , x = 2 x = 0 , x = 1 , x = 2 x=0,x=1,x=2x=0, x=1, x=2 你将会有今后,大写英文字母将代表变量,小写英文字母将代表变量所取的具体实数。根据函数的概念,随机变量的定义域就是样本空间。 ( Ω ) ( Ω ) (Omega)(\Omega) 并且范围是一个真实值 ( R ) ( R ) (R)(R) 是一个函数。

그림 5-1 图5-1

X : Ω R X : Ω R X:Omega rarr R\mathrm{X}: \Omega \rightarrow R

이산확률변수는 확률변수가 취할 수 있는 실숫값의 수를 셀 수 있는 변수이다. 연속확률 변수는 확률변수가 취할 수 있는 실숫값이 어떤 특정 구간 전체에 해당하여 그 수를 셀 수 없는 변수이다.
离散随机变量是可以统计随机变量可以取的实数个数的变量。连续随机变量是一种数量无法统计的变量,因为随机变量可以取的实数值的数量对应于整个特定区间。
일반적으로 이산확률변수가 취하는 실숫값의 수는 유한하다. 이에 대한 예를 들면 다음과 같다.
一般来说,离散随机变量可以取的实值个数是有限的。示例如下:
  • 10 명의 회사원을 선택하여 성별을 관측하는 임의실험에서 여자 사원의 수( 0 , 1 , 2 , 0 , 1 , 2 , 0,1,2,cdots0,1,2, \cdots, 9 , 10 ) 9 , 10 ) 9,10)9,10)
    在随机选取 10 名上班族并观察其性别的实验中,女性员工的数量( 0 , 1 , 2 , 0 , 1 , 2 , 0,1,2,cdots0,1,2, \cdots , 9 , 10 ) 9 , 10 ) 9,10)9,10)
  • 공기청정기 공장에서 생산한 100 개의 완성품 중 불량품의 개수 ( 0 , 1 , , 100 ) ( 0 , 1 , , 100 ) (0,1,cdots,100)(0,1, \cdots, 100)
    空气净化器工厂生产的100件成品中不良品的数量 ( 0 , 1 , , 100 ) ( 0 , 1 , , 100 ) (0,1,cdots,100)(0,1, \cdots, 100)
  • 정원이 20 명인 인공지능 대학원에 입학한 학생 수 ( 0 , 1 , , 20 ) ( 0 , 1 , , 20 ) (0,1,cdots,20)(0,1, \cdots, 20)
    人工智能研究生院录取名额20人 ( 0 , 1 , , 20 ) ( 0 , 1 , , 20 ) (0,1,cdots,20)(0,1, \cdots, 20)
  • 하루 동안 은행의 한 지점을 방문한 고객의 수 ( 0 , 1 , 2 , ) ( 0 , 1 , 2 , ) (0,1,2,cdots)(0,1,2, \cdots)
    一天内到访银行网点的客户数量 ( 0 , 1 , 2 , ) ( 0 , 1 , 2 , ) (0,1,2,cdots)(0,1,2, \cdots)
  • 우리나라 대기업에서 과거 10 년 동안 발생한 파업의 수 ( 0 , 1 , 2 , ) ( 0 , 1 , 2 , ) (0,1,2,cdots)(0,1,2, \cdots)
    近10年我国大企业罢工次数 ( 0 , 1 , 2 , ) ( 0 , 1 , 2 , ) (0,1,2,cdots)(0,1,2, \cdots)
  • 어떤 포털 사이트를 오픈한 후 사람들이 접속한 횟수 ( 0 , 1 , 2 , ) ( 0 , 1 , 2 , ) (0,1,2,cdots)(0,1,2, \cdots)
    人们打开门户网站后访问该网站的次数 ( 0 , 1 , 2 , ) ( 0 , 1 , 2 , ) (0,1,2,cdots)(0,1,2, \cdots)

    반면, 연속확률변수는 취할 수 있는 실숫값의 수가 셀 수 없이 무한하여 연속변수가 취할 수 있 는 값이 어떤 특정 구간 전체에 해당된다. 병원에 서 의사가 하루에 환자를 진료하는 정확한 시간(초 이하의 단위로 측정)을 확률변수라고 하면, 이 변 수가 취할 수 있는 값은 245.70812 245.70812 245.70812 cdots245.70812 \cdots 초같이 0 부터 86,400 까지 일정 구간의 무한한 실숫값 중 하나가
    另一方面,连续随机变量可以取的实数个数是无数且无限的,因此连续变量可以取的值对应于整个特定区间。如果医生每天在医院治疗病人的确切时间(以秒或更短的时间为单位)称为随机变量,则该变量可以取的值是 245.70812 245.70812 245.70812 cdots245.70812 \cdots 某个范围内的无限实数之一,例如一秒,从 0 到 86,400。
출처 : 셔터스톡 될 수 있으며, 이때의 확률변수는 연속인 것이다. 이에 대한 예를 들어보면 다음과 같다.
来源:Shutterstock 在这种情况下,随机变量是连续的。示例如下:
  • 국내 기업 중 사회적 기업의 비율
    社会企业占国内企业的比例
  • 바이오 기업 연구소에서 신약을 개발하기 위해 걸리는 정확한 시간
    在生物技术实验室开发新药所需的确切时间
  • 어떤 회사의 매출 증가율 某公司销售额增长率
  • 오늘의 대미환율 今日美元汇率
  • 다이아몬드의 정확한 무게 钻石的精确重量
    X X XX 의 확률분포는 X X XX 가 취할 수 있는 모든 x x xx 의 확률값들을 표, 공식 또는 그래프로 표시한 것이며, 확률분포를 함수로 나타낸 것을 확률함수라고 한다. 확률함수는 이산확률변수 의 분포를 나타내는 확률질량함수와 연속확률변수의 분포를 나타내는 확률밀도함수로 구별될 수 있다.
    X X XX 的概率分布 X X XX 尽其所能 x x xx 的概率值以表格、公式或图形显示,用函数表示的概率分布称为概率函数。概率函数可以分为表示离散随机变量分布的概率质量函数和表示连续随机变量分布的概率密度函数。
이산확률변수 X X XX 의 확률질량함수 P X ( x ) P X ( x ) P_(X)(x)P_{X}(x) X X XX x x xx 를 취하는 확률을 x x xx 의 함수로 표현한 것 이다.
离散随机变量 X X XX 概率质量函数为 P X ( x ) P X ( x ) P_(X)(x)P_{X}(x) X X XX x x xx 采取的概率 x x xx 它被表示为 的函数。
P X ( x ) = P ( X = x ) P X ( x ) = P ( X = x ) P_(X)(x)=P(X=x)P_{X}(x)=P(X=x)
동전을 두 번 던지는 임의실험에서 동전의 앞면이 나오는 횟수를 확률변수 X X XX 로 표현하면, 이때 X X XX 가 취할 수 있는 값들은 x = 0 , x = 1 x = 0 , x = 1 x=0,x=1x=0, x=1 또는 x = 2 x = 2 x=2x=2 가 되며 이에 대응하는 확률값들은 다음 과 같다.
随机变量是指在抛硬币两次的随机实验中硬币正面朝上的次数。 X X XX 表示为,此时 X X XX 可以取的值为 x = 0 , x = 1 x = 0 , x = 1 x=0,x=1x=0, x=1 或者 x = 2 x = 2 x=2x=2 ,对应的概率值如下。
P X ( 0 ) = P ( X = 0 ) = P ( T T ) = 1 4 P X ( 1 ) = P ( X = 1 ) = P ( H T ) + P ( T H ) = 1 4 + 1 4 = 1 2 P X ( 2 ) = P ( X = 2 ) = P ( H H ) = 1 4 P X ( 0 ) = P ( X = 0 ) = P ( T T ) = 1 4 P X ( 1 ) = P ( X = 1 ) = P ( H T ) + P ( T H ) = 1 4 + 1 4 = 1 2 P X ( 2 ) = P ( X = 2 ) = P ( H H ) = 1 4 {:[P_(X)(0)=P(X=0)=P(TT)=(1)/(4)],[P_(X)(1)=P(X=1)=P(HT)+P(TH)=(1)/(4)+(1)/(4)=(1)/(2)],[P_(X)(2)=P(X=2)=P(HH)=(1)/(4)]:}\begin{aligned} & P_{X}(0)=P(X=0)=P(T T)=\frac{1}{4} \\ & P_{X}(1)=P(X=1)=P(H T)+P(T H)=\frac{1}{4}+\frac{1}{4}=\frac{1}{2} \\ & P_{X}(2)=P(X=2)=P(H H)=\frac{1}{4} \end{aligned}
표 5-1 X의 확률분포 表 5-1 X 的概率分布
확률변수가 취하는 값 ( x ) ( x ) (x)(x) 随机变量取的值 ( x ) ( x ) (x)(x) P X ( x ) P X ( x ) P_(X)(x)P_{X}(x)
0 1 / 4 1 / 4 1//41 / 4
1 1 / 2 1 / 2 1//21 / 2
2 1 / 4 1 / 4 1//41 / 4
확률변수가 취하는 값 (x) P_(X)(x) 0 1//4 1 1//2 2 1//4| 확률변수가 취하는 값 $(x)$ | $P_{X}(x)$ | | :---: | :---: | | 0 | $1 / 4$ | | 1 | $1 / 2$ | | 2 | $1 / 4$ |
그림 5-2 X X XX 의 확률분포 그래프
图5-2 X X XX 的概率分布图

이산확률변수 X X XX 의 확률함수 특성
离散随机变量 X X XX 概率函数特征

  1. 어떤 x x xx 값에 대해 P X ( x ) 0 P X ( x ) 0 P_(X)(x) >= 0P_{X}(x) \geq 0
    哪个 x x xx 关于价值 P X ( x ) 0 P X ( x ) 0 P_(X)(x) >= 0P_{X}(x) \geq 0
  2. 각 확률의 합은 1 이다. 즉 x P X ( x ) = 1 x P X ( x ) = 1 sum_(x)P_(X)(x)=1\sum_{x} P_{X}(x)=1
    每个概率的总和为 1。换句话说 x P X ( x ) = 1 x P X ( x ) = 1 sum_(x)P_(X)(x)=1\sum_{x} P_{X}(x)=1

표 5-2 일일 자동차 판매량
表5-2 汽车日销量

일일 자동차 판매량 ( x ) ( x ) (x)(x) 每日汽车销量 ( x ) ( x ) (x)(x) 도수 频率
0 5
1 10
2 40
3 30
4 15
합계 全部的 100
일일 자동차 판매량 (x) 도수 0 5 1 10 2 40 3 30 4 15 합계 100| 일일 자동차 판매량 $(x)$ | 도수 | | :---: | :---: | | 0 | 5 | | 1 | 10 | | 2 | 40 | | 3 | 30 | | 4 | 15 | | 합계 | 100 |

표 5-3 일일 자동차 판매량의 확률분포
表5-3 每日汽车销量概率分布

일일 자동차 판매량 ( x ) ( x ) (x)(x) 每日汽车销量 ( x ) ( x ) (x)(x) 상대도수 ~~\approx 확률 P x ( x ) P x ( x ) P_(x)(x)P_{x}(x)
相对频率 ~~\approx 可能性 P x ( x ) P x ( x ) P_(x)(x)P_{x}(x)
0 5 / 100 = 0.05 5 / 100 = 0.05 5//100=0.055 / 100=0.05
1 10 / 100 = 0.1 10 / 100 = 0.1 10//100=0.110 / 100=0.1
2 40 / 100 = 0.4 40 / 100 = 0.4 40//100=0.440 / 100=0.4
3 30 / 100 = 0.3 30 / 100 = 0.3 30//100=0.330 / 100=0.3
4 15 / 100 = 0.15 15 / 100 = 0.15 15//100=0.1515 / 100=0.15
합계 全部的 100 / 100 = 1 100 / 100 = 1 100//100=1100 / 100=1
일일 자동차 판매량 (x) 상대도수 ~~ 확률 P_(x)(x) 0 5//100=0.05 1 10//100=0.1 2 40//100=0.4 3 30//100=0.3 4 15//100=0.15 합계 100//100=1| 일일 자동차 판매량 $(x)$ | 상대도수 $\approx$ 확률 $P_{x}(x)$ | | :---: | :---: | | 0 | $5 / 100=0.05$ | | 1 | $10 / 100=0.1$ | | 2 | $40 / 100=0.4$ | | 3 | $30 / 100=0.3$ | | 4 | $15 / 100=0.15$ | | 합계 | $100 / 100=1$ |
확률변수와 관련된 확률의 또 다른 표현함수로 누적분포함수(cumulative distribution function, c.d.f.)가 있다. 여기서 누적분포함수란 확률변수 X X XX 가 특정한 값 x 0 x 0 x_(0)x_{0} 를 넘지 않을 확률 을 나타내는 함수로서 P ( X x 0 ) P X x 0 P(X <= x_(0))P\left(X \leq x_{0}\right) 를 의미한다.
与随机变量相关的概率的另一个表达函数是累积分布函数(cdf)。这里,累积分布函数是随机变量。 X X XX 是一个特定值 x 0 x 0 x_(0)x_{0} 作为表示不超过概率的函数 P ( X x 0 ) P X x 0 P(X <= x_(0))P\left(X \leq x_{0}\right) 方法。

X X XX 의 누적분포함수 F X ( x 0 ) F X x 0 F_(X)(x_(0))F_{X}\left(x_{0}\right) X X XX x 0 x 0 x_(0)x_{0} 를 넘지 않을 확률을 나타낸다. 즉
X X XX 累积分布函数 F X ( x 0 ) F X x 0 F_(X)(x_(0))F_{X}\left(x_{0}\right) X X XX x 0 x 0 x_(0)x_{0} 表示不超过的概率。换句话说
F X ( x 0 ) = P ( X x 0 ) F X x 0 = P X x 0 F_(X)(x_(0))=P(X <= x_(0))F_{X}\left(x_{0}\right)=P\left(X \leq x_{0}\right)
동전을 두 번 던져서 동전의 앞면이 나오는 횟수를 관찰하는 앞의 임의실험 예에서 누적분 포함수는 다음과 같다.
在前面抛硬币两次并观察硬币正面朝上的次数的随机实验示例中,累计夹杂物数量如下。
F X ( 0 ) = P ( X 0 ) = 1 4 F X ( 1 ) = P ( X 1 ) = 3 4 F X ( 2 ) = P ( X 2 ) = 4 4 = 1 F X ( 0 ) = P ( X 0 ) = 1 4 F X ( 1 ) = P ( X 1 ) = 3 4 F X ( 2 ) = P ( X 2 ) = 4 4 = 1 {:[F_(X)(0)=P(X <= 0)=(1)/(4)],[F_(X)(1)=P(X <= 1)=(3)/(4)],[F_(X)(2)=P(X <= 2)=(4)/(4)=1]:}\begin{aligned} & F_{X}(0)=P(X \leq 0)=\frac{1}{4} \\ & F_{X}(1)=P(X \leq 1)=\frac{3}{4} \\ & F_{X}(2)=P(X \leq 2)=\frac{4}{4}=1 \end{aligned}

이산확률변수의 누적분포함수 특성 离散随机变量的累积分布函数特征

  1. 모든 x 0 x 0 x_(0)x_{0} 에 대해 0 F X ( x 0 ) 1 0 F X x 0 1 0 <= F_(X)(x_(0)) <= 10 \leq F_{X}\left(x_{0}\right) \leq 1
    每一个 x 0 x 0 x_(0)x_{0} 关于 0 F X ( x 0 ) 1 0 F X x 0 1 0 <= F_(X)(x_(0)) <= 10 \leq F_{X}\left(x_{0}\right) \leq 1
  2. 만일 x 0 < x 1 x 0 < x 1 x_(0) < x_(1)x_{0}<x_{1} 이면 F X ( x 0 ) F X ( x 1 ) F X x 0 F X x 1 F_(X)(x_(0)) <= F_(X)(x_(1))F_{X}\left(x_{0}\right) \leq F_{X}\left(x_{1}\right)
    应该 x 0 < x 1 x 0 < x 1 x_(0) < x_(1)x_{0}<x_{1} 这边 F X ( x 0 ) F X ( x 1 ) F X x 0 F X x 1 F_(X)(x_(0)) <= F_(X)(x_(1))F_{X}\left(x_{0}\right) \leq F_{X}\left(x_{1}\right)

제5장 확룰변수오 이산확룰분포 第 5 章随机变量和离散概率分布

우연에 대한 기대 巧合的期望

일반적으로 사람들은 우연의 발생을 100 만 분의 1 에도 못 미치는 아주 특이한 경우라고 믿는다. 즉 사 람들은 우연의 확률이 0 에 가까워 우연은 일어날 것으로 기대하지 않을 뿐만 아니라 미래에 일어날 것
一般来说,人们认为巧合是一种非常不寻常的现象,不到百万分之一。换句话说,人们不仅不期望巧合发生,因为巧合的概率接近于0,而且还期望它们在未来发生。
내용으 230-231pp. 참고 内容 230-231 页。参考
출처 : 셔터스톡 来源:Shutterstock
기댓값은 E ( X ) E ( X ) E(X)E(X) 혹은 μ μ mu\mu 로 표현하며, 확률변수가 취할 수 있는 모든 값과 그들의 발생확률을 각각 곱한 후 합함으로써 계산된다.
期望值为 E ( X ) E ( X ) E(X)E(X) 或者 μ μ mu\mu 它表示为 , 的计算方法是将随机变量可以取的所有值分别与其出现的概率相乘,然后相加。
이산확률변수 X X XX 의 기댓값 E ( X ) E ( X ) E(X)E(X) 는 다음과 같이 정의된다.
离散随机变量 X X XX 期望值 E ( X ) E ( X ) E(X)E(X) 定义如下。
E ( X ) = x P X ( x ) E ( X ) = x P X ( x ) E(X)=sum_(xP_(X)(x))E(X)=\sum_{x P_{X}(x)}

어떤 조사기관에서 A 도시에 거주하는 사람들에게 과거 5 년 동안 직업을 바꾼 횟수를 물 어보고 그 비율을 계산하여 표 5-4와 같은 결과를 얻었다.
某研究机构询问了A市居民过去5年换工作的次数,并计算了比例,得到表5-4所示的结果。
표 5-4 직업을 바꾼 횟수의 확률분포
表5-4 换工作次数概率分布
직업을 바꾼 횟수 您换工作的次数 0 1 2 3 4 5
비율 比率 0.3 0.4 0.2 0.05 0.03 0.02
직업을 바꾼 횟수 0 1 2 3 4 5 비율 0.3 0.4 0.2 0.05 0.03 0.02| 직업을 바꾼 횟수 | 0 | 1 | 2 | 3 | 4 | 5 | | :--- | :---: | :---: | :---: | :---: | :---: | :---: | | 비율 | 0.3 | 0.4 | 0.2 | 0.05 | 0.03 | 0.02 |
이 도시의 거주민들이 직업을 바꾼 평균 횟수를 계산하라.
计算该城市居民平均换工作的次数。

기댓값의 특성 期望值的特征

X X XX Y Y YY 는 확률변수이고 a a aa 는 상수라고 하자.
X X XX Y Y YY 是一个随机变量 a a aa 让 是一个常数。
  1. E ( a ) = a E ( a ) = a E(a)=aE(a)=a
  2. E ( a X ) = a E ( X ) E ( a X ) = a E ( X ) E(aX)=aE(X)E(a X)=a E(X)
  3. E ( X + Y ) = E ( X ) + E ( Y ) E ( X + Y ) = E ( X ) + E ( Y ) E(X+Y)=E(X)+E(Y)E(X+Y)=E(X)+E(Y)
    E ( X Y ) = E ( X ) E ( Y ) E ( X Y ) = E ( X ) E ( Y ) E(X-Y)=E(X)-E(Y)E(X-Y)=E(X)-E(Y)
  • 농구공을 생산하는 공장의 총생산비용과 관련된 예
    与生产篮球的工厂的总生产成本相关的示例
함수의 기댓값은 다음과 같이 정의된다.
函数的期望值定义如下。
E [ g ( X ) ] = X g ( x ) P X ( x ) E [ g ( X ) ] = X g ( x ) P X ( x ) E[g(X)]=sum_(X)g(x)P_(X)(x)E[g(X)]=\sum_{X} g(x) P_{X}(x)
분포의 특성을 계산하는 유용한 방법으로 분포의 중심을 측정하는 기댓값 외에도 분포의 흘 어짐 정도를 측정하는 분산(variance)을 고려할 수 있는데, 이 분산은 x x xx 의 함수인 g ( X ) g ( X ) g(X)g(\mathrm{X}) 의 기댓 값으로 정의할 수 있다.
作为计算分布特征的有用方法,除了衡量分布中心的期望值之外,还可以考虑衡量分布分散程度的方差。 x x xx 这是一个函数 g ( X ) g ( X ) g(X)g(\mathrm{X}) 它可以定义为 的期望值。
σ X 2 = E [ g ( X ) ] = E [ ( X μ X ) 2 ] σ X 2 = E [ g ( X ) ] = E X μ X 2 sigma_(X)^(2)=E[g(X)]=E[(X-mu_(X))^(2)]\sigma_{X}^{2}=E[g(X)]=E\left[\left(X-\mu_{X}\right)^{2}\right]
확률변수 X 의 분산 σ X 2 σ X 2 sigma_(X)^(2)\sigma_{X}^{2} 는 다음과 같이 정의된다.
随机变量的方差 σ X 2 σ X 2 sigma_(X)^(2)\sigma_{X}^{2} 定义如下。
σ X 2 = E [ ( X μ X ) 2 ] = X ( x μ X ) 2 P X ( x ) = E ( X 2 ) μ X 2 σ X 2 = E X μ X 2 = X x μ X 2 P X ( x ) = E X 2 μ X 2 sigma_(X)^(2)=E[(X-mu_(X))^(2)]=sum_(X)(x-mu_(X))^(2)P_(X)(x)=E(X^(2))-mu_(X)^(2)\sigma_{X}^{2}=E\left[\left(X-\mu_{X}\right)^{2}\right]=\sum_{X}\left(x-\mu_{X}\right)^{2} P_{X}(x)=E\left(X^{2}\right)-\mu_{X}^{2}
표준편차 σ x σ x sigma_(x)\sigma_{x} 는 분산의 제곱근이다.
标准差 σ x σ x sigma_(x)\sigma_{x} 是方差的平方根。

앞의 예에서 A 도시의 거주민들이 직업을 바꾼 횟수의 분산과 표준편차를 구하라.
在前面的示例中,求 A 城市居民换工作次数的方差和标准差。

분산의 특성 分散体的性质

  1. Var ( a ) = 0 Var ( a ) = 0 Var(a)=0\operatorname{Var}(a)=0
  2. Var ( a X ) = a 2 Var ( X ) Var ( a X ) = a 2 Var ( X ) Var(aX)=a^(2)Var(X)\operatorname{Var}(a X)=a^{2} \operatorname{Var}(X)
  3. Var ( X + a ) = Var ( X ) Var ( X + a ) = Var ( X ) Var(X+a)=Var(X)\operatorname{Var}(X+a)=\operatorname{Var}(X)
  4. 만약 X X XX Y Y YY 가 독립이면
    如果 X X XX Y Y YY 如果是独立的
Var ( X + Y ) = Var ( X ) + Var ( Y ) Var ( X Y ) = Var ( X ) + Var ( Y ) Var ( X + Y ) = Var ( X ) + Var ( Y ) Var ( X Y ) = Var ( X ) + Var ( Y ) {:[Var(X+Y)=Var(X)+Var(Y)],[Var(X-Y)=Var(X)+Var(Y)]:}\begin{aligned} & \operatorname{Var}(X+Y)=\operatorname{Var}(X)+\operatorname{Var}(Y) \\ & \operatorname{Var}(X-Y)=\operatorname{Var}(X)+\operatorname{Var}(Y) \end{aligned}
농구공을 생산하는 공장의 총생산비용과 관련된 앞의 예에서 총생산비용의 분산은 Var ( Y ) Var ( Y ) Var(Y)\operatorname{Var}(Y) = Var ( b + c X ) = Var ( b + c X ) =Var(b+cX)=\operatorname{Var}(b+c X) 가 되며, 분산의 특성을 이용하면 Var ( Y ) = Var ( b ) + Var ( c X ) = c 2 Var ( X ) Var ( Y ) = Var ( b ) + Var ( c X ) = c 2 Var ( X ) Var(Y)=Var(b)+Var(cX)=c^(2)Var(X)\operatorname{Var}(Y)=\operatorname{Var}(b)+\operatorname{Var}(c X)=c^{2} \operatorname{Var}(X) 가 될 것이다.
在前面涉及生产篮球的工厂的总生产成本的示例中,总生产成本的方差为 Var ( Y ) Var ( Y ) Var(Y)\operatorname{Var}(Y) = Var ( b + c X ) = Var ( b + c X ) =Var(b+cX)=\operatorname{Var}(b+c X) ,并利用色散的特性, Var ( Y ) = Var ( b ) + Var ( c X ) = c 2 Var ( X ) Var ( Y ) = Var ( b ) + Var ( c X ) = c 2 Var ( X ) Var(Y)=Var(b)+Var(cX)=c^(2)Var(X)\operatorname{Var}(Y)=\operatorname{Var}(b)+\operatorname{Var}(c X)=c^{2} \operatorname{Var}(X) 这将是。

경기불황으로 자동차의 판매 대수가 현격히 줄어들자 H 자동차 영업소의 한 직원이 가격 할인과 함께 사은품을 증정하여 자동차 매출량을 향상하고자 한다. 이 직원이 다음 달에 판매하게 될 자동차 대수(X)의 확률분포를 다음과 같이 추정하였다.
由于经济不景气,汽车销量大幅下降,H汽车销售处的一名员工试图通过赠送礼品和价格折扣来增加汽车销量。该员工下个月将销售的汽车数量 (X) 的概率分布估计如下。
표 5-5 자동차 대수 ( X ) ( X ) (X)(X) 의 확률분포
表5-5 汽车数量 ( X ) ( X ) (X)(X) 的概率分布
X X XX 0 1 2 3 4
P X ( x ) P X ( x ) P_(X)(x)P_{X}(x) 0.05 0.15 0.35 0.25 0.20
X 0 1 2 3 4 P_(X)(x) 0.05 0.15 0.35 0.25 0.20| $X$ | 0 | 1 | 2 | 3 | 4 | | :---: | :---: | :---: | :---: | :---: | :---: | | $P_{X}(x)$ | 0.05 | 0.15 | 0.35 | 0.25 | 0.20 |
다음 달에 이 직원이 판매하게 될 자동차 대수의 기댓값과 분산을 계산하라. 만일 이 직 원의 기본 월급이 100 만 원이고 자동차 한 대 판매당 50 만 원의 판매수당을 받는다고 하 면, 이 직원의 다음 달 임금의 기댓값과 분산은 얼마인가?
计算该员工下个月将销售的汽车数量的预期值和方差。如果该员工的基本月薪为 100 万韩元,每售出一辆汽车,他将获得 50 万韩元的销售补贴,那么该员工下个月的工资预期值和方差是多少?

아래 그림과 같이 반지름의 길이가 1 인 원이 있으며, 원의 둘레를 6 등분한 위치에 1 부터 6 까지의 숫자를 부여하였다. 한 주사위를 두 번 던져 나온 숫자에 해당하는 위치의 점을 각각 a , b a , b a,ba, b 라고 하자. 두 점 a , b a , b a,ba, b 로 만들어지는 부채꼴(반원 포함) 호의 길이를 확률변수 X X XX 라고 하면 확률변수 X X XX 의 기댓값과 분산은 얼마인가?
如下图所示,有一个半径为1的圆,将圆的圆周分成6等份的位置分配了1到6的数字。每个骰子被抛出两次,点对应于滚动的数字。 a , b a , b a,ba, b 比方说两点 a , b a , b a,ba, b 随机变量是由以下项创建的弧(包括半圆)的长度 X X XX 如果你说随机变量 X X XX 的期望值和方差是多少?

2 개의 이산확률변수 X X XX Y Y YY 가 있다고 하자. 이 변수들의 졀합확률함수는 확률변수 X X XX 가 특정한 값 x x xx 를, 확률변수 Y Y YY 가 특정한 값 y y yy 를 동시에 취하는 확률을 나타내는 x x xx y y yy 의 함 수이다. 이 결합확률함수 P X , Y Y ( x , y ) P X , Y Y ( x , y ) P_(X),Y_(Y)(x,y)P_{X}, Y_{Y}(x, y) 는 다음과 같이 정의된다.
2 个离散随机变量 X X XX Y Y YY 假设有。这些变量的概率函数之和是一个随机变量 X X XX 是一个特定值 x x xx , 随机变量 Y Y YY 是一个特定值 y y yy 表示同时采取的概率 x x xx y y yy 它是 的函数。这个联合概率函数 P X , Y Y ( x , y ) P X , Y Y ( x , y ) P_(X),Y_(Y)(x,y)P_{X}, Y_{Y}(x, y) 定义如下。
P X , Y ( x , y ) = P ( X = x Y = y ) P X , Y ( x , y ) = P ( X = x Y = y ) P_(X,Y)(x,y)=P(X=x nn Y=y)P_{X, Y}(x, y)=P(X=x \cap Y=y)
두 이산확률변수의 결합확률분포로부터 각 이산확률변수에 대한 분포를 구할 수 있는 데, 각 이산확률변수에 대한 분포를 주변확률분포라고 정의한다. 여기서 Y Y YY 가 취할 수 있 는 모든 값에 대한 결합함수의 합이 확률변수 X X XX 의 주변확률이며, 그 확률을 나타내는 함 수를 주변확률함수라 한다.
每个离散随机变量的分布可以从两个离散随机变量的联合概率分布获得,并且每个离散随机变量的分布被定义为边际概率分布。这里 Y Y YY 所有可能值的组合函数之和是一个随机变量。 X X XX 它是 的边际概率,表示该概率的函数称为边际概率函数。
P X ( x ) = y P X , Y ( x , y ) P X ( x ) = y P X , Y ( x , y ) P_(X)(x)=sum_(y)P_(X,Y)(x,y)P_{X}(x)=\sum_{y} P_{X, Y}(x, y)
한편, X X XX 가 취할 수 있는 모든 값에 대한 결합확률의 합은 확률변수 Y Y YY 의 주변확률이며, 그 확률을 나타내는 함수를 주변확률함수라 한다.
一边, X X XX 所有可能值的联合概率之和是一个随机变量。 Y Y YY 它是 的边际概率,表示该概率的函数称为边际概率函数。
P Y ( y ) = x P X , Y ( x , y ) P Y ( y ) = x P X , Y ( x , y ) P_(Y)(y)=sum_(x)P_(X,Y)(x,y)P_{Y}(y)=\sum_{x} P_{X, Y}(x, y)
  • 수입차의 엔진 크기와 차바퀴 크기의 관계 예
    进口车发动机尺寸与轮毂尺寸关系示例
출처 : 셔터스록 资料来源:百叶窗摇滚

표 5-7 차바퀴 크기 ( X ) ( X ) (X)(X) 와 엔진 크기 ( Y ) ( Y ) (Y)(Y) 에 대한 결합확률
表5-7 车轮尺寸 ( X ) ( X ) (X)(X) 和发动机尺寸 ( Y ) ( Y ) (Y)(Y) 组合概率为

X X XX Y Y YY 4기통 4缸 6 기통 6缸 8기통 8缸
14 인치 14英寸 0.16 0.19 0.12
16 인치 16英寸 0.14 0.19 0.20
X Y 4기통 6 기통 8기통 14 인치 0.16 0.19 0.12 16 인치 0.14 0.19 0.20 | $X$ | $Y$ | 4기통 | 6 기통 | 8기통 | | :---: | :---: | :---: | :---: | :---: | | 14 인치 | 0.16 | 0.19 | 0.12 | | | 16 인치 | 0.14 | 0.19 | 0.20 | |
P X ( 14 ) = P X , Y ( 14 , 4 ) + P X , Y ( 14 , 6 ) + P X , Y ( 14 , 8 ) = 0.16 + 0.19 + 0.12 = 0.47 P X ( 16 ) = P X , Y ( 16 , 4 ) + P X , Y ( 16 , 6 ) + P X , Y ( 16 , 8 ) = 0.14 + 0.19 + 0.20 = 0.53 P X ( 14 ) = P X , Y ( 14 , 4 ) + P X , Y ( 14 , 6 ) + P X , Y ( 14 , 8 ) = 0.16 + 0.19 + 0.12 = 0.47 P X ( 16 ) = P X , Y ( 16 , 4 ) + P X , Y ( 16 , 6 ) + P X , Y ( 16 , 8 ) = 0.14 + 0.19 + 0.20 = 0.53 {:[P_(X)(14)=P_(X,Y)(14","4)+P_(X,Y)(14","6)+P_(X,Y)(14","8)],[=0.16+0.19+0.12=0.47],[P_(X)(16)=P_(X,Y)(16","4)+P_(X,Y)(16","6)+P_(X,Y)(16","8)],[=0.14+0.19+0.20=0.53]:}\begin{aligned} P_{X}(14) & =P_{X, Y}(14,4)+P_{X, Y}(14,6)+P_{X, Y}(14,8) \\ & =0.16+0.19+0.12=0.47 \\ P_{X}(16) & =P_{X, Y}(16,4)+P_{X, Y}(16,6)+P_{X, Y}(16,8) \\ & =0.14+0.19+0.20=0.53 \end{aligned}

이산확률변수의 결합확률함수 특성 离散随机变量的联合概率函数的特征

  1. P X , Y ( x , y ) 0 P X , Y ( x , y ) 0 P_(X,Y)(x,y) >= 0P_{X, Y}(x, y) \geq 0
  2. X X XX Y Y YY 가 동시에 취할 수 있는 값들에 대한 결합확률 P X , Y ( x , y ) P X , Y ( x , y ) P_(X,Y)(x,y)P_{X, Y}(x, y) 의 총합은 1 이다.
    X X XX Y Y YY 可以同时取值的联合概率 P X , Y ( x , y ) P X , Y ( x , y ) P_(X,Y)(x,y)P_{X, Y}(x, y) 总和是1。

    확률변수 X X XX 가 어떤 특정한 값 x x xx 를 취한 것이 전제된 상태에서 확률변수 Y Y YY 가 어떤 특정 한 값 y y yy 를 취할 조건부확률은 다음 조건부확률함수에 의해 표현된다.
    随机变量 X X XX 是一些特定的值 x x xx 取随机变量的前提下 Y Y YY 是一些特定的值 y y yy 采取的条件概率由以下条件概率函数表示。
P Y X ( y x ) = P X , Y ( x , y ) P X ( x ) P Y X ( y x ) = P X , Y ( x , y ) P X ( x ) P_(Y∣X)(y∣x)=(P_(X,Y)(x,y))/(P_(X)(x))P_{Y \mid X}(y \mid x)=\frac{P_{X, Y}(x, y)}{P_{X}(x)}
표 5-8 수입차 바퀴 크기 X X XX 가 주어졌을 때 엔진 크기 Y Y YY 의 조건부확률
表5-8 进口汽车轮毂尺寸 X X XX 给定发动机尺寸 Y Y YY 的条件概率
X X XX Y Y YY 4기통 4缸 6 기통 6缸 8 기통 8缸
14 인치 14英寸 0.34 0.40 0.26
16 인치 16英寸 0.26 0.36 0.38
X Y 4기통 6 기통 8 기통 14 인치 0.34 0.40 0.26 16 인치 0.26 0.36 0.38 | $X$ | $Y$ | 4기통 | 6 기통 | 8 기통 | | :---: | ---: | :---: | :---: | :---: | | 14 인치 | | 0.34 | 0.40 | 0.26 | | 16 인치 | 0.26 | 0.36 | 0.38 | |
만약 두 확률변수 X X XX Y Y YY 의 결합확률함수가 각 주변확률함수의 곱과 일치하면 두 확률 변수 X X XX Y Y YY 는 봉계적으로 독립이다. 즉
如果两个随机变量 X X XX Y Y YY 如果 的联合概率函数等于每个边际概率函数的乘积,则两个随机变量 X X XX Y Y YY 是层级独立的。换句话说
P X , Y ( x , y ) = P X ( x ) P Y ( y ) P X , Y ( x , y ) = P X ( x ) P Y ( y ) P_(X,Y)(x,y)=P_(X)(x)P_(Y)(y)P_{X, Y}(x, y)=P_{X}(x) P_{Y}(y)

제5절 공분산과 상관계수 第五节 协方差和相关系数

두 확률변수 사이의 관계를 나타내는 결합확률분포와 관련된 통계분석으로 공분산 (covariance)이 있다. 공분산이란 두 확률변수 X , Y X , Y X,YX, Y 가 있을 때 각각의 확률변수와 그 확률변수 의 평균과의 편차를 서로 곱한 결과 ( X μ X ) ( Y μ Y ) X μ X Y μ Y (X-mu_(X))(Y-mu_(Y))\left(X-\mu_{X}\right)\left(Y-\mu_{Y}\right) 에 기댓값을 취하는 것으로 정의된다.
协方差是与联合概率分布相关的统计分析,表示两个随机变量之间的关系。协方差是两个随机变量 X , Y X , Y X,YX, Y 如果存在,则为每个随机变量与该随机变量均值的偏差相乘的结果。 ( X μ X ) ( Y μ Y ) X μ X Y μ Y (X-mu_(X))(Y-mu_(Y))\left(X-\mu_{X}\right)\left(Y-\mu_{Y}\right) 它被定义为取期望值。

공분산 协方差

Cov ( X , Y ) = E [ ( X μ X ) ( Y μ Y ) ] = E ( X Y ) μ X μ Y Cov ( X , Y ) = E X μ X Y μ Y = E ( X Y ) μ X μ Y {:[Cov(X","Y)=E[(X-mu_(X))(Y-mu_(Y))]],[=E(XY)-mu_(X)mu_(Y)]:}\begin{aligned} \operatorname{Cov}(X, Y) & =E\left[\left(X-\mu_{X}\right)\left(Y-\mu_{Y}\right)\right] \\ & =E(X Y)-\mu_{X} \mu_{Y} \end{aligned}
앞의 예에서 바퀴 크기 ( X ) ( X ) (X)(X) 와 엔진 크기 ( Y ) ( Y ) (Y)(Y) 의 공분산을 계산해 보자.
上一个示例中的车轮尺寸 ( X ) ( X ) (X)(X) 和发动机尺寸 ( Y ) ( Y ) (Y)(Y) 我们来计算 的协方差。
μ X = E ( X ) = x x P X ( x ) = ( 14 × 0.47 ) + ( 16 × 0.53 ) = 15.06 μ Y = E ( Y ) = y y P Y ( y ) = ( 4 × 0.30 ) + ( 6 × 0.38 ) + ( 8 × 0.32 ) = 6.04 E ( X Y ) = x y x y P X , Y ( x , y ) = ( 14 × 4 × 0.16 ) + ( 14 × 6 × 0.19 ) + ( 14 × 8 × 0.12 ) + ( 16 × 4 × 0.14 ) + ( 16 × 6 × 0.19 ) + ( 16 × 8 × 0.20 ) = 91.16 μ X = E ( X ) = x x P X ( x ) = ( 14 × 0.47 ) + ( 16 × 0.53 ) = 15.06 μ Y = E ( Y ) = y y P Y ( y ) = ( 4 × 0.30 ) + ( 6 × 0.38 ) + ( 8 × 0.32 ) = 6.04 E ( X Y ) = x y x y P X , Y ( x , y ) = ( 14 × 4 × 0.16 ) + ( 14 × 6 × 0.19 ) + ( 14 × 8 × 0.12 ) + ( 16 × 4 × 0.14 ) + ( 16 × 6 × 0.19 ) + ( 16 × 8 × 0.20 ) = 91.16 {:[mu_(X)=E(X)=sum_(x)xP_(X)(x)=(14 xx0.47)+(16 xx0.53)=15.06],[mu_(Y)=E(Y)=sum_(y)yP_(Y)(y)=(4xx0.30)+(6xx0.38)+(8xx0.32)=6.04],[E(XY)=sum_(x)sum_(y)xyP_(X,Y)(x","y)],[=(14 xx4xx0.16)+(14 xx6xx0.19)+(14 xx8xx0.12)],[+(16 xx4xx0.14)+(16 xx6xx0.19)+(16 xx8xx0.20)],[=91.16]:}\begin{aligned} \mu_{X}= & E(X)=\sum_{x} x P_{X}(x)=(14 \times 0.47)+(16 \times 0.53)=15.06 \\ \mu_{Y}= & E(Y)=\sum_{y} y P_{Y}(y)=(4 \times 0.30)+(6 \times 0.38)+(8 \times 0.32)=6.04 \\ E(X Y)= & \sum_{x} \sum_{y} x y P_{X, Y}(x, y) \\ = & (14 \times 4 \times 0.16)+(14 \times 6 \times 0.19)+(14 \times 8 \times 0.12) \\ & +(16 \times 4 \times 0.14)+(16 \times 6 \times 0.19)+(16 \times 8 \times 0.20) \\ = & 91.16 \end{aligned}
따라서 X X XX Y Y YY 의 공분산은 다음과 같다.
因此 X X XX Y Y YY 的协方差如下。
Cov ( X , Y ) = E ( X Y ) μ X μ Y = 91.16 ( 15.06 × 6.04 ) = 0.198 Cov ( X , Y ) = E ( X Y ) μ X μ Y = 91.16 ( 15.06 × 6.04 ) = 0.198 {:[Cov(X","Y)=E(XY)-mu_(X)mu_(Y)],[=91.16-(15.06 xx6.04)=0.198]:}\begin{aligned} \operatorname{Cov}(X, Y) & =E(X Y)-\mu_{X} \mu_{Y} \\ & =91.16-(15.06 \times 6.04)=0.198 \end{aligned}
공분산이 0 보다 크므로 바퀴 크기가 크면(작으면) 엔진 크기도 커짐(작아짐)을 알 수 있다. 즉 바퀴 크기와 엔진 크기는 서로 양의 상관관계가 있음을 나타낸다.
由于协方差大于0,可以看出,随着车轮尺寸变大(变小),发动机尺寸也变大(变小)。换句话说,这表明车轮尺寸和发动机尺寸呈正相关。

공분산과 통계적 독립 协方差和统计独立性

만일 두 확률변수가 통계적으로 독립이면 두 확률변수의 공분산은 반드시 0 이다. 그러 나 두 확률변수의 공분산이 0 이라고 해서 두 확률변수가 반드시 독립은 아니다.
如果两个随机变量在统计上独立,则两个随机变量的协方差必然为 0。然而,正因为两个随机变量的协方差为0,所以这两个随机变量并不一定是独立的。
두 확률변수의 공분산이 0이라는 의미는 두 확률변수 간에 선형 상관(linear correlation)이 존재하지 않는다는 것이기 때문에, 두 확률변수가 아무런 관계도 갖지 않는다는 것을 의미하지는 않는다. 예를 들어 두 확률변수가 완전한 비선형 상관관계 를 갖지만 공분산은 0이 되는 그림 5-6을 살펴보자.
由于两个随机变量的协方差为0,意味着两个随机变量之间不存在线性相关,但并不意味着两个随机变量没有关系。例如,让我们看一下图 5-6,其中两个随机变量具有完美的非线性相关性,但它们的协方差为 0。

그림 5-6 图5-6
완전한 비선형 상관관계 完全非线性相关

X X XX Y Y YY 가 통계적으로 독립이 아닌 경우
X X XX Y Y YY 不具有统计独立性
Var ( X + Y ) = Var ( X ) + Var ( Y ) + 2 Cov ( X , Y ) Var ( X Y ) = Var ( X ) + Var ( Y ) 2 Cov ( X , Y ) Var ( X + Y ) = Var ( X ) + Var ( Y ) + 2 Cov ( X , Y ) Var ( X Y ) = Var ( X ) + Var ( Y ) 2 Cov ( X , Y ) {:[Var(X+Y)=Var(X)+Var(Y)+2*Cov(X","Y)],[Var(X-Y)=Var(X)+Var(Y)-2*Cov(X","Y)]:}\begin{aligned} & \operatorname{Var}(X+Y)=\operatorname{Var}(X)+\operatorname{Var}(Y)+2 \cdot \operatorname{Cov}(X, Y) \\ & \operatorname{Var}(X-Y)=\operatorname{Var}(X)+\operatorname{Var}(Y)-2 \cdot \operatorname{Cov}(X, Y) \end{aligned}

제5절 공분산고 상관계수 第五节 协方差和相关系数

한 전자 대리점에서 그래픽 소프트웨어의 주문량(X)과 메모리칩의 주문량 ( Y ) ( Y ) (Y)(Y) 을 한 달 동 안 관찰하여 다음과 같은 결과를 얻었다.
电子经销商处图形软件的订单数量 (X) 和存储芯片的订单数量 ( Y ) ( Y ) (Y)(Y) 观察1个月,得到以下结果。
Var ( X ) = 4 , Var ( Y ) = 0.25 , Cov ( X , Y ) = 0.1 Var ( X ) = 4 , Var ( Y ) = 0.25 , Cov ( X , Y ) = 0.1 Var(X)=4,Var(Y)=0.25,Cov(X,Y)=0.1\operatorname{Var}(X)=4, \operatorname{Var}(Y)=0.25, \operatorname{Cov}(X, Y)=0.1
관찰 결과에 따르면 소프트웨어의 주문량과 메모리칩의 주문량은 서로 정의 관계가 있 다. 이 경우 소프트웨어 주문량과 메모리칩 주문량의 합의 분산은 얼마인가?
根据观察结果,软件订单量与存储芯片订单量之间存在正相关关系。那么,软件订单数量与存储芯片订单数量之和的方差是多少?
두 확률변수 X X XX Y Y YY 의 상관계수는 ρ ρ rho\rho 로 표현하며, 다음과 같이 정의한다.
两个随机变量 X X XX Y Y YY 相关系数为 ρ ρ rho\rho 它的表达和定义如下。
ρ = Cov ( X , Y ) σ X σ Y ρ = Cov ( X , Y ) σ X σ Y rho=(Cov(X,Y))/(sigma_(X)sigma_(Y))\rho=\frac{\operatorname{Cov}(X, Y)}{\sigma_{X} \sigma_{Y}}
ρ = 0 : X ρ = 0 : X rho=0:X\rho=0: X Y Y YY 간에 선형 상관관계 없음
ρ = 0 : X ρ = 0 : X rho=0:X\rho=0: X Y Y YY 之间不存在线性相关性

ρ = 1 : X ρ = 1 : X rho=1:X\rho=1: X Y Y YY 간에 완전한 정의 선형 상관관계
ρ = 1 : X ρ = 1 : X rho=1:X\rho=1: X Y Y YY 之间完全正线性相关

ρ = 1 : X ρ = 1 : X rho=-1:X\rho=-1: X Y Y YY 간에 완전한 역의 선형 상관관계
ρ = 1 : X ρ = 1 : X rho=-1:X\rho=-1: X Y Y YY 之间的完美逆线性相关

그림 5-7 图5-7

상관계수와 相关系数和
산포도 散点图

제5절 궁분사과 상관계수 第 5 节 Gungbun Apple 相关系数

앞의 예에서 그래픽 소프트웨어의 주문량(X)과 메모리칩의 주문량(Y)에 대한 상관계수 를 계산하고 두 변수의 관계를 설명하라.
在前面的示例中,计算图形软件订购量 (X) 和存储芯片订购量 (Y) 的相关系数,并解释两个变量之间的关系。
ρ = Cov ( X , Y ) σ X σ Y = 0.1 2 × 0.5 = 0.1 ρ = Cov ( X , Y ) σ X σ Y = 0.1 2 × 0.5 = 0.1 rho=(Cov(X,Y))/(sigma_(X)sigma_(Y))=(0.1)/(2xx0.5)=0.1\rho=\frac{\operatorname{Cov}(X, Y)}{\sigma_{\mathrm{X}} \sigma_{Y}}=\frac{0.1}{2 \times 0.5}=0.1
어떤 투자자는 투자 위험을 줄이기 위해 투자금 1 억 원을 모두 한 주식에 투자하지 않고 분산투자를 결정하고, 1 억 원 중 4,500 만 원은 S S SS 회사 주식에, 5,500 만 원은 P 회사 주식에 투자하였다. S 회사 주식의 기대수익률과 표준편차는 각각 9 % 9 % 9%9 \% 12 % , P 12 % , P 12%,P12 \%, \mathrm{P} 회사 주식의 기대 수익률과 표준편차는 각각 11 % 11 % 11%11 \% 20 % 20 % 20%20 \% 로 예상한다.
为了降低投资风险,一些投资者决定进行多元化投资,而不是将其全部 1 亿韩元投资于一只股票,而这 1 亿韩元中的 4500 万韩元投资于一只股票。 S S SS 该公司的股票中,5500万韩元投资于P公司的股票。 S公司股票的预期收益和标准差分别为 9 % 9 % 9%9 \% 12 % , P 12 % , P 12%,P12 \%, \mathrm{P} 公司股票的预期收益和标准差分别为 11 % 11 % 11%11 \% 20 % 20 % 20%20 \% 预计
  1. 이 투자자의 기대수익률은 얼마인가? 这位投资者的预期回报率是多少?
  2. 두 주식의 수익률이 서로 독립이라면 이 투자자의 수익률 분산은 얼마인가?
    如果两只股票的回报是独立的,那么该投资者的回报方差是多少?
  3. 두 주식의 수익률의 상관계수가 0.2 라면 이 투자자의 수익률 분산은 얼마인가?
    如果两只股票的回报之间的相关系数为 0.2,那么该投资者的回报离散度是多少?

    어떤 임의 시행(trial)의 결과는 서로 배타적이며 전체를 포괄하는(총체적으로 망라된) 두 가지 사건으로만 나타난다. 동전을 던지는 시행의 경우 그 결과는 동전의 앞면 혹은 뒷면이 며, 이 두 사건은 서로 배타적이고 전체를 포괄한다. 동전을 던지는 시행 외에도 컴퓨터 메모 리를 생산하는 공장에서 생산된 제품이 정상품 혹은 불량품인지 판정하는 시행, 어느 회사원 을 임의로 선정하였을 때 그 회사원이 여자 혹은 남자인지 성별 확인 시행, 공인회계사 시험 의 결과가 합격 혹은 불합격인지 합격 여부를 확인하는 시행 등은 모두 두 가지 결과만을 기 대할 수 있다. 이런 시행을 베르누이 시행(Bernoulli trial)이라고 하며, 편의상 이 두 가지 결과 중 하나는 ‘성공’, 나머지 하나는 '실패’로 구별할 수 있다. 여기서 성공과 실패의 의미는 단지 두 가지 결과를 나타내는 상황적 표현이며 좋고 나뼘을 의미하지는 않는다. 성공의 확률을 p p pp 로 나타내면 실패의 확률은 1 p 1 p 1-p1-p 가 되며, 성공과 실패가 나타날 확률의 합은 1 이 된다. 이때 얻어진 확률변수 X X XX 는 베르누이분포(Bernoulli distribution)를 이루게 된다.
    任何随机试验的结果仅由两个相互排斥且包罗万象的事件来代表。在抛硬币试验中,结果要么是正面,要么是反面,这两个事件是相互排斥和包容的。除了抛硬币试验之外,还有判断计算机存储器制造工厂生产的产品是正常产品还是缺陷产品的试验、随机选择办公室工作人员是女性还是男性的试验、以及注册会计师考试的结果 在所有情况下,例如通过或失败,只能预期两个结果。这种类型的试验称为伯努利试验,为了方便起见,可以将这两个结果之一区分为“成功”,另一个称为“失败”。这里,成功和失败的含义只是表示两种结果的情境表达,并不意味着好或坏。成功的概率 p p pp 表示为 ,失败概率为 1 p 1 p 1-p1-p ,成功和失败的概率之和为 1。此时得到的随机变量 X X XX 形成伯努利分布。
베르누이 시행의 결과가 성공이면 X X XX 는 1 , 실패이면 0 의 값을 갖는다고 가정하면, 한 번 베 르누이 시행으로 값이 결정되는 확률변수 X X XX 의 확률함수는 베르누이분포의 확률함수이다.
如果伯努利试验的结果是成功的,那么 X X XX 是一个随机变量,其值由一次伯努利试验确定,假设失败时其值为 1 和 0。 X X XX 的概率函数是伯努利分布的概率函数。

베르누이분포의 확률함수 伯努利分布的概率函数

P X ( x ) = p x ( 1 p ) 1 x ( 여기서 x = 0 , 1 ) P X ( x ) = p x ( 1 p ) 1 x (  여기서  x = 0 , 1 ) P_(X)(x)=p^(x)(1-p)^(1-x)(" 여기서 "x=0,1)P_{X}(x)=p^{x}(1-p)^{1-x}(\text { 여기서 } x=0,1)
따라서 베르누이분포를 따르는 확률변수 X X XX 의 평균은 다음과 같다.
因此,服从伯努利分布的随机变量 X X XX 平均值如下:
μ X = E ( X ) = 1 p + 0 ( 1 p ) = p μ X = E ( X ) = 1 p + 0 ( 1 p ) = p mu_(X)=E(X)=1*p+0*(1-p)=p\mu_{\mathrm{X}}=E(X)=1 \cdot p+0 \cdot(1-p)=p
그리고 E ( X 2 ) = 1 2 p + 0 2 ( 1 p ) = p E X 2 = 1 2 p + 0 2 ( 1 p ) = p E(X^(2))=1^(2)*p+0^(2)*(1-p)=pE\left(X^{2}\right)=1^{2} \cdot p+0^{2} \cdot(1-p)=p 이므로 확률변수 X X XX 의 분산은 다음과 같다.
E ( X 2 ) = 1 2 p + 0 2 ( 1 p ) = p E X 2 = 1 2 p + 0 2 ( 1 p ) = p E(X^(2))=1^(2)*p+0^(2)*(1-p)=pE\left(X^{2}\right)=1^{2} \cdot p+0^{2} \cdot(1-p)=p 所以随机变量 X X XX 的方差如下。
σ X 2 = Var ( X ) = E ( X 2 ) μ X 2 = p p 2 = p ( 1 p ) σ X 2 = Var ( X ) = E X 2 μ X 2 = p p 2 = p ( 1 p ) sigma_(X)^(2)=Var(X)=E(X^(2))-mu_(X)^(2)=p-p^(2)=p(1-p)\sigma_{X}^{2}=\operatorname{Var}(X)=E\left(X^{2}\right)-\mu_{X}^{2}=p-p^{2}=p(1-p)
베르누이분포의 평균 베르누이분포의 분산 베르누이분포의 표준편차
伯努利分布的平均值 伯努利分布的方差 伯努利分布的标准差
μ X = E ( X ) = p σ 2 X = Var ( X ) = p ( 1 p ) σ X = p ( 1 p ) μ X = E ( X ) = p σ 2 X = Var ( X ) = p ( 1 p ) σ X = p ( 1 p ) {:[mu_(X)=E(X)=p],[sigma^(2)_(X)=Var(X)=p*(1-p)],[sigma_(X)=sqrt(p*(1-p))]:}\begin{aligned} & \mu_{\mathrm{X}}=E(\mathrm{X})=p \\ & \sigma^{2}{ }_{\mathrm{X}}=\operatorname{Var}(\mathrm{X})=p \cdot(1-p) \\ & \sigma_{\mathrm{X}}=\sqrt{p \cdot(1-p)} \end{aligned}
이제 베르누이 시행을 한 번만 하는 것이 아니라 서로 독립적인 베르누이 시행을 여러 번 반복할 때의 성공 횟수를 고려해 보자. 그리고 이 성공의 횟수를 확률변수 X X XX 로 표현하면 X X XX 는 이항확률변수(binomial random variable)가 된다. 베르누이 시행을 n n nn 번 반복한다면 이항확률변 수는 0 , 1 , 2 , , n 0 , 1 , 2 , , n 0,1,2,cdots,n0,1,2, \cdots, n 중에서 어떤 하나의 값을 취하게 되므로 이산확률변수이며, 이항확률변수 의 확률분포를 이항확률분포(binomial probability distribution) 또는 간단히 이항분포라고 한다.
现在让我们考虑一下当我们多次重复伯努利试验时的成功次数,彼此独立,而不是仅仅一次伯努利试验。而这个成功次数是一个随机变量 X X XX 如果表示为 X X XX 变成二项式随机变量。伯努利试验 n n nn 如果重复多次,二项式随机变量为 0 , 1 , 2 , , n 0 , 1 , 2 , , n 0,1,2,cdots,n0,1,2, \cdots, n 它是一种离散随机变量,因为它取多个值中的一个值,二项式随机变量的概率分布称为二项式概率分布或简称二项式分布。
  • 보험계약 체결 예 签订保险合同示例

표 5-9 방문자가 3명일 때의 이항분포
表5-9 访客数为3时的二项式分布

계약 체결의 수 ( x ) ( x ) (x)(x) 签订的合同数量 ( x ) ( x ) (x)(x) P ( x ) P ( x ) P(x)P(x)
0 ( 1 p ) 3 ( 1 p ) 3 (1-p)^(3)(1-p)^{3}
1 3 p ( 1 p ) 2 3 p ( 1 p ) 2 3p(1-p)^(2)3 p(1-p)^{2}
2 3 p 2 ( 1 p ) 3 p 2 ( 1 p ) 3p^(2)(1-p)3 p^{2}(1-p)
3 p 3 p 3 p^(3)p^{3}
계약 체결의 수 (x) P(x) 0 (1-p)^(3) 1 3p(1-p)^(2) 2 3p^(2)(1-p) 3 p^(3)| 계약 체결의 수 $(x)$ | $P(x)$ | | :---: | :---: | | 0 | $(1-p)^{3}$ | | 1 | $3 p(1-p)^{2}$ | | 2 | $3 p^{2}(1-p)$ | | 3 | $p^{3}$ |
S S S S S x F F F F ( n x ) P ( S ) P ( S ) P ( S ) x P ( F ) P ( F ) P ( F ) ( n x ) = p × p p × ( 1 p ) × ( 1 p ) ( 1 p ) = p x ( 1 p ) n x n C x = n ! x ! ( n x ) !  S S S   S S  x  번   F F   F F  ( n x )  번  P ( S ) P ( S ) P ( S ) x  번  P ( F ) P ( F ) P ( F ) ( n x )  번  = p × p p × ( 1 p ) × ( 1 p ) ( 1 p ) = p x ( 1 p ) n x n C x = n ! x ! ( n x ) ! {:[ubrace(" S S S "cdots" S S "ubrace)_(x" 번 ")ubrace(" F F "cdots" F F "ubrace)_((n-x)" 번 ")],[ubrace(P(S)P(S)cdots P(S)ubrace)_(x" 번 ")ubrace(P(F)P(F)cdots P(F)ubrace)_((n-x)" 번 ")],[=p xx p cdots p xx(1-p)xx(1-p)cdots(1-p)],[=p^(x)(1-p)^(n-x)],[_(n)C_(x)=(n!)/(x!(n-x)!)]:}\begin{aligned} & \underbrace{\text { S S S } \cdots \text { S S }}_{x \text { 번 }} \underbrace{\text { F F } \cdots \text { F F }}_{(n-x) \text { 번 }} \\ & \underbrace{P(S) P(S) \cdots P(S)}_{x \text { 번 }} \underbrace{P(F) P(F) \cdots P(F)}_{(n-x) \text { 번 }} \\ & =p \times p \cdots p \times(1-p) \times(1-p) \cdots(1-p) \\ & =p^{x}(1-p)^{n-x} \\ & { }_{n} C_{x}=\frac{n!}{x!(n-x)!} \end{aligned}

이항분포의 확률함수 二项式分布的概率函数

P X ( x ) = n C x p x ( 1 p ) n x P X ( x ) = n C x p x ( 1 p ) n x P_(X)(x)=_(n)C_(x)p^(x)(1-p)^(n-x)P_{X}(x)={ }_{n} C_{x} p^{x}(1-p)^{n-x}
재벌의 지배구조 개선에 대한 한 신문사의 여론조사 결과, 우리 국민 중 80 % 80 % 80%80 \% 는 강도 높 은 재벌의 지배구조 개선에 찬성하고 20 % 20 % 20%20 \% 는 반대하는 것으로 나타났다고 하자. 임의로 5 명이 선택되었을 때 3 명이 반대할 확률은 얼마인가? 또한 임의로 선택된 5 명 중 3 명 이 상이 반대할 확률은 얼마인가?
韩国民众对改善企业集团治理结构的报纸民意调查结果显示 80 % 80 % 80%80 \% 赞成完善高强度企业集团的治理结构 20 % 20 % 20%20 \% 假设事实证明这是反对的。如果随机选择 5 个人,其中 3 人反对的概率是多少?另外,随机抽取的 5 个人中有超过 3 人投反对票的概率是多少?
이항분포의 평균 μ X = E ( X ) = n p 이항분포의 분산 σ X 2 = Var ( X ) = n p ( 1 p ) 이항분포의 표준편차 σ X = n p ( 1 p )  이항분포의 평균  μ X = E ( X ) = n p  이항분포의 분산  σ X 2 = Var ( X ) = n p ( 1 p )  이항분포의 표준편차  σ X = n p ( 1 p ) {:[" 이항분포의 평균 ",mu_(X)=E(X)=n*p],[" 이항분포의 분산 ",sigma_(X)^(2)=Var(X)=n*p*(1-p)],[" 이항분포의 표준편차 ",sigma_(X)=sqrt(n*p*(1-p))]:}\begin{array}{ll} \text { 이항분포의 평균 } & \mu_{\mathrm{X}}=E(X)=n \cdot p \\ \text { 이항분포의 분산 } & \sigma_{\mathrm{X}}^{2}=\operatorname{Var}(X)=n \cdot p \cdot(1-p) \\ \text { 이항분포의 표준편차 } & \sigma_{\mathrm{X}}=\sqrt{n \cdot p \cdot(1-p)} \end{array}

큰 수의 법칙 大数定律

베르누이 시행에서 성공의 수학적 확률이 p p pp 인 독립시행을 n n nn 번 반복할 때 성공의 횟수를 확률변수 X X XX 라 하면 임의의 작은 양수 ϵ ϵ epsilon\epsilon 에 대해 다음이 성립한다.
伯努利试验成功的数学概率是 p p pp 实行独立性 n n nn 随机变量是重复时的成功次数 X X XX 假设它是一个任意小的正数。 ϵ ϵ epsilon\epsilon 以下情况适用于:
lim n P ( | X / n p | < ϵ ) = 1 lim n P ( | X / n p | < ϵ ) = 1 lim_(n rarr oo)P(|X//n-p| < epsilon)=1\lim _{n \rightarrow \infty} P(|X / n-p|<\epsilon)=1

기하분포의 확률함수 几何分布的概率函数

P X ( x ) = p ( 1 p ) x 1 , x = 1 , 2 , 3 , P X ( x ) = p ( 1 p ) x 1 , x = 1 , 2 , 3 , P_(X)(x)=p*(1-p)^(x-1),quad x=1,2,3,cdotsP_{X}(x)=p \cdot(1-p)^{x-1}, \quad x=1,2,3, \cdots
기하분포하는 확률변수 X X XX 평균은 다음과 같다.
几何分布随机变量 X X XX 平均值如下:
μ X = E ( X ) = x = 1 x ( 1 p ) x 1 p = 1 p 2 p = 1 p μ X = E ( X ) = x = 1 x ( 1 p ) x 1 p = 1 p 2 p = 1 p mu_(X)=E(X)=sum_(x=1)^(oo)x*(1-p)^(x-1)*p=(1)/(p^(2))*p=(1)/(p)\mu_{X}=E(X)=\sum_{x=1}^{\infty} x \cdot(1-p)^{x-1} \cdot p=\frac{1}{p^{2}} \cdot p=\frac{1}{p}
그리고 E ( X 2 ) = x = 1 x 2 p ( 1 p ) x 1 = 2 p P 2 E X 2 = x = 1 x 2 p ( 1 p ) x 1 = 2 p P 2 E(X^(2))=sum_(x=1)^(oo)x^(2)*p*(1-p)^(x-1)=(2-p)/(P^(2))E\left(X^{2}\right)=\sum_{x=1}^{\infty} x^{2} \cdot p \cdot(1-p)^{x-1}=\frac{2-p}{P^{2}} 이므로 확률변수 X X XX 의 분산은 다음과 같다.
E ( X 2 ) = x = 1 x 2 p ( 1 p ) x 1 = 2 p P 2 E X 2 = x = 1 x 2 p ( 1 p ) x 1 = 2 p P 2 E(X^(2))=sum_(x=1)^(oo)x^(2)*p*(1-p)^(x-1)=(2-p)/(P^(2))E\left(X^{2}\right)=\sum_{x=1}^{\infty} x^{2} \cdot p \cdot(1-p)^{x-1}=\frac{2-p}{P^{2}} 所以随机变量 X X XX 的方差如下。
σ X 2 = Var ( X ) = E ( X 2 ) μ X 2 = 2 p p 2 1 p 2 = 1 p p 2 σ X 2 = Var ( X ) = E X 2 μ X 2 = 2 p p 2 1 p 2 = 1 p p 2 sigma_(X)^(2)=Var(X)=E(X^(2))-mu_(X)^(2)=(2-p)/(p^(2))-(1)/(p^(2))=(1-p)/(p^(2))\sigma_{X}^{2}=\operatorname{Var}(X)=E\left(X^{2}\right)-\mu_{X}^{2}=\frac{2-p}{p^{2}}-\frac{1}{p^{2}}=\frac{1-p}{p^{2}}

기하분포의 평균 几何分布的平均值

기하분포의 분산 几何分布的方差

기하분포의 표준편차 几何分布的标准差
μ X = E ( X ) = 1 p μ X = E ( X ) = 1 p mu_(X)=E(X)=(1)/(p)\mu_{\mathrm{X}}=E(X)=\frac{1}{p}
σ X 2 = Var ( X ) = 1 p p 2 σ X = 1 p p 2 σ X 2 = Var ( X ) = 1 p p 2 σ X = 1 p p 2 {:[sigma_(X)^(2)=Var(X)=(1-p)/(p^(2))],[sigma_(X)=sqrt((1-p)/(p^(2)))]:}\begin{aligned} & \sigma_{X}^{2}=\operatorname{Var}(X)=\frac{1-p}{p^{2}} \\ & \sigma_{X}=\sqrt{\frac{1-p}{p^{2}}} \end{aligned}
한 정유회사는 사업성 있는 새로운 유전을 발견하기 위해 석유가 매장되어 있을 것 같은 후보지를 선정하여 시추를 진행하고 있다. 이 정유회사가 시추하였을 때 유전을 발견할 확률은 0.1 이라고 한다.
一家炼油公司正在通过选择可能含有石油的候选地点进行钻探,以发现具有商业潜力的新油田。据说这家石油公司钻探时发现油田的概率是0.1。
  1. 이 정유회사가 3 번의 시추를 시도한 후 처음으로 유전을 발견할 확률은 얼마인가? 단, 각 시추는 서로 독립적으로 이루어진다.
    石油公司在三次钻探后发现第一口油井的概率是多少?然而,每次钻孔都是彼此独立进行的。
  2. 첫 번째 유전을 발견하기 위해 반복되는 시추횟수를 확률변수 X X XX 로 정의하면 X X XX 의 기 댓값과 분산은 얼마인가?
    随机变量是发现第一个油田的重复钻井次数。 X X XX 如果定义为 X X XX 的期望值和方差是多少?

포아송 실험 泊松实验

  1. 독립성 : 어떤 구간에서 일어날 성공의 수는 다른 구간에서 일어날 성공의 수와 서로 독립적이다.
    独立性:某一部分中发生的成功次数独立于其他部分中发生的成功次数。
  2. 비례성 : 같은 길이의 구간에서 일어날 성공의 확률은 같으며, 성공의 수는 구간의 길 이에 비례한다.
    比例性:相同长度的路段发生成功的概率相同,成功的次数与路段的长度成正比。
  3. 비군집성 : 구간이 아주 작아지면 두 번 이상의 성공이 일어날 확률은 0 에 근접한다.
    非聚类:当间隔变得非常小时,两次或多次成功的概率接近于0。

포아송분포 泊松分布

단위 구간 내에서 어떤 특별한 사건이 평균 μ μ mu\mu 번 일어난다면, 그 구간 내에서 일어나는 사건의 수의 분포를 포아송분포라고 정의한다. 사건의 발생 수를 나타내는 확률변수 X X XX 의 확률함수는 다음과 같다.
单位间隔内的特定事件被平均 μ μ mu\mu 如果发生一次,则该间隔内发生的事件数量的分布被定义为泊松分布。表示事件发生次数的随机变量 X X XX 的概率函数如下。
P X ( x ) = μ x x ! e μ P X ( x ) = μ x x ! e μ P_(X)(x)=(mu^(x))/(x!)e^(-mu)P_{X}(x)=\frac{\mu^{x}}{x!} e^{-\mu}
여기서 x x xx 는 사건의 발생 수 ( x = 0 , 1 , 2 , ) , μ ( x = 0 , 1 , 2 , ) , μ (x=0,1,2,cdots),mu(x=0,1,2, \cdots), \mu 는 단위 구간당 사건의 평균 발생횟수 ( μ > ( μ > (mu >(\mu> 0 ) 0 ) 0)0), 그리고 e = 2.71828 e = 2.71828 e=2.71828 cdotse=2.71828 \cdots 이다.
这里 x x xx 是事件的数量 ( x = 0 , 1 , 2 , ) , μ ( x = 0 , 1 , 2 , ) , μ (x=0,1,2,cdots),mu(x=0,1,2, \cdots), \mu 是每个单位部分的平均事件数 ( μ > ( μ > (mu >(\mu> 0 ) 0 ) 0)0) , 和 e = 2.71828 e = 2.71828 e=2.71828 cdotse=2.71828 \cdots 是。

포아송분포의 평균과 분산 泊松分布的均值和方差

포아송분포를 따르는 확률변수 X X XX 의 평균과 분산은 다음과 같다.
服从泊松分布的随机变量 X X XX 的均值和方差如下。
E ( X ) = μ Var ( X ) = μ E ( X ) = μ Var ( X ) = μ {:[E(X)=mu],[Var(X)=mu]:}\begin{gathered} E(X)=\mu \\ \operatorname{Var}(X)=\mu \end{gathered}
어떤 자동차 보험회사에서 조사한 결과에 의하면 한 보험 가입자에게 1 년 동안에 발생하 는 자동차 사고는 대체로 포아송분포에 따르며, 보험 가입자 1 인당 평균 사고 수는 0.25 인 것으로 나타났다. 임의로 추출된 보험 가입자가 내년에 2 회의 사고를 당할 확률은 얼 마인가?
根据某汽车保险公司的调查结果,一名投保人每年发生的汽车事故一般服从泊松分布,平均每名投保人发生事故的次数为0.25起。随机选择的受保人明年发生两次事故的概率是多少?
베르누이 시행횟수 n n nn 이 비교적 크고 ( n 20 ) ( n 20 ) (n >= 20)(n \geq 20) 시행의 성공확률 p p pp 가 아주 작을 경우 ( n p < 5 ) ( n p < 5 ) (n*p < 5)(n \cdot p<5) 이항분포는 근사적으로 X = n p X = n p X=n*pX=n \cdot p 인 포아송분포에 따르게 된다. 따라서 n p < 5 n p < 5 n*p < 5n \cdot p<5 인 경우 베 르누이 시행횟수를 포아송분포의 단위 구간이나 시간으로 간주하고, 이항확률변수의 평균 ( n p ) ( n p ) (n*p)(n \cdot p) 을 포아송분포의 단위당 평균 발생횟수 μ μ mu\mu 로 간주하여 계산하면 이항분포를 이용하여 계산한 확률값과 거의 유사한 값을 구할 수 있다.
伯努利试验次数 n n nn 这个比较大 ( n 20 ) ( n 20 ) (n >= 20)(n \geq 20) 实施成功概率 p p pp 如果非常小 ( n p < 5 ) ( n p < 5 ) (n*p < 5)(n \cdot p<5) 二项式分布大约为 X = n p X = n p X=n*pX=n \cdot p 它遵循泊松分布。因此 n p < 5 n p < 5 n*p < 5n \cdot p<5 在这种情况下,伯努利试验的次数被视为泊松分布的单位间隔或时间,二项式随机变量的平均值为 ( n p ) ( n p ) (n*p)(n \cdot p) 泊松分布每单位的平均出现次数 μ μ mu\mu 如果考虑 进行计算,可以获得与使用二项式分布计算的概率值几乎相似的值。

그림 5-9 图5-9

  • 온라인 매체에 노출된 창업기업의 광고 개수 예: 이항분포 적용
    初创公司接触在线媒体的广告数量示例:应用二项式分布
P X ( 3 ) = n C x P x ( 1 p ) n x = 50 C 3 × 0.07 3 × 0.93 47 = 0.2219 P X ( 3 ) = n C x P x ( 1 p ) n x = 50 C 3 × 0.07 3 × 0.93 47 = 0.2219 P_(X)(3)=_(n)C_(x)P^(x)(1-p)^(n-x)=_(50)C_(3)xx0.07^(3)xx0.93^(47)=0.2219P_{X}(3)={ }_{n} C_{x} P^{x}(1-p)^{n-x}={ }_{50} C_{3} \times 0.07^{3} \times 0.93^{47}=0.2219
이번에는 단위당 평균 발생횟수가 3.5 인 포아송분포를 이용하여 창업기업 광고가 3 개일 확률 을 구해보자.
这次,我们使用泊松分布计算一家初创公司出现 3 个广告的概率,每单位平均出现次数为 3.5。
P X ( 3 ) = μ x x ! e μ = 3.5 3 3 ! e 3.5 = 0.2158 P X ( 3 ) = μ x x ! e μ = 3.5 3 3 ! e 3.5 = 0.2158 P_(X)(3)=(mu^(x))/(x!)e^(-mu)=(3.5^(3))/(3!)e^(-3.5)=0.2158P_{X}(3)=\frac{\mu^{x}}{x!} e^{-\mu}=\frac{3.5^{3}}{3!} e^{-3.5}=0.2158

요약 求和

253-255 pp. 참고 253-255 页。参考

주요 푱어 主要流行词

255-256pp. 참고 255-256页。参考

열습둔제 湿热消光剂

256-259pp. 참고 256-259页。参考

기출문제 以前的考试题

260-265 pp. 참고 260-265 页。参考

사졔분석 业务分析

5
최적 투자를 위한 기준 :
最佳投资标准:

a.s.(almost surely)의 개념과 켈리 기준
as(几乎肯定)的概念和凯利准则

출체 : bttps://www,championbers,com,au/betting’ education/bankroll staking/what-is-the-kelly
资料来源:bttps://www,championbers,com,au/betting' education/bankroll stake/what-is-the-kelly

켈리 기준을 소개하기 전에 확률론에서 널리 사용되는 '확실하게(surely)'와 '거의 확실하게 (almost surely)'의 개념 차이를 명확하게 이해할 필요가 있다. 어떤 사건이 확실하게(surely) 발 생한다는 것은 그 사건이 언제나 발생하여 그 사건 외의 다른 결과가 전혀 발생할 수 없음을 의미하지만, 어떤 사건이 거의 확실하게(almost surely) 발생한다는 것은 그 사건이 확률 1 로 발생함을 의미한다. 즉, 후자의 경우 이론적으로 그 사건에 속하지 않은 결과가 발생할 수 있 지만, 가능성이 너무 낮아서 고정된 양의 확률보다 작아 0 이 되므로 사건의 발생확률은 1 이 된다는 의미이다.
在介绍凯利准则之前,有必要清楚地理解概率论中广泛使用的“肯定”和“几乎肯定”概念之间的区别。一个事件肯定发生意味着该事件总是会发生,并且除了该事件之外不会有其他结果发生,但一个事件几乎肯定发生意味着该事件的概率为 1。这意味着它发生为也就是说,后一种情况,理论上可能会出现不属于该事件的结果,但是概率很低,小于固定的正概率,变成0,也就是说该事件发生的概率发生次数为 1。
K = b p w ( 1 p w ) b K = b p w 1 p w b K=(bp_(w)-(1-p_(w)))/(b)K=\frac{b p_{w}-\left(1-p_{w}\right)}{b}
여기서 K K KK 는 베팅 규모, p w p w p_(w)p_{w} 는 수익 확률(성공 확률), b b bb 는 1 달러(화폐 1 단위)를 베팅했을 때 수익 금이며, 베팅 규모를 퍼센트로 전환하기 위해 100 을 곱하기도 한다 ( K % = 100 K ) ( K % = 100 K ) (K%=100*K)(K \%=100 \cdot K).
这里 K K KK 是赌注大小, p w p w p_(w)p_{w} 是盈利的概率(成功的概率), b b bb 是投注 1 美元(1 个货币单位)时的赔率,可以乘以 100 将投注金额转换为百分比。 ( K % = 100 K ) ( K % = 100 K ) (K%=100*K)(K \%=100 \cdot K)
켈리 기준 관련 예를 들어보자. 70 % 70 % 70%70 \% 확률로 이길 수 있으며 이기면 베팅 금액만큼 추가 로 받고 지면 베팅 금액을 모두 잃는 게임이 있으며 현재 자금은 500 만 원이 있다고 하 자. 이 게임의 경우 최적 베팅비율은 얼마인가?
让我们看一个与凯利标准相关的例子。 70 % 70 % 70%70 \% 假设有一款游戏,你可以根据赔率获胜,如果你赢了,你将获得与下注金额相等的额外金额,如果你输了,你将失去全部下注金额,而你当前的资金是500万韩元。这场比赛的最佳投注比例是多少?

S기업의 주식에 10 번 투자하여 4 번 수익을, 6 번 손실을 기록했으며 매번 투자에 따른 수 익과 손실의 금액이 같다고 가정하자. 켈리 기준에 따르면 이 기업의 주식에 투자할 필 요가 있는가?
假设您投资了一家S公司的股票10次,盈利4次,亏损6次,每次投资的盈亏金额是相同的。根据凯利准则,是否有必要投资这家公司的股票?
  • ETEX 혹은 R을 이용하여 n = 50 n = 50 n=50n=50, 성공확률 p = 0.7 p = 0.7 p=0.7p=0.7 인 베르누이분포를 이루는 임의수(난 수)(random number)를 생성하라.
    使用 ETEX 或 R n = 50 n = 50 n=50n=50 , 成功概率 p = 0.7 p = 0.7 p=0.7p=0.7 生成形成伯努利分布的随机数。

    생성된 임의수에서 1 을 성공, 0 을 실패라고 가정하고(성공확률 p = 0.7 p = 0.7 p=0.7p=0.7 ) 매번 모든 자금 을 베팅하는 경우 몇 번째 투자에서 모든 자금을 잃게 되는가?
    假设生成的随机数中1为成功,0为失败(成功概率 p = 0.7 p = 0.7 p=0.7p=0.7 ) 如果您每次都投注所有资金,那么您会输掉所有资金的投资数量是多少?

    켈리 기준에 따른 최적 베팅비율을 적용하였을 때 자금의 변화를 꺾은선 그래프로 그려 보아라.
    绘制一个折线图,显示根据凯利标准应用最佳投注比率时资金的变化。

시례분석 5 최적 투자를 위한 기준
案例分析5 最佳投资标准

사려분석 5 考虑因素分析5

확률계산, 베르누이분포, 켈리 기준 概率计算、伯努利分布、凯利准则

  1. 켈리 기준 관련 예를 들어보자. 70 % 70 % 70%70 \% 확률로 이길 수 있으며 이기면 베팅금액만큼 추가 로 받고 지면 베팅금액을 모두 잃는 게임이 있으며 현재 자금은 500 만 원이 있다고 하 자. 이 게임의 경우 최적 베팅비율은 얼마인가?
    让我们看一个与凯利标准相关的例子。 70 % 70 % 70%70 \% 假设有一款游戏,你可以根据赔率获胜,如果你赢了,你会得到与下注金额相等的额外金额,如果你输了,你会输掉全部下注金额假设你目前有 500 万韩元。在资金中。这场比赛的最佳投注比例是多少?
  2. S기업의 주식에 10 번 투자하여 4 번 수익을, 6 번 손실을 기록했으며 매번 투자에 따른 수익과 손실의 금액이 같다고 가정하자. 켈리 기준에 따르면 이 기업의 주식에 투자할 필요가 있는가?
    假设您投资了一家S公司的股票10次,盈利4次,亏损6次,每次投资的盈亏金额是相同的。根据凯利准则,是否有必要投资这家公司的股票?
  3. ETEX를 이용하여 n = 50 n = 50 n=50n=50, 성공확률 p = 0.7 p = 0.7 p=0.7p=0.7 인 이항분포를 이루는 임의수(난수) (random number)를 생성하라.
    使用ETEX n = 50 n = 50 n=50n=50 , 成功概率 p = 0.7 p = 0.7 p=0.7p=0.7 生成形成二项式分布的随机数。
  4. 생성된 임의수에서 1 을 성공, 0 을 실패라고 가정하고(성공확률 p = 0.7 p = 0.7 p=0.7p=0.7 ) 매번 모든 자금 을 베팅하는 경우 몇 번째 투자에서 모든 자금을 잃게 되는가?
    假设生成的随机数中1为成功,0为失败(成功概率 p = 0.7 p = 0.7 p=0.7p=0.7 ) 如果您每次都投注所有资金,那么您会输掉所有资金的投资数量是多少?
  5. 켈리 기준에 따른 최적 베팅비율을 적용하였을 때 자금의 변화를 꺾은선 그래프로 그려 보아라.
    绘制一个折线图,显示根据凯利标准应用最佳投注比率时资金的变化。
  • 경영경제룽계학 유튜브 채널 참고(둥영상 QR코드: 경영경제룽계학 책 제궁)
    请参阅龙溪管理与经济学 YouTube 频道(视频二维码:龙溪管理与经济学书籍 Jeggung)
  • 사례분석에 필요한 자료 다운로드(구르 드라이브 Q R Q R QRQ R 코드: 경영경제룽계학 책 제공)
    下载案例分析所需的数据(Gur Drive Q R Q R QRQ R 代码:由商业经济学龙溪研究书提供)

시례분석 5 최적 투자를 위한 기준
案例分析5 最佳投资标准

사련분석 5 故事分析5

켈리 기준과 사용자 정의 함수 활용
使用凯利准则和用户定义的函数

  1. 켈리 기준 관련 예를 들어보자. 70 % 70 % 70%70 \% 확률로 이길 수 있으며 이기면 베팅금액만큼 추가 로 받고 지면 베팅금액을 모두 잃는 게임이 있으며 현재 자금은 500 만 원이 있다고 하 자. 이 게임의 경우 최적 베팅비율은 얼마인가?
    让我们看一个与凯利标准相关的例子。 70 % 70 % 70%70 \% 假设有一款游戏,你可以根据赔率获胜,如果你赢了,你会得到与下注金额相等的额外金额,如果你输了,你会输掉全部下注金额假设你目前有 500 万韩元。在资金中。这场比赛的最佳投注比例是多少?
  2. S 기업의 주식에 10 번 투자하여 4 번 수익을, 6 번 손실을 기록했으며 매번 투자에 따른 수익과 손실의 금액이 같다고 가정하자. 켈리 기준에 따르면 이 기업의 주식에 투자할 필요가 있는가?
    假设您投资S公司股票10次,盈利4次,亏损6次,每次投资的盈亏金额相同。根据凯利准则,是否有必要投资这家公司的股票?
  3. R 을 이용하여 n = 50 n = 50 n=50n=50, 성공확률 p = 0.7 p = 0.7 p=0.7p=0.7 인 이항분포를 이루는 임의수(난수)(random number)를 생성히라.
    使用R n = 50 n = 50 n=50n=50 , 成功概率 p = 0.7 p = 0.7 p=0.7p=0.7 生成形成二项式分布的随机数。
  4. 생성된 임의수에서 1 을 성공, 0 을 실패라고 가정하고(성공확률 p = 0.7 p = 0.7 p=0.7p=0.7 ) 매번 모든 자금 을 베팅하는 경우 몇 번째 투자에서 모든 자금을 잃게 되는가?
    假设生成的随机数中1为成功,0为失败(成功概率 p = 0.7 p = 0.7 p=0.7p=0.7 ) 如果您每次都投注所有资金,那么您会输掉所有资金的投资数量是多少?
  5. 켈리 기준에 따른 최적 베팅비율을 적용하였을 때 자금의 변화를 꺾은선 그래프로 그려 보아라.
    绘制一个折线图,显示根据凯利标准应用最佳投注比率时资金的变化。