[08]확률분포

확률이란? – 확률을 보는 두 가지 견해

고전적 확률(Classical probability)

P(A) = ‘특정사건 A가 일어날 수 있는 경우의 수’ 나누기 ‘모든 경우의 수’

A사건이 유한개인 경우에만 적용가능하다는 한계가 있음.

경험적 확률(Empirical probability) 또는 상대도수(Relative frequency)확률

아주 많은 시행을 거쳐서 특정한 퍼센트가 산출되면, 이 특정한 퍼센트는 확률에 근접한다

즉, 오랜 시간을 두고 여러 번 통계적 시행을 반복한다면 한 사건 A의 확률은 어떤 값에 가까워 질 것이다는 견해이다.

A사건이 극한으로 일어나도 확률을 정의할 수 있지만, 이 극한을 증명할 방법이 없다는 단점을 가짐

※ 고전적 확률과 경헙적 확률 개념 모두 객곽적인 확률이 존재한다는 데에 동의한다는 점에서 공통       점을 가짐

※ 또한 경험적 확률은 시행횟수가 증가함에 따라 고전적 확률개념에 가까워짐                                        예를 들어, 동전을 1000번 던졌을 때 앞면이 58번 나왔다는 결과를 얻었으면 58/1000 = 5.8%로         경험적 확률은 5.8%가 된다. 하지만 동전 던지기를 한다면 계속한다면 결국 결과가 고전적 확률         인 50%에 가까워 질 것이다.

이산확률분포와 연속확률분포 – 확률값들의 분포

확률변수는 데이터의 특성에 따라 이산확률 변수와 연속확률 변수로 나눌 수 있음

이산확률분포

이산 변수 : 동전이나 주사위의 숫자와 같이 ‘셀 수 있는’ 정수

이산변수의 확률분포를 나타낸 것이 이산확률분포.

예를들어, 동전을 두개를 던져서 나오는 앞면의 수를 보면 전체 경우의 수는 아래와 같이 4개임

앞면 앞면, 앞면 뒷면, 뒷면 앞면, 뒷면 뒷면

앞면이 한번도 나오지 않는 경우의 수는 ‘뒷면 뒷면’으로써 1번,  앞면이 한 번 나오는 경우의 수는 ‘앞면 뒷면’, ‘뒷면 앞면’으로써 2번이다. 앞면이 두 번 나오는 경우는 ‘앞면 앞면’으로써 1번이다.

이 때 앞면이 나오는 숫자에 따른 각각의 확률을 살펴보면 앞 면이 한번도 나오지 않을 확률은 P(0) = 1/4(25%), 한 번 나올 확률은 p(1) = 2/4(50%), 두 번 나올 확률은 P(2) = 1/4(25%)이다.

이를 도표로 나타내면 아래와 같다.

1

 

이산확률분포에는 베르누이분포, 이항분포, 다항분포, 초기하분포, 기하분포, 음이항분포, 포아송분포 등이 있다

연속확률분포

연속  변수 : 키나 몸무게, 이론적으로 각 값이 연속적으로 위치할 수 있는 변수. 소수점 이하까지로                          측정되어지는 변수.

연속변수의 확률분포를 나타낸 것이 연속확률분포.

케이스 수가 아주 많고 구간이 아주 작아질 때 궁극적으로 만들어지는 곡선이라고 이해하면 됨

예를 들어 아래의 그림처럼 히스토그램의 구간인 △x가 0에 접근하면, 연속변수의 성격을 가지게 되는 것임

2

연속확률분포는 셀 수가 없는 연속 변수를 이용하기 때문에 특정 숫자에 대한 확률은 0임.  일정 구간에 대해서만 확률을 언급할 수 있음

연속확률분포에는 균등분포, 정규분포, 지수분포, 감마분포, 베타분포, t분포, 카이제곱분포, F분포 등이 있음

확률과 실제의 차이

아래 그림은 막대그래프를 통해 30대 한국남성의 키를 나타내었고, 이 분포에 적합한 파란색 정규분포곡선을 그린 것이다.
4

키나 몸무게와 같은 연속 변수는 흔히 정규분포라는 확률밀도함수를 따른다고 하는데 실제결과는 정규분포와 다르게 나타난 것을 알 수 있다.

확률의 계산

확률의 덧셈법칙

P(A or B) : 두 사건 중 적어도 하나의 사건이 발생할 확률

P(A and B) : 두 사건이 함께 발생할 확률

덧셈법칙 :  상호배반일 때 –> P(A or B) = P(A) + P(B)

상호배반이 아닐 때 –> P(A or B) = P(A) + P(B) – P(A and B)

확률의 곱셈법칙

P(A and B) : 결합확률 , 두사건이 함께 일어날 확률

P(A|B) : 조건부 확률, 사건 B가 주어진 조건 하에서 사건 A가 일어날 확률

P(A), P(B) : 주변 확률, 비조건부 확률

답글 남기기