[통계학_제3부] 우연, 확률과 변동성(13장)

제 3 부: 우연, 확률과 변동성 13장_정규분포곡선과 확률히스토그램 해당 장에서는 정규분포곡선과 확률히스토그램간의 관계를 설명하며, 이와 관련된 부트스트래핑 내용 또한 설명하고 있다.   1. 동전 던지기와 정규분포 동전을 백 번 던졌을 때, 앞면이 50번 나올 확률은 얼마나 될까?   위와 같은 방법으로 그 확률을 구할 수 있다. 하지만 매 번 특정한 확률을 계산하는 것은 불편하다.   […]

Continue reading →

CNN 기본개념

CNN(Convolutional Neural Network)란? CNN(Convolutional neural network)는 전통적인 뉴럴 네트워크 앞에 여러 계층의 Convolutional Layer를 붙인 모양입니다.  Convolutional Layer를 통해서 입력 받은 이미지에 대한 특징(Feature)를 추출하게 되고, 추출된 특징을 바탕으로 기존의 Fully-connected Layer(일반적인 뉴럴네트워크)를 이용하여 이미지에 대한 분류(Classification)를 수행합니다. CNN structure는 아래 그림과 같습니다. Convolutional Layer란? Convolutional Layer는 입력된 이미지 데이터로부터 특징을 추출하는 역할을 수행합니다. Convolutional Layer에는 […]

Continue reading →

이원분산분석

이원배치 분산분석(Tow-Way ANOVA) 2개의 독립변수가 종속변수에 어떠한 영향을 미치고 있는가를 분석하는 것 각각의 독립변수가 종속변수에 미치는 영향을 ‘주효과’라고 함.  한 독립 변수의 변화가 종속변수에 미치는 영향이 다른 독립 변수의 수준에 따라 달라지는가의 여부 즉, 2개의 독립변수가 동시에 작용하여 종속변수에 미치는 영향을 ‘상호작용효과’라고 함. 이원분산분석의 조건 독립성 : 독립변수의 그룹 군은 서로 독립적이어야함. 정규성 : 독립변수에 […]

Continue reading →

neural network_activation function

활성화 함수(Activation function) 활성화 함수란? unit(node)에서 하나의 값이 다음 unit으로 넘어갈 때, 일정값 이상이 되면 activation 되고, 아니면 activation 되지 않는 작용을 하는 함수 분류(Classification) 문제에서 activation function이 없다면, Y=W*x + b의 결과는 발생(1),미발생(0)의 분류가 아닌 실수값이 산출되게 됨. 활성화 함수는 산출되는 값을 일정한 기준에 의해 발생(1), 미발생(0)으로 분류할 수 있게 값을 활성화하는 역할 ex) […]

Continue reading →

실제 이미지 데이터를 활용한 CNN 모델 구현하기

실제 이미지로 CNN 모델을 구현하여 나만의 이미지 분류기를 만들 수 있을까? 여러 Youtube 영상과 CNN 관련 코드 예제들을 살펴보면 실제 이미지가 아닌 Tensorflow에서 제공하는 MNIST 데이터를 활용한 것을 알 수 있습니다. Tensorflow에서 제공한 MNIST 데이터는 실제 이미지가 아닌 숫자 데이터이며, 이 때문에 실제 이미지를 활용하여 CNN 모델을 구현하는 것이 쉽지 않습니다. <Figure 1> Tensorflow에서 제공하는 […]

Continue reading →

[통계학_제3부] 우연, 확률과 변동성(11, 12장)

[배반, 독립] 지난 번 범한 오류: 독립을 한글 그대로 받아들임. A가 일어났다고해서 B의 확률이 변하는 것을 관찰하는 것이 아님. 단순히 독립이라는 의미를 놓고 보면 주사위 자체는 항상 독립적인 사건이 일어날 것만 같다. 하지만 독립은 그런 의미가 아닌 A의 조건에서 B가 일어날 확률이 변하지 않는 것을 확인하는 것.   즉, 가 만족하면 두 사건 A와 B는 독립이다. […]

Continue reading →

Object Detection with Tensorflow API

Object Detection 이란? Object Detection이란 사진이나 동영상에 존재하는 사물에 대해 인식하는 것을 의미합니다. 다음은 위키 피디아(Wikipedia)에서 정의한 Object detection의 정의입니다 Object detection is a computer technology related to computer vision and image processing that deals with detecting instances of semantic objects of a certain class (such as humans, buildings, or cars) in digital images and videos. Well-researched domains of object […]

Continue reading →

[통계학_제3부] 우연, 확률과 변동성(9, 10장)

제 3 부: 우연, 확률과 변동성 9장_확률이란 무엇인가 살펴볼 용어: 도수이론, 주관적 견해, 여사건, 복원추출, 비복원추출, 벤 다이어그램, 상호배반, 덧셈법칙, 조건부확률, 사전확률, 사후확률, 분할, 베이즈정리, 독립 [도수이론, frequency theory/ 주관적 견해, subjective view/ 여사건, complementary event] 확률을 보는 관점은 크게 두 가지. 도수이론과 주관적 견해.   우선 도수이론은 하나의 시행을 동일한 조건하에서 독립적으로 무한히 반복할 […]

Continue reading →

Overfitting과 Dropout

Layer가 많아질 때 발생하는 대표적인 문제점은 overfitting입니다. 왼쪽 그림처럼 어느정도의 오차도 허용해야 하는데, 오른쪽 그림처럼 선을 지나치게 구부려서 잘 분류가 되는 것처럼 보일 때 이를 overfitting 이라고 합니다. 위의 x축은 weight(layer), y축은 error를 의미하는 그래프를 살펴보면 아래의 파란선은 training set에 대해 발생하는 오차(error)를 나타내고 주황선은 test set에 대해 발생하는 오차를 나타냅니다. 이 그래프에서 얻을 수 […]

Continue reading →

가설검정 2

독립표본 T검정 독립표본? 현실적으로 모집단에 대한 전수조사가 어렵기 때문에 표본을 사용하는데, 이 때 표본을 두 개의 각 모집단으로부터 독립적으로 추출해야함 추출한 표본의 차이를 가지고 모집단의 차이를 검정하는것이 ‘독립표본 T검정’임 (서로 다른 두 개의 그룹 간의 평균 비교) 귀무가설(H0) : 두 모평균의 차이가 없음 (M1-M2=0). 대립가설(H1)  : 두 모평균의 차이가 있음 (M1-M2≠0). 독립표본 T검정의 조건 -정규성, […]

Continue reading →