CNN 기본개념

CNN(Convolutional Neural Network)란? CNN(Convolutional neural network)는 전통적인 뉴럴 네트워크 앞에 여러 계층의 Convolutional Layer를 붙인 모양입니다.  Convolutional Layer를 통해서 입력 받은 이미지에 대한 특징(Feature)를 추출하게 되고, 추출된 특징을 바탕으로 기존의 Fully-connected Layer(일반적인 뉴럴네트워크)를 이용하여 이미지에 대한 분류(Classification)를 수행합니다. CNN structure는 아래 그림과 같습니다. Convolutional Layer란? Convolutional Layer는 입력된 이미지 데이터로부터 특징을 추출하는 역할을 수행합니다. Convolutional Layer에는 […]

Continue reading →

Object Detection with Tensorflow API

Object Detection 이란? Object Detection이란 사진이나 동영상에 존재하는 사물에 대해 인식하는 것을 의미합니다. 다음은 위키 피디아(Wikipedia)에서 정의한 Object detection의 정의입니다 Object detection is a computer technology related to computer vision and image processing that deals with detecting instances of semantic objects of a certain class (such as humans, buildings, or cars) in digital images and videos. Well-researched domains of object […]

Continue reading →

Overfitting과 Dropout

Layer가 많아질 때 발생하는 대표적인 문제점은 overfitting입니다. 왼쪽 그림처럼 어느정도의 오차도 허용해야 하는데, 오른쪽 그림처럼 선을 지나치게 구부려서 잘 분류가 되는 것처럼 보일 때 이를 overfitting 이라고 합니다. 위의 x축은 weight(layer), y축은 error를 의미하는 그래프를 살펴보면 아래의 파란선은 training set에 대해 발생하는 오차(error)를 나타내고 주황선은 test set에 대해 발생하는 오차를 나타냅니다. 이 그래프에서 얻을 수 […]

Continue reading →

Vanishing Gradient Problem & ReLU(Rectified Linear Unit)

1. Vanishing Gradient Problem 이란? Vanishing Gradient Problem(경사 사라짐 문제)란, 뉴럴 네트워크의 레이어 수가 많아지고, 각 레이어의 노드 수가 많아 질 수록, 마지막 레이어는 학습이 이루어지는 반면, 초기 레이어는 학습이 이루어지지 않는 문제를 의미합니다. 쉬운 이해를 위해 예시를 들어 설명해드리겠습니다. <figure 1>은 지난 시간에 다루었던 XOR 문제를 나타내고 있습니다. 우선, XOR 문제를 2개의 hidden layer를 […]

Continue reading →

Back propagation 2

  미분은 순간변화율을 말합니다.(순간 변화율을 구하는 방법이 나누기라서 미분이라고 하지 않을까..) 우선 변화율이 무엇인지 이해해보자면, 변화율이란 상대적인 개념이라는 것을 알아야합니다. ‘f의 변화율이 3이다’라는 말은 온전한 표현은 아닙니다. 무엇에 대한 변화율인지가 빠졌기 때문입니다.  예를 들어, 속도(력)는 시간에 대한 위치변화(이동거리)의 변화율이고, 직선의 기울기는 x값에 대한 y값의 변화율입니다. 즉,  변화율을 말하려면 변화율의 기준이 되는 놈이 있어야 한다는 말이고 […]

Continue reading →

XOR 문제와 Neural Network

1. XOR 문제란? XOR 문제란 <figure 1>에 나타난 것 처럼 linear 방식으로 데이터를 구분할 수 없는 문제를 말합니다. OR 문제나 AND 문제는 아래와 같이 직선을 활용하여 데이터를 명확하게 구분할 수 있지만, XOR 문제는 어떤 직선을 활용하더라도 + 와 – 를 구분할 수 없습니다. <figure 1> OR, AND, XOR problem Minsky(1969)에서는 XOR 문제를 해결할 수 있는 […]

Continue reading →

Softmax의 비용 함수(Cost function)

1. 비용 함수(Cost function) 이란? 비용 함수(Cost function)는 모델의 정확도를 측정할 때 활용 되며, 비용 함수란 예측 값(측정 값)과 실제 값 차이의 평균을 의미합니다. 비용 함수의 일반적인 식은 아래와 같습니다.     쉬운 이해를 돕기 위해 아래의 예제 데이터를 활용하여 설명하겠습니다. <Table 1> Example dataset #1 <Table 1>의 첫 번째 열은 모델의 예측 값을 나타내며, […]

Continue reading →

[03]장바구니 분석을 통한 소비자 쇼핑 트렌트 예측

장바구니 분석을 왜 하는가? 소비자들이 구매하는 가장 인기 있는 상품과 소비자들이 좋아하는 제품들과 싫어하는 제품들, 사람들이 함께 구매하려는 경향이 있는 상품들의 조합 등의 데이터들을 합쳐 다양한 머신 러닝 알고리즘을 적용해 상품의 경향성을 분석하고, 추천 엔진을 만들어 소비자들이 사고 싶은 제품을 예측하도록하거나 추천 서비스를 제공함   . 장바구니 분석 구매 패턴에 기초해 사람들이 어떤 제품을 구매할지 […]

Continue reading →

카이제곱분석

카이제곱분석(Chi-squared analysis) 카이제곱검정은 카이제곱 분포에 기초한 통계적 방법으로, 관찰된 빈도가 기대되는 빈도와 의미있게 다른지의 여부를 검증하기 위해 사용되는 검증방법 두 변수의 관계가 독립적일 때 기대할 수 있는 값과 실제로 표본을 조사해 보았을 때 나온 값을 비교하는 것 즉, 카이제곱분석의 목적은 표본자료를 가지고 모집단이 이러한 독립성을 가지고 있는지에 대해 확률적으로 추정하는 분석 자료가 빈도로 주어졌으면서 명목변수나 서열변수로 […]

Continue reading →

[07] 상응분석

상응분석(Correspondence Analysis) 명목척도로 측정된 2개 이상의 범주형 변수값들 간의 연관성을 분석하여 그 결과를 시각적 해석이 용이하도록 기하학적 맵으로 제시하는 다변량 통계기법 즉, 상응분석은 다차원척도법과 같이 일종의 수치정보를 그림으로 요약해서 표현하는 방법 다차원 척도는 자극점들 간의 유사성자료를 사용함으로써 대부분 등간척도나 비율척도로 측정한 자료를 사정보를 시각화하여 표현하는 방법 중의 하나 하지만 등간이나 서열척도로 측정된 변수는 일정한 규칙을 […]

Continue reading →