Recent Posts

Youngjae Oh's Avatar'

딥러닝이 주로 다루는 문제들

Association Rule Mining Association Rule이란 어떤 사건이 얼마나 자주 함께 발생하는지, 서로 얼마나 연관되어 있는지를 표시한다. Supervised Learning(지도 학습) 학습할 데이터셋이 참고할 정답지가 있다. Classification(분류) 분류의 문제를 해결한다. 기존에 존재하는 데이터의 카테고리 관계를 파악하고, 새롭게 관측된 데이터의 카테고리를 스스로 판별하는 과정이다. 이에는 단일 분류, 다중 분류가 있다. 다중 분류는 Unsuvervised Learning의 Clustering과 비슷하지만, 가장 큰 차이점은 Category의 도메인이 정의되어있는가 그렇지 않는가이다. 지도 학습의 Classification은...

Association Rule Mining Association Rule이란 어떤 사건이 얼마나 자주 함께 발생하는지, 서로 얼마나 연관되어 있는지를 표시한다. Supervised Learning(지도 학습) 학습할 데이터셋이 참고할 정답지가 있다. Classification(분류) 분류의 문제를 해결한다. 기존에 존재하는 데이터의 카테고리 관계를 파악하고, 새롭게 관측된 데이터의 카테고리를 스스로 판별하는 과정이다. 이에는 단일 분류, 다중 분류가 있다. 다중 분류는 Unsuverv...

Youngjae Oh's Avatar'

로지스틱 회귀

앞서 선형 회귀가 무엇인지에 대하여 살펴 보았다. 선형 회귀는 어떠한 데이터들의 집합이 주어졌을 때, 이들을 적절하게 구분할 수 있는 선을 긋는 것이 목적이었고, 이는 결국 주어진 일차방정식의 기울기와 절편, 그리고 오차를 구하는 것이었다. 기울기와 절편 어쩌구 저쩌구.., 일단 선형 회귀가 뭘 하려는 지는 알겠다. 하지만 이는 우리 인간지능이 할 수 있는 “예, 아니오”와 같은 결과를 내놓지는 않는다. 여기서 등장하는 개념이 바로 로지스틱 회귀(Logistic Regression)이다. 로지스틱 회귀는 참과 거짓 중 하나를 내놓는데, 이의 작동 방식 역시 선형 회귀와 비슷하게 “참”과 “거짓”을 효과적으로 구분짓는 선을 긋는 것이다.

앞서 선형 회귀가 무엇인지에 대하여 살펴 보았다. 선형 회귀는 어떠한 데이터들의 집합이 주어졌을 때, 이들을 적절하게 구분할 수 있는 선을 긋는 것이 목적이었고, 이는 결국 주어진 일차방정식의 기울기와 절편, 그리고 오차를 구하는 것이었다. 기울기와 절편 어쩌구 저쩌구.., 일단 선형 회귀가 뭘 하려는 지는 알겠다. 하지만 이는 우리 인간지능이 할 수 있는 “예, 아니오”와 같은 결과를 내놓지는 않는다. 여기서 등장하는 개념이 바로 로지스틱 회귀(Logistic Regression)이다. 로지스틱 회귀는 참과 거짓 중 하나를 ...

Youngjae Oh's Avatar'

MFCC에 대한 기본적인 이해

MFCC는 Mel-Frequency Cepstral Coefficient의 약자로, 약자에서 볼 수 있듯이 멜 스펙트럼(Mel Spectrum) 에서 Cepstral(켑스트럴) 분석을 통해 추출된 값이다. 벌써부터 머리가 아프다. 멜 스펙트럼, 켑스트럼…. 일단 멜 스펙트럼부터 살펴보자. 오디오 시그널은 대충 이렇게 생겼다. 이 오디오 시그널을 Framing한다. 여기서 Framing이란 오디오 신호를 프레임별(보통 20ms ~ 40ms)로 나눈다는 뜻이다. 이후, 이에 FFT(Fast Fourier Transform)을 적용한다. FFT란 고속 푸리에 변환으로, 주기성과 대칭성을 이용하여 DFT(Discrete Fourier Transform, DFT)와 그 역변환을 빠르게 수행하는 알고리즘이다...

MFCC는 Mel-Frequency Cepstral Coefficient의 약자로, 약자에서 볼 수 있듯이 멜 스펙트럼(Mel Spectrum) 에서 Cepstral(켑스트럴) 분석을 통해 추출된 값이다. 벌써부터 머리가 아프다. 멜 스펙트럼, 켑스트럼…. 일단 멜 스펙트럼부터 살펴보자. 오디오 시그널은 대충 이렇게 생겼다. 이 오디오 시그널을 Framing한다. 여기서 Framing이란 오디오 신호를 프레임별(보통 20ms ~ 40ms)로 나눈다는 뜻이다. 이후, 이에 FFT(Fast Fourier Transform)을 ...

Youngjae Oh's Avatar'

MFCC 파이썬 코드 01

MFCC의 파이썬 구현 코드를 살펴보자. 일단 코드를 설명하기 전에, librosa 라이브러리에 대한 간단한 설명이 필요할 것이다. librosa는 음악과 오디오 분석을 위한 파이썬 라이브러리로, 설치는 여타 라이브러리와 다르지 않게 매우 간단하다. 본인도 아직 librosa에 대한 기능을 완벽하게 이해하거나 숙지하진 못하였지만, 아주x100 유용한 툴임에는 틀림없다. 자 이제 코드를 한번 뜯어보도록 하자. 일단 필요한 라이브러리들을 임포트하도록 하자. matplotlib 라이브러리는 그래프 표현에 사용되고, librosa는 분석에, numpy 최댓값 기능을 사용하기 위하여 임포트하였다. 이제 분석할 오디오 파일을 불러오도록 하자. 이 포스트에서는 Palebabyblue-사랑방 손님을...

MFCC의 파이썬 구현 코드를 살펴보자. 일단 코드를 설명하기 전에, librosa 라이브러리에 대한 간단한 설명이 필요할 것이다. librosa는 음악과 오디오 분석을 위한 파이썬 라이브러리로, 설치는 여타 라이브러리와 다르지 않게 매우 간단하다. 본인도 아직 librosa에 대한 기능을 완벽하게 이해하거나 숙지하진 못하였지만, 아주x100 유용한 툴임에는 틀림없다. 자 이제 코드를 한번 뜯어보도록 하자. 일단 필요한 라이브러리들을 임포트하도록 하자. matplotlib 라이브러리는 그래프 표현에 사용되고, l...

Youngjae Oh's Avatar'

선형 회귀란?

선형 회귀를 가장 쉽게 설명할수 있는 문장은 가장 훌륭한 예측선 긋기 라고 할 수 있을 것이다. 예를 들어 어느 한 일차 방정식이 있다고 해 보자. 여기서 x는 독립 변수, y는 종속 변수 라 칭한다. 이름이 헷갈린다면, y는 x가 변하는데 종속하여 변화하니 종속 변수인것이고, x는 말 그대로 독립적으로 변하기에 독립 변수인 것이다. 선형 회귀는 여기서부터 두 갈래로 나뉜다. 1. 단순 선형 회귀(Simple Linear Regression) 2. 다중 선형 회귀(Multiple Linear Regression) 말 그대로다. 결국 종속 변수가 하나이냐, 아니면 다수이냐의 차이인 것이다. 이와 관련된 코드들은 후에 다시 다루기로 하고, 일단은 선형 회귀의 정확한 정의부터 확실하게 찍고 ...

선형 회귀를 가장 쉽게 설명할수 있는 문장은 가장 훌륭한 예측선 긋기 라고 할 수 있을 것이다. 예를 들어 어느 한 일차 방정식이 있다고 해 보자. 여기서 x는 독립 변수, y는 종속 변수 라 칭한다. 이름이 헷갈린다면, y는 x가 변하는데 종속하여 변화하니 종속 변수인것이고, x는 말 그대로 독립적으로 변하기에 독립 변수인 것이다. 선형 회귀는 여기서부터 두 갈래로 나뉜다. 1. 단순 선형 회귀(Simple Linear Regression) 2. 다중 선형 회귀(Multiple Linear Regression)...