개발 기록/Google ML Bootcamp
구글 머신러닝 부트캠프 1주차(1/4)
시유후
2022. 8. 3. 16:52
목차
Introduction
Linear Regression
선형 회귀(linear Regression)는 다수의 데이터를
대표할 수 있는 직선을 만드는 것을 말한다.
예를 들어 집의 가격과 크기를 생각해보자.
아래의 그래프와 같이 보통 집의 크기가 크면, 집의 가격이 높아지는 경향이 있다

이 모두를 적당히 대표할 수 있는 직선을 하나 그을 수 있는데, 이것을 선형회귀라고 한다.
이런 직선을 그리는 함수를 집의 크기를 입력으로 받고 집의 가격을 출력으로 하는 Single Neuron이라고 한다.
Supervised Learning
인공지능을 학습 시킬 때, 결과를 알려주고 학습을 시키는 지도학습이라는 기법이다.
지도학습은 Structed Data, Unstructed Data를 통해서 학습을 시키는데,
Structed Data는
아래의 표와 같이
| size | #bedroom | ... | price |
|---|---|---|---|
| 40 | 3 | ... | 200 |
| 35 | 2 | ... | 170 |
| ... | ... | ... | ... |
| 60 | 4 | ... | 350 |
구조적으로 나타낼 수 있는 데이터를 말하며,
Unstructed Data는
그림, 음성, 텍스트와 같이
구조적이지 않은 데이터들을 말합니다.
Why Deep Learning?
아래의 그래프와 같이

과거의 데이터가 적을때는 굳이 Neural Network를 사용하지 않아도, 성능이 그렇게 드라마틱하게 상승하진 않았다.
하지만, 점점 라벨링된 데이터가 많아지면서, 이 Neural Network가 가지는 성능이 훨씬 유의미하게 되었다.
따라서 점점 이 전통적인 방식의 계산에서 NN를 사용하는 방식으로 넘어가게 되었다.
따로 부족한 부분이나 틀린점, 오타 지적은 댓글로 부탁드려요!