
수강 내용(실무에 바로 쓰는 바닥부터 시작하는 머신러닝)
머신러닝
컴퓨터가 명시적으로 프로그래밍 되지 않아도, 데이터를 통해 학습하고 예측할 수 있도록 하는 기능.
(AI일부분의 알고리즘이다.)
최근에는 딥러닝을 많이사용한다.
하지만 딥러닝도 머신러닝의 일부분이다.
ex) 스스로 규칙과 논리를 학습하고 결과를 도출해 낸다.
오해하는부분
코딩없이 가능하다?
X 규칙과 논리를 스스로 찾는것이지 그 찾는 것은 프로그래밍해야한다.
인공지능 -> 가장 큰 범위(스스로 생각할 수 있는 프로그래밍) 머신러닝은 그중에 하나이다.
또 딥러닝과 강화학습은 머신러닝의 부분이다.

- 지도학습
- 비지도학습
- 강화학습
머신러닝의 역사
과거에 머신러닝을 활용하지 못했던 이유
근본적인 문제:
데이터가 굉장히 많이 필요했었다. 데이터의 질과 양이 필요했다. 하지만 과거에는 불가능 했다.
데이터를 통해 논리와 규칙을 찾아내는 것이 어려웠다.
근본적인 문제 해결:
엔비니아나 intel에서 좋은 하드웨어를 제공하고있고, 빅데이터시대가 오면서 과거의 문제가 해결되었다.
알고리즘의 향상과, 오픈소스 커뮤니티와 생태계의 발전을 통해 머신러닝이 폭발했다.
개요와 구성
머신러닝의 기본적인 구성요소, 학습과정
1. 지도학습 : 데이터에 정답이 포함되어있다.
ex) 주택가격: 평수,위치, ... -> 집값이 정답이된다. 이러한 요소를 가지고 집값을 맞추는 것.
2. 비지도 학습: 데이터에 정답이없다. (분류)
ex) 데이터의 특징을 보고 유사한 데이터끼리 모으는 것을 의미.
3. 강화학습: 게임을 하는 인공지능 -> 순차적인 결정문제
ex)action이라는 특정행위를 하는 알고리즘 (알파고)
머신러닝의 핵심들
1. 데이터셋 :
항상 존재한다. 일반적으로 (입력과 출력(레이블) 데이터로 구성된다.)
ex) 과일 데이터 셋 => 과일 크기, 종류, 색깔 : 레이블은 항상 다르다.
입력데이터: 정보를 추론하기 위한 데이터
출력데이터: (레이블) 정답데이터
100%의 비율로 본다면 80%은 학습 20%는 테스트에 사용한다.
2. 특징(모델이 학습할 수 있는 개별 속성)
3. 레이블 (출력값)
4. 모델, 학습
5. test
over fitting -> 일반적인 지식이아니라 특정 지식으로 국한되어있다. 조심해야한다.
머신러닝 흐름

ex)과일을 분류하는 과제.
데이터 수집(사과사진찍기) -> 데이터 전처리(잘못찍은 바나나 사진 없애기) -> *특징선택(가격,무게,갯수(불필요한 피쳐를 제거하자))* -> 모델선택(여러가지 모델을 해봐야한다. best 를 찾기 쉽지않다.) -> 모델 평가 -> 모델 배포
계속 발전시키는것이 머신러닝이다.
수강후기
- 머신러닝에 대해 개념이 하나도 없는 상태였는데도, 머신러닝이 대충 어떤건지 어떻게 공부를 해야하는 건지 감을 잡게 해줄수 있다는 것이 놀라웠다.
- 강의 자료만 봤을 때는 이해하지 못하는 부분이 너무 많았는데, 강의를 보며 예시를 통해 직접적으로 접근하고 집중하라는 부분만 집중을 하니깐 이해가 쏙쏙 되는 기분이였다.
- 웬만해서는 후기는 솔직하게 쓰는 편인데 지금은 1주차만 들었는데도, 앞으로의 강의가 기대가 되는 부분이다.
- 머신러닝 강의에 이어 딥러닝 강의도 있는데 머신러닝과 함께 딥러닝도 기초를 다질 수 있을 것 같다.
- 아직 다들은건 아니지만, 머신러닝과 딥러닝이 어렵게 느껴져서 시작도 못하는 사람들에게 충분히 시작할 수 있게 해주는 강의이다.