Python

태태개발일지 - [스파르타코딩클럽 후기]실무에 바로 쓰는 바닥부터 시작하는 머신러닝

태태코 2025. 1. 29. 17:12
반응형

수강 내용(실무에 바로 쓰는 바닥부터 시작하는 머신러닝)

머신러닝

 

컴퓨터가 명시적으로 프로그래밍 되지 않아도, 데이터를 통해 학습하고 예측할 수 있도록 하는 기능.
(AI일부분의 알고리즘이다.)

최근에는 딥러닝을 많이사용한다.
하지만 딥러닝도 머신러닝의 일부분이다.

ex) 스스로 규칙과 논리를 학습하고 결과를 도출해 낸다.

 

오해하는부분 

코딩없이 가능하다?

X 규칙과 논리를 스스로 찾는것이지 그 찾는 것은 프로그래밍해야한다.

 

 

인공지능 -> 가장 큰 범위(스스로 생각할 수 있는 프로그래밍) 머신러닝은 그중에 하나이다.
또 딥러닝과 강화학습은 머신러닝의 부분이다.

 

  • 지도학습 
  • 비지도학습 
  • 강화학습

 

머신러닝의 역사

과거에 머신러닝을 활용하지 못했던 이유

 

근본적인 문제:

 데이터가 굉장히 많이 필요했었다. 데이터의 질과 양이 필요했다. 하지만 과거에는 불가능 했다.

데이터를 통해 논리와 규칙을 찾아내는 것이 어려웠다.

 

근본적인 문제 해결:

엔비니아나 intel에서 좋은 하드웨어를 제공하고있고, 빅데이터시대가 오면서 과거의 문제가 해결되었다.

알고리즘의 향상과, 오픈소스 커뮤니티와 생태계의 발전을 통해 머신러닝이 폭발했다.

 

 

개요와 구성

머신러닝의 기본적인 구성요소, 학습과정

 

1. 지도학습 : 데이터에 정답이 포함되어있다.

ex) 주택가격: 평수,위치, ... -> 집값이 정답이된다. 이러한 요소를 가지고 집값을 맞추는 것.

 

2. 비지도 학습: 데이터에 정답이없다. (류)

ex) 데이터의 특징을 보고 유사한 데이터끼리 모으는 것을 의미.

 

3. 강화학습: 게임을 하는 인공지능 -> 순차적인 결정문제

ex)action이라는 특정행위를 하는 알고리즘 (알파고)

 

 

머신러닝의 핵심들

 

1. 데이터셋 :

    항상 존재한다.  일반적으로 (입력과 출력(레이블) 데이터로 구성된다.)

 

ex) 과일 데이터 셋 => 과일 크기, 종류, 색깔 : 레이블은 항상 다르다.

 

 

입력데이터: 정보를 추론하기 위한 데이터

출력데이터: (레이블) 정답데이터

 

100%의 비율로 본다면 80%은 학습 20%는 테스트에 사용한다.

 

2.  특징(모델이 학습할 수 있는 개별 속성)

 

3. 레이블 (출력값)

 

4. 모델, 학습

 

5. test

 

over fitting -> 일반적인 지식이아니라 특정 지식으로 국한되어있다. 조심해야한다.

 

머신러닝 흐름

ex)과일을 분류하는 과제.

데이터 수집(사과사진찍기) -> 데이터 전처리(잘못찍은 바나나 사진 없애기) -> *특징선택(가격,무게,갯수(불필요한 피쳐를 제거하자))* -> 모델선택(여러가지 모델을 해봐야한다. best 를 찾기 쉽지않다.) ->  모델 평가  -> 모델 배포

 

계속 발전시키는것이 머신러닝이다.

 

<강의 중 강의자료>

 

 

수강후기

  1. 머신러닝에 대해 개념이 하나도 없는 상태였는데도, 머신러닝이 대충 어떤건지 어떻게 공부를 해야하는 건지 감을 잡게 해줄수 있다는 것이 놀라웠다.
  2. 강의 자료만 봤을 때는 이해하지 못하는 부분이 너무 많았는데, 강의를 보며 예시를 통해 직접적으로 접근하고 집중하라는 부분만 집중을 하니깐 이해가 쏙쏙 되는 기분이였다.
  3. 웬만해서는 후기는 솔직하게 쓰는 편인데 지금은 1주차만 들었는데도, 앞으로의 강의가 기대가 되는 부분이다.
  4. 머신러닝 강의에 이어 딥러닝 강의도 있는데 머신러닝과 함께 딥러닝도 기초를 다질 수 있을 것 같다.
  5. 아직 다들은건 아니지만, 머신러닝과 딥러닝이 어렵게 느껴져서 시작도 못하는 사람들에게 충분히 시작할 수 있게 해주는 강의이다.

 

 

반응형