반응형

Python 4

태태코딩 - pandas 정리

Pandas엑셀말고 판다스를 이용하는 이유 엑셀은 만줄만 넘어가도 느려지지만, 파이썬은 만줄은 가볍다. pandas종류seriesdataframe구별법 열의 갯수이다. series는 열이 하나이다.dataframe은 열이 두개이상이다. loc와 iloc 구별법pd.loc['index']pd.iloc[index숫자] loc는 ''로 특정 인덱스 이름으로 찾는 것이고,iloc는 인덱스의 번호로 찾는다. #판다스 사용법import pandas as pdlst = [1,2,3,4,5,6,7,8,9]lst2 = [1,2,3,'Apple','play',6,7,8,9]#열이 하나여야 한다.sr2 = pd.Series(lst2)#csv파일 읽어오기pd.read_csv('삼성전자 종가.csv')#csv파일에있는..

태태개발일지 - [스파르타코딩클럽 후기]실무에 바로 쓰는 바닥부터 시작하는 머신러닝

수강 내용(실무에 바로 쓰는 바닥부터 시작하는 머신러닝)머신러닝 컴퓨터가 명시적으로 프로그래밍 되지 않아도, 데이터를 통해 학습하고 예측할 수 있도록 하는 기능. (AI일부분의 알고리즘이다.)최근에는 딥러닝을 많이사용한다. 하지만 딥러닝도 머신러닝의 일부분이다.ex) 스스로 규칙과 논리를 학습하고 결과를 도출해 낸다. 오해하는부분 코딩없이 가능하다?X 규칙과 논리를 스스로 찾는것이지 그 찾는 것은 프로그래밍해야한다.  인공지능 -> 가장 큰 범위(스스로 생각할 수 있는 프로그래밍) 머신러닝은 그중에 하나이다.또 딥러닝과 강화학습은 머신러닝의 부분이다. 지도학습 비지도학습 강화학습 머신러닝의 역사과거에 머신러닝을 활용하지 못했던 이유 근본적인 문제: 데이터가 굉장히 많이 필요했었다. 데이터의 질과 양이 필..

Python 2025.01.29

태태개발일지(Numpy)

python으로 하는 데이터 분석에도 관심이 생겨서 데이터 분석 입문인 Numpy를 공부해 보았다. #원소에 10씩 곱하기 array = np.random.randint(1,10, size=4).reshape(2,2) result_array = array*10 print(result_array) array1 =np.arange(4).reshape(2,2) #배열 덧셈 print(array1) array2 = np.arange(2) array3 = array1+ array2 print(array3) array1 = np.arange(0,8).reshape(2,4) array2 = np.arange(0,8).reshape(2,4) #배열 합치기 array3 = np.concatenate([array1,arr..

태태개발일지(크롤링)

python을 이용하여 웹 크롤링을 하는 것을 실습해 보았는데 생각보다 간단해서 깜짝놀랐다.request 와 BeatifulSoup이라는 라이브러리를 통해 실습해 보았는데request 라이브러리를 통해서 웹에있는 정보를 가져온후 BeautifulSoup라이브러리를 통해서 html을 파싱하고soup 명령어를 통해 제목을 가져오는 실습 이였다.Requests:     http요청을 통해서 html소스를 가져오는 용도로 사용. BeautifulSoup:     request가져온 html코드를 ptyhon이 이해하는 구조로 바꿔주는 라이브러리 ect) selenium,urllib p라는 태그와 , p태그의 텍스트를 가져오는 문단이고마지막은 html 구조를 이쁘게 찍어주는 prettify 메서드이다. 다음은 j..

반응형