일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- tensorflow
- angular
- TypeScript
- AWS
- Crawling
- Project
- instance
- opencv
- adaptive life cycle
- keras
- matplotlib
- algorithm
- ECS
- Scrum
- visualizing
- javascript
- DANAWA
- pandas
- data analyze
- Method
- analyzing
- webcrawling
- 프로젝트
- 크롤링
- python
- 자바스크립트
- 애자일
- data
- 다나와
- Agile
- Today
- Total
목록python (43)
LiJell's 성장기
Modified on Jan 10 # -- coding: utf-8 -- """ Created on Tue Dec 28 14:56:05 2021 @author: hanju """ 16. NA 결측치 처리, 중복값 제거 (significantly important) NA (결측치) 처리 숫자형 NA (float type), 문자형 NA import numpy as np import pandas as pd from pandas import Series, DataFrame s1= Series([1,2,3,np.nan]) s1 # 0 1.0 # 1 2.0 # 2 3.0 # 3 NaN # dtype: float64 s2 = Series(['a','b','c', np.na..
Modified on Jan 08 2022 # -- coding: utf-8 -- """ Created on Tue Dec 28 14:26:49 2021 @author: hanju """ 15. stack, unstack, pivot_table 자료구조 (데이터타입) 형태 long data(tidy data) 각 속성을 컬럼으로 표현 지점 A B C -wide data(cross table : 교차표) 하나의 속성을 갖는 데이터가 각 종류마다 서로 다른 컬럼으로 분리되어 나열함 A B C 판매량 stack / unstack 1. stack wide ->> long 2. unstack long --> wide import numpy as np import pandas as pd from pandas imp..
Modified on Jan 07 2022 # -- coding: utf-8 -- """ Created on Tue Dec 28 13:14:11 2021 @author: hanju """ 14. drop, shift, rename 1. drop 특정 행, 컬럼 제거 이름 전달 emp = pd.read_csv("./data/emp.csv") emp # empno ename deptno sal # 0 1 smith 10 4000 # 1 2 allen 10 4500 # 2 3 ford 20 4300 # 3 4 grace 10 4200 # 4 5 scott 30 4100 # 5 6 king 20 4000 # scott 퇴사 emp.loc() emp['ename'] =='scott' ..
Modified on Jan 06 2022 # -_- coding: utf-8 -_- """ Created on Mon Dec 27 13:20:27 2021 @author: hanju """ 13. merge vs. concat 행이 서로 분리되어 있는 하나의 데이터프레임으로 합치기 컬럼이 서로 불리되어 있는 하나의 데이터vㅡ레임으로 합치기 참조 조건 사용, 연된된 두 데이터를 병합(join) import pandas as pd import numpy as np from pandas import Series, DataFrame DataFrame(np.arange(1,7).reshape(2,3), columns=\['A','B','C'\]) df1 = DataFr..
Modified on Jan 05 2022 # -_- coding: utf-8 -_- """ Created on Mon Dec 27 11:15:23 2021 @author: hanju """ python pandas groupby 그룹연산 성별 성적 평균, 학년별 성적 최고점수, 부서별 평균 연봉 groupby import pandas as pd from pandas import Series, DataFrame kimchi = pd.read_csv("./data/kimchi_test.csv", encoding='cp949') ''' kimchi.groupby(by=None, # 그룹핑 할 컬럼(기준) axis= 0, # 그룹핑 연산 방향 level = None) # 멀..
Modified on Jan 04 2022 # -- coding: utf-8 -- """ Created on Fri Dec 24 13:23:31 2021 @author: hanju """ pandas 정렬 sort() 예제파일은 다운 후 파일을 불러 올 때 경로를 잘 설정해주면 된다. 다운로드 참고 import pandas as pd import numpy as np from pandas import Series, DataFrame pwd # present working directory 현 위치 폴더(디렉토리) # C:\Users\hanju\Desktop\multicamp\data pd.read_csv('C:/Users/hanju/Desktop/multicamp/data/emp.csv') # 절대 경로..
Modified on Jan 03 2022 # -- coding: utf-8 -- """ Created on Fri Dec 24 11:06:32 2021 @author: hanju """ replace 메서드_치환, 삭제 replace 메서드 replce(찾을 문자열, 바꿀 문자열) 1. 기본 문자열 메서드 기본 파이썬 제공 문자열에서 호출 가능 벡터 연산(각 원소별 반복 처리) 불가 오직 문자열 치환만 가능(숫자치환, NA 치환 불가능) 'abcd'.replace('a', 'A') #'Abcd' >> a를 A로 치환 'abcd'.replace('a', '') # 'bcd' >> 공백으로 치..
Modified on Jan 02 2022 # -- coding: utf-8 -- """ Created on Mon Dec 20 17:05:55 2021 @author: hanju """ import numpy as np from pandas import Series, DataFrame df1 = DataFrame(np.arange(1,17).reshape(4,4)) dir(df1) # 다양한 기능 확인 df1 # 0 1 2 3 # 0 1 2 3 4 # 1 5 6 7 8 # 2 9 10 11 12 # 3 13 14 15 16 df1.sum(axis=0) # 행별 (서로 다른 행 끼리) 같은 위치값 갖는것 끼리 합 # 0 28 # 1 32 # 2 36 # 3 40 # dtype: int64 df1.sum(..
Modified on Jan 02 2022 # -- coding: utf-8 -- """ Created on Mon Dec 20 15:18:23 2021 @author: hanju """ 판다스_문자열 메소드 기본 메소드 : 벡터 연산 불가능 (매 원소마다 반복 불가) 'abc'.upper() # 'ABC' 'a/b/c'.split('/')[1] l1 = ['abc','def'] l2 = ['a/b/c','d/e/f'] l1.upper() # 안됨 ㅠ l2.upper() # 따라서 맵 활용 list(map(lambda x: x.upper(), l1)) # ['ABC', 'DEF'] list(map(lambda x: x.split('/'), l2)) # [['a', 'b', 'c'], ['d', 'e', ..