일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- algorithm
- Project
- python
- Agile
- opencv
- 애자일
- adaptive life cycle
- Scrum
- ECS
- data
- tensorflow
- angular
- 프로젝트
- pandas
- AWS
- webcrawling
- 크롤링
- visualizing
- instance
- analyzing
- DANAWA
- javascript
- TypeScript
- data analyze
- Crawling
- Method
- keras
- matplotlib
- 다나와
- 자바스크립트
- Today
- Total
목록pandas (10)
LiJell's 성장기

import pandas as pd import numpy as np np.random.seed(88) df = pd.DataFrame({'A': np.linspace(1,10,10)}) df = pd.concat([df, pd.DataFrame(np.random.randn(10,4), columns = list('BCDE'))], axis= 1) df.iloc[3,3] = np.nan df.iloc[0,2] = np.nan Styling the DataFrame 1. Highlight: 하이라이트 Highlight Min-Max values For highlighting maximum values : chain '.highlight_max()' function to the styler object Ad..
02. about Pandas pandas는 numpy를 기반으로 만들어진 라이브러리로 데이터 분석에서 가장 많이 활용된다 1차원 배열 형태의 데이터 구조를 Series, 2차원 배열 형태를 DataFrame이라고 한다 2.1. DataFrame pandas의 가장 기본적인 구조인 DataFrame은 2차원 배열 형태로 행과 열이 있고, 행을 구분해주는 index, 열을 구분해주는 column이 있다 아래는 날짜 형태로 된 8개의 인덱스를 간단히 만들어봤다 import pandas as pd index = pd.date_range('1/1/2000', periods= 8) print(index) ''' DatetimeIndex(['2000-01-01', ..
01. Olympic Medal data 하계 올림픽 데이터를 정리해보자 1.1. 필요한 라이브러리 다운로드 !pip install lxml !pip install html5lib !pip install openpyxl 1.2. 데이터 가져오기 import pandas as pd import numpy as np 올림픽 메달 집계를 구글에 검색하고 위키백과 자료를 가져와보자 df = pd.read_html('https://ko.wikipedia.org/wiki/%EC%98%AC%EB%A6%BC%ED%94%BD_%EB%A9%94%EB%8B%AC_%EC%A7%91%EA%B3%84') print(df) 위키 백과에 있는 html 데이터를 가져올 수 있다 [] 에 쌓여있는것을 보니 리스트 임을 알..

""" Created on Wed Jan 12 2021 @author: hanju """ 1. 데이터 불러오기 file download: https://github.com/Play-with-data/datasalon 02_개정판을 이용 import pandas as pd import numpy as np csv file 불러오기 fish = pd.read_csv('https://bit.ly/fish_csv', encoding = 'utf-8') # 한글 오류 있으면 encoding = 'euc-kr' fish ''' Species Weight Length Diagonal Height Width 0 Bream 242.0 25.4 30.0 11.5200 4.0200 1 Bream 290.0 26.3 31.2..
Modified on Jan 10 2022 # -- coding: utf-8 -- """ Created on Wed Dec 29 15:04:23 2021 @author: hanju """ 판다스 연습문제 df1 = pd.read_csv("./data/cancer_test.csv") df1.columns df1.dtypes df1.head() df1.info() df1.describe() 1. radius_mean, texture_mean, texture_se , smoothness_se NA인 행을 제거하고 총 행의 수 리턴 df1['radius_mean'].isnull().sum() df1['texture_mean'].isnull().sum() df1['texture..
Modified on Jan 05 2022 # -_- coding: utf-8 -_- """ Created on Mon Dec 27 11:15:23 2021 @author: hanju """ python pandas groupby 그룹연산 성별 성적 평균, 학년별 성적 최고점수, 부서별 평균 연봉 groupby import pandas as pd from pandas import Series, DataFrame kimchi = pd.read_csv("./data/kimchi_test.csv", encoding='cp949') ''' kimchi.groupby(by=None, # 그룹핑 할 컬럼(기준) axis= 0, # 그룹핑 연산 방향 level = None) # 멀..
Modified on Jan 04 2022 # -- coding: utf-8 -- """ Created on Fri Dec 24 13:23:31 2021 @author: hanju """ pandas 정렬 sort() 예제파일은 다운 후 파일을 불러 올 때 경로를 잘 설정해주면 된다. 다운로드 참고 import pandas as pd import numpy as np from pandas import Series, DataFrame pwd # present working directory 현 위치 폴더(디렉토리) # C:\Users\hanju\Desktop\multicamp\data pd.read_csv('C:/Users/hanju/Desktop/multicamp/data/emp.csv') # 절대 경로..
Modified on Jan 02 2022 # -- coding: utf-8 -- """ Created on Mon Dec 20 17:05:55 2021 @author: hanju """ import numpy as np from pandas import Series, DataFrame df1 = DataFrame(np.arange(1,17).reshape(4,4)) dir(df1) # 다양한 기능 확인 df1 # 0 1 2 3 # 0 1 2 3 4 # 1 5 6 7 8 # 2 9 10 11 12 # 3 13 14 15 16 df1.sum(axis=0) # 행별 (서로 다른 행 끼리) 같은 위치값 갖는것 끼리 합 # 0 28 # 1 32 # 2 36 # 3 40 # dtype: int64 df1.sum(..
Modified on Jan 02 2022 # -- coding: utf-8 -- """ Created on Mon Dec 20 15:18:23 2021 @author: hanju """ 판다스_문자열 메소드 기본 메소드 : 벡터 연산 불가능 (매 원소마다 반복 불가) 'abc'.upper() # 'ABC' 'a/b/c'.split('/')[1] l1 = ['abc','def'] l2 = ['a/b/c','d/e/f'] l1.upper() # 안됨 ㅠ l2.upper() # 따라서 맵 활용 list(map(lambda x: x.upper(), l1)) # ['ABC', 'DEF'] list(map(lambda x: x.split('/'), l2)) # [['a', 'b', 'c'], ['d', 'e', ..