일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 프로젝트
- 크롤링
- Agile
- data
- Project
- analyzing
- javascript
- opencv
- visualizing
- instance
- python
- adaptive life cycle
- Scrum
- TypeScript
- data analyze
- 애자일
- 자바스크립트
- angular
- ECS
- AWS
- 다나와
- Crawling
- webcrawling
- Method
- algorithm
- pandas
- tensorflow
- matplotlib
- DANAWA
- keras
- Today
- Total
목록Bigdata (62)
LiJell's 성장기

유튜브 1편 크롤링 : https://lime-jelly.tistory.com/41 __04.data_analyzing_crawling_youtube_ranking (유튜브 1편) 4. Youtube ranking Crawling 멜론, 벅스, 지니 차트 크롤링 : https://lime-jelly.tistory.com/40 Crawling 기초: https://lime-jelly.tistory.com/39 4.1. 크롤링 전 사전 준비 이해가 안된다면 음악차트 크롤링.. lime-jelly.tistory.com 5.1. 시각화를 위해 필요한 라이브러리 불러오기 5.1.1. 시각화 그래프에 한글 적용을 위한 라이브러리 from matplotlib import rc, font_manager 5.1.2. 한..
유튜브 2편 전처리/시각화: https://lime-jelly.tistory.com/42 __05.data.analyzing_youtube_data_visualizing (유튜브 2편) 유튜브 1편 크롤링 : https://lime-jelly.tistory.com/41 __04.data_analyzing_crawling_youtube_ranking (유튜브 1편) 4. Youtube ranking Crawling 멜론, 벅스, 지니 차트 크롤링 : https://lime-jelly.tistory... lime-jelly.tistory.com 4.1. 크롤링 전 사전 준비 이해가 안된다면 음악차트 크롤링을 참고하세요 4.1.1. HTML 다운하기 from selenium import webdriver fr..

crawling 기초 : https://lime-jelly.tistory.com/39 3. 멜론, 벅스, 지니 차트 크롤링 3.1. selenium & Chrome Driver 라이브러리 불러오기 from selenium import webdriver import 에러가 날 경우 라이브러리 설치: !pip install selenium 크롬 드라이버 다운받기: https://chromedriver.chromium.org/downloads 본인의 크롬 버전과 알맞는 버전을 이용하시면 됩니다. 3.1.1. Chrome Driver 활용하기 from selenium import webdriver ser = Service('../chromedriver/chromedriver.exe') # 크롬드라이버 파일이 있..
crwaling crwaling을 위한 pandas 기초 https://lime-jelly.tistory.com/37 2. HTML 이해하기 2.1 필요한 라이브러리 불러오기 from selenium import webdriver from selenium.webdriver.chrome.service import Service from bs4 import BeautifulSoup import pandas as pd import numpy as np 2.2 예제 예제 다운로드: https://github.com/Play-with-data/datasalon/blob/master/02_%EA%B0%9C%EC%A0%95%ED%8C%90/2_Data_Analysis_Basic/2_2_Crawling.ipynb ht..

""" Created on Wed Jan 12 2021 @author: hanju """ 1. 데이터 불러오기 file download: https://github.com/Play-with-data/datasalon 02_개정판을 이용 import pandas as pd import numpy as np csv file 불러오기 fish = pd.read_csv('https://bit.ly/fish_csv', encoding = 'utf-8') # 한글 오류 있으면 encoding = 'euc-kr' fish ''' Species Weight Length Diagonal Height Width 0 Bream 242.0 25.4 30.0 11.5200 4.0200 1 Bream 290.0 26.3 31.2..
Modified on Jan 10 2022 # -- coding: utf-8 -- """ Created on Wed Dec 29 15:04:23 2021 @author: hanju """ 판다스 연습문제 df1 = pd.read_csv("./data/cancer_test.csv") df1.columns df1.dtypes df1.head() df1.info() df1.describe() 1. radius_mean, texture_mean, texture_se , smoothness_se NA인 행을 제거하고 총 행의 수 리턴 df1['radius_mean'].isnull().sum() df1['texture_mean'].isnull().sum() df1['texture..
Modified on Jan 10 2022 # -- coding: utf-8 -- """ Created on Wed Dec 29 14:14:18 2021 @author: hanju """ 시각화( visualization) df1 = pd.read_csv("./data/cancer_test.csv") df1 ''' id diagnosis ... symmetry_worst fractal_dimension_worst 0 842302 Malignant ... 0.4601 0.11890 1 842517 Malignant ... 0.2750 0.08902 2 84300903 Malignant ... 0.3613 0.08758 3 84348301 Malignant ... 0.6638 0.17300 4 8435840..
Modified on Jan 10 # -_- coding: utf-8 -_- """ Created on Wed Dec 29 11:23:53 2021 @author: hanju """ 17. 날짜표현 월별, 일별, 요일별 집계 현재 날짜 - 입사일자 = 근무 일자 현재 날짜 import numpy as np import pandas as pd from pandas import Series, DataFrame from datetime import datetime datetime.now() # datetime.datetime(2021, 12, 29, 11, 26, 59, 534499) d1 = datetime.now() type(d1) # datetime.datetime d1.year # 연 d1.month ..
Modified on Jan 10 # -- coding: utf-8 -- """ Created on Tue Dec 28 14:56:05 2021 @author: hanju """ 16. NA 결측치 처리, 중복값 제거 (significantly important) NA (결측치) 처리 숫자형 NA (float type), 문자형 NA import numpy as np import pandas as pd from pandas import Series, DataFrame s1= Series([1,2,3,np.nan]) s1 # 0 1.0 # 1 2.0 # 2 3.0 # 3 NaN # dtype: float64 s2 = Series(['a','b','c', np.na..