본문 바로가기

전체 글

(103)
[ABC 220829 - 10일차] 웹기초 실습(혼자 해본 것) 교통사고 현황 데이터 분석 및 지도 시각화 서울을 기준으로 한번 실습해보자! - 이 경우 강남이나 강북의 차이를 보도록 하자. 1. 데이터 분석, 시각화 2. 지도 시각화 3. 느낀점 ** 데이터 전처리 과정은 이전 글에서 확인 ** 1) 데이터 준비하기 su_df = df[df['발생지시도'] == '서울'] su_df.info() 2) 데이터 확인 su_df.head() 3) 발생시간별 사망자수 현황 fig = px.bar(su_df,x='사망자수', y='발생시간', orientation='h') fig.show() 4) 요일별 사망자수 현황 fig = px.bar(su_df,x='사망자수', y='요일', orientation='h',color='주야') fig.show() 5) 발생지별 사망자수..
[ABC 220829- 10일차] 웹 기초 교통사고 현황 데이터 분석 1. 라이브러리 임포트 import pandas as pd import plotly.express as px 2. 데이터 준비하기 - 데이터를 불러오기 전에, 데이터를 먼저 확인해보자. 왜 notepad++로 열었냐? => 데이터의 개수가 많은 csv 파일일 경우에는 엑셀로 열게 되면 데이터가 깨질 수 있다. notepad++로 열면 안깨짐!! 데이터를 열어서 우리가 확인할 것? - 1. encoding 방식 확인, 2. 데이터 개수 확인, 3. 각 데이터 형식 확인 - 데이터 불러오기 df = pd.read_csv('/content/도로교통공단_교통사고 정보.csv', encoding='euc-kr') df.head() : 이때, 왜 경로가 내 PC가 아닐까? ==> Cola..
[220824 ABC - 7일차] PYTHON 라이브러리 # 파이썬 머신러닝 판다스 데이터 분석 교재 실습 시작 1. 데이터 과학자가 판다스를 배우는 이유? - 데이터과학은 데이터를 연구하는 분야이고, 데이터 자체가 가장 중요한 자원이다. - 실제로 데이터 분석 업무의 80~90%는 데이터를 수집하고 정리하는 일이 차지한다고 볼 수 있다. - 데이터과학자가 하는 가장 기초적이고 중요한 일은 데이터를 수집하고 분석이 가능한 형태로 정리하는 것이다. - 판다스 라이브러리는 데이터를 수집하고 정리하는 데 최적화된 도구라고 할 수 있다. * 데이터를 신뢰할 정도로 만든다? => 데이터 정리를 잘한다! 2. 판다스 자료구조 - 판다스는 시리즈(Series)와 데이터프레임(DataFrame)이라는 구조화된 데이터 형식을 제공한다. - 이때, 시리즈는 1차원 배열이고, 데..
[220824 ABC - 7일차] PYTHON 기초 [ turtle 라이브러리로 python을 정리 해보자! ] - forward() 함수를 통해 지정한 만큼 앞으로 전진 - right() 함수와 left() 함수를 통해 지정한 각도만큼 회전한다 import turtle as t t.shape("turtle") t.forward(50) # 50 픽셀만큼 앞으로 감 t.right(90) # 90도만큼 오른쪽으로 회전한다. t.forward(50) - circle() 함수를 통해서 원을 그릴 수 있다. import turtle as t # 삼각형 그리기 t.forward(d) t.left(120) t.forward(d) t.left(120) t.forward(d) t.left(120) # 사각형 그리기 t.forward(d) t.left(90) t.forwa..
[220823 ABC - 6일차] PYTHON 라이브러리 [ 수학 라이브러리 numpy ] - 많은 게임 프로그램과 시뮬레이션에서 무작위 번호, 즉, 난수를 구하는 것이 필수적이다. - 난수나 수학과 관련된 집합, 특정 계산과 숫자를 2차원, 1차원 형태로 관리해주는 모듈이다. - 인공지능에서 필수적으로 사용되는 기능이다. - numpy는 numeraical python의 약자로, 파이썬에서 배열을 처리할 때 널리 사용되는 라이브러리다. - numpy는 배열 자료구조를 이용한다. - 즉, 배열이라는 개념은 파이썬에서 존재하지 않기 때문에 numpy를 설치해서 사용한다. - 처리속도가 빠르다. 대용량의 다차원 배열에서 파이썬의 리스트보다 월등히 빠르다. - 유연한 연산을 제공한다. !pip install numpy import numpy as np # 1차원 배..
[220823 ABC - 6일차] PYTHON 기초 [ 0822 복습 ] - 전역변수와 지역변수 def fun_abc() : a = 10 fun_abc() : 사용자 정의 함수 내부에 선언된 a는 밖에 나와서는 의미있는 변수가 아니라 fun_abc()의 함수가 종료되면 사라지는 변수이다. [ 사용자 정의 함수 ] - 외부 함수를 호출해 수행을 완료하면 함수 안에 선언된 모든 지역변수의 생명주기는 마무리된다. - 외부 함수에 있는 내부 변수들을 계속 유지할 수 있도록 도와주는 것에 클로저(closure)라는 것이 있다. - 내부 함수의 변수값을 해당 함수 외부에서도 계속해서 참조할 수 있게 도와준다. def outer(): count = 0 def inner() : nonlocal count count += 1 return count return inner..
ABC 프로젝트 준비 (220823 조사 시작) 보호되어 있는 글입니다.
[220822 ABC 5일차] - PYTHON 기초 [ 0818 복습 ] - if 조건식 : 명령문 no = 12 if no >= 7: print("7보다 크네요.") print("끝내기.") - and 연산자를 이용해서 조건식 사용 가능 no = 12 if no >= 7 and no = 7 and no 범위를 지정해주는 것도 가능 8. i의 초깃값을 지정할 경우 초깃값이 for문의 i에 영향을 미칠 수 있다. 9. for i in ['대전', '서울', '부산'] => 글자의 갯수로 불러와서 for문을 사용하는 것도 가능 10. for _ in range() => 별도의 변수를 사용하고 싶지 않으면 _(언더바)를 사용한다 11. 사용자 정의 함수 12. def 함수명(인자) : 13. def a(5) => 소셜 네트워크 분석 14. def b(5) =>..

반응형
LIST