728x90
반응형

파이썬판다스 따라하기 12

#판다스연산4편 - 판다스 diff pct_change expending rolling groupby ewm 함수

판다스에서 사용하는 함수들은 사용자가 일반 파이썬 연산으로 구현도 가능함 하지만 오류검증등 코드를 완성도 있게 구현하는데 시간이 소요되기 때문에 구현 보다는 활용이 더 현명함 하지만 앞서 말한것과 같이 다른사람이 만든 코드를 사용하는것이 항상 옳은 방향은 아님 예를 들어 대량의 데이터를 반복하여 수행하며 직접 코드를 만들어서 사용하는 것이 속도가 더빠르고 이 작업의 핵심이 시간이라면 직접만들어서 사용할 수 밖에 없음 기능과 리소스등을 고려해서 오픈소스를 사용하는 것이 현명함 DataFrame.diff(periods=1, axis=0) diff는 diffence(차이)의 줄임말임 axis가 0이면 행을 의미하며 axix가 1이면 열이며 설정된 axis값을 참조하여 행열을 비교함 axis의 기본값은 0임 p..

#판다스연산3편 - 판다스 round sum prod abs transpose rank 함수

python에서 일반적으로 사용하는 함수들과 유사하게 판다스에도 적용가능함 하지만 숫자 1개 가 아니라 dataframe을 가공하는 기능이 추가적으로 존재함 DataFrame.round(decimals=0, args, kwargs) 반올림해주는 함수임 파이썬의 round함수와 동일 decimals는 소수 몇째 자리인지 정의하는 부분 decimals = 1이면 소수2째자리에서 반올림함 decimals = -1이면 일의 자리에서 반올림함 단 출력들은 모두 실수로 반환 number = 35.45275 for i in range(-1,3): print(round(number,i)) print('\n-----------\n') import pandas as pd import numpy as np ## 난수 발생기..

#판다스연산2편 - 판다스 mod pow dot함수

파이썬에서 나머지 거듭제곱과 유사하게 판다스에서도 나머지 거듭제곱이 존재함 나머지는 mod함수 거듭제곱은 pow함수가 있음 그리고 dot이라는 행열곱 연산이 있음 -결과(이미지) DataFrame.mod(other, axis='columns', level=None, fill_value=None) 판다스 사칙연산과 유사하게 mod는 나누기 함수이며 전체 틀은 add와 유사함 import pandas as pd data = [[1,2,3],[4,5,6],[7,8,9]] df = pd.DataFrame(columns = ['col1','col2','col3'],index = ['index1','index2','index3'],data = data) print(df) print('\n---------------..

#판다스연산1편 - 판다스 사칙연산

판다스연산을 시작하기 전에 계속 반복해야 하는것이 있음 판다스는 패키지를 활용하는 것이며 가장 기본적인 형태는 수 없이 반복해도 지나치지 않음 import pandas as pd df = pd.DataFrame() print(df) -결과 (드래그로 확인가능) Empty DataFrame Columns: [] Index: [] 비어있는 데이터프레임을 선언했고 결과는 인덱스와 컬럼이 출력됨 비어있는 데이터프레임이기 때문에 값은 출력되지 않음 주피터 노트북에서는 print()로 출력을 할 수도 있지만 변수 자체를 코딩할 수 있는 Cells에 입력후 출력할 수도 있음 사용자가 시각적으로 편한 방법으로선택가능함 #출력1 print로 출력 import pandas as pd df = pd.DataFrame(col..

#파이썬기초5편 - 패키지 설치

패키지는 코딩 철학을 의미하며 패키지가 파이썬의 철학이고 파이썬의 철학이 곧 패키지임 도데체 뭔말인지 모른다? 뭐다? 다시 초심으로 돌아가면 코딩을 하는 이유는 자동화를 하기 위해서 임 왜 자동화를 해야함? 이라고 물을 수도 있음 안해도 됨 하지만 하면 더 편해짐 더 빨라짐 그리고 주어진시간에 더 빨리 마쳤기에 내가 하고 싶은 다른걸 할 수 있음 그래서 코딩을 해야함 다시 돌아와서 자동화를 해야하는데 하루 아침에 자동화가 뚝딱하고 완성 되진 않음 시간과 노력이 걸린다는 뜻임 조선시대에서 대한민국으로 수백년이 결렸듯이 코딩 결과물도 마찬가지임 그 결과물 자체도 자동화 개념을 적용시켜야함 결과물을 최대한 다음에도 쓸 수 있게 만들어야하고 그런 가치관을 갖고 살아야함 왜 의사가 수술을 잘하냐면 밥만 먹고 수술..

파이썬판다스따라하기

Pandas는 왜 알아야 하는가? 좀 더 편하게 연산하기 위해서? 방대한 기능을 포함하고 있어서 테이블이나 대량의 데이터들을 연산하고 가공하는데 매우 유용함 세상엔 양면이 항상 존재함 쉽게 생각해 보면 집에 칼이 있음 칼은 정말 유용한 도구중 하나임 요리를 할때도 과일을 깍아 먹을때도 택배상자 포장테이프 자를때도 모두 유용하게 쓰이지만 한눈을 팔고 칼을 사용하다가는 손에 베이게 됨 당연히 칼이 단점보다는 장점이 많으니깐 지금 까지 살아 남았겠지만 판다스도 마찬가지임 방대하고 편하함 하지만 고속연산이 필요하면서 반복적인 작업에는 리스트나 더 빠른 방법을 찾아야 함 판다스 역시 장점보다는 단점이 많기에 지금까지 파이썬 유저들에게 사랑 받고 있음 계속 이야기 하지만 방대함 앞으로 살펴볼 각 편에서는 panda..

#파이썬기초4편 - 파일 읽기 쓰기 추가

코딩으로 구현하고 자 하는 목표치가 각각 다를것임 학생들은 데이터를 수집하는 것 부터 시작해서 데이터를 가공하여 그래프등을 만들수도 있음 회사원들은 수치 데이터를 가공하여 나온 결과 값으로 보고서를 만드는 등 다양한 곳에 활용할 수 있음 파일입출력은 txt파일등 파일을 읽거나 쓰거나 이미 쓰여진 파일에 추가를 하는 기능이 있음 path = 'D:\\tmp\\test.txt' mode = 'w' f = open(path,mode) f.write('modoo python\n') f.write('hello python\n') f.close() mode2 = 'a' f = open(path,mode2) f.write('\n\n') f.write('goodbye python\n') f.close() -결과 (이미..

#파이썬기초3편 - 함수 클래스

인간은 맨몸으로 수렵활동을 하다가 돌과 나무등 도구를 만들어 쓰고 그 도구들이 진화하여 지금은 기계 장비들이 그 역할들을 대신 하고 있음 이런것을 산업혁명 또는 자동화라고 부름 코딩 또한 마찬가지임 컴퓨터를 사용하여 10명 100명 1000명에게 보낼 이메일을 파이썬 코딩으로 한번에 보낼수 있음 집 안에 잘 살펴보면 자동화 도구들로 다 모여 있음 칼 가스레인지 샤워기 등등 모두 자동화 도구들임 칼이 없으면 손으로 잘라야 하고 가스레인지가 없으면 불피워서 라면을 끓여야하고 샤워기가 없으면 물을 받아서 바가지로 퍼서 샤워를 해야함 칼의 사용처는 다양함 손님이 왔을때 사과깍는 용도로 감자전 먹고 싶을땐 감자 깍는용도로 사용됨 이처럼 도구들은 유용하며 집에 놔두고 계속 사용하는 것들임 계속 사용하는 것을 기억해..

#파이썬기초2편 - 제어문

제어문은 제어문법임 제어문의 핵심문법은 2가지임 if문과 for문임 원하는 무엇인가를 구현하려고 할때 if문과 for문으로 모든것을 구현 가능함 다른 사람이 만들어 놓은 코드를 보면 모든 것들이 if문과 for문의 조합임 if문은 상태의 True이냐 False이냐를 판단해 주는 구문이며 for문은 반복해주는 구문임 원하는 상태를 반복으로 수행해주는 것이 자동화임 for i in range(0,10): if i%2 == 0: print(i) -결과 (드래그로 확인가능) 0 2 4 6 8 0에서 9까지 2의 나머지가 0인 숫자 다른말로 짝수를 출력하는 코드임 for문은 반복을 수행하는 역할이며 if문은 짝수 필터를 수행하는 역할임 if문은 조건문이라고함 추가 조건을 만드려면 if문 다음에 elif를 사용할 ..

#파이썬기초1편 - 자료형

파이썬에는 가장 기초적인 변수들의 형태를 반드시 알고 가야함 다양한 자료형이 존재함 숫자형, 문자열, 리스트, 딕셔너리, 집합, 불 자료형이 있음 숫자형은 대표적으로 int형과 float형이 존재하며 int는 정수형이고 float은 실수형임 정수형과 실수형의 연산의 결과는 실수형으로 표현됨 결과를 실수형의 연산을 했더라도 결과값을 int() 괄호로 감싸면 결과는 정수형이 됨 마찬가지로 정수형 연산이라도 float()로 감싸면 실수형으로 표현됨 참고로 코드 실습을하고 결과를 보여주게 되는데 주로 print() 함수를 사용함 print()함수는 괄호안의 값을 출력해 주는 함수임 a = 1 print(type(a)) print(a) b = 1.0 print(type(b)) print(b) c = a + b p..

728x90
반응형