python
-
파이썬 if ~ not in의 사용python 2020. 12. 22. 20:29
파이썬 문법 중 if~in / if ~ not in 에 대한 내용이다. 항상 헷갈리는 부분이라서 정리해둔다. (0) 기본적인 사용방법은 다음과 같다. if A in B : B안에 A가 있으면 참(true)이다. if A not in B : B안에 A가 없다면 참(true)이다. B에는 리스트, 튜플, 문자열을 사용할 수 있다. (중요) 리스트 = [1,2,3,4,5] if 9 not in 리스트: print('9가 없다') else: print('9가 있다') #### 출력 #### 9가 없다 문자열 = 'hello world' if 'a' not in 문자열: print('a가 문자열안에 없다') if 'e' in 문자열: print('e가 문자열안에 있다') #### 출력 #### a가 문자열안에 없..
-
파이썬 conda 및 pip 명령어python 2020. 12. 20. 09:05
pip와 conda는 파이썬의 각종 라이브러리들을 설치 및 관리해주는 패키지 매니져이다. pandas또는 tensorflow, keras 같은 것들이 모두 패키지(라이브러리)이고 이것들을 설치할때 pip와 conda명령어를 사용한다. conda의 경우 anaconda.org에서 관리하는 패키지로 한정되어있기때문에 원하는 패키지가 없을 경우 pip를 사용한다. 간혹 책이나 인터넷에서 pip3, pip2 명령어도 볼 수 있는데 그냥 pip를 사용하면 된다. 예전에 여러버전 설치(파이썬2와 3을 함께 사용)했을때는 패키지설치 중복을 피하기위해 pip2와 pip3와 같이 버전을 붙여서 실행했다. 이것저것 삽질하면서 많이 사용하는 명령어들 모아봤다. 이외에도 네이버에 검색하면 여러 종류의 명령어들이 있다. 구글에..
-
파이썬 판다스(pandas) 요약 정리python 2020. 12. 19. 20:05
데이터 분석용으로 많이 쓰이는 pandas를 메모장에 정리한 내용이다. 가끔 기억이 가물가물할때 쭉 읽어본다. 구글에 검색해보면 나오는 Cheat sheet(pdf)도 유용하다. https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf B. pandas basic # pandas 의 기본자료구조, Serise, DataFrame # Serise : 컬럼이 없음, 인덱스만 존재하는 자료구조 # DataFrame: 인덱스와 컬럼이 존재하는 자료구조 s= pd.Series([1,2,3]) # 리스트 또는 배열을 시리즈로 변환, 인덱스는 0,1,2...자동 s= pd.Series(np.array([1,2,3])) s= pd.Series({'a':5, 'b':6}) # 딕셔너리를 시..
-
파이썬 판다스(pandas) 데이터 처리 속도 비교python 2020. 12. 19. 19:21
판다스를 사용할때 데이터프레임(dataframe)에 행데이터(row data)를 연속적으로 쌓아나가야 하는 경우가 있다. 매우 많은 행들을 쌓아나가는 작업을 할 때 (Adding a lot of rows to dataframe) 어떻게 하면 속도측면에서 효율적일까? (1) 데이터프레임 생성 후 행데이터를 append로 삽입한다. (2) 데이터프레임 생성 후 행데이터를 concat으로 삽입한다. (3) 데이터프레임 생성 후 행데이터를 loc인덱싱하여 삽입한다. (4) dict 타입으로 행데이터를 append하고 완료 후 데이터프레임을 생성한다. (5) list타입으로 행데이터를 append하고 완료 후 데이터프레임을 생성한다. * 속도측정 결과(in secs) 방식 1000 rows 5000 rows 10..
-
파이썬 코드 스타일python 2020. 12. 19. 19:04
파이썬스러운 코딩방식을 알아보자, 파이썬 특유의 코드를 소개한다. (참고: 데이터 과학을 위한 파이썬 프로그래밍, 최성철 지음) (1) for문 없이 문자열을 나누고 합친다. 문자열.split(',') # 문자열을 쉼표(,)기준으로 분리하여 list 반환 문자열.split() # 문자열을 빈칸기준으로 분리하여 list 반환 ''.join(리스트) # 문자열로 구성된 list를 합쳐 하나의 문자열로 반환 '-'.join(리스트) # 구분자'-'를 추가하여 합친다. a=' 키움 증권 ' # 앞뒤 공백 a.rstrip() # 마지막문자에 한해 공백제거 ' 키움 증권' a='키움 증권;' a.rstrip(';') # 마지막문자에 한해 세미콜론(;)제거 '키움 증권' (2) 지능형리스트 리스트와 for문을 ..
-
파이썬 Naming Rulepython 2020. 12. 19. 17:49
프로그램을 작성함에 있어 변수나 파일의 이름을 짓는게 힘든 경우가 많다. 아마 프로그래밍 경험이 적거나 습관이 되지 않아서 일 것이다. Naming Rule(네이밍 룰)은 코드의 가독성 및 일관성, 여러사람과의 협업을 위해서 꼭 필요하다. 표준적인 네이밍 룰을 사용하거나 협업을 위한 공통된 네이밍 룰을 만들어 놓는것이 중요하다. PEP8(파이썬 코딩 스타일에 대한 가이드)을 참고하여 개인적인 작명법(네이밍룰)을 만들어 보았다. 정답은 없지만 가능하면 표준 스타일을 사용하는 것을 권장한다. 링크: http://pythonstudy.xyz/python/article/511-파이썬-코딩-스타일 (1) 함수명 - 소문자 + 밑줄 - 처음에는 기능의 의미가 들어가면 좋다. get_company_list (Get_..
-
파이썬 시작하기 (설치 및 기타)python 2020. 12. 12. 13:15
파이썬을 18년초부터 공부하기 시작했다. 그때 정리했던 내용이다. (18.10.03 작성) 아마 지금이랑 크게 차이나는건 없을것 같다. 1. 아나콘다3 64비트 설치 (0) 아나콘다(Anaconda)에 파이썬(python)이 포함되어있기때문에 파이썬을 별도로 설치할 필요없음. (1) https://www.anaconda.com/download/ 으로 접속 (2) 좌측의 아나콘다 python3.6버전 64비트 선택하여 다운로드한다. (3) 설치파일을 관리자권한으로 실행시키고 설치과정에서 Advanced Option에서 첫째 path설정 체크 2. 파이썬 버전 확인 (1) Anaconda Prompt를 관리자권한으로 실행시킨다. Anaconda Prompt는 cmd창과 동일하다고 보면 된다. (2) 프롬프트..