본문 바로가기
728x90

데이터 분석4

[Numpy] column_stack, tile numpy.column_stack(tup) 1-D 배열을 column으로 쌓아서 2-D 를 만드는 것이다. numpy.tile(A, reps) 배열 A를 행, 열로 반복해서 배열을 구성 2023. 8. 20.
[Pandas] 데이터 숫자로 매핑방법 데이터를 머신러닝 학습시키기 위해서는 모두 수치화 해주는 것이 좋다. 만약 명목형 데이터인 경우에는 순서가 없으므로 유/무를 원핫 인코딩을 통해 여러 열을 만들어 해결하는 것이 좋다. 이를 더미함수(dummy)를 이용한다고 하는데 이 때 판다스에서는 친절한 함수가 있다. 일 때 import pandas as pd dummy = pd.get_dummies(test['측정 시간대']) 만약 순서가 있는 데이터일 경우는 어떻게 짤 수 있을까? for문으로 함수를 구현해야할까? 아니다. 매핑을 통해 할 수 있다. 만약 새벽:0, 오전:1 오후:2 저녁:3으로 매핑시키고 싶으면 다음과 같은 코드를 짜면 된다. time_mapping = {"새벽":0,"오전":1,"오후":2,"저녁":3} df['측정 시간대'] .. 2023. 7. 19.
셀레니움 (selenium)을 이용한 데이터 크롤링 1) 크롬 정보 확인 2) webdriver 설치 아래 사이트 들어가서 버전에 맞는 크롬을 설치한다. https://chromedriver.chromium.org/downloads ChromeDriver - WebDriver for Chrome - Downloads Current Releases If you are using Chrome version 113, please download ChromeDriver 113.0.5672.24 If you are using Chrome version 112, please download ChromeDriver 112.0.5615.49 If you are using Chrome version 111, please download ChromeDriver 111.0... 2023. 4. 24.
[데이터 분석] 2023 LCK_스프링 챔피언 분석(01.18~01.19) 2023 LCK 스프링이 이번 주 시작이 되었습니다. 바텀 메타답게 바텀에 라인전 강한 픽들이 나왔는데요 한번 재미로 데이터 정리를 해봤습니다. (자료는 제가 수작업을 했습니다.) 혹시 오류가 있다면 말씀해주세요 ㅜㅜ 선수들이 생각하는 탑티어(OP챔) 현재까지는 케이틀린은 8경기 8벤입니다. 긴사거리와 덫과 헤드샷, e 스킬을 통한 약간의 회피기능은 라인전이 강한 만큼 필밴으로 한번도 못나오고 있습니다. 마오카이, 유미, 바루스는 무조건 픽되거나 밴이 되고 있는데 바루스는 유성바루스로 강한 라인전때문에 뽑고 있는 것 같습니다. 유미는 라인전이 강하다고는 할 수 없는데 후반 사기적인 힐 보유량으로 라인전때 정글이 계속 봐주는 만큼 버틸 수 있다고 생각되는지 인기픽으로 꼽히고 있습니다. 좀 놀라운 사실은 이.. 2023. 1. 20.
728x90