목록데이터 분석 (156)
Data Analyst KIM
SELECT ai.NAME , ai.DATETIME FROM ANIMAL_INS AS ai LEFT JOIN ANIMAL_OUTS AS ao ON ai.ANIMAL_ID = ao.ANIMAL_ID WHERE ao.ANIMAL_ID IS NULL ORDER BY ai.DATETIME LIMIT 3
사이킷런의 Model Selection 모듈에서 제공하는 기능 학습 데이터와 테스트 데이터 세트 분리 교차 검증 분할 및 평가 하이퍼 파라미터 튜닝 1. 학습 데이터와 테스트 데이터 세트 분리 데이터를 분리하기 위해서는 train_test_split을 사용을 해야한다. X_train, X_test, y_train, y_test로 나누게 된다. 그 이유는 정확도를 계산 하려면 실제 값과 같은지 다른지를 파악해야하기 때문이다. X_train과 y_train로 학습을 한다. 여기서 feature는 X_train이 되고 Target은 y_train이 된다. 모델링에서 학습을 한 후 X_test를 이용하여 예측을 수행한다. 예측 결과와 y_test를 비교하여 정확도를 계산한다. 기본 코드는 다음과 같다. 여기서 ..
사이킷런 기반 프레임워크 학습 및 예측을 위해 fit(),predict()를 제공 분류와 회귀의 다양한 알고리즘 구현 분류 모듈명 설명 예제 데이터 sklearn.datasets 사이킷런 내장 데이터셋 데이터분리,검증 & 파라미터 튜닝 sklearn.model_selection train_test_split,교차검증,GridSearchCV를 이용하여 데이터 분리,검증 및 튜닝 피처 처리 & 차원 축소 skelarn.decomposition 차원 축소과 관련한 알고리즘을 지원 ex) PCA,NMF,Truncated SVD 평가 sklearn.metrics 성능 측정 ex) Accuracy,Recall,Precision,ROC-AUC,RMSE 등 알고리즘 - sklearn.ensemble - sklearn...
: 신고결과받기(정답률 36%) 처음에는 문제를 그대로 따라가면서 다음과 같은 코드를 작성했다. def solution(id_list, report, k): answer = [0]*len(id_list) count= [0]*len(id_list) lst = [] kkk = [] for i in range(len(report)) : a = report[i].split(' ') if a not in lst : # 동일한 유저ID와 유저가 신고한 ID가 동일하면 삭제 lst.append(a) for i in range(len(lst)): # 신고당한 횟수를 계산 for v in range(len(id_list)) : if lst[i][1] == id_list[v] : count[v] += 1 else : pa..
프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 1. id_list에게 메일을 보내는 횟수를 나타낼 리스트를 만들자 => answer 2. 신고 횟수를 누적하는 방을 딕셔너리를 만들자 => report_all 3. report에 중복되는 값을 제거하자 => set(report) 4. 중복되지 않는 report를 split하고 1번 인데스의 값을 신고 횟수 누적하는 딕셔너리에 누적하자. 5. 딕셔너리에 누적된 값이 k보다 크거나 같으면 6. report를 split한 0번째 인덱스의 값이 id_list에 해당하는 리스트의 인덱스에 메일을 보내는 횟수의 리스트..