일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 구글애널리틱스4
- 감사인사
- ㅂㅂ
- 독서
- 코오롱베네트
- Python
- 명상
- 코딩
- 티스토리
- 프로그래머스
- GA4
- 니다
- 벚꽃개화시기
- 미라클 모닝
- 영화 올드 줄거리
- 수명예측 인공지능
- 얼음여왕
- GA
- 데이터문해력
- 벚꽃
- 6시 기상
- 채용공고
- 데이터 분석
- 알파줄거리
- 구글애널리틱스
- 기사스크랩
- Google Analytics
- Today
- Total
목록데이터 분석 (156)
Data Analyst KIM
프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr def solution(name, yearning, photo): answer = [] for i in photo : # photo의 조건문 sum = 0 # yearning를 저장할 변수 for v in range(len(i)): # photo의 인덱스 안에 인덱스 if i[v] in name : # photo의 인덱스 안에 인덱스가 name에 포함되어 있을 경우 name_index = name.index(i[v]) # 그 값의 name의 index값을 저장 sum += yearning[name_index]..
1. 숫자를 문자열로 바꿔주기 cast(_ as varchar) 2. 문자열 컬럼에서 일부만 잘라내기 left(cast(_ as varchar),개수) => 처음 개수 substring(cast(_ as varchar),시작,개수) => 중간 개수 right(cast(_ as varchar),개수) => 마지막 개수 3. yyyy-mm-dd 형식으로 이어주기 concat() + ,'-', 활용 || 활용 연령대 그룹 만들어보기(20,30,40대) 그룹 별 gmv합계 구하기 TOP3 카테고리와 그 외 상품의 매출액 비교하기 특정 키워드가 담긴 상품과 그렇지 않은 상품의 매출 비교하기
활동 : Coding Club 일시 : 2023.06.22 내용 : 프로그래머스Lv.1 문제 풀이 문제 : 크기가작은부분문자열,신규아이디추천 다음주 과제 : 대충 만든 자판, 추억 점수 문제1. 신규 아이디 추천 def solution(new_id): answer = '' new_id = new_id.lower() # 1단계 for word in new_id: # 2단계 if word.isalnum() or word in '-_.': answer += word while '..' in answer: # 3단계 answer = answer.replace('..', '.') # 단계적으로 계속 줄임(.을 만족할 때까지) if answer[0] == '.' and len(answer) > 1 : # 4단계 a..
def solution(new_id): answer = '' new_id = new_id.lower() # 1단계 for word in new_id: # 2단계 if word.isalnum() or word in '-_.': answer += word while '..' in answer: # 3단계 answer = answer.replace('..', '.') # 단계적으로 계속 줄임(.을 만족할 때까지) if answer[0] == '.' and len(answer) > 1 : # 4단계 answer = answer[1:] else : answer if answer[-1] == '.' : answer = answer[:-1] else : answer if answer == '' : # 5단계 answ..
[code1] => list로 저장 후 비교 def solution(t, p): answer = 0 t_li = [] # len(p)에 따른 t를 저장할 방 for i in range(0, len(t)-len(p)+1): t_li.append(t[i:i+len(p)]) # len(p)에 따른 t를 t_li에 저장 for v in t_li: if int(v) list로 저장 하지 않고 바로 비교 def solution(t, p): answer = 0 for i in range(len(t)-len(p)+1) : if int(t[i:i+len(p)])
데이터 분석을 하기 위해서 문자열을 숫자형으로 변형을 하는 것을 인코딩이라고 한다. 대표적으로 레이블 인코딩(Label encoding)과 원-핫 인코딩(One-Hot encoding)을 사용한다. 그렇다면 레이블 / 원-핫을 언제 사용하는 것이 좋을까? 레이블 인코딩(Label encoding)은 문자열의 unique값을 숫자로 바꾸는 방법이다. 1,2,3처럼 숫자값으로 변환이 되어서 숫자값을 가중치로 잘못 인식하여 값에 왜곡이 생길 수 있다. 예측 성능의 저하를 일으킬 수 있다. 레이블 인코딩(Label encoding)은 선형회귀와 비슷한 ML알고리즘에서는 잘 사용하지 않는다. 주로 트리계열의 ML알고리즘에서 레이블 인코딩을 사용한다. (트리계열은 숫자의 고유적인 특성을 반영하지 않는다) 원-핫 인..