블로그 이사
기존 티스토리 블로그에서 velog로 이사하게 되었습니다.향후 포스팅은 아래 블로그에서 진행됩니다.https://velog.io/@minyeamer/posts minyeamer (minyeamer) / 작성글 - velog데이터의 모든 것을 추구합니다.velog.io 기존 티스토리 블로그에서 깃허브 블로그로 이사하게 되었습니다.향후 포스팅은 아래 블로그에서 진행됩니다.https://minyeamer.github.io/ Minystoryminyeamer's logbook of the data worldminyeamer.github.io블로그 이사 과정은 아래 포스트를 참조해주세요.https://minyeamer.github.io/blog/hugo-blog-1/ Hugo 블로그 만들기 (1) - Hugo 기..
[백준 1308] D-Day (Python)
문제 링크 https://www.acmicpc.net/problem/1308 1308번: D-Day 첫째 줄에 오늘의 날짜가 주어지고, 두 번째 줄에 D-Day인 날의 날짜가 주어진다. 날짜는 연도, 월, 일순으로 주어지며, 공백으로 구분한다. 입력 범위는 1년 1월 1일부터 9999년 12월 31일 까지 이다. www.acmicpc.net 문제 해설 Idea 각각의 날짜에 대한 문자열을 date 타입으로 변환하고, today 기준 1000년 후 날짜와 dday를 비교 dday가 today의 1000년 이후일 경우 'gg'를 출력하고, 그렇지 않으면 두 날짜의 차이를 출력 Data Size y,m,d: 1,1,1
[백준 7569] 토마토 (Python)
문제 링크 https://www.acmicpc.net/problem/7569 문제 해설 Idea BFS 7576번 토마토 문제에서 하나의 차원이 추가된 버전입니다. 차원이 늘어난만큼 N의 최대 길이가 감소했기 때문에 여전히 BFS로 해결할 수 있습니다. 익은 토마토의 기준에서 전체 상자를 BFS로 완전탐색하면서 안익은 토마토까지의 최소 거리를 기록합니다. 최소 거리의 최댓값이 곧 토마토들이 모두 익는 최소 일수이며, 모든 토마토가 다 익었을 경우에 최소 일수를 출력하고, 그렇지 않은 경우엔 -1을 출력합니다. Time Complexity O(N^3) = 1,000,000 Data Size M,N: 2
[백준 7576] 토마토 (Python)
문제 링크 https://www.acmicpc.net/problem/7576 7576번: 토마토 첫 줄에는 상자의 크기를 나타내는 두 정수 M,N이 주어진다. M은 상자의 가로 칸의 수, N은 상자의 세로 칸의 수를 나타낸다. 단, 2 ≤ M,N ≤ 1,000 이다. 둘째 줄부터는 하나의 상자에 저장된 토마토 www.acmicpc.net 문제 해설 Idea BFS를 활용한 시뮬레이션을 통해 모든 토마토가 익을 떄까지 걸리는 최소 기간을 계산 초기엔 안익은 토마토의 기준에서 매번 익은 토마토까지의 최단거리를 탐색하여, O(N^4)의 시간 복잡도로 시간 초과가 발생 이후 익은 토마토의 기준에서 시뮬레이션을 단 한번만 수행하여 각각의 칸에 도달하는데 걸리는 거리값을 갱신 모두 익지 못하는 상황에 대해 1안에선..
[백준 18870] 좌표 압축 (Python)
문제 링크 https://www.acmicpc.net/problem/18870 18870번: 좌표 압축 수직선 위에 N개의 좌표 X1, X2, ..., XN이 있다. 이 좌표에 좌표 압축을 적용하려고 한다. Xi를 좌표 압축한 결과 X'i의 값은 Xi > Xj를 만족하는 서로 다른 좌표의 개수와 같아야 한다. X1, X2, ..., XN에 좌 www.acmicpc.net 문제 해설 Idea Sort 집합을 통해 압축한 unique한 좌표 목록을 정렬시키고, 정렬된 리스트 내에서 좌표와 인덱스를 딕셔너리로 맵핑 Time Complexity O(N Log N) = 13,000,000 Data Size N: 1
[백준 1931] 회의실 배정 (Python)
문제 링크 https://www.acmicpc.net/problem/1931 문제 해설 Idea Sliding Window 슬라이딩 윈도우의 전형적인 문제로, 끝 시간을 기준으로 시간을 정렬해서 겹치지 않는 수를 계산 Time Complexity O(N) = 100,000 Data Size N: 1
[백준 15686] 치킨 배달 (Python)
문제 링크 https://www.acmicpc.net/problem/15686 15686번: 치킨 배달 크기가 N×N인 도시가 있다. 도시는 1×1크기의 칸으로 나누어져 있다. 도시의 각 칸은 빈 칸, 치킨집, 집 중 하나이다. 도시의 칸은 (r, c)와 같은 형태로 나타내고, r행 c열 또는 위에서부터 r번째 칸 www.acmicpc.net 문제 해설 Idea Combinations 최대 집의 개수가 100, 최대 치킨집의 개수가 13으로 매우 적은 경우의 수를 가지고 있기 때문에, 모든 조합에 대한 완전탐색을 통해 최소 거리를 계산 초기에는 집에 대한 치킨 거리가 작은 치킨집을 우선적으로 선발해서, 폐업하지 않은 치킨집에 대한 치킨 거리의 최소 합을 계산했지만 틀림 이후 combinations 모듈을..
![[DACON] 쇼핑몰 리뷰 평점 분류 경진대회](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FdxGJw5%2FbtrKcwuU2yr%2FAAAAAAAAAAAAAAAAAAAAAKByA8RZwQ8NbN2927IseISdGHJLN3N47L5oqy9FTXnt%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3DsLpQBt5YnXy3gMxjCy%252BC0qD3EUg%253D)
[DACON] 쇼핑몰 리뷰 평점 분류 경진대회
Reference https://dacon.io/competitions/official/235938/codeshare/5932 Private 2nd | 0.7116 | KoELECTAR+RoBERTa | Hard-Voting 데이콘 Basic 쇼핑몰 리뷰 평점 분류 경진대회 dacon.io Introduction 쇼핑몰에서 상품을 고르는데 있어서 다른 사람들의 리뷰와 평점을 참고하게 되는데, 상품 리뷰 텍스트와 평점 사이에 어떤 관계가 있는지, 리뷰 텍스트만으로 평점을 예측가능한지에 대해 실험합니다. 1점, 2점, 4점, 5점으로 분류된 평점 별로 워드 클라우드를 활용해 빈도수가 많은 단어를 시각화해보고, 다중 분류 작업을 수행하는 언어 모델을 학습시킨 결과를 비교할 계획으로 프로젝트 진행합니다. 평점 ..
![[DACON] 음성 분류 경진대회](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FY8e6s%2FbtrKj1Ab0mL%2FAAAAAAAAAAAAAAAAAAAAADDmZuwgvYL75e_ObImOUNqu90UpakRCzPvDX0AHMbf9%2Fimg.jpg%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3DYGskZzxcf5Jn3u0igXCtLDFoxrc%253D)
[DACON] 음성 분류 경진대회
분석 목표 및 결과 음성 녹음 데이터를 0부터 9 사이의 숫자 라벨로 분류합니다. 음성 데이터 학습에 대한 체험을 목적으로 진행합니다. Mel Spectrogram, MFCC 방식으로 추출한 feature를 각각 ResNet 응용 모델에 학습시키고 결과를 ensemble하여 accuracy를 0.9725까지 향상했습니다. 학습 데이터 음성 파일 및 라벨 데이터 음성 파일 이름과 숫자 라벨을 연관시킨 csv 파일과 음성 녹음 데이터가 존재합니다. # train/ 249.wav sample rate: 20000 , audio shape: (11267,) length: 0.56335 secs ========================================== 513.wav sample rate: 20..

브런치 사용자 데이터 분석 및 추천
분석 목표 및 결과 자연어 처리 및 코사인 유사도 기반 추천 과정 복습 목적으로 진행합니다. 브런치 사용자 키워드, 구독한 작가를 기반으로 코사인 유사도가 높은 작가 및 글을 추천합니다. 활용 데이터 metadata: 작가 아이디, 글 제목 등의 메타데이터 정보입니다. magazine.json: 작가가 부여한 매거진 태그 목록과 ID 번호 정보입니다. user.json: 가입한 사용자 정보입니다. read.tar: 브런치 독자들이 본 글의 정보입니다. 데이터 시각화 작가들이 많이 사용한 키워드 목록 독자들이 주로 구독한 작가들의 키워드 목록 데이터 전처리 메타데이터로부터 글을 많이 쓴 작가 4000명을 추출하고 빈도수가 많은 20개 키워드 목록을 정리했습니다. 유사도 분석 사용자 키워드 기반으로 유사도가..