[DACON] 쇼핑몰 리뷰 평점 분류 경진대회

    [DACON] 쇼핑몰 리뷰 평점 분류 경진대회

    Reference https://dacon.io/competitions/official/235938/codeshare/5932 Private 2nd | 0.7116 | KoELECTAR+RoBERTa | Hard-Voting 데이콘 Basic 쇼핑몰 리뷰 평점 분류 경진대회 dacon.io Introduction 쇼핑몰에서 상품을 고르는데 있어서 다른 사람들의 리뷰와 평점을 참고하게 되는데, 상품 리뷰 텍스트와 평점 사이에 어떤 관계가 있는지, 리뷰 텍스트만으로 평점을 예측가능한지에 대해 실험합니다. 1점, 2점, 4점, 5점으로 분류된 평점 별로 워드 클라우드를 활용해 빈도수가 많은 단어를 시각화해보고, 다중 분류 작업을 수행하는 언어 모델을 학습시킨 결과를 비교할 계획으로 프로젝트 진행합니다. 평점 ..

    [DACON] 음성 분류 경진대회

    [DACON] 음성 분류 경진대회

    분석 목표 및 결과 음성 녹음 데이터를 0부터 9 사이의 숫자 라벨로 분류합니다. 음성 데이터 학습에 대한 체험을 목적으로 진행합니다. Mel Spectrogram, MFCC 방식으로 추출한 feature를 각각 ResNet 응용 모델에 학습시키고 결과를 ensemble하여 accuracy를 0.9725까지 향상했습니다. 학습 데이터 음성 파일 및 라벨 데이터 음성 파일 이름과 숫자 라벨을 연관시킨 csv 파일과 음성 녹음 데이터가 존재합니다. # train/ 249.wav sample rate: 20000 , audio shape: (11267,) length: 0.56335 secs ========================================== 513.wav sample rate: 20..

    브런치 사용자 데이터 분석 및 추천

    브런치 사용자 데이터 분석 및 추천

    분석 목표 및 결과 자연어 처리 및 코사인 유사도 기반 추천 과정 복습 목적으로 진행합니다. 브런치 사용자 키워드, 구독한 작가를 기반으로 코사인 유사도가 높은 작가 및 글을 추천합니다. 활용 데이터 metadata: 작가 아이디, 글 제목 등의 메타데이터 정보입니다. magazine.json: 작가가 부여한 매거진 태그 목록과 ID 번호 정보입니다. user.json: 가입한 사용자 정보입니다. read.tar: 브런치 독자들이 본 글의 정보입니다. 데이터 시각화 작가들이 많이 사용한 키워드 목록 독자들이 주로 구독한 작가들의 키워드 목록 데이터 전처리 메타데이터로부터 글을 많이 쓴 작가 4000명을 추출하고 빈도수가 많은 20개 키워드 목록을 정리했습니다. 유사도 분석 사용자 키워드 기반으로 유사도가..

    [DACON] 소비자 데이터 기반 소비 예측 경진대회

    [DACON] 소비자 데이터 기반 소비 예측 경진대회

    코드 공유 https://dacon.io/competitions/official/235893/codeshare/4921 [0.16691] EDA 및 Ensemble을 활용한 데이터 예측 소비자 데이터 기반 소비 예측 경진대회 dacon.io 분석 목표 및 결과 소비자 데이터를 바탕으로 고객의 제품 총 소비량을 예측했습니다. 팀 프로젝트를 통해 습득한 EDA 시각화를 최대한 활용해보는 것을 목적으로 진행했습니다. Ensemble 기법 중 Soft Voting 방식을 사용해 NMAE 기준 0.18533 수치를 달성하여 36위를 기록했습니다. 학습 데이터 소비자 데이터 베이스라인에서 데이터 결측치가 없음을 확인받고 전처리 없이 EDA 진행했습니다. EDA Target 예측해야할 소비량 데이터는 6부터 2525..

    [AI SCHOOL 5기] 팀 프로젝트 - Dinut

    [AI SCHOOL 5기] 팀 프로젝트 - Dinut

    1. Introduction 전통적인 식단 관리 서비스는 사용자가 직접 식품명과 영양소를 입력하는 방식이지만, 이미지 소통이 주류가 되는 사회적 흐름에 맞춰 식단 관리도 이미지 기반으로 동작할 필요가 있습니다. 또한, 이미지 기반의 접근방식은 영양 지식에 문외한이지만 건강을 챙기고 싶은 소비자들에게도 쉽고 간단하게 식단을 관리할 수 있는 경험을 제공할 것입니다. 식단 이미지 상에서 음식을 검출하고 영양 분석 결과를 시각화하는 식단 분석 기능과 캘린더에 일일 식단 이미지를 기록하는 식단 관리 기능을 구현해 서비스에 적용합니다. 음식 검출을 위해 YOLOv5 모델을, 음식 분류를 위해 InceptionV3 모델을 활용합니다. Vultr에서 제공하는 가상 인스턴스 상에서 Docker를 활용해 딥러닝 모델이 포..

    [Instork] BERT for Regression 가설

    [Instork] BERT for Regression 가설

    Task 실시간 코인 데이터 + 코인 뉴스 데이터를 종합해 코인 가격 예측 모델 생성 코인 데이터(예상): 측정 일자(datetime), 일/시/분 단위 시계열 데이터(float) 코인 뉴스 데이터(예상): 뉴스 작성 일자(datetime), 뉴스 헤드라인(str) Expected Flow [출처] https://blog.est.ai/2021/03/employment-rate/ Encoder 단에서는 굳이 감정 분석을 할 필요 없이 경제 뉴스 텍스트에 대한 이해만 가지면 될 것 BERT for Regression DALL-E 원리에 착안 뉴스 데이터에 대한 이해를 가지는 Encoder(BERT)와 시계열 데이터에 대한 이해를 가지는 Decoder를 Networking Encoder는 경제 뉴스에 대해 학..

    [AI SCHOOL 5기] 팀 프로젝트 - Gourmaid

    [AI SCHOOL 5기] 팀 프로젝트 - Gourmaid

    프로젝트 링크 https://github.com/minyeamer/gourmaid GitHub - minyeamer/gourmaid: AI SCHOOL 5th Mid Project AI SCHOOL 5th Mid Project. Contribute to minyeamer/gourmaid development by creating an account on GitHub. github.com Index How to Use Project Description Implementation Main Classes Main Methods Input/Output Error List Restropective 1. How to Use streamlit run app.py --server.port 8080 명령어를 입력하여 ..

    [AI SCHOOL 5기] 팀 프로젝트 - Recruit Pirates

    [AI SCHOOL 5기] 팀 프로젝트 - Recruit Pirates

    프로젝트 링크 https://github.com/minyeamer/recruit-pirates GitHub - minyeamer/recruit-pirates Contribute to minyeamer/recruit-pirates development by creating an account on GitHub. github.com Index How to Use Project Description Implementation Main Classes Main Methods Input/Output Mail Example Error List Restropective 1. How to Use 실제 서비스를 위해선 웹과 연동해야겠지만, 현재는 run.py 위에 직접 값을 넣어 실행 관리자 정보 및 API 키는 개인정보..

    [AI SCHOOL 5기] 팀 프로젝트 - Delivery Weather

    [AI SCHOOL 5기] 팀 프로젝트 - Delivery Weather

    프로젝트 링크 https://github.com/minyeamer/delivery-weather GitHub - minyeamer/delivery-weather: AI SCHOOL 5th Semi-Project AI SCHOOL 5th Semi-Project. Contribute to minyeamer/delivery-weather development by creating an account on GitHub. github.com 목차 분석 주제 및 목표 프로젝트 설명 기술 스택 데이터 탐색 데이터 전처리 데이터 시각화 그래프 분석 상관관계 분석 아쉬운 점 1. 분석 주제 및 목표 1-1. 분석 주제 날씨 변화에 따른 배달 소비 성향 분석 1-2. 분석 목표 배달 주문횟수와 날씨와의 상관관계 분석 매우..