본문 바로가기
728x90

Coloring (Additional Study)/Contest9

Google Solution Challenge 2024 - Voice-Bridge Review 약 한달반간의 팀원과의 협업의 결과로 Voice Bridge라는 농인을 위한 양방향 통역 어플을 완성하였다. 간단한 소개는 아래의 2분짜리 데모영상에 나와 있다. https://youtu.be/2Yceyr7ussU 우리 팀의 깃허브 링크이다. 프론트 파트 1명 ,백엔드 파트 1명, 인공지능 파트 2명이서 열심히 지지고 볶아서 완성된 프로젝트이다. 내가 모은 팀원들이 모두 고생하여 완성을 해내서 기특하단 말을 해주고 싶다. https://github.com/GSC-voice-linker VOICE LINKER Communication App for the Deaf. VOICE LINKER has 4 repositories available. Follow their code on GitHub. .. 2024. 2. 28.
Google Solution Challenge 2024 - STT Intro 구글 솔루션 챌린지를 위해 진행하는 이번 프로젝트는 청각장애인을 위한 혁신적인 양방향 통역기를 개발하는 것을 목표로 하고 있다. 이 어플리케이션은 카메라를 통해 수어를 인식하고, 이를 Google의 Text-to-Speech(TTS)를 통해 텍스트로 변환하여 일반인에게 음성으로 전달한다. 또한, 일반인의 말을 Google의 Speech-to-Text(STT) 기술을 이용하여 텍스트로 변환해서 청각장애인에게 보여줌으로써, 소통의 장벽을 없애는 데 중점을 두고 있다. 이 기술은 청각장애인이 일상 생활에서 더욱 원활하게 소통할 수 있게 하며, 모두가 접근 가능한 커뮤니케이션 환경을 조성하는 데 기여할 것으로 기대된다. STT 음성 인식 기술, 흔히 STT(Speech-to-Text)라고 불리는 이 .. 2024. 1. 14.
DCC 수상 후기 수상 후기 정말 많은 내용을 공부하고 준비했지만 5분이라는 제한된 발표시간에 끝내야했기에 ppt의 내용은 너무나 부족한것이 아쉽다.. PPT 내용 일부를 공유해보고자한다. 똑같은 진흥원 원장상이니 크게 연연하지 않으려했지만 여전히 왜 우수상이었는지 의문과 아쉬움이 크다. 팀원끼리는 한두팀말고는 경쟁상대가 없다며 최소 최우수라고 생각했는데 단순히 연구성과나 디벨롭 정도만으로 결과가 나오는 것은 아니니 인정하고 이 분함을 품고 나아가려고 한다. 다음 대회에서는 기대와 일치하는 성적을 거두길바라며 아쉬움을 달래보게 되는 대회였다. 2023. 12. 11.
대구 교통사고 피해 예측 AI 경진대회 - (1) 대회 개요 이동수단의 발달에 따라 다양한 유형의 교통사고들이 계속 발생하고 있는 현실에 따라 한국자동차연구원과 대구디지털혁신진흥원에서는 해당 사고의 원인을 규명하고 사고율을 낮추기 위해, 시공간 정보로부터 사고위험도(ECLO)를 예측하는 AI 알고리즘 발굴을 목표로 본 대회를 개최한다고 한다. ECLO(Equivalent Casualty Loss Only) : 인명피해 심각도 ECLO = 사망자수 * 10 + 중상자수 * 5 + 경상자수 * 3 + 부상자수 * 1 본 대회에서는 사고의 위험도를 인명피해 심각도로 측정한다. 데이터 train.csv 각 사건 ID에 대한 Feature는 사고일시,요일,기상상태,시군구,도로형태,노면상태,사고유형,사고유형 - 세부분류,법규위반,가해운전자 차종,가해운전자 성별,가.. 2023. 11. 19.
DCC 전이학습 Mission3 미션3에서는 미션2에서 한국음식 데이터를 통해 만든 모델에 전이학습을 시켜서 한국 건강식을 분류하는 모델을 만들어 보았다. import numpy as np import matplotlib.pyplot as plt import torch import torch.nn as nn import torch.nn.functional as F from torch import FloatTensor as FT from torch import LongTensor as LT from torch.autograd import Variable from torchvision import datasets, transforms, models from PIL import Image from tqdm import tqd.. 2023. 11. 3.
DCC 한국음식 분류 모델 Model 한국음식 분류 모델을 구현해보았다. ResNet의 pretrained weight를 이용하지 않기 때문에 성능이 많이 높지는 않지만 42개의 클래스에 대해서 분류하는 최고 성능을 낸 코드는 아래와 같다. import torch import numpy as np import os from torchvision import datasets, transforms, models import torch.nn as nn import torch.optim as optim from tqdm import tqdm import copy def main(): train_loader = os.path.join('train') valid_loader = os.path.join('kfood_val', 'val') pr.. 2023. 10. 29.
DCC Normalization Normalization 처음에는 normalization을 imagenet에 적합하다고 알려져 있는 값인 평균: [0.485, 0.456, 0.406] 표준편차: [0.229, 0.224, 0.225]로 normalize이미지를 normalize하여 결과를 봤으나 오히려 성능이 떨어졌다. 따라서 우리가 갖고있는 데이터에 적절한 normalization 값을 찾아보고자 했다. 몇몇 방법을 사용해 봤지만 직접 계산한 값중에는 음식이 있는 위치인 중앙을 중심으로 crop하여 norm과 std를 계산한 것이 성능이 제일 좋았다. 아래는 해당 calculated mean과 std를 구하는 코드이다. import os import torch from torchvision import datasets, transf.. 2023. 10. 29.
DCC 클래스별 시각화 한국 이미지 데이터셋 분류 우선 시각화를 하고 ResNet18을 이용하여 42종의 클래스 분류를 수행하고 Validation 데이터에 대한 정확도를 뽑아보자. 시각화 import zipfile # 압축 파일의 경로 zip_file_path = 'drive/MyDrive/데이터셋.zip' # 해당 경로의 압축 파일을 열기 with zipfile.ZipFile(zip_file_path, 'r') as zip_ref: # 현재 디렉토리에 압축 해제 zip_ref.extractall() #kfood_train.zip 파일 압축 해제 with zipfile.ZipFile('kfood_train.zip', 'r') as zip_ref: zip_ref.extractall() import os import zipfil.. 2023. 10. 13.
DCC - 이미지 분류를 위한 딥러닝 모델 Intro Data Creator Camp의 미션 수행을 위한 공부 및 미션 수행 과정을 기록하고자 한다. 시작으로 이미지 분류를 위한 다양한 딥러닝 모델을 살펴보고자한다. AlexNet AlexNet은 2012년 ImageNet Large Scale Visual Recognition Challenge (ILSVRC)에서 우승하며 딥러닝과 CNN의 인기를 크게 높인 모델이다. 해당 모델을 소개하는 논문의 1저자의 이름이 Alex여서 이렇게 이름이 붙게 되었다. 크게 봤을 때 5개의 Convolution layer이후에 3개의 Fully-connected layer로 이루어진 구조이다. 2,4,5번째 convolution layer는 전단계의 같은 채널의 feature map들과만 연결되어 있는 반면 3번.. 2023. 10. 2.
728x90