Bengali_Kaggle(1/2부)

2020. 3. 8. 17:58Data Science/04_Competition(Kaggle, Dacon)

반응형
Bengali 대회 진행

 

2020년 03월 07일

 

Bengali 손글씨를 분류하는 캐글 대회에 참가했다.

대회에는 혼자 진행하는게 아니라 같이 머신러닝을 공부하는분들과 팀을 이루어 참가했다.

 

참가한 대회는 아래와 같음


https://www.kaggle.com/c/bengaliai-cv19

 

Bengali.AI Handwritten Grapheme Classification

Classify the components of handwritten Bengali

www.kaggle.com


 

 

1. META DATA


 

벵갈어란

 


우리가 분류해야 하는 벵갈어는 벵갈해 인근지역에서 주로 사용되는 언어 중 하나이며,

분류해야 하는 종류는 총 3개로 다음과 같다.

 

1. Grapheme_root: 자음/모음 모두 가능

2.Vowel_diacritic:: 모음

3.Consonant_diacritic: 자음

 

해당 언어의 특징으로는 1) 모음은 독립적으로 사용 가능, 2)자음은 모음이 와도 되고, 오지 않아도 됨, 3) Consonant는 하나의 개별 자음으로 쓰임, 4) Consonant 모음이 압축되어있거나 모음의 비음화를 나타내는 자음 기호이다

 

 

2. Framework

 

해당 대회에서는 Keras의 다중출력모델을 활용하여 모델을 개발

주 참고자료는 캐글 커널과 케라스 창시자에게 배우는 딥러닝 책을 활용할 계획이다.

 

 

3. ~진행상황

 

약 2주간 베이스라인 모델을 만들고 팀원을과 성능을 올릴 수 있는 방법을 토론하고 있다.

지금 캐글에서의 순위로는 상위 10%에 겨우 들어있으며 이대로 진행된다면 동메달을 획득할 수 있을것 같다.

향후 데이터 전처리와 모델링 부분에 대해서는 대회 종료 후 포스팅을 진행하고자 한다.

 

반응형