<
ALBERT : A Lite Bert For Self-Supervised Learning of Language Representations
>
上一篇

Drop an Octave : Deducing Spatial Redundancy in Convolutional Neural networks with Octave Convolution
下一篇

BigGAN

ALBERT : A Lite Bert For Self-Supervised Learning of Language Representations

원논문 주소 : https://arxiv.org/abs/1909.11942

SQUAD 공식 홈페이지에 들렀다가 왠 처음보는 모델이 1위를 먹고 있기에
바로 찾아보니 일주일도 안된 따끈따끈한 논문!
요새 대부분 모델들이 커지는데 집중하는데 비해
버트의 파라미터 경량화와 성능향상을 함께 이루어낸 좋은 모델인듯 하다.
솔직히 버트 모델 좀 과하긴했지….
XLNet도 열심히 파려고 했는데 갈아탈 좋은 명분이 생겨서 구글님께 매우 감사.
게다가 수식이 거의 없어 보기좋….읍

Abstract

ALBERT 의 요소



Table1


Table1

세부 실험 설정

평가









결론

Top
Foot