전체 글
-
[BERT] BERT에 대해 쉽게 알아보기4 - BERT 파인튜닝✨ AI/NLP 2020. 3. 30. 15:09
● BERT 파인튜닝 2편에서 구글에서 제공하는 공식 BERT코드로 대량의 위키디피아 코퍼스로 사전훈련하여 생성한 모델을, 이번 포스팅에서는 전이학습시켜 다른 nlp task에 적용하는 파인튜닝 실습을 진행해 보려고 합니다. 저번시간에 생성한 vocab.txt파일과 사전학습한 모델 ckpt를 그대로 사용하여도 되고, 미리 생성한 위키디피아 큰 코퍼스로 학습시킨 모델 데이터를 첨부하니 그것을 이용하여도 됩니다. 파인튜닝에 필요한 다른 필요한 코드 파일은 이전 포스팅에서 사전에 첨부한 파일을 그대로 사용합니다. run_squad.py, run_classifier.py, run_multi_classifier.py 등 2020/03/26 - [SW개발/AI Development] - [BERT] BERT에 대해..
-
[BERT] BERT에 대해 쉽게 알아보기3 - tf-hub BERT layer를 이용한 캐글 분류문제✨ AI/NLP 2020. 3. 27. 17:41
● 텐서플로우 허브의 BERT layer를 이용한 캐글 분류문제 예제 지난번 포스팅에서 사전학습한 BERT 모델을 다른 NLP task 문제에 전이학습시켜 예제에 적용하는 포스팅을 이번 포스팅에서 작성하려고 하였는데요. 그 이전에 텐서플로우 허브, 허깅페이스 등을 이용해서 multilingual BERT 레이어를 실제로 예제에 어떻게 적용하는지 알아보는 포스팅을 먼저 쓰도록 하겠습니다. ● 텐서플로우 허브(TensorFlow Hub) 텐서플로우 허브는 일반화된 문제들에 대해서 모델의 재사용성을 극대화 하기 위해 구글에서 새로 공개한 API입니다. 텐서플로우 1.7.0 버전 이상에서 사용할 수 있고, pip install을 통해 설치해주어야 합니다. 텐서플로우를 이용하면 지금 사용하려는 사전 훈련된 버트 ..
-
[BERT] BERT에 대해 쉽게 알아보기2 - colab으로 BERT Pretraining(수정)✨ AI/NLP 2020. 3. 26. 16:14
** 이전 포스팅 코랩 노트북을 따라하시다가 오류가 난다는 분이 많아서, 코드를 쭉 수정하였습니다. ● BERT모델로 대량의 코퍼스 사전훈련 시키기 구글이 만든 사전훈련 모델 'BERT'로 대량의 코퍼스를 가지고 사전훈련을 시키는 방법을 포스팅 하도록 하겠습니다. 그리고 이 다음 포스팅에서는 사전훈련된 모델로 NLP모델 Task에 전이학습 시키는 방법을 포스팅 할 예정입니다. BERT는 위키디피아 같은 대량의 코퍼스를 사용해서 사전훈련을 시키고 언어의 기본적인 패턴을 이해한 워드임베딩을 추출해냅니다. 이렇게 사전훈련을 통해 생성된 임베딩으로 새로운 문제에 적용하는 전이학습(transfer learning)을 수행하여 적은데이터로 기존 ML, DL모델에 적용하여 빠르게 학습이 가능합니다. BERT가 무엇인..
-
[Numpy] 딥러닝을 위한 Numpy3 - 함수 정리💫 Computer Science/Python & AI Framework 2020. 3. 16. 13:04
● Numpy에서 많이 사용하는 주요 기능 벡터 산술연산 다차원 배열 ndarray 표준 수학 함수 선형대수, 난수 생성, 푸리에 변환 ○ 배열 생성 함수 함수 내용 np.array 입력된 데이터를 ndarray로 변환. dtype을 명시하면 자료형을 설정할 수 있다 np.asarray 입력 데이터를 ndarray로 변환하나 이미 ndarray일 경우에는 새로 메모리에 ndarray가 생성되지는 않는다 np.arange range 함수와 유사하나 ndarray를 반환, 자료형 기본 float64 np.ones 전달인자로 전달한 dtype과 모양(행,렬)으로 배열을 생성하고 모든 내용을 1로 초기화하여 ndarray를 반환 np.zeros ones와 같으나 초기값이 0이다 np.empty ones와 zer..
-
[Numpy] 딥러닝을 위한 Numpy2 - 행렬의 연산💫 Computer Science/Python & AI Framework 2020. 3. 10. 13:18
앞선 포스팅에서 2020/03/05 - [SW개발/Framework Library] - [파이썬패키지] 딥러닝을 위한 Numpy 공부1 - Numpy기초 [파이썬패키지] 딥러닝을 위한 Numpy 공부1 - Numpy기초 ● Numpy란 넘파이(Numpy)는 C로 구현된 고성능의 수치계산을 위해 제작된 파이썬 라이브러리로, 'Numerical Python'의 줄임말입니다. 넘파이는 벡터, 행렬 연산에 있어 많은 기능들을 제공하고 pandas와 matplot.. ebbnflow.tistory.com Numpy의 큰 장점은 벡터 연산이 가능하다는 것이라고 했는데요. 행렬의 연산이 수학에서 말하는 벡터의 내적이 아닌, 같은 위치의 요소들끼리 합, 곱 등의 연산이 가능하다는 것이었습니다. 이것을 'Element-..