Releases: boostcampaitech7/level2-mrc-nlp-01
Releases · boostcampaitech7/level2-mrc-nlp-01
v3.0.1
v3.0.0
What's Changed
- Feat: Generation-based MRC 구현 by @swbaek97 in #37
- Refactor: dense encoder 설정 변경 by @Now100 in #38
- Feature: streamlit에서 context의 어떤 부분이 UNK 토큰인지 확인할 수 있도록 추가 by @rasauq1122 in #40
- �feat: negative sampling 변경 by @Now100 in #44
- fix: Fix negative sampling storage in dense retrieval by @Now100 in #46
- feat: BM25 성능 검증 by @rasauq1122 in #45
- Fix: Evaluation error during generation model training by @swbaek97 in #52
- feat: evaluation시 retriever와 연동해서 진행할 수 있습니다. by @rasauq1122 in #59
- feat: Cross Encoder 추가 by @rasauq1122 in #51
- Feat: RoBERTa Encoder 추가 & Mixed Precision 추가 by @Now100 in #53
- Feat: EDA streamlit 서버 관련하여 기능추가 (데이터셋 길이 보기, 토크나이저에 따른 데이터 EDA) by @hskhyl in #55
- Feat: wandb logging 코드 추가 by @hskhyl in #57
Full Changelog: v2.0.0...v3.0.0
v2.0.0
What's Changed
- feat: TF-IDF를 이용한 Sparse Retrieval의 성능 측정 by @rasauq1122 in #22
- fix : top_k 설정 안 되던 버그 수정 by @hskhyl in #27
- Feat : change TF-IDF to BM25 by @hskhyl in #23
- refactor: streamlit 폴더 구조 개편 by @rasauq1122 in #30
- refactor: config 사용법 정상화 by @rasauq1122 in #33
- Refactor/Feat: CLI 커맨드 통일화 및 train.py 와 inference.py를 main.py로 합침. by @hskhyl in #29
- Feat: Dense Retrieval 구현 by @Now100 in #35
Full Changelog: v1.1.0...v2.0.0
실행방법
python src/main.py --do_train
python src/main.py --do_eval
python src/main.py --do_predict
v1.1.0
What's Changed
- 훈련용 데이터셋의 Context에 대한 출처 조사 #15
TrainingArguments
에서 사용하는 실험 설정값(ex. epochs, batch_size 등)을config.yaml
으로 통제 가능 #16- streamlit을 이용한 데이터 시각화 폴더 구조 생성 #17
--testing
을 프로그램 실행 인자로 넘겨 극소수의 데이터만을 이용하여 실험 가능 (로컬에서도 정상적으로 작동하는지 확인할 수 있음) #19
What's Fixed
sparse_retrieval.py
를 main으로 실행했을 때 동작하지 않는 버그 수정 #10