This respository provides list of Korean NLP papers.
Feel free to contribute!
- How To Contribute
- Conference and Journal List
- POS Tagging and Morpheme Analysis
- Dependency Parsing
- Named Entity Recognition
- Semantic Role Labeling
- Emotion Recognition
- Sentiment Analysis
- Coreference Resolution
- Question Answering
- Translation
- Dialogue Management
- Document Classification
- Document Summarization
- Image Captioning
- Keyword Extraction
- Grammatical Error Correction
- Relation Classification
- Natural Language Generation
- Speech Act Classification
- Abusive Detection
- Transliteration
- Document Similarity
- Automatic Speech Recognition
- Word Sense Disambiguation
- Tools
- Dataset
Feel free to
- Add/Modify wrong or blank informations of papers.
- Add/Modify wrong or blank informations of conferences.
And you can open issue
- When a paper you want to find is missing.
- Whenever else you want to contribute.
Please consider sending PR first. It is a great help to keep this list up-to-date.
Please, do not hesitate to create an issue. It always helps this repository to be informative and healthy.
Conference /Journal |
Date | Web Page | Paper List |
---|---|---|---|
2015 정보과학회 동계학술대회 |
2015. 12. 17. ~ 18. | LINK | |
2016 HCLT | 2016. 10. 7. ~ 8. | LINK | LINK |
2017 HCLT | 2017. 10. 13. ~ 14. | LINK | LINK |
Date | Conference /Journal |
Paper | Metric | Dataset |
---|---|---|---|---|
2008. 10. | HCLT | CRFs를 이용한 강건한 한국어 의존구조 분석 | UAS:87.30 | 세종+KIB |
2008. 12. | 한국어정보학회 | SVM을 이용한 결정적 한국어 의존 구문분석 | UAS:88.25 | KIBS95 |
2010. 3. | 한국시뮬레이션 학회논문지 |
다단계 구단위화를 이용한 고속 한국어 의존구조 분석 | UAS:86.01 | |
2011. 4. | 정보과학회논문지 | 자질 가중치의 기계학습에 기반한 한국어 의존파싱 | UAS:88.15 | 세종 |
2011 | ACL-WorkShop (SPMRL 2011) |
Statistical Dependency Parsing in Korean: From Corpus Generation To Automatic Parsing |
UAS:85.47 LAS:83.74 FNC:94.57 |
세종 |
2013. 10. | 정보과학회논문지 | 키어절을 이용한 새로운 한국어 구문분석 | F1:87.03 | |
2014. 1. | 정보과학회논문지 | 지배소 후위 집합을 이용한 한국어 의존 구문 분석 알고리즘 |
UAS:87.52 | 세종 |
신경망과 제약만족 알고리즘을 이용한 한국어 구문분석 | ||||
2015. 8. | 정보과학회논문지 | 순환 신경망을 이용한 전이 기반 한국어 의존 구문 분석 | UAS:90.33 | KIBS |
2015. 12. | 정보과학회 동계학술대회 |
통계 정보를 이용한 구문분석 트리 후보의 순위화 방법 | ||
2016. 6. | APIC-IST | Improving Korean Dependency Parsing performance using predicate-argument features |
UAS/자동형태:84.39 LAS/자동형태:81.91 |
세종 |
KCC | Stack LSTM을 이용한 전이 기반 한국어 의존 파싱 | |||
2016. 10. | HCLT | Sequence-to-sequence 모델을 이용한 한국어 구구조 구문 분석 |
F1:89.03 | 세종 |
2016. 10. | HCLT | Stack LSTM 기반 한국어 의존 파싱을 위한 음절과 형태소의 결합 단어 표상 방법 |
UAS/정답형태:93.65 LAS/정답형태:91.57 UAS/자동형태:90.44 LAS/자동형태:88.17 |
세종 |
2016. 10. | HCLT | 의존 경로와 음절단위 의존 관계명 분포 기반의 Bidirectional LSTM CRFs를 이용한 한국어 의존 관계명 레이블링 |
의존관계F1:96.01 | 세종 |
2016. 12. | 정보과학회 동계학술대회 |
멀티 태스크 학습 기반 포인터 네트워크를 이용한 한국어 의존 구문 분석 |
UAS/자동형태:91.65 LAS/자동형태:89.34 |
세종 |
2017. 6. | KCC | Deep Biaffine Attention을 이용한 한국어 의존 파싱 | UAS/자동형태:91.78 LAS/자동형태:89.76 |
세종 |
2017. 6. | KCC | 전이기반 순환유닛을 이용한 SyntaxNet 기반 한국어 의존 파싱 |
UAS:90.33 LAS:88.69 |
SPMRL '14 |
Date | Conference /Journal |
Paper | Performance(F1) /Dataset |
Tagset |
---|---|---|---|---|
2006. 10. | HCLT | Conditional Random Fields를 이용한 세부 분류 개체명 인식 |
83.40/ETRI-QA | ETRI-147 |
2010. 12. | 인지과학회 논문지 |
Structural SVMs 및 Pegasos 알고리즘을 이용한 한국어 개체명 인식 |
86.79/ETRI-Sports 85.43/ETRI-TV |
ETRI-15 |
2014. 12. | KCC | 딥러닝을 이용한 개체명 인식 | 89.03/ETRI-TV-PLO | ETRI-PLO |
2015. 12. | 정보과학회 동계학술대회 |
Word Embeddings 자질을 이용한 한국어 개체명 인식 및 분류 |
89.03/ETRI-TV 89.98/ETRI-Sports 81.32/ETRI-IT |
ETRI-15 |
2016. 6. | 정보과학회논문지 | Word Embedding 자질을 이용한 한국어 개체명 인식 및 분류 |
89.81/ETRI-TV 90.04/ETRI-Sports |
|
2016. 6. | KCC | 문자 기반 LSTM CRF를 이용한 개체명 인식 | 86.53/ETRI | ETRI |
2016. 10. | HCLT | 문자 기반 LSTM-CRF 한국어 개체명 인식을 위한 사전 자질 활용 |
89.34/ETRI | ETRI |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2015 | 정보과학회논문지 | Structural SVM 기반의 한국어 의미역 결정 | F1:76.04 |
2015. 6. | KCC | 딥 러닝을 이용한 한국어 의미역 결정 | F1:76.96 |
2015. 12. | 한국정보과학회 학술대회 |
Bidirectional LSTM CRF를 이용한 End-To-End 한국어 의미역 결정 |
F1:78.16 |
2015 | 인지과학회 | 한국어 의미역 결정을 위한 Korean PropBank 확장 및 도메인 적응 기술 적용 |
|
A study of Korean Semantic Role Labeling using Word sense | |||
2016 | Advanced Science and Technology Letters |
Korean Semantic Role Labeling Using Korean PropBank Frame Files |
ACC:90.00 |
2016. 10. | HCLT | 음절의 의미역 태그 분포를 이용한 Bidirectional LSTM CRFs 기반의 한국어 의미역 결정 |
F1:66.13 |
2016. 10. | HCLT | CRF를 이용한 복수 의미역 문제 해결 | F1:74.47 |
2016. 10. | HCLT | Input-feeding RNN Search 모델과 CopyNet을 이용한 한국어 의미역 결정 | 어절AIC:71.58 Label AIC:79.42 |
2016. 10. | HCLT | 베이지안 모형 기반 한국어 의미역 유도 | F1*:83.26 |
2016. 12. | 정보과학회논문지 | 격틀 사전과 하위 범주 정보를 이용한 한국어 의미역 결정 | F1:78.47 |
2017. 1. | 정보과학회논문지 | Stacked Bidirectional LSTM-CRFs를 이용한 한국어 의미역 결정 |
F1:78.57 |
2017. 6. | KCC | 형태 의미 정보를 이용한 한국어 의미역 결정 | F1:77.36 |
2017. 6. | KCC | 문자 기반 LSTM CRF를 이용한 한국어 의미역 결정 | |
2017 | International Journal of Database Theory and Application |
A Study of Dictionary Based Korean Semantic Role Labeling |
|
2017. 10. | HCLT | Highway BiLSTM-CRFs 모델을 이용한 한국어 의미역 결정 |
Date | Conference /Journal |
Paper | Metric | Number of Tags |
---|---|---|---|---|
2002 | 석사학위논문 | Hybrid Naive Bayes HMM 기법을 사용한 텍스트로부터의 감정 분류 |
7 | |
2010 | 인지과학회 | 대화 시스템을 위한 사용자 발화 문장의 감정 분류 | F1:62.80 | 9 |
2013. 6. | 정보과학회논문지 | 한글 마이크로블로그 텍스트의 감정 분류 및 분석 |
||
2013. 11. | 한국엔터테인먼트 산업학회 학술대회 |
기계 학습을 이용한 한글 텍스트 감정 분류 | F1:72.00 | 9 |
2014. 6. | KCC | 기계 학습을 이용한 한글 텍스트 감정 분류 및 분석 | ||
2015. 10. | HCLT | 임베딩 자질을 이용한 대화의 감정 분류 | ACC:72.89 | 9 |
2016. 10. | HCLT | CNN-LSTM을 이용한 대화 문맥 반영과 감정 분류 | ACC:82.93 | 11 |
Date | Conference /Journal |
Paper | Metric | Tagset |
---|---|---|---|---|
2010. 4. | 정보과학회논문지 | 감정 단어의 의미적 특성을 반영한 한국어 문서 감정분류 시스템 |
F1:80.18 | P/N |
2012. 5. | 언어과학연구 | 감성 분석 연구의 현황과 말뭉치에 기반한 사례 분석 : 영화평 자료를 중심으로 |
83.82 | P/N |
2014. 11. | 대한산업공학회 | SVM과 HCRF를 이용한 텍스트 문서 감정 분류 모델 | F1:86.00 | P/N |
2014 | Advanced Science and Technology Letters |
Sentiment Classification of Movie Reviews Using Korean Sentiment Dictionary |
ACC*:81.50 | P/N |
2014. 2. | Journal of Korea Multimedia Society |
한국어 트위터의 감정 분류를 위한 기계학습의 실증적 비교 |
||
2015. 12. | 정보과학회 동계학술대회 |
RNN과 attention mechanism을 이용한 감성분석 | ACC:80.41 | P/N |
2016. 5. | 정보처리학회논문지 | 감성 분석 및 감성 정보 부착 시스템 구현 | ACC:76.00 | P/N/N |
2016. 10. | HCLT | WPM(Word Piece Model)을 활용한 구글 플레이스토어 앱의 댓글 감정 분석 연구 | P/N | |
2016. 10. | HCLT | 영어 SentiWordNet을 이용하여 구축된 한국어 감성어휘사전의 성능과 한계 연구 | ||
2016. 10. | HCLT | MUSE 감성주석코퍼스를 활용한 문장 극성과 키워드 극성간의 불일치 현상에 대한 분석 | ||
2017. 2. | 의미 정보가 강화된 워드 임베딩을 통한 감성 분석 |
ACC:82.30 | ||
2017. 6. | KCC | 합성 곱 신경망을 이용한 한글 텍스트 감성 분류기 설계 | ACC:87.88 | |
2017. 6. | KCC | Skip-Connected LSTM을 이용한 감성 분석 | ACC:81.47 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2014. 6. | KCC | SVM 기반의 Mention Pair Model을 이용한 한국어 상호참조해결 | F1:61.67 |
2014. 11. | 정보과학회논문지 | Multi-pass Sieve를 이용한 한국어 상호참조해결 | MUC:58.97 CoNLL:60.65 |
2015. 4. | 정보과학회논문지 | SVM 기반의 멘션 페어 모델을 이용한한국어 상호참조해결 | CEAFE-F1:61.75 |
2015. 6. | KCC | 딥러닝을 이용한 가이드 멘션페어 한국어 상호참조해결 | |
2016. 2. | 석사학위논문 | 규칙과 기계학습을 이용한 한국어 상호참조해결 | |
2016. 6. | KCC | 시브 자질 기반 랜덤 포레스트를 이용한 한국어 상호참조 해결 |
CoNLL:62.00 |
2016. 10. | HCLT | 포인터 네트워크를 이용한 멘션 탐지 | 상호참조F1:52.69 멘션탐지F1:80.75 |
2016. 11. | 정보처리학회논문지 | 랜덤 포레스트를 이용한 한국어 상호참조 해결 | |
2016. 12. | 정보과학회 동계학술대회 |
계층적 포인터 네트워크를 이용한 상호참조해결 | F1:72.43 |
2017. 5. | 정보과학회논문지 | 포인터 네트워크를 이용한 한국어 대명사 상호참조해결 |
81.40 |
2017. 6. | KCC | Bi-directional Multiple Timescale GRU 기반 포인터 네트워크를 이용한 상호참조해결 |
F1:71.05 |
2017. 6. | KCC | k-Max Pooling을 적용한 Cluster-Pair Encoder를 이용한 상호참조해결 |
MUC:64.05 F1:54.76 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2003 | 한국어 질의응답시스템을 위한 지지벡터기계 기반의 질의유형분류기 | ||
2004 | 한국어 질의응답시스템에서 구문정보에 기반한 질의분석 | Precision* | |
어휘 의미 정보를 이용하는 질의응답 시스템의 질의유형 분류 | |||
2011 | HCLT | 실시간 검색어를 이용한 주제어 기반의 질의응답시스템 | |
2012. 2. | 정보과학회논문지 | 오픈 도메인 질의응답을 위한 검색문서 제약 및 정답유형 분류기술 | |
2013 | HCLT | 질의 응답 시스템을 위한 반교사 기반의 정답 유형 분류 | |
2014. 4. | 정보처리학회논문지 | Q&A 문서의 검색 결과 요약을 활용한 질의응답 시스템 | |
2015. 10. | ISWC NLIWoD 2015 Workshop |
Design and Implementation of an Evaluator for Building a Good Knowledge Base in Question Answering |
|
2015. 12. | 정보과학회 동계학술대회 |
질의응답 시스템에서 처음 보는 단어의 효율적인 처리 | |
2016. 6. | KCC | 질의응답 시스템 성능 개선을 위한 질의 트리플 확장 | |
2016. 10. | HCLT | 한국어 질의응답 시스템을 위한 프레임 시멘틱스 기반 질의 의미 분석 | F1:81.37 |
2016. 10. | HCLT | 질의응답 시스템에서 형태소임베딩 모델과 GRU 인코더를 이용한 문장유사도 측정 |
TOP5*:51.63 |
2016. 10. | HCLT | 딥러닝과 정보검색을 결합한 질의응답 시스템 | |
2017. 10. | HCLT | 심층적 의미 매칭을 이용한 cQA 시스템 질문 검색 | P@1:51.5 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2014. 8. | 정보과학회논문지 | 위키피디아로부터 한국어-영어 병렬 문장 추출 | |
2016. 10. | HCLT | 극한 언어 환경에 대응 가능한 영한 자동 주소번역 시스템 | ACC:95.39 |
2016. 10. | HCLT | 말뭉치 자동 확장을 통한 SMT 성능 향상에 대한 연구 | BLEU:24.26 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2014 | 정보과학회 동계학술대회 |
Hidden Markov Model을 이용한 대화 의도 모델링 | |
2016. 10. | HCLT | 격틀과 워드 임베딩을 활용한 유사도 기반 대화 모델링 | MRR:93.9 |
2016. 10. | HCLT | Long Short-Term Memory를 이용한 통합 대화 분석 | 감정ACC:58.08 화행ACC:82.60 서술자ACC:62.74 |
2016. 12. | 정보과학회 동계학술대회 |
Konvbot: 한국어 대화 모델 - 아침, 가정환경을 중심으로 | |
2017. 6. | KCC | 합성곱 신경망을 이용한 음절 표상의 학습을 통한 대화 시스템의 사용자 발화 의도 분석 |
ACC:92.84 |
2017. 6. | KCC | End-to-end learning을 이용한 한국어 단문 응답 시스템 개발 | |
2017. 8. | 컴퓨터교육학회 | Hybrid Code Network를 이용한 한국어 식당 예약 시스템 모델 | |
2017. 10. | HCLT | MTRNN을 이용한 한국어 대화 모델 생성 | BLEU4:0.22 |
2017. 10. | HCLT | 도메인 특정 지식을 결합한 End-to-End Learning 방식의 한국어 식당 예약 대화 시스템 모델 개발 |
Per Response:0.95 Per Dialogue:0.64 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2012. 4. | 한국전자거래학회 춘계학술대회 |
청킹 기반 특징 추출을 통한 문서 분류 시스템의 성능 향상 | |
2016. 10. | 문서 분류 알고리즘을 이용한 한국어 스팸 문서 분류 성능 비교 | F1:98.40 | |
2016. 10. | HCLT | Doc2Vec을 활용한 CNN기반 한국어 신문기사 분류에 관한 연구 |
|
2017. 6. | KCC | 한국어자모단위기반의 Convolution Neural Network를 이용한 텍스트 분류 |
|
2017. 10. | HCLT | 대규모 분류 체계에서 계층적 샘플링을 활용한 문서의 분류 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2016. 10. | HCLT | Copy Mechanism과 Input Feeding을 이용한 End-to-End 한국어 문서요약 |
ROUGE-1:35.92 ROUGE-2:15.37 ROUGE-L:29.45 |
2016. 12. | 정보과학회 동계학술대회 |
lexrankr: LexRank 기반 한국어 다중 문서 요약 | F1:53.40 |
2017. 5. | 정보과학회논문지 | 복사 방법론과 입력 추가 구조를 이용한 End-to-End 한국어 문서요약 |
ROUGE-1:35.92 ROUGE-2:15.37 ROUGE-L:29.45 |
Date | Conference /Journal |
Paper |
---|---|---|
2015. 12. | 정보과학회 동계학술대회 |
Recurrent Neural Network를 이용한 이미지 캡션 생성 |
2016. 8. | 정보과학회논문지 | Recurrent Neural Network를 이용한 이미지 캡션 생성 |
2016. 12. | 정보과학회 동계학술대회 |
딥러닝을 이용한 한국어 이미지 캡션 생성 |
2017. 10. | HCLT | LSTM을 이용한 한국어 이미지 캡션 생성 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2002. 10. | 정보과학회논문지 | 주성분 분석을 이용한 문서 주제어 추출 | |
2010 | 한국정보통신 학회논문지 |
비감독 학습 기법에 의한 한국어의 키워드 추출 | F1:65 |
2015. 2. | 한국컴퓨터정보 학회논문지 |
TF-IDF와 소설 텍스트의 구조를 이용한 주제어 추출 연구 | |
2016. 10. | HCLT | 한글 문서의 단어 동시 출현 정보에 개선된 TextRank를 적용한 키워드 자동 추출 기법 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2016. 6. | KCC | 딥러닝을 이용한 한국어 자동 띄어쓰기 | 어절F1:92.32 |
2016. 10. | HCLT | Default 연산 알고리즘을 적용한 통계적 문맥의존 철자오류 교정 기법의 성능 향상 | |
2017. 6. | KCC | 말뭉치 확장 기법을 이용한 음절 단위 한국어 문장 교정 시스템 | |
2017 | 한글 편집거리 알고리즘을 이용한 한국어 철자오류 교정방법 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2017. 6. | KCC | Input Attention 기반 LSTM-CNN 모델을 이용한 Relation Classification | F1:69.30 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2016. 10. | HCLT | 온톨로지 기반의 문서생성 시스템 | |
2017. 6. | KCC | Sequence-to-sequence 모델을 이용한 자연어생성 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2015. 1. | Pattern Recognition Letters |
New feature weighting approaches for speech-act classification | |
2017. 6. | KCC | 대화문맥을 이용한 심층학습 기반 다중-태그 화행분석 모델 | |
2017. 10. | HCLT | CNN-LSTM 신경망을 이용한 발화 분석 모델 | |
2017. 10. | HCLT | CNN을 이용한 발화 주제 다중 분류 | F1:98.73 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2017. 6. | KCC | 반자동 학습 기반의 비속어 및 욕설 탐지 시스템 | F1:84.23 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2017. 10. | HCLT | Distance LSTM-CNN with Layer Normalization을 이용한음차 표기 대역 쌍 판별 | F1:89.70 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2016. 10. | HCLT | 문서의 공기관계를 이용하여 국가 R&D 보고서간 유사도 계산 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2016. 10. | HCLT | 음성 인식 오류 수정을 위한 Trie 기반 사전을 이용한 Guided Sequence Generation | WER:7.05 |
Date | Conference /Journal |
Paper | Metric |
---|---|---|---|
2017. 10. | HCLT | 코어넷을 활용한 비지도 한국어 어의 중의성 해소 |
Date | Conference /Journal |
Paper |
---|---|---|
2014 | 한국어 의미역 말뭉치 구축을 위한 반자동 태깅 도구 개발 |
Date | Conference /Journal |
Paper |
---|---|---|
2017. 10. | HCLT | 식당 예약 대화 시스템 개발을 위한 한국어 데이터셋 구축 |