Korean SmileStyle Dataset으로 문체 스타일을 바꾸는 모델 만들어보기

https://github.com/smilegate-ai/korean_smile_style_dataset

GPT-2 vs BART

처음에는 GPT-2를 이용해서 문체 스타일을 변환해보는 모델을 만들어봤습니다. 예를 들어 아래와 같은 데이터 쌍이 있다고 가정했을 때

존댓말 스타일(formal): 고양이를 6마리나요? 키우는거 안 힘드세요?
반말 스타일(informal): 고양이를 6마리나? 키우는거 안 힘들어?
로봇 스타일(android): 고양이. 6마리. 양육. 번거로운가.
고양이를 6마리나요? 키우는거 안 힘드세요?[android]고양이. 6마리. 양육. 번거로운가.
구어체 말투로 변환:반가운. 나는 6마리의 고양이를 소지하고 있다.
안녕! 나는 고양이 6마리 키워.</s>

--

--

나는 최고의 선수다. 나를 최고라고 믿지 않는 사람은 최고가 될 수 없다.

Love podcasts or audiobooks? Learn on the go with our new app.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
김희규

김희규

나는 최고의 선수다. 나를 최고라고 믿지 않는 사람은 최고가 될 수 없다.