김희규두번째 논문을 쓰고 느낀 것들좋은 글을 쓰는 것은 너무나 어렵다. 남들은 어떻게 좋은 글을 쓸까 고민했고, 유명한 논문들을 다시 읽었다. 그들이 쓴 단어들과 접속사들을 다시 면밀히 살펴봤다. ChatGPT와 Grammarly의 도움도 적극적으로 받아서 더 나은 표현을 찾았다…2 min read·Mar 5, 2024----
김희규INSTRUCTOR하나의 모델에서 여러가지 NLU task를 수행할 수 있는 모델이 나왔다. task instruction이 추가된 text embedding을 이용한다.2 min read·May 19, 2023----
김희규Adafactor Optimizer for Deep Learning메모리 사용량이 적으면서 learning rate도 알아서 찾아주는 Adafactor에 대해서 알아본다.6 min read·Apr 25, 2023----
김희규Large Language Model의 scaling law와 emergent ability거대한 언어모델(Large Language Model, LLM)을 학습할 때, 우리는 한정적인 리소스로 최적의 모델을 학습해야 한다. 한 번 학습에 큰 비용이 들기 때문에 여러번 실험하기 어렵다. 공개된 문헌을 바탕을 연산량, 데이터 크기, 모델…10 min read·Apr 23, 2023----
김희규Huggingface Diffusers를 이용해서 만든 Diffusion 모델로 이미지 생성하기허깅페이스가 NLP 외에도 컴퓨터 비전과 관련된 라이브러리도 제공하고있는데 최근에 diffusers라는 라이브러리가 나왔습니다. 이를 이용해서 간단히 이미지 생성 모델을 만드는 예제도 공개가 됬는데 이를 사용해보았습니다.5 min read·Aug 15, 2022----
김희규셀레니움 파이썬 웹 크롤러 프록시 적용 방법 및 트래픽 줄이기최근 파이썬과 셀레니움을 이용해서 웹 크롤러를 개발하고 프록시를 도입하면서 비용 문제 때문에 최적화를 진행했는데 그 과정에서 사용한 방법들을 정리해봅니다.6 min read·Aug 7, 2022--1--1