훈동정음 - 어린이들을 위한 AI 동화책 만들어주기 서비스
처음 다뤄본 AI 서비스 프로젝트가 마무리 되었다.
딥러닝을 사용한 얼굴인식은 졸업논문으로 다뤄본 적이 있는데 자연어 전처리는 처음 해보는 거라서 꽤 어려웠다.
한국어는 정말이지 어려운 언어다ㅠ
python을 사용해서 AI를 만들다 보니, 자연스럽게 백엔드 프레임워크는 Django를 사용했다.
spring 쓰다가 다시 django 써보니까 또 기본 기능들이 헷갈리고ㅎㅎ
프로젝트에서 내가 맡은 부분은 단어를 받아 문장으로 만드는 기능과 EC2 배포였다.
데이터 학습 자료가 너무 없어서 힘들었다. 그리고 또 빠져버린 배포의 늪..ㅠㅠ
스프링은 이제 배포를 잘 하는데 django는 EC2 배포가 처음이라..ㅠㅠㅠ
심지어 배포 리눅스 안에서 anaconda 가상환경을 사용하다보니, venv를 사용했을 때와 꼬여서
보여줘야하는 파일이 아닌 이상한 파일과 연결되고, 로컬에서 설치한 기능들이 한번에 설치가 안되니
백엔드 실행시키면서 계속 새로운 파일 설치해주고...ㅎㅎ
배포하느라 36시간동안 잠을 못잤다.
개발자와 라꾸라꾸 침대, 커피는 한 묶음인가보다ㅠㅠ 그래도 하나 해결할때마다 쾌감느끼면서 했다<<진성 개발자
아무튼 배포까지 잘 하니 기분이 좋았다!
움직이는 사진 때문이라도 오리지널 ppt가 들어가면 좋을텐데 용량 초과ㅠㅠ
파일 첨부에 슬라이드쇼가 있는 것을 보니 한 번 알아봐야겠다.
아니면 추가로 프로젝트 소개를 길게 적을 수밖에...
작동도 아주 잘 되는 것을 확인할 수 있다!
음성 모델은 싸피 우리반 교수님으로ㅎㅎ
따로 교수님을 불러 목소리를 녹음할 수는 없었고, 웹엑스 조례/종례나 라이브 특강 등을 할때 녹음 한 목소리를 사용한 거라서 데이터가 처리가 부족했었다ㅠ
특히 "습니다."로 끝나는 문장이 많이 없어서...ㅠㅠㅠ
만약 음성 모델이 근처 사람이었다면 문장이 더 깔끔하게 떨어졌을 것이다.
AI는 학습 데이터가 매우 중요하단 걸 깨달았던 프로젝트였다ㅠㅠ
참고로 발표하며 많은 질문 중 하나가, 만약 캐릭터들이 서로 다른 동화에서 가져온 것이면 어떡하냐는 것이었는데
현재는 오버트레이닝을 시켜 더 많은 객체가 있는 동화의 내용으로 진행이 되도록 해두었다.
하지만 데이터를 조금 더 추가하고(아마 직접 만들지 않을까...), 히든 레이어에 이전 문장을 처리해주는 기능을 추가하고,
마지막으로 사용자가 학습을 더 시킬 수 있게 결과문을 수정하거나 추가할 수 있는 기능을 더해서
더 좋은 서비스로 발전을 시켜주는게 목표이다.
(팀원들이 다시 모여 만들어야해서 시간은 좀 더 걸리겠지만ㅠㅠ 현재는 다들 다른 프로젝트 중ㅠ)
다음 프로젝트는 최신 기술을 접합해서 진행해볼 예정이다.
실패할 수도 있겠지만, 어쨌든 모든 경험으로 성장하고 있으니 이번에도 많은 성장이 있겠지:)
두근!