본문 바로가기

카테고리 없음

AI 허브(AI Hub) 페르소나 기반의 "가상 인물 몽타주" 데이터셋 소개

※ 이 글은 필자가 개인적으로 공부하면서 정리한 글이기 때문에, 잘못된 정보가 포함되어 있을 수 있습니다. ※

 

  필자는 AI 허브(AI Hub)에서 이것저것 다양한 데이터 세트를 둘러보고 있다. 참고로 AI 허브(AI Hub)는 AI 기술 및 서비스를 개발하기 위해 필요한 AI 데이터를 제공하는 사이트로 유명하다. 특히 한국 제품에 최적화된 다양한 데이터가 존재한다는 장점이 있다. 

 

  ▶ 웹 사이트 링크https://www.aihub.or.kr/

 

AI-Hub

자세히보기 AI 허브가 추천하는 검색어입니다. 태그를 클릭하여 검색결과를 확인하세요.

www.aihub.or.kr

 

※ 페르소나 기반의 가상 인물 몽타주 데이터 세트 다운로드 방법 ※

 

  필자는 AI 허브(AI Hub)의 다양한 데이터 세트를 둘러보다가, 재미있는 데이터 세트가 보여서 확인해 보았다. 바로 "페르소나 기반의 가상 인물 몽타주" 데이터 세트인데, 이것을 확인하고 [다운로드]를 진행했다.

 

 

  다음과 같이 원하는 데이터를 선택하여 [선택 다운로드]를 진행하면 된다.

 

 

  다운로드가 진행되는 모습은 다음과 같다. 필자의 경우 다운로드가 굉장히 빠르게 이루어졌다.

 

 

  다운로드가 완료되면, 다음과 같이 약 4GB 정도의 레이블링이 존재하는 데이터 세트가 존재하는 것을 확인할 수 있다.

 

 

※ 페르소나 기반의 가상 인물 몽타주 데이터 세트 소개 ※

 

  가상 인물 몽타주 데이터 세트에 포함된 이미지 데이터를 요약하면 다음과 같다.

 

  - 한국인 가상인물 얼굴 이미지 약 10,000장
  - 가상인물 육안 관찰 인물 스케치 약 10,000장
  - 설명문을 보고 그린 몽타주 스케치(상) 약 10,000장
  - 설명문을 보고 그린 몽타주 스케치(중) 약 10,000장
  - 설명문을 보고 그린 몽타주 스케치(하) 약 10,000장

  특히 "설명문"이 포함되어 있으므로, 데이터가 (텍스트, 이미지) 형태로 구성된다는 점이 강력한 장점이다. 따라서 다양한 딥러닝 모델을 만들 수 있다. 그 예시는 다음과 같다.

 

  1. 시각장애인을 위해 이미지를 주었을 때, 이것을 텍스트로 표현하는 모델 (Show an Tell 논문 등)

  2. 몽타주 작업을 위해 텍스트를 주었을 때, 이것을 이미지로 표현하는 모델 (DALL-E와 같은 text-to-image generation 기법 등)

 

  참고로 본 학습 데이터를 설명해주는 교육 동영상을 유튜브에서 확인할 수 있다.

 

  ▶ 학습 데이터 설명 영상https://www.youtube.com/watch?v=x7x14unFOTY

 

  실제로 학습 데이터를 확인해 보면 다음과 같다. 학습 데이터에는 약 8,000명의 사람 얼굴에 대해서 사진이 1장씩 있는 것으로 이해하면 된다. 데이터 세트의 전체 폴더 구성은 다음과 같다.

 

  ▶ montage: 가상 얼굴 이미지

  ▶ org_sketch: 가상 얼굴을 육안으로 보고 그린 이미지 (일종의 ground-truth 정답 스케치 이미지로 볼 수 있다.)

  ▶ sketch: 설명문만 보고 그린 스케치 이미지 (얼굴을 모르기 때문에, ground-truth와 거리가 있다.)

    /H: 상(제일 디테일하게 열심히 그린 그림)

    /M: 중

    /L: 하(제일 간단히 그린 그림)