ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 데이터 라벨링이란? 데이터 라벨러란?
    경제/상식 2022. 3. 15. 06:15
    반응형

    #데이터 라벨링이란? 데이터 라벨러란?

    데이터 라벨링이란 자료를 뜻하는 데이터와 라벨을 붙이는 작업을 뜻하는 라벨링의 합성어입니다. 즉, 어떤 정보에 라벨링을 한다는 말인데요, 사진이나 영성 등의 데이터를 인공지능(AI)이 인식할 수 있도록 AI를 학습시키는 작업을 가리킵니다. 그래서 AI 데이터 라벨링이라고도 합니다. 그리고 데이터 라벨링을 하는 사람을 '데이터 라벨러'라고 합니다.

     

    #데이터 라벨링의 필요성

    데이터 라벨링이 필요한 이유가 뭘까요? 스스로 학습할 수 없나요? 사람을 예로 들어보겠습니다. 대부분의 사람은 스스로 학습할 수 있습니다. 하지만 아주 어린 아기는 어떨까요? 부모로부터 언어를 배웁니다. '엄마', '아빠'라는 단어부터 시작해서 기본적인 개념을 학습을 통해서 배우게 되고 그렇게 학습능력이 생긴 이후에 스스로 배워나갈 수 있는 능력이 생깁니다. 인공지능도 큰 틀에서는 이와 비슷하다고 할 수 있습니다. 이세돌을 꺾으며 유명해진 알파고도 사람이 일일이 '이건 흰 돌이야, 이건 검은 돌이야'라고 하는 학습 과정(데이터 라벨링) 작업을 거친 것이죠. 

     

    #데이터 라벨링 사업

    그렇습니다. 데이터 라벨링 사업은 곧 인공지능 산업의 일부분인 것입니다. 인공지능 산업은 매해 폭발적인 증가를 하고 있고, 그에 따라 데이터 라벨링 분야도 커지고 있습니다. 글로벌 데이터 라벨링 시장은 2020년 59조 원이었으나 2024년에는 130조로 늘어날 것으로 예상되고 있습니다. 자연스럽게 국내의 데이터 라벨링 시장도 커지고 있는데요 국내 데이터 라벨링 시장은 5년 동안 평균 21.9%의 높은 성장률을 기록해왔고, 2025년에는 4조가 넘는 시장이 될 것으로 예상됩니다. 

     

    #데이터 라벨링 사이트(플랫폼)

    데이터라벨링 업체가 국내에도 점차 늘어나고 있습니다. 마이크라우드, 에이모, 크라우드웍스, 스타마타, 나초스, 캐시미션 등 데이터 라벨링을 하는 사이트(플랫폼)는 점차 증가하고 있습니다. 그만큼 데이터 라벨링의 수요가 늘어나고 있고 많은 사람들이 이를 통해 소득을 창출하고 있습니다.

     

    #데이터 라벨링 방법

    데이터 라벨링 방법은 크게 어렵지 않습니다. 유형별로 말씀드리자면 먼저 크게 고양이나 자동차와 같은 이미지 수집과 영상, 음성 수집으로 구분할 수 있습니다. 이를 좀 더 세분화하자면 해당 이미지에 고양이를 찾아 크기에 맞게 네모 박스를 치거나 특정 부위(관절 또는 얼굴에서 눈코입의 경계)에 체크한다든가 이 사람 얼굴이 화가 난 얼굴인지, 웃는 얼굴인지 그 감정을 체크하고 여러 개의 문장이 같은 의미인지 여부를 구분하는 것 등이 있습니다. 어렵지는 않고 대부분의 사람들이 할 수 있는 일이기에 많은 분들이 참여하고 있습니다. 

     

    #직업으로서의 데이터 라벨링

    한 설문조사에 따르면 데이터 라벨러 10명 중 4명이 부업이 아닌 전업으로 활동하고 있다는 결과가 나왔습니다. 업체마다, 데이터마다 상이하지만 평균 시급이 1만 원 중반 대이고, 고급 프로젝트는 2만 5천 원까지 시급이 측정된다고 하니 전문 데이터 라벨러가 되어 자신의 몸값을 높이는 사람들이 나오고 있는 것이죠. 꼭 돈을 번다는 개념이 아니더라도 한 번쯤 경험을 해 본다면 향후 자신의 시야를 넓힐 수 있는 긍정적인 효과가 크다고 생각됩니다.

    반응형

    댓글

Designed by Tistory.