IT 모바일/데이터라벨링

데이터라벨링 입문 텍스트 수집: 글로쓰는 나만의 웹툰 실습 후기..(feat. 노가다...)

비니의 끄적임 2022. 2. 16. 13:47
728x90
반응형

데이터 라벨링 실습 3일차 후기 글로쓰는 나만의 웹툰 실습 후기

 

데이터 라벨링?

 

보통 사람들이라면 과목명만 들으면 꽤 흥미를 가질지도 모른다. 그게 바로 나였으니까.. 그런데 은근히...은근히 은근히 은근히... 노가다를 필요로 하는 작업이었음을.. 누가 알았겠는가...ㅠ-ㅠ 

 

수업을 들어보니 IT 계열에 종사하는 직업이고, 대체로 인공지능이랑 같이 공존하면서 살아가는 직업같다 그리고 컴퓨터 앞에서 단순작업을 많이 하며, 그 양 또한 방대하다 AI가 이 기능을 습득할 수 있도록 옆에서 도와주는 역할을 하는 것같다. 즉, 데이터라벨러들은 AI 학습을 위한 데이터를 구축하는 작업을 하는 것이다. 

 

 수업을 들어보니 나는 고등학생 때부터 수학은 극혐했었고 무엇을 증명하시오 이런건 싫어했었다. 정답을 요구하는 걸 싫어했으며 이해하는 걸 정말 짜증냈었기 때문에 문과를 왔었지만 늘 색다른 경험을 할 수 있는 데이터라벨링은 좋은 것같다. 흥미로운 건 AI는 개와 고양이를 30년동안 인식하지 못했다는 것이다..ㅠ-ㅠ 또롱탁..

 

 


쫌 이야기가 길어질지도 모르나 AI들이 모델을 해도 될까?

 

 최근에는 인건비가 싸다는 이유로 라면 모델로도 한다고 들었는데 이런식으로 생각해보면 인간 VS AI AI VS 인간... 경쟁을 하게 될 상황이 올 수도 있을 같다는 생각을 했다..... 

 

 데이터라벨링 이야기를 하다가, 서론이 길어졌지만 이제 본론으로 넘어가겠다. 실습이 개인적으로 처음에도 노가다였지만 두번째도 노가다였다...ㅠㅠ 3번째는 얼마나 노가다일까... Ai한테 반려 엄청 당해서 마상입을 뻔했다..ㅠㅠ ♨_♨

 

데이터 라벨링 실습 3일차 후기 글로쓰는 나만의 웹툰 실습 후기

고용노동부 x 크라우드웍스 텍스트수집 글로쓰는 나만의 웹툰 실습 프로젝트를 완료하였습니다를 보면 뿌듯하지만 간신히 했다.... 수업도 잘 듣고 반려 한번 빠구당해서 빡쳐가지고 실습가이드 영상 다시봤다. 그리고 실습에서 나오는 키워드를 적었다. 

 

그런데 핵심만 말하자면, 실습에서 나오는 키워드는 도움이 되는 키워드도 있었고 안되는 키워드도 있었다. 나머지는 나의 직감이 중요하며 애매모호하다 싶은 단어는 빼는 것이 중요하다. 

 

그림이 좀 어려운 것도 있었기 때문에 직감만으로도 추출해내기 어려운 단어가 있었다.-.- 그러니까 노가다 웹툰이라는 것이다....-- 

 

 

데이터 라벨링 실습 3일차 제일 무서운 순간 "반려" 

올해는 진짜로 반려의 날인가 보네... 실습은 온라인으로 진행이 된다. AI가 현재 제출하신 결과물에 대해서 검수를 진행하고 있다. 평균 5초 이내 검수가 완료될 예정이니 잠시만 기다리길 바란다. 검수가 완료되면 자동으로 화면이 전환이 된다. 

 

만약에 작업할 때 작업 중에서 하나라도 반려 된 것이 있으면 "반려"가 뜨며, 그중에서 반려된 것이 없으면 정상적으로 넘어간다. 근데 가이드 사항대로 했었지만 좀 아까 말했다 싶이 이상한 기준이 있어서 키워드를 받아 적었음에도 불구하고 애매모호하다 싶은 단어는 실습 때 적지 않는 것을 추천한다. 

 

실습 가이드 대로 공부했는데도 반려 꽤 많이 당했다.. 

 

그런데, 15개 정도 반복해서 하다보니 스킬이 생겼다, 약간 인스타그램 해시태그 블로그 해시태그 느낌이라고 보면된다.

하지만 문제는 내가 원하는 그 인스타용 느낌의 해시태그가 아니라는게 문제. Ai 기준에 맞아야한다. 작업 가능 수량을 모두 완료하면  실습은 끝!!! 후하하하 텍스트 기능 실습까지 일단 피니쉬

 

 

728x90