데이터 사이언티스트(Data Scientist)라는 이름의 유니콘

2012년 <하버드 비즈니스 리뷰>에서 21세기의 가장 섹시한 직업으로 데이터 사이언티스트를 꼽았다. 섹시하다고…? 어쩌면 가장 땀내 나는 직업 아닐런지.

Worker, Perspiration, Wiping, Sweat, Hot, Young
아오… 이 더러운 데이터들…

어쨌든 “데이터 사이언스”를 하는 사람들을 말할 텐데, 그럼 대체 데이터 사이언스가 무엇인지 좀 알아야겠지.

이걸 설명하는 굉장히 유명한 벤 다이어그램이 있다.

이 벤 다이어그램이 설명하는 걸 보면 결국 데이터 사이언스는 “컴퓨터공학/IT, 수학/통계학, 도메인/비즈니스 지식의 교집합”이다. 실제로 이 영역을 자신있게 아우르는 사람이 존재하긴 하는 걸까? 상상 속에 존재하는 유니콘 아닐런지.

그런데 이건 어쩌면 ‘지식’과 ‘기술’에 초점이 맞춰져 있는 설명인 것 같다. 실제로 데이터 사이언스가 무엇을 하고 어떤 가치를 창출하는 분야인지 설명하는 게 그 표현을 이해할 때 더 중요할 거다.

나 개인적으로는 ‘데이터에서 인사이트를 얻기 위한 방법을 고민하는 분야’ 정도로 이해하고 있다.

그러다가 최근에 유튜브에서 우연히 데이터 사이언스와 관련한 채널을 발견했는데, “대체 데이터 사이언스란 무엇이냐”에 대해 진행자들이 정의도 내려보고 갑론을박하는 영상이 있어 재밌게 듣게 되었다. 좀 nerdy하긴 하지만 아무튼 그런 재미로…

어쨌든 듣다가 나온 내용이 흥미롭고 생각할 거리들이 많이 있어서 여기 간략히 요약, 재구성해서 남겨본다. (실제 방송은 무려 1시간 15분이 넘는 시간 동안 진행되니 자세한 내용은 유튜브나 팟캐스트를 들으면 된다.)


데이터 사이언스는 ~ 이다.

1. 문화

데이터 사이언스, 데이터 과학이라는 건 애초에 말이 안 되는 표현일 수 있다. 본래 과학은 데이터를 가지고 자신의 가설을 검증하고 이론을 정립해 현상을 설명하는 것이기 때문이다.

그런데 이제는 데이터를 수집하고 가공하는 방식이 더 정교화되면서 이러한 과정이 정말 중요해졌고, 그래서 데이터 과학이라 함은 데이터에 초점을 두고 그것을 더 엄밀한 방식으로 다루는 접근이나 방식을 의미한다고 볼 수 있겠다. 일단 데이터를 놓고 얘기하자는 일종의 유행이나 문화가 생긴 것이다.

2. 번역

데이터 그 자체로는 사람이 직관적으로 이해하기 어려운 형태를 가지고 있다. 그래서 데이터 사이언스는 데이터를 사람이 쉽게 이해할 수 있는 언어로 번역하는 것을 의미한다고 할 수 있다. 데이터 사이언티스는 일종의 커뮤니케이터 역할? “이 데이터가 이런 말을 하고 있어요”라는 설명을 해야 하는 것이다.

3. …?

데이터를 다루는 일을 하는 사람들이 멋있게 보이기 위해 꾸며낸, 명확히 정의되거나 합의되지 않은 용어다. 심지어 “통계학이 결국 데이터 과학 아니냐. 데이터 과학으로 개명하자”는 움직임도 있다. 데이터 사이언스는 그저 통계학을 좀 더 섹시하게 꾸며낸 말, 혹은 통계학+컴퓨터공학 정도의 개념일 뿐일지도 모른다.

정리

지금 데이터 사이언스라고 부르는 것들도 결국 사람들이 아주 오래 전부터해오던 것들인데, 이게 비로소 우리가 당면한 문제를 실질적으로 해결해주기 시작하면서, 특히 비즈니스에 직접적으로 도움이 된다는 걸 인식하고 나서부터 본격적으로 이런 표현을 사용하게 된 것이 아닐까.

이건 마치 음악 장르를 대하는 방식과도 같다고 볼 수 있다. 사실 음악의 장르 구분은 음반사에서 마케팅을 위해 정의한 것이었다고 한다. 그래야 그 아티스트, 그 앨범이 어떤 느낌을 전달하는지 감을 잡을 수 있으니까. 그치만 실제로는 그 구분이 명확하지 않고 이제는 더욱 전통적인 장르 구분이 무너져있기도 하고.

“데이터 사이언스”도 어쨌든 널리 사용되는 용어이긴 하지만 뭐라 딱 명확하게 정의를 내리기엔 어려운 영역이기도 한 것 같다. 그런데 용어라는 것이 결국 사람들과 커뮤니케이션하기 위한 목적에서 생겨난 것이니 함께 그 영역이나 역할을 떠올리고 설명할 수 있는 수준으로 적절한 곳에 사용하자.

추천 글


댓글 남기기