회원들이 가장 많이 본 디자인 뉴스
해외 리포트
페이스북 아이콘 트위터 아이콘 카카오 아이콘 인쇄 아이콘

데이터 과학과 민족지학의 공통분모 III

지난달에 이어 데이터 과학과 민족지학의 공통분모, 그리고 차이점에 대해 각 분야 전문가의 대화를 통해 살펴본다. 


데이터과학자 (TYE): 데이터셋 수집에 대한 기대는 프로젝트를 어떠한 관점에서 볼 것이냐에 대한 초기단계로 귀결된다. 데이터 과학자들은 이미 수집된 데이터 내에서 사용 가능한 데이터셋으로 작업하는 것에 대해 생각하지만, 민족지학자들은 관련 분야 (인류학, 사회학 등)의 최첨단 기술을 고려할 때 어떠한 데이터셋이 생성될 있는지, 또는 어떠한 데이터셋을 만들어야 하는지에 대해 광범위하게 생각하면서 프로젝트를 시작하는 경향이 있다. 이러한 관점의 차이는 결과에 대한 다른 기여 모델로 이어진다. 데이터 과학자들은 종종 결과를 데이터에서 파생된 것으로 설명한다. (출처가 복잡하고 추적이 사실상 불가능한 경우에도). 데이터 과학자는 프로젝트 전반에 걸쳐 결과에 영향을 미치는 결정을 내렸다는 것을 쉽게 인식할 수 있지만, 이러한 결정은 데이터 (또는 데이터에 대한 공통적이고 입증된 분석) 의해 결정되는 것으로 특징지어진다. 하지만 민족지학자들은 데이터를 다루는 방법에 있어서 데이터 과학과 전혀 다르다.

 

민족지학자 (DAWN): 동의한다. 인사이트는 모두 "데이터"에서 나오지만, 데이터를 어떻게 해석하느냐에 따라 다른 인사이트가 나오기때문에 민족지학에서는 데이터를 해석하는 주체인 민족지학자 역시 데이터의 일부분으로 인식한다. 예를 들어, 만약 민족지학자가 인사이트를 끌어내는데에 적극적으로 참여했다면, 데이터가 수집되는 그곳에서 사람들과 대화를 나누고, 그 사람들이 민족지학자의 존재를 이해하려고 애쓰면서 함께 시간을 보냈다면, 특정 연구자에 의해 해석된 그 데이터는 다른 관점에서 보여질 없을 것이다. 또한 민족지학자는 데이터가 수집된 그 순간과 관련된 다른 모든 우발적 요소들과 배경들에 대해 다 알고 있기 때문에, 데이터를 수집하는 주체자의 사회적 지위가 결과에 어떤 영향을 미쳤는지에 대해 명시적으로 반영하고 비판해야 한다.

 

개인적인 이야기를 예로 들자면, 내가 박사학위를 위해 러시아에서 소비 패턴을 연구할 , 내가 미국 국적여자라는 사실은 현지 러시아인들이 나를 대하는 방식에 영향을 미쳤다. 미국과 러시아는 냉전의 역사를 포함해서 중요한 거미줄 (web of significance)' 공유하고 있다. 이것이 의미하는 바는 누군가와 의사소통을 시작하기 전에 그들은 이미 나에 대해 어떠한 편견과 가정을 가지고 있으며, 내가 그들에게 던지는 연구 질문에 대한 인사이트 또한 이러한 편견과 가정에 영향을 받았다는 것이다. 여기서 데이터 과학과 민족지학이 보여주는 큰 차이가 드러나는데, 데이터 과학이 이러한 데이터에 대한 편향을 제거해야할 오염요인으로 취급하는 반면, 민족지학적 접근 방식은 데이터에 대한 편향을 설명되어야 할 현상 요인으로 취급하는 것이다. 민족지학자는 분석 과정의 일부로서 문맥과 사회적 지위에 따른 수집 데이터의 문제들을 냉철하게 검토한다.

 


 

빅데이터를 의미있는 인사이트로 만드는 프로세스. ⓒShaffer, D. (2018) 

 

데이터과학자 (TYE): 얘기를 듣고 보니 데이터과학과 민족지학이 결과에 도달하는 방법은 다르지만, 연구 과정은 내가 경험한 것과 다소 유사한걸로 들린다. 데이터 과학 프로세스의 가지 주요 단계는 다음과 같다.

1. 데이터 소싱단순한 액세스 이상의, 데이터 계통을 이해하고 품질과 범위를 평가하는 것이기도 하다.

2. 데이터 변환 - 필터링 간단한 산술 변환에서 예측 무감독 클러스터링과 같은 복잡한 가설 추론, 귀추법까지 포함한다.

3. 결과 전달사회적으로 (커뮤니케이션을 위한 목적), 혹은 프로그램적으로 (, 코드 라인으로) 전달

데이터 과학 프로세스를 간단히 세단계로 설명했지만, 데이터 수집과 클리닝, 모델링에 이르는 광범위한 데이터 변환, 결과를 제공하는데 필요한 테크닉과 도메인 지식의 범위와 같은 가지 중요한 세부 사항들이 요약되어져있다. 또한, 데이터과학이 매우 광범위한 다학제간 분야라, 한명의 데이터 과학자가 모든 일을 맡아서 하기보다 각 분야의 전문가 여러 명이 데이터 프로세스 단계에 시간과 에너지를 전문화하고 집중한다.

민족지학자 (DAWN): 민족지학자 역시 다른 방식으로 하나의 프로세서에서 참여 연구원들의 노력을 분산, 집중시킨다. 일부는 현장 조사와 설명을 좋아하는 반면 다른 일부는 이러한 설명에서 개념과 이론을 구축하는 초점을 맞추고 있다. 표현되는 방식에 있어서는 다소 다르지만, 민족지학적 연구 프로세스 역시3단계로 개략적으로 설명된 데이터과학 프로세스와 동일한 기본 단계 (데이터 소싱, 변환, 그리고 통찰력 공유)로 설명될 수 있다.

 


Reference:

Rattenbury, T., and Nafus, D. (2018) Data Science and Ethnography: What’s our common ground, and why does it matter? Available at: https://www.epicpeople.org/data-science-and-ethnography/

Shaffer, D. (2018) Transforming Big Data into Meaningful Insights: Introducing Quantitative Ethnography. Scientia.

 

 영국 리포터_이보연.  

designdb logo
"데이터 과학과 민족지학의 공통분모 III"의 경우,
공공누리"출처표시+상업적 이용금지+변경금지" 조건에 따라 이용할 수 있습니다. 단, 사진, 이미지, 일러스트, 동영상 등의 일부 자료는
발행기관이 저작권 전부를 갖고 있지 않을 수 있으므로, 자유롭게 이용하기 위해서는 반드시 해당 저작권자의 허락을 받으셔야 합니다.

목록 버튼 이전 버튼 다음 버튼
최초 3개의 게시물은 임시로 내용 조회가 가능하며, 이후 로그인이 필요합니다. ( 임시조회 게시글 수: )