회원들이 가장 많이 본 디자인 뉴스
해외 리포트
페이스북 아이콘 트위터 아이콘 카카오 아이콘 인쇄 아이콘

데이터 과학과 민족지학의 공통분모 IV

티클은 2018EPIC 컨퍼런스에서 진행된 데이터과학자 (Tye)와 에스노그래퍼 (Dawn) 간의 대화를 통해 데이터에 대한 통계적 관점과 민족지학적 접근의 공통점과 차이점에 대해 정리한 내용의 마지막 시리즈이다

데이터 과학과 민족지학의 공통점과 차이점을 다시한번 정리해보자면 다음과 같다. 


 공통점: 

 차이점: 

 


 

  1. 데이터 과학과 민족지학은 일관된 역사적 행태와 인식론에서긴장과 정체성 문제가 수반되는 과정으로 학제 전반에 걸친 관행으로 확장되었다는 점에서 공통점을 찾을 수 있다
  2. 두 영역에서 데이터를 다루는 방법에 있어 큰차이가 있지만, 데이터 프로세스는 3단계 (데이터 소싱변환, 그리고 통찰력 공유)로 개략적으로 설명될 수 있다.
  3.  영역 모두 핵심 기대치를 가지고 있지만사회 생활에 대한 데이터매우 실제적인 사회적 결과를 가져오는 데이터를 다루기 위해서는 데이터 과학과 민족지학 둘  핵심을 벗어나야 한다. 

 

  1.  연구 스펙트럼의 측면에서 데이터 과학과 민족지학은 때때로 서로 극과 극에 있는 개념으로 이해되고 있다이를테면 데이터 사이언스는 폭발하는 거대한 데이터 세트로민족지학은 느리게 진행되는 경험적 몰입에 의한 데이터로 말이다
  2. 민족지학의 핵심은 사람들의 신념과 행동을 이해하고이러한 들이 시간이 지남에 따라 어떻게 변화하는지 이해하는 것이다. 반면, 데이터 과학의 핵심은 다양한 형태에 걸친 통계적 계산에 뿌리를 두고 있지만, 최근 통계적 계산을  넓은 시스템(인간 시스템과 기술 시스템)으로 통합하는 것에 대한 강조가 증가하고 있다. 
  3. 데이터 과학자들은 이미 수집된 데이터 내에서 사용 가능한 데이터셋으로 작업하는 것에 대해 생각하지만민족지학자들은 관련 분야 (인류학사회학 등)의 최첨단 기술을 고려할 때 어떠한 데이터셋이 생성될  있는지또는 어떠한 데이터셋을 만들어야 하는지에 대해 광범위하게 생각하면서 프로젝트를 시작하는 경향이 있다. 
  4. 인사이트는 모두 "데이터"에서 나오지만데이터를 어떻게 해석하느냐에 따라 다른 인사이트가 나오기 때문에 민족지학에서는 데이터를 해석하는 주체인 민족지학자 역시 데이터의 일부분으로 인식한다데이터 과학이 이러한 데이터에 대한 편향을 제거해야할 오염요인으로 취급하는 반면민족지학적 접근 방식은 데이터에 대한 편향을 설명되어야 할 현상 요인으로 취급하는 것이다. 
  5. 두 영역의 큰 차이점인 동시에 협업이 가능한 부분은 문제 정의와 데이터 수집일 수 있다프로세스 초기단계에서 일부 데이터 과학자들이 내려야하는 결정예를 들면 데이터 수집 범위와 정도데이터 수집 성과데이터에서 발생할 수 있는 편견의 여부 등에 대한 결정에 민족지학자들이 훈련 받은 직관력이 유용할  있다. 데이터 과학자들은 특정 데이터 집합을 살펴본 후에만 일부 문제 정의와 연구질문을 상상할 수 있으며, 추가 설명이 필요한 패턴을 찾아내기 때문이다.

 


 

 

데이터과학자 (TYE): 데이터 과학자로서 민족지학의 방식에 대해 흥미로웠던 부분은, 민족지학자들이 종종 데이터 수집과 동시에 메타데이터를 수집한다는 것이다. 예를 들어, 여러 사람들 중 왜 이 사람들에 대한 관찰을 진행했는지에 대한 이유, 혹은 관찰이 그들의 기대와 어떻게 일치하는지, 또는 어떻게 충돌하는지 등을 기록한다.

민족지학자 (DAWN): 메타데이터와 수집된 데이터는 분석을 진행하기 전까지 구분하기 쉽지 않기때문에 굳이 그 둘을 엄격히 구분하지 않지만, 출처에 대한 기입은 여전히 유효하다. 데이터 과학과 마찬가지로 명칭은 다르지만 민족지학에서 데이터 변환에 대한 개념이 있는데, 두 영역 모두 데이터 해석을 하는 주체의 훈련된 판단에 의존하는 것 같다. 데이터 과학에서 훈련된 판단은 데이터를 적절한 패턴으로 가장 잘 변환하는 집계 함수 또는 분류 방법을 말하고, 이와 유사하게 민족지학에서의 데이터 변환은 민족지학자들의 현장 노트나 말에서 연구 질문에 대해 뭔가를 말해주는 높은 수준의 패턴으로 가는 방법을 말한다. 어떻게 보면 "집계 함수"이지만, 집계는 데이터에서 공유된 특성을 식별함으로써 발생하고, 이것은 훈련된 민족지학자의 판단으로 귀결되는 문제이다. 예를 들면 어떠한 문학을 데이터 과학의 관점에서 볼 때, 무슨 주제에 대해 말하는 , 주제가 얼마나 자주 나오는 , 누가 무엇에 대해 많이 이야기하고 조금 이야기하는가 등 ‘What’, ‘When’, ‘Who’‘How Often’ 에 대해 고려할 뿐, 어떠한 방식으로 이야기되거나, 동기가 무엇인가와 같은 ‘How’‘Why’ 에 대한 분석은 다뤄지지 않는다. 민족지학의 경우, 대부분 "Write-up" 단계에서 실제로 분석이 진행되며, 여기서 모든 데이터 변환은 어떠한 현상이 일어나는 데에 대한 논증이 된다.

데이터과학자 (TYE): 데이터를 해석하는 주체자의 훈련된 판단이 중요하다는 점에 동의한다. 경험이 풍부한 데이터 과학자와 입문한 데이터 과학자의 상대적 가치는 데이터 조작, 알고리즘 구성이나 샘플 가중치 체계와 같은 일련의 변환을 보다 좋고 강력한 출력 세트로 유도해 내는 경험이다. 데이터 변환 이후 단계인 통찰력 공유에서도 데이터 과학과 민족지학의 중요한 차이점을 발견할 수 있다. 결과를 전달할때에 민족지학적 발견은 프로그래밍 방식으로 전달되는 경우가 거의 없는 대신 민족지학자의 사회적 위치가 그 결과를 어떻게 형성했는지를 포함하여 결과를 설명하는 텍스트 원고나 프리젠테이션 형태의 보고서이다. 반면 데이터 과학에서는 이러한 보고서형태를 포함하여 코딩의 형태로 결과물이 전달되기도 한다.


Numbers need Stories and Vice Versa ⓒ Tracy Wang

 

데이터과학자 (TYE): 궁극적으로 프로세스 모두 사람에 의해 진행되며, 연구 과정에서 반복을 유도하는 것은 종종 연구자의 직관이나 외부 사회문화적 압력이다. 데이터과학과 민족지학의 중요한 차이점은 민족지학 연구는 연구 과정의 명시적이고 예상되는 부분으로서 연구자들의 역할을 비판적으로 평가한다는 것이다. 반면, 데이터 과학은 프로젝트가 데이터(센서 데이터, 클릭 데이터 )만으로 실제로 결정되었다면, 누가 분석하느냐에 관계없이 동일한 결과가 나와야 한다. 하지만 최근 들어 이러한 경향이 점차  사라지고있는 것이 "p-hacking" 같은 개념에 의해 포착되고 있으며, 데이터 과학과 민족지학의 협업 가능성이 여기에 있을 수 있다. 특히, 데이터 과학 프로세스에서 컨텍스트에 대한 정보를 제공하는 (연구자의 편견과 사회적 압력을 식별하고 설명) 민족지학의 개입이 더 큰 도움될 수 있다는 것은 분명하다.

데이터과학자 (TYE): 다른 협업을 위한 분야는 문제 정의와 데이터 수집일 수 있다. 프로세스 초기단계에서 일부 데이터 과학자들이 내려야하는 결정, 예를 들면 데이터 수집 범위와 정도, 데이터 수집 성과, 데이터에서 발생할 수 있는 편견의 여부 등에 대한 결정에 민족지학자들이 훈련 받은 직관력이 유용할 있다.

민족지학자 (DAWN): 그리고 반대로, 일부 문제 정의와 연구 질문은 데이터 과학자가 특정 데이터 집합을 살펴본 후에만 상상할 있으며, 추가 설명이 필요한 패턴을 찾아낸다. 이러한 과정은 민족학적으로 매우 흥미로울 있지만, 데이터 과학의 도움없이 진행될 수 없다.

데이터과학자 (TYE): 앞서 데이터 입증에 대해 언급했지만, 정량적 데이터의 관점에서 다시 한번 강조하고 싶다. 특히 정량적 데이터를 생성하는 시스템은 반드시 사회기술적 시스템이 내재되어야만 한다는 것을 명심하는 것이 중요하다. 그러한 시스템의 기술적 요소 (센서, 소프트웨어 기반 원격 측정 ) 사회문화적 요인에 의해 설계, 제조, 유지된다. 따라서 데이터 과학자는 때때로 데이터셋보다 메타 데이터까지 고려하면서 자신의 데이터가 어디에서 왔는지, 데이터를 생산한 사회문화 현상에 대해 부단히 이해하려고 노력해야 한다. 사회 기술 시스템에서 생성되는 데이터의 품질을 평가하기 위해서라도 데이터 과학과 민족지학의 협업은 타당하다. 이러한 평가는 데이터 사용의 보다 신중한 방법을 유도하거나 기술 시스템을 개선하는 데에 도움이 될 수 있다.

 

출처:

Rattenbury, T., and Nafus, D. (2018) Data Science and Ethnography: What’s our common ground, and why does it matter? Available at: https://www.epicpeople.org/data-science-and-ethnography/

Wang, T. (2016) Why Big Data Needs Thick Data. Available at: https://medium.com/ethnography-matters/why-big-data-needs-thick-data-b4b3e75e3d7

 

 영국 리포터_이보연. 

designdb logo
"데이터 과학과 민족지학의 공통분모 IV"의 경우,
공공누리"출처표시+상업적 이용금지+변경금지" 조건에 따라 이용할 수 있습니다. 단, 사진, 이미지, 일러스트, 동영상 등의 일부 자료는
발행기관이 저작권 전부를 갖고 있지 않을 수 있으므로, 자유롭게 이용하기 위해서는 반드시 해당 저작권자의 허락을 받으셔야 합니다.

목록 버튼 이전 버튼 다음 버튼
최초 3개의 게시물은 임시로 내용 조회가 가능하며, 이후 로그인이 필요합니다. ( 임시조회 게시글 수: )