안녕하세요! 서울대학교 한국사회과학자료원 서포터즈 DataBee🐝입니다.
지난 1편에서는 비지도 학습 모델인 HDBSCAN 알고리즘을 활용해 수천 개의 인터뷰 발화를 의미 있는 군집으로 묶어내는 기술적 여정을 함께 살펴보았는데요. 그렇다면 숫자와 키워드로 정교하게 요약된 이 데이터 군집들은 과연 그 이면에 어떤 생생한 삶의 서사를 담고 있을까요?
이번 2편에서는 단순히 기술적인 분석 결과에 머무르지 않고, 경계에 선 청소년들의 목소리를 사회과학적 프레임인 '디아스포라(Diaspora) 이론'을 통해 인문학적으로 심층 해독할 예정입니다.
차가운 데이터라는 껍질 속에 숨겨진 이들의 뜨거운 정체성 이야기, 지금 바로 시작합니다!
디아스포라(Diaspora) 이론
디아스포라(Diaspora)는 그리스어에서 유래한 말로, ‘~너머로(dia)’와 ‘씨를 뿌리다(speirein)’가 결합해 본래의 터전을 떠나 다른 지역에 흩어져 살아가는 공동체를 의미합니다. 오늘날에는 단순한 물리적 이주를 넘어, 고향과 현재의 삶 사이에서 형성되는 복합적인 정체성과 감정의 상태를 포괄하는 개념으로 확장되어 사용되고 있는데요.
이러한 맥락에서 디아스포라 이론은 단순히 ‘이주’라는 사건을 설명하는 것이 아니라, 고향과 현재의 삶 사이에서 정체성이 어떻게 흔들리고 재구성되는지, 사회의 시선 속에서 개인이 어떻게 타자화되거나 스스로를 재정의하는지를 분석하는 틀로 이해할 수 있습니다.
근본적으로, 디아스포라 이론은 ‘경계에 선 존재는 어떤 방식으로 자신을 인식하고, 또 어떻게 살아남는가?’라는 질문에 답하려는 이론적 근원인 것이죠. 그리고 이러한 문제의식이 가장 잘 반영된 장르가 바로 디아스포라 문학인데요, 우리가 비교적 잘 알고 있는 파친코, 작은 땅의 야수들, 유희와 같은 작품들은 디아스포라 이론이 말하는 ‘경계성’, ‘타자화’, ‘혼종적 정체성’을 인물의 삶 속에서 구체적으로 보여주는 대표적인 디아스포라 문학입니다. 이 작품들은 단순한 이주 서사가 아니라, 어디에도 완전히 속하지 못하는 감각과 그 속에서 스스로를 지켜내는 과정을 통해 디아스포라 이론의 핵심 문제의식을 서사적으로 구현하고 있죠.

그렇다면 이제 질문은 하나로 모아집니다. 이러한 이론과 문학이 던지는 문제의식은, 과연 오늘날 한국 사회를 살아가는 다문화 가정 청소년들의 실생활 속에서 어떻게 드러나고 있을까요? 저희는 바로 이 지점을 탐색하기 위해, 17명의 다문화 가정 청소년들의 인터뷰 데이터 뒤에 숨겨진 진짜 고민과 생존 전략을 읽어내고자 합니다. 그리고 이를 위해 디아스포라 이론의 핵심 개념들을 보다 구체화한 네 가지 심층 렌즈를 활용할 계획입니다. 이는 다음과 같은데요.
- 주변의 시선에 의해 끊임없이 나의 '다름'을 확인받는 ① 타자화(Othering)
- 주류 사회에 완벽히 녹아들기 위해 자신의 배경을 의도적으로 숨기는 ② 동화와 패싱(Passing)
- 서로 다른 두 문화를 결합해 새로운 정체성을 창조하는 ③ 혼종성(Hybridity)
- 국경을 넘어 모국과 심리적으로 깊게 연결되는 ④ 초국적 유대(Transnational Ties)
수천 개의 파편화된 발화 속에 숨겨진 이 네 가지 코드는 아이들이 한국 사회에서 자신을 지키기 위해 그려낸 '마음의 지도'를 읽어내는 결정적인 실마리가 될 것입니다. 과연 데이터 속의 점들은 어떤 키워드로 우리에게 말을 걸고 있을까요? 그 구체적인 분석 결과를 지금 공개합니다!
클러스터 심층 분석 - 1. 타자화
본격적으로 심층 분석 단계를 설명드리자면, 앞서 클러스터 분석을 통해 도출한 각 군집의 c-TF-IDF 핵심 키워드와 대표 문장을 디아스포라 이론의 네 가지 핵심 렌즈—타자화, 동화와 패싱, 혼종성, 초국적 유대—에 대응시키는 작업을 진행했습니다.
즉, 데이터가 스스로 묶어낸 주제적 군집이 디아스포라적 정체성 형성 과정의 어떤 지점과 연결되는지를 해석적으로 매핑을 진행한 것인데요. 이를 통해 각 클러스터가 단순한 ‘주제 분류’를 넘어, 다문화 가정 청소년들이 한국 사회 속에서 경험하는 정체성의 긴장과 전략을 어떻게 드러내고 있는지 체계적으로 분석하고자 하였습니다.
※ 이해를 돕기 위해, 기존 데이터에서 사용된 가명 대신 인터뷰 진행 순서를 기준으로 Person 1–17로 재명명한 점 참고 부탁드립니다.

먼저 살펴볼 것은 디아스포라 이론의 첫 번째 핵심 개념인 타자화(Othering)입니다. 타자화란, 주류 사회가 특정 집단을 ‘우리’와 구분되는 ‘그들’로 설정하고, 그 차이를 부각시키며 고정된 이미지나 편견을 덧씌우는 과정을 말하는데요. 겉으로는 사소해 보일지라도, 반복되는 시선과 말, 태도 속에서 개인은 끊임없이 자신의 ‘다름’을 확인받게 됩니다.
이번 데이터에서는 이러한 타자화가 거창한 갈등이나 극단적인 사건의 형태가 아니라, 친구의 농담, 어른의 말투 변화, 특정 국가에 대한 막연한 이미지처럼 일상 속에 스며든 언어와 분위기로 드러났습니다.
즉, 노골적인 배제라기보다 ‘은근하지만 반복되는’ 방식으로 작동하며, 당사자로 하여금 자신이 공동체의 중심이 아니라 경계에 서 있다는 감각을 체화하게 만드는 모습이 포착되었습니다.
- 스테레오타입의 내면화와 상처: Person 14 (Cluster 1)
- 키워드: 이미지, 차별, 색깔, 나라
- 대표 문장 "중국… 더럽다고 맨날… 딱 이렇게 보면요, 차별… 다 사람인데 왜 이렇게 차별하는지 모르겠어요."
이 사례는 특정 국가에 대한 부정적인 사회적 이미지가 한 개인에게 그대로 투사되는 전형적인 타자화의 장면입니다.
‘중국=더럽다’라는 왜곡된 스테레오타입은 단순한 의견이 아니라, 상대를 열등한 존재로 위치 짓는 언어적 폭력으로 작동합니다. Person 14는 “다 사람인데”라고 말하며 그 부당함을 인식하고 있지만, 동시에 반복적으로 노출되는 편견 속에서 상처를 경험하고 있습니다.
이는 사회적 이미지가 어떻게 개인의 자존감과 정체성에 직접적인 영향을 미치는지를 보여주는 사례입니다.
- 이주 여성에 대한 노골적 무시: Person 11 (Cluster 1)
- 키워드: 어머니, 결혼, 대만, 무시
- 대표 문장 "택배 기사 아저씨가 외국인 것을 눈치채고... 한국 아줌마에게 그렇게 했다가는 그 회사 망할 거예요."
이 발화는 외국인임을 ‘눈치채는 순간’ 태도가 달라지는 장면을 포착합니다. 발음, 억양, 외모 등에서 비주류로 인식되자마자 존중의 기준이 달라지는 것이죠. 이는 물리적 폭력이 아닌, 일상적 상호작용 속에서 발생하는 전형적인 미시적 차별입니다.
특히 이주 여성에 대한 사회적 위계가 암묵적으로 작동하고 있음을 드러내며, 주류 사회가 설정한 보이지 않는 서열 구조를 그대로 보여줍니다.
- 일상적 혐오 발언의 노출: Person 5 (Cluster 3)
- 키워드: 일본, 할머니, 이지메, 역효과
- 대표 문장 "제 앞에서 너무 그러잖아요… 일본 그 욕을 하면서 너무 듣기 싫은데, 너무 일부러 보이면서 하는 애들 있잖아요."
이 사례는 특정 국가에 대한 집단적 혐오 발언이 개인에게 어떤 방식으로 상처가 되는지를 보여줍니다. 친구들은 ‘일본’을 향해 욕을 하지만, 그 말은 일본과 연결된 정체성을 가진 Person 5에게 직접적으로 꽂힙니다.
더 문제적인 지점은 “일부러 보이면서”라는 표현입니다. 이는 단순한 무지라기보다, 상대의 배경을 의식한 상태에서 이루어지는 배타적 행위일 가능성을 시사합니다. 즉, 타자화가 또래 집단 내에서 관계적 압박으로 작동하는 순간입니다.
- 출신국 기반의 교내 소외: Person 16 (Cluster 2)
- 키워드: 중학교, 중국, 도시, 고등학교
- 대표 문장 "제가 중국에서 왔잖아요. 그러면 애들이 막 처음에 학교 왔을 때 저를 막 이상하게 보는 거예요... 왕따를 잘 시키는 거예요."
이 사례는 출신 국가가 곧 차별의 근거가 되는 상황을 보여줍니다. 단지 ‘중국에서 왔다’는 사실 하나만으로 또래 집단 안에서 이상한 시선을 받고, 심지어 왕따로 이어지는 배제가 발생합니다.
이는 타자화가 개인의 사회적 관계망을 직접적으로 제한하는 방식으로 작동함을 보여주는 분명한 사례입니다. 교실이라는 가장 일상적인 공간에서조차 ‘우리’와 ‘그들’의 경계가 형성되고 있는 것입니다.
클러스터 심층 분석 - 2. 주류 사회로의 동화 압력 및 생존 전략

다음으로 살펴볼 디아스포라 이론의 개념은 주류 사회로의 동화(Assimilation) 압력과 그에 따른 생존 전략입니다. 이는 다문화 청소년들이 한국 사회 안에서 배제되지 않고 ‘안전하게 속하기 위해’ 체감하는 보이지 않는 규범의 힘이라고 할 수 있습니다. 주변의 시선과 비교 속에서 이들은 자연스럽게 “더 한국인처럼 보여야 한다”는 압력을 경험하게 되고, 그 과정에서 나름의 방어 기제를 만들어냅니다. 실제 데이터에서도 이러한 흐름이 분명하게 포착되었는데요. 자신의 배경을 먼저 드러내지 않거나, 굳이 묻지 않으면 말하지 않는 태도, 외모나 언어에서 ‘튀지 않음’을 중요하게 여기는 발화들이 반복적으로 포착되었습니다.
- 동화 압력의 내면화와 조건부 정체성 인식: Person 15 (Cluster 2)
- 키워드: 몽골. 학교, 학년, 공부
- 대표 문장 "저… 깨달았고, 그래서… 아, 이거는 한국은… 전 한국 사람이기도 하고 몽골 사람이기도 하고… 그때 알았어요…한국에서 살고 있으니까 한국 사람… (이어야 한다고)"
위의 사례는 겉으로 보면 ‘한국 사람이기도 하고 몽골 사람이기도 하다’는 혼종적 정체성을 자각하는 장면처럼 보입니다. 그러나 문장의 흐름을 따라가 보면, 그 결론은 “한국에서 살고 있으니까 한국 사람이어야 한다”는 인식으로 수렴됩니다. 이는 두 정체성을 동등하게 수용했다기보다, 한국 사회 안에서 살아가기 위해서는 ‘한국 사람’으로 위치 지어져야 한다는 현실적 판단이 작동한 결과에 가깝습니다.
특히 이 깨달음이 또래 관계와 학교생활이라는 맥락 속에서 등장한다는 점은 중요합니다. ‘한국 사람처럼 보이는 것’이 편안함과 연결되고, ‘외국 사람으로 인식되는 것’이 고립의 가능성과 연결되는 경험을 거치며, 결국 정체성은 선택의 문제가 아니라 생존의 문제로 전환됩니다. 따라서 이 사례는 안정적인 혼종성의 수용이라기보다, 주류 사회의 동화 압력이 개인의 내면에서 어떻게 규범으로 자리 잡는지를 보여주는 장면으로 해석할 수 있습니다.
경계 위에서의 혼란 끝에 도달한 결론이 ‘공존’이 아니라 ‘적응’에 가깝다는 점에서, 동화 압력이 정체성 구성에 깊게 개입하고 있음을 드러내는 사례라고 볼 수 있겠습니다.
- ‘묻지 않으면 말하지 않기’ — 은폐 전략: Person 13 (Cluster 2)
- 키워드: 중국, 중국말, 한국말, 잔소리, 부모
- 대표 문장 "00(인터뷰이)이는 사람들한테 엄마가 중국 사람이란 얘기 잘해? 잘 안 해? 해야 할 때는요 하고요, 안 물어보는 이상은요, 말 안 해요."
이 발화는 매우 조용하지만 분명한 전략을 보여줍니다. 굳이 묻지 않는다면 자신의 배경을 먼저 드러내지 않는 것, 즉 스스로 ‘다름’을 최소화하는 방식입니다. 이는 차별이나 불편한 시선을 사전에 차단하기 위한 소극적 동화 전략, 곧 패싱의 한 형태로 읽을 수 있습니다. 자신의 정체성을 부정한다기보다는, 필요할 때만 꺼내는 ‘조건부 공개’ 전략에 가깝습니다. 하지만 그 이면에는 “드러내면 불리해질 수 있다”는 경험적 학습이 자리하고 있습니다.
- 지위 획득을 통한 방어 기제: Person 8 (Cluster 2 & 4)
- 키워드: 일본, 경찰, 공무원, 반장, 공부
- 대표 문장 "어… 좀… 그러니까 후배들도 있잖아요, 경찰… 그런 사람들한테 존경받으면서… 공부 되게 잘한다고 하던데? 반장… 아, 반장만 했는데, 못해요, 별로."
이 사례는 보다 적극적인 전략을 보여줍니다. 단지 배경을 숨기는 데 그치지 않고, ‘인정받는 위치’에 오름으로써 스스로를 보호하려는 방식입니다. 반장을 맡거나, ‘경찰’과 같은 권위 있고 존경받는 직업을 희망하는 모습은 단순한 진로 선택을 넘어섭니다.
이는 다문화라는 꼬리표를 능력과 지위로 상쇄하고, 사회적 존중을 확보하려는 보상적 성취 전략으로 해석할 수 있습니다. 즉, 차별의 가능성을 실력과 역할 수행으로 선제적으로 무력화하려는 시도로 바라볼 수 있습니다.
클러스터 심층 분석 - 3. 혼종성(Hybridity)의 수용

이처럼 동화 압력 속에서 ‘튀지 않음’을 선택하는 전략이 반복적으로 포착되었다면, 다음으로 살펴볼 개념은 경계인(Marginal Man)의 혼란에서 혼종성(Hybridity) 수용으로 이동하는 과정입니다. 이는 두 문화 사이에 놓인 존재가 어느 한쪽에도 완전히 속하지 못한다는 혼란과 긴장을 겪다가, 점차 그 이중적 위치를 부정의 대상이 아닌 자산으로 재해석하는 과정을 의미합니다.
처음에는 “나는 어디에 속한 사람인가”라는 질문 앞에서 흔들리지만, 시간이 지나며 ‘둘 중 하나’가 아니라 ‘둘 모두일 수 있다’는 인식으로 확장되는 것이죠. 즉, 경계에 서 있다는 사실이 결핍이 아니라, 두 세계를 이해하고 넘나들 수 있는 감각으로 전환되는 순간입니다. 이번 데이터에서도 이러한 정체성의 이동과 재구성의 장면들이 포착되었으며, 이는 다문화 청소년들이 단순히 적응하거나 숨는 데 그치지 않고, 자신의 복합적 배경을 능동적으로 해석하고 의미화 해나가고 있음을 보여줍니다.
- 내적 성숙 및 이중 정체성의 자원화: Person 11 (Cluster 0)
- 키워드: 언어, 문화, 다양, 인식
- 대표 문장 "다양한 생각을 받아들일 수 있는 것... 제가 이런 다문화 배경에서 태어났기 때문에 저는 이런 성격? 혹은 그런 내적인 자아? 그런 것을 가질 수 있었던 것 같아요. 자랑스러운 점이고..."
이 발화는 혼종성이 갈등이나 혼란의 단계에 머무르지 않고, 긍정적으로 재해석된 상태에 도달했음을 보여줍니다. 다문화 배경을 ‘극복해야 할 조건’이 아니라, 오히려 자신을 더 넓고 유연한 시각을 지닌 사람으로 만들어준 자산으로 인식하고 있습니다.
특히 “자랑스러운 점”이라는 표현은 중요한데, 이는 타인의 시선에 의해 정의되는 정체성이 아니라, 스스로 의미를 부여한 정체성이라는 점에서 차별화됩니다. 이 발화는 다문화 정체성이 결핍이 아닌 문화적 자본(Cultural Capital)으로 전환된 장면이라고 볼 수 있습니다.
즉, 두 문화를 경험했다는 사실이 사고의 확장과 공감 능력의 기반이 되며, 이는 완성도 높은 혼종성 수용의 단계로 해석할 수 있습니다.
- ‘특별함’의 인지와 정체성의 재해석: Person 8 (Cluster 3)
- 키워드: 가족, 다문화, 자연, 차별
- 대표 문장 "음… 그냥 다문화인 게요, "다른 사람들이 가지고 있는 거 보다 전 좀 더 특별한 거니까, 그게 더 좋은 거 같앴어요."
이 발화 역시 혼종적 정체성을 긍정적으로 재구성하는 모습이 드러납니다. 과거에는 차별의 가능성과 연결되었을 다문화 배경이, 이제는 ‘특별함’이라는 언어로 재명명되고 있습니다.
이는 단순한 자기 위안이라기보다, 자신만의 배경을 차별화된 정체성 자원으로 전환하는 인식의 변화입니다. 여기서 중요한 점은 비교의 기준이 바뀌었다는 것입니다. ‘남들과 다르다’는 사실이 더 이상 고립의 근거가 아니라, 오히려 차별화된 가치로 재해석됩니다. 경계인의 불안을 넘어, 혼종성을 주체적으로 수용하고 의미화하는 단계로 나아간 모습이라 할 수 있습니다.
클러스터 심층 분석 - 4. 초국적 유대(Transnational Ties)와 사회적 자본

이처럼 혼종성을 자각하고 자신의 이중 정체성을 긍정적으로 재구성하는 흐름이 보였다면, 마지막으로 살펴볼 개념은 초국적 유대(Transnational Ties)와 사회적 자본으로, 이는 태어나고 살아가는 공간이 한국이라 하더라도, 정체성이 그 경계 안에만 머무르지 않는다는 디아스포라의 핵심적 특성을 설명하는 개념입니다.
즉, 부모의 출신국과 언어적·문화적·정서적 교류를 지속하며 두 사회를 동시에 참조하는 삶의 방식입니다. 이는 단순히 ‘고향을 그리워하는 감정’ 차원이 아니라, 모국어 사용, 현지 커뮤니티와의 연결, 대중문화 향유, 가족 네트워크 유지 등 다양한 형태로 일상 속에서 구체화됩니다. 이러한 초국적 유대는 때로는 정체성의 안정감을 제공하고, 때로는 또 다른 선택지를 열어주는 사회적 자본으로 기능합니다.
결국 다문화 청소년들의 삶은 하나의 국가 안에 고정된 서사가 아니라, 여러 문화적 좌표를 동시에 오가며 형성되는 다층적 관계망 속에서 이해되어야 함을 보여주고 있습니다.
- 초국적 커뮤니티와 디아스포라적 거점 형성: Person 17 (Cluster 0)
- 키워드: 몽골, 학교
- 대표 문장 "한국 올 때는… 초등학교 다녔다고 했잖아요. 근데 OO(수도권 내 도시)에 몽골 학교 있거든요. 거기 다녔어요."
이 사례는 한국 사회 안에서 형성된 몽골 디아스포라 커뮤니티의 존재를 보여줍니다. 단순히 개인이 타국에서 살아가는 것이 아니라, 동일한 출신 배경을 지닌 이들이 모여 언어와 문화를 유지하는 공간이 마련되어 있다는 점이 중요합니다.
이러한 ‘몽골 학교’는 물리적 교육기관을 넘어, 정체성을 지속시키는 문화적 거점(Diasporic Enclave)으로 기능합니다. 즉, 한국이라는 공간 안에서도 모국과의 연결이 단절되지 않으며, 초국적 정체성이 일상적으로 재생산되고 있음을 보여주는 사례인 것입니다.
- 대중문화 및 언어 자본의 향유: Person 9 (Cluster 2) & Person 4 (Cluster 1)
- 키워드: 유학, 일본, 드라마, 영어
- 대표 문장 "일본 드라마 봐도 알아들을 거 같아, 00(인터뷰이)이는. 일본말 아니까. 우리 엄마 일본 사람이라고 해서... 한국에서 일본 분들이 많이 계시고, 서로 얘기하면서 하면 긍정적으로 바라봐요."
이 발화들은 부모의 출신국 언어와 문화가 일상 속에서 자연스럽게 활용되고 있음을 보여줍니다. 일본 드라마를 자막 없이 이해할 수 있다는 점은 단순한 취향의 문제가 아니라, 언어 능력이 곧 문화 접근성을 넓혀주는 자산으로 작동하는 사례로, 한국 내 일본 커뮤니티와의 교류 역시 초국적 네트워크의 한 형태로도 볼 수 있습니다.
즉, 여기서 부모의 모국어는 더 이상 ‘다름’의 표지가 아니라, 글로벌 시대에 유용하게 기능하는 문화적 자본으로 전환된 것입니다.
- 모국어를 매개로 한 정서적 유대: Person 10 (Cluster 1)
- 키워드: 필리핀(0.17), 엄마(0.15), 동생(0.08)
- 대표 문장 "어어, 그렇구나. 엄마가 다른 필리핀 말을 할 줄 아니까 좋겠다. 그런 데 갔을 때."
이 사례는 물리적으로는 한국에 거주하고 있지만, 어머니의 언어 능력을 매개로 필리핀과의 연결이 유지되고 있음을 보여줍니다. ‘필리핀 말을 할 수 있다’는 사실은 단순한 기술이 아니라, 가족 내부의 유대와 출신국과의 보이지 않는 연결 고리를 상징합니다.
이는 초국적 유대(Transnational Ties)가 거창한 이동이나 송금 같은 경제적 차원만이 아니라, 일상적 언어 사용과 정서적 안정감 속에서도 작동하고 있음을 입증하는 사례입니다.
분석의 경계: 모든 것이 '디아스포라'는 아니다
지금까지 4개의 디아스포라 개념을 적용하여 각각의 클러스터를 분류해보았는데요. 다만 여기서 한 가지 중요한 균형 잡기가 필요합니다. 17명 청소년의 모든 발화를 ‘디아스포라’라는 틀로만 해석하는 것은 또 다른 과잉 해석이 될 수 있기 때문입니다.
실제로 클러스터 분석 결과에는 다문화적 특성과 직접적으로 연결되지 않는 주제들도 다수 도출되었습니다. 교우관계에서의 갈등과 화해, 장래 희망에 대한 고민, 공부 스트레스, 좋아하는 음식이나 취미 이야기 등등 여느 10대와 다르지 않은 평범한 일상적 발화들도 상당 부분을 차지하고 있었는데요.
이는 이들이 ‘다문화 청소년’이기 이전에, 먼저 동시대를 살아가는 청소년이라는 사실을 상기시켜 줍니다.

1. 성적 스트레스와 진로에 대한 고민
분석 결과, 다문화 배경과 직접적인 연관 없이도 뚜렷하게 형성된 하나의 군집이 있었는데요. 바로 학업 스트레스와 장래 희망에 대한 현실적인 고민입니다. 이는 특정 문화적 배경의 문제가 아니라, 오늘날 대한민국을 살아가는 10대라면 누구나 한 번쯤 마주하게 되는 보편적 주제이기도 합니다. 성적에 대한 부담, 진로 선택의 압박, ‘잘해야 한다’는 기대 속에서의 불안 등은 다문화 여부와 관계없이 공유되는 청소년기의 공통된 정서인데요. 따라서 이들 군집은 이들이 ‘다문화 청소년’이기 이전에, 입시 경쟁과 미래 불확실성 속을 살아가는 한국 사회의 청소년이라는 점을 다시 한 번 보여주는 지점이라고 할 수 있겠습니다.
- 키워드: 인문, 고등학교, 이과, 과학자
- 대표 문장 "제 장래 희망은 과학자였거든요. 과학자 한번 해보고 싶었는데 제 성적으로는 아직 좀 어려운 것 같아서"
- 키워드: 요리사, 음식, 일식, 문화, 일본
- 대표문장 "아 그렇구나. 뭐를 믿는 거야? 한번 먹어봤던 음식이니깐… 그 맛을 최대한… 그 뭐냐, 맛을 잘 만들 수 있을 거 같아요."
- 키워드: 공부, 수학, 학원, 과목, 피아노
- 대표문장 "응? 공부를 해야 된다고? 근데 어때? 공부하는 거? 귀찮아요."
2. 또래 관계와 내향적인 성격 (교우관계) + 가족과의 일상
이와 더불어 또 하나 주목할 군집은, 국적이나 민족적 배경과는 무관하게 그저 ‘10대이기 때문에’ 겪는 감정의 굴곡을 담고 있는 발화들입니다. 친구 관계에서의 오해와 서운함, 관계가 멀어진 이유를 사회적 차별이 아니라 “내가 소심하고 잘 삐쳐서 그런 것 같다”고 설명하는 자기 성찰적 표현들은, 다문화라는 구조적 맥락 이전에 사춘기 특유의 예민한 감수성과 성격적 고민을 보여줍니다.
이는 심오한 정체성 갈등이라기보다, 또래 집단 안에서 누구나 한 번쯤 겪는 관계의 부침에 가깝습니다. 동시에 “엄마가 해준 한국 음식 중 최애는 김치찌개”라거나, 오늘 저녁 메뉴 이야기 같이 평온하고 일상적인 대화들도 적지 않게 등장합니다.
이러한 발화들은 이들이 거창한 정체성의 경계 위에만 서 있는 존재가 아니라, 웃고 떠들고 고민하고 삐지는 평범한 청소년이라는 사실을 다시 한 번 환기시켜 줍니다.
- 키워드: 다문화, 학교, 가정, 교회, 성격
- 대표문장 "중학교 들어오고 나서 친구가 별로 없어졌어요? 왜 그럴까? 말수도 적고, 성격도 제가 좀 소심해가지고요. 잘 삐치고 그거 때문인 거 같아요"
- 키워드: 돈까스, 떡볶이, 소스, 김치찌개
- 대표문장 "김치찌개. 아, 그럼 진짜 음식 잘하시네. 음, 그렇구나"
결론: 데이터 사이언스와 인문학의 융합이 남긴 것
이번 분석에서는 총 17명 중 14명의 데이터를 채택해 c-TF-IDF 키워드와 대표 문장을 중심으로 각 클러스터를 디아스포라 이론의 네 가지 개념(타자화, 동화/패싱, 혼종성, 초국적 유대), 그리고 문화적 특성과 직접적으로 연결되지 않는 보편적 청소년 주제로 나누어 살펴보았습니다.
흥미로웠던 점은 한 개인이 하나의 범주에만 머무르지 않았다는 건데요. 동일한 샘플 안에서도 동화 전략과 초국적 유대가 함께 나타나거나, 타자화 경험과 학업 고민이 동시에 등장하는 등 여러 분류가 교차하는 복합적인 모습이 확인되었습니다. 한편 모든 사례가 이렇게 깔끔하게 이론에 들어맞았던 건 아니었습니다. 채택되지 못한 Person 1, 2, 12의 경우에는 “아 그래… 네.”, “(잠시 침묵)”처럼 맥락이 드러나지 않는 단답형 응답이 대부분이었고, 세 스크립트 모두 발화의 70~80%를 면접관이 차지하는 ‘면접관 주도형 대화’ 구조를 보였는데요. 질문자가 상황을 설명하고 해석까지 제시한 뒤 학생은 짧게 호응하는 방식이 반복되면서, 청소년 본인의 자발적인 서사나 감정 표현을 충분히 추출하기 어려웠습니다.
이처럼 인터뷰 맥락과 발화 분위기까지는 수치화하기 어렵다는 점 역시 이번 분석의 한계로 남습니다.. 그럼에도 불구하고 기존의 전통적인 질적 방법과 달리 머신러닝 기반 토픽 모델링을 적용해 보니, 기대했던 것보다 질적 데이터에서도 주제 군집이 효과적으로 도출되었고, 방대한 인터뷰 내용을 일일이 설명하지 않고도 일부 문장 및 키워드 제시를 통해 전반적인 경향을 전달할 수 있었다는 점에서 나름 의미 있는 시도였던 것 같습니다 처음 해본 분석인 만큼 가볍게 읽어주시면 감사하겠습니다!
이상 KOSSDA 서포터즈 DataBee🐝였습니다.
📍 분석자료: 김기현. 국제결혼가정 청소년의 민족정체성에 관한 인터뷰 조사, 2012 [데이터 세트]. 한국사회과학자료원 (KOSSDA) [자료제공기관], 2021-08-09,https://doi.org/10.22687/KOSSDA-B3-2012-0004-V1.0
🔗 데이터로 읽는 국제결혼가정 청소년의 민족정체성, 1편
🔗 데이터로 읽는 국제결혼가정 청소년의 민족정체성,부록(Appendix) “그래서 이 지표들, 정말 괜찮은 걸까?”질문과 답




안녕하세요! 서울대학교 한국사회과학자료원 서포터즈 DataBee🐝입니다.
지난 1편에서는 비지도 학습 모델인 HDBSCAN 알고리즘을 활용해 수천 개의 인터뷰 발화를 의미 있는 군집으로 묶어내는 기술적 여정을 함께 살펴보았는데요. 그렇다면 숫자와 키워드로 정교하게 요약된 이 데이터 군집들은 과연 그 이면에 어떤 생생한 삶의 서사를 담고 있을까요?
이번 2편에서는 단순히 기술적인 분석 결과에 머무르지 않고, 경계에 선 청소년들의 목소리를 사회과학적 프레임인 '디아스포라(Diaspora) 이론'을 통해 인문학적으로 심층 해독할 예정입니다.
차가운 데이터라는 껍질 속에 숨겨진 이들의 뜨거운 정체성 이야기, 지금 바로 시작합니다!
디아스포라(Diaspora) 이론
디아스포라(Diaspora)는 그리스어에서 유래한 말로, ‘~너머로(dia)’와 ‘씨를 뿌리다(speirein)’가 결합해 본래의 터전을 떠나 다른 지역에 흩어져 살아가는 공동체를 의미합니다. 오늘날에는 단순한 물리적 이주를 넘어, 고향과 현재의 삶 사이에서 형성되는 복합적인 정체성과 감정의 상태를 포괄하는 개념으로 확장되어 사용되고 있는데요.
이러한 맥락에서 디아스포라 이론은 단순히 ‘이주’라는 사건을 설명하는 것이 아니라, 고향과 현재의 삶 사이에서 정체성이 어떻게 흔들리고 재구성되는지, 사회의 시선 속에서 개인이 어떻게 타자화되거나 스스로를 재정의하는지를 분석하는 틀로 이해할 수 있습니다.
근본적으로, 디아스포라 이론은 ‘경계에 선 존재는 어떤 방식으로 자신을 인식하고, 또 어떻게 살아남는가?’라는 질문에 답하려는 이론적 근원인 것이죠. 그리고 이러한 문제의식이 가장 잘 반영된 장르가 바로 디아스포라 문학인데요, 우리가 비교적 잘 알고 있는 파친코, 작은 땅의 야수들, 유희와 같은 작품들은 디아스포라 이론이 말하는 ‘경계성’, ‘타자화’, ‘혼종적 정체성’을 인물의 삶 속에서 구체적으로 보여주는 대표적인 디아스포라 문학입니다. 이 작품들은 단순한 이주 서사가 아니라, 어디에도 완전히 속하지 못하는 감각과 그 속에서 스스로를 지켜내는 과정을 통해 디아스포라 이론의 핵심 문제의식을 서사적으로 구현하고 있죠.
그렇다면 이제 질문은 하나로 모아집니다. 이러한 이론과 문학이 던지는 문제의식은, 과연 오늘날 한국 사회를 살아가는 다문화 가정 청소년들의 실생활 속에서 어떻게 드러나고 있을까요? 저희는 바로 이 지점을 탐색하기 위해, 17명의 다문화 가정 청소년들의 인터뷰 데이터 뒤에 숨겨진 진짜 고민과 생존 전략을 읽어내고자 합니다. 그리고 이를 위해 디아스포라 이론의 핵심 개념들을 보다 구체화한 네 가지 심층 렌즈를 활용할 계획입니다. 이는 다음과 같은데요.
수천 개의 파편화된 발화 속에 숨겨진 이 네 가지 코드는 아이들이 한국 사회에서 자신을 지키기 위해 그려낸 '마음의 지도'를 읽어내는 결정적인 실마리가 될 것입니다. 과연 데이터 속의 점들은 어떤 키워드로 우리에게 말을 걸고 있을까요? 그 구체적인 분석 결과를 지금 공개합니다!
클러스터 심층 분석 - 1. 타자화
본격적으로 심층 분석 단계를 설명드리자면, 앞서 클러스터 분석을 통해 도출한 각 군집의 c-TF-IDF 핵심 키워드와 대표 문장을 디아스포라 이론의 네 가지 핵심 렌즈—타자화, 동화와 패싱, 혼종성, 초국적 유대—에 대응시키는 작업을 진행했습니다.
즉, 데이터가 스스로 묶어낸 주제적 군집이 디아스포라적 정체성 형성 과정의 어떤 지점과 연결되는지를 해석적으로 매핑을 진행한 것인데요. 이를 통해 각 클러스터가 단순한 ‘주제 분류’를 넘어, 다문화 가정 청소년들이 한국 사회 속에서 경험하는 정체성의 긴장과 전략을 어떻게 드러내고 있는지 체계적으로 분석하고자 하였습니다.
※ 이해를 돕기 위해, 기존 데이터에서 사용된 가명 대신 인터뷰 진행 순서를 기준으로 Person 1–17로 재명명한 점 참고 부탁드립니다.
먼저 살펴볼 것은 디아스포라 이론의 첫 번째 핵심 개념인 타자화(Othering)입니다. 타자화란, 주류 사회가 특정 집단을 ‘우리’와 구분되는 ‘그들’로 설정하고, 그 차이를 부각시키며 고정된 이미지나 편견을 덧씌우는 과정을 말하는데요. 겉으로는 사소해 보일지라도, 반복되는 시선과 말, 태도 속에서 개인은 끊임없이 자신의 ‘다름’을 확인받게 됩니다.
이번 데이터에서는 이러한 타자화가 거창한 갈등이나 극단적인 사건의 형태가 아니라, 친구의 농담, 어른의 말투 변화, 특정 국가에 대한 막연한 이미지처럼 일상 속에 스며든 언어와 분위기로 드러났습니다.
즉, 노골적인 배제라기보다 ‘은근하지만 반복되는’ 방식으로 작동하며, 당사자로 하여금 자신이 공동체의 중심이 아니라 경계에 서 있다는 감각을 체화하게 만드는 모습이 포착되었습니다.
이 사례는 특정 국가에 대한 부정적인 사회적 이미지가 한 개인에게 그대로 투사되는 전형적인 타자화의 장면입니다.
‘중국=더럽다’라는 왜곡된 스테레오타입은 단순한 의견이 아니라, 상대를 열등한 존재로 위치 짓는 언어적 폭력으로 작동합니다. Person 14는 “다 사람인데”라고 말하며 그 부당함을 인식하고 있지만, 동시에 반복적으로 노출되는 편견 속에서 상처를 경험하고 있습니다.
이는 사회적 이미지가 어떻게 개인의 자존감과 정체성에 직접적인 영향을 미치는지를 보여주는 사례입니다.
이 발화는 외국인임을 ‘눈치채는 순간’ 태도가 달라지는 장면을 포착합니다. 발음, 억양, 외모 등에서 비주류로 인식되자마자 존중의 기준이 달라지는 것이죠. 이는 물리적 폭력이 아닌, 일상적 상호작용 속에서 발생하는 전형적인 미시적 차별입니다.
특히 이주 여성에 대한 사회적 위계가 암묵적으로 작동하고 있음을 드러내며, 주류 사회가 설정한 보이지 않는 서열 구조를 그대로 보여줍니다.
이 사례는 특정 국가에 대한 집단적 혐오 발언이 개인에게 어떤 방식으로 상처가 되는지를 보여줍니다. 친구들은 ‘일본’을 향해 욕을 하지만, 그 말은 일본과 연결된 정체성을 가진 Person 5에게 직접적으로 꽂힙니다.
더 문제적인 지점은 “일부러 보이면서”라는 표현입니다. 이는 단순한 무지라기보다, 상대의 배경을 의식한 상태에서 이루어지는 배타적 행위일 가능성을 시사합니다. 즉, 타자화가 또래 집단 내에서 관계적 압박으로 작동하는 순간입니다.
이 사례는 출신 국가가 곧 차별의 근거가 되는 상황을 보여줍니다. 단지 ‘중국에서 왔다’는 사실 하나만으로 또래 집단 안에서 이상한 시선을 받고, 심지어 왕따로 이어지는 배제가 발생합니다.
이는 타자화가 개인의 사회적 관계망을 직접적으로 제한하는 방식으로 작동함을 보여주는 분명한 사례입니다. 교실이라는 가장 일상적인 공간에서조차 ‘우리’와 ‘그들’의 경계가 형성되고 있는 것입니다.
클러스터 심층 분석 - 2. 주류 사회로의 동화 압력 및 생존 전략
다음으로 살펴볼 디아스포라 이론의 개념은 주류 사회로의 동화(Assimilation) 압력과 그에 따른 생존 전략입니다. 이는 다문화 청소년들이 한국 사회 안에서 배제되지 않고 ‘안전하게 속하기 위해’ 체감하는 보이지 않는 규범의 힘이라고 할 수 있습니다. 주변의 시선과 비교 속에서 이들은 자연스럽게 “더 한국인처럼 보여야 한다”는 압력을 경험하게 되고, 그 과정에서 나름의 방어 기제를 만들어냅니다. 실제 데이터에서도 이러한 흐름이 분명하게 포착되었는데요. 자신의 배경을 먼저 드러내지 않거나, 굳이 묻지 않으면 말하지 않는 태도, 외모나 언어에서 ‘튀지 않음’을 중요하게 여기는 발화들이 반복적으로 포착되었습니다.
위의 사례는 겉으로 보면 ‘한국 사람이기도 하고 몽골 사람이기도 하다’는 혼종적 정체성을 자각하는 장면처럼 보입니다. 그러나 문장의 흐름을 따라가 보면, 그 결론은 “한국에서 살고 있으니까 한국 사람이어야 한다”는 인식으로 수렴됩니다. 이는 두 정체성을 동등하게 수용했다기보다, 한국 사회 안에서 살아가기 위해서는 ‘한국 사람’으로 위치 지어져야 한다는 현실적 판단이 작동한 결과에 가깝습니다.
특히 이 깨달음이 또래 관계와 학교생활이라는 맥락 속에서 등장한다는 점은 중요합니다. ‘한국 사람처럼 보이는 것’이 편안함과 연결되고, ‘외국 사람으로 인식되는 것’이 고립의 가능성과 연결되는 경험을 거치며, 결국 정체성은 선택의 문제가 아니라 생존의 문제로 전환됩니다. 따라서 이 사례는 안정적인 혼종성의 수용이라기보다, 주류 사회의 동화 압력이 개인의 내면에서 어떻게 규범으로 자리 잡는지를 보여주는 장면으로 해석할 수 있습니다.
경계 위에서의 혼란 끝에 도달한 결론이 ‘공존’이 아니라 ‘적응’에 가깝다는 점에서, 동화 압력이 정체성 구성에 깊게 개입하고 있음을 드러내는 사례라고 볼 수 있겠습니다.
이 발화는 매우 조용하지만 분명한 전략을 보여줍니다. 굳이 묻지 않는다면 자신의 배경을 먼저 드러내지 않는 것, 즉 스스로 ‘다름’을 최소화하는 방식입니다. 이는 차별이나 불편한 시선을 사전에 차단하기 위한 소극적 동화 전략, 곧 패싱의 한 형태로 읽을 수 있습니다. 자신의 정체성을 부정한다기보다는, 필요할 때만 꺼내는 ‘조건부 공개’ 전략에 가깝습니다. 하지만 그 이면에는 “드러내면 불리해질 수 있다”는 경험적 학습이 자리하고 있습니다.
이 사례는 보다 적극적인 전략을 보여줍니다. 단지 배경을 숨기는 데 그치지 않고, ‘인정받는 위치’에 오름으로써 스스로를 보호하려는 방식입니다. 반장을 맡거나, ‘경찰’과 같은 권위 있고 존경받는 직업을 희망하는 모습은 단순한 진로 선택을 넘어섭니다.
이는 다문화라는 꼬리표를 능력과 지위로 상쇄하고, 사회적 존중을 확보하려는 보상적 성취 전략으로 해석할 수 있습니다. 즉, 차별의 가능성을 실력과 역할 수행으로 선제적으로 무력화하려는 시도로 바라볼 수 있습니다.
클러스터 심층 분석 - 3. 혼종성(Hybridity)의 수용
이처럼 동화 압력 속에서 ‘튀지 않음’을 선택하는 전략이 반복적으로 포착되었다면, 다음으로 살펴볼 개념은 경계인(Marginal Man)의 혼란에서 혼종성(Hybridity) 수용으로 이동하는 과정입니다. 이는 두 문화 사이에 놓인 존재가 어느 한쪽에도 완전히 속하지 못한다는 혼란과 긴장을 겪다가, 점차 그 이중적 위치를 부정의 대상이 아닌 자산으로 재해석하는 과정을 의미합니다.
처음에는 “나는 어디에 속한 사람인가”라는 질문 앞에서 흔들리지만, 시간이 지나며 ‘둘 중 하나’가 아니라 ‘둘 모두일 수 있다’는 인식으로 확장되는 것이죠. 즉, 경계에 서 있다는 사실이 결핍이 아니라, 두 세계를 이해하고 넘나들 수 있는 감각으로 전환되는 순간입니다. 이번 데이터에서도 이러한 정체성의 이동과 재구성의 장면들이 포착되었으며, 이는 다문화 청소년들이 단순히 적응하거나 숨는 데 그치지 않고, 자신의 복합적 배경을 능동적으로 해석하고 의미화 해나가고 있음을 보여줍니다.
이 발화는 혼종성이 갈등이나 혼란의 단계에 머무르지 않고, 긍정적으로 재해석된 상태에 도달했음을 보여줍니다. 다문화 배경을 ‘극복해야 할 조건’이 아니라, 오히려 자신을 더 넓고 유연한 시각을 지닌 사람으로 만들어준 자산으로 인식하고 있습니다.
특히 “자랑스러운 점”이라는 표현은 중요한데, 이는 타인의 시선에 의해 정의되는 정체성이 아니라, 스스로 의미를 부여한 정체성이라는 점에서 차별화됩니다. 이 발화는 다문화 정체성이 결핍이 아닌 문화적 자본(Cultural Capital)으로 전환된 장면이라고 볼 수 있습니다.
즉, 두 문화를 경험했다는 사실이 사고의 확장과 공감 능력의 기반이 되며, 이는 완성도 높은 혼종성 수용의 단계로 해석할 수 있습니다.
이 발화 역시 혼종적 정체성을 긍정적으로 재구성하는 모습이 드러납니다. 과거에는 차별의 가능성과 연결되었을 다문화 배경이, 이제는 ‘특별함’이라는 언어로 재명명되고 있습니다.
이는 단순한 자기 위안이라기보다, 자신만의 배경을 차별화된 정체성 자원으로 전환하는 인식의 변화입니다. 여기서 중요한 점은 비교의 기준이 바뀌었다는 것입니다. ‘남들과 다르다’는 사실이 더 이상 고립의 근거가 아니라, 오히려 차별화된 가치로 재해석됩니다. 경계인의 불안을 넘어, 혼종성을 주체적으로 수용하고 의미화하는 단계로 나아간 모습이라 할 수 있습니다.
클러스터 심층 분석 - 4. 초국적 유대(Transnational Ties)와 사회적 자본
이처럼 혼종성을 자각하고 자신의 이중 정체성을 긍정적으로 재구성하는 흐름이 보였다면, 마지막으로 살펴볼 개념은 초국적 유대(Transnational Ties)와 사회적 자본으로, 이는 태어나고 살아가는 공간이 한국이라 하더라도, 정체성이 그 경계 안에만 머무르지 않는다는 디아스포라의 핵심적 특성을 설명하는 개념입니다.
즉, 부모의 출신국과 언어적·문화적·정서적 교류를 지속하며 두 사회를 동시에 참조하는 삶의 방식입니다. 이는 단순히 ‘고향을 그리워하는 감정’ 차원이 아니라, 모국어 사용, 현지 커뮤니티와의 연결, 대중문화 향유, 가족 네트워크 유지 등 다양한 형태로 일상 속에서 구체화됩니다. 이러한 초국적 유대는 때로는 정체성의 안정감을 제공하고, 때로는 또 다른 선택지를 열어주는 사회적 자본으로 기능합니다.
결국 다문화 청소년들의 삶은 하나의 국가 안에 고정된 서사가 아니라, 여러 문화적 좌표를 동시에 오가며 형성되는 다층적 관계망 속에서 이해되어야 함을 보여주고 있습니다.
이 사례는 한국 사회 안에서 형성된 몽골 디아스포라 커뮤니티의 존재를 보여줍니다. 단순히 개인이 타국에서 살아가는 것이 아니라, 동일한 출신 배경을 지닌 이들이 모여 언어와 문화를 유지하는 공간이 마련되어 있다는 점이 중요합니다.
이러한 ‘몽골 학교’는 물리적 교육기관을 넘어, 정체성을 지속시키는 문화적 거점(Diasporic Enclave)으로 기능합니다. 즉, 한국이라는 공간 안에서도 모국과의 연결이 단절되지 않으며, 초국적 정체성이 일상적으로 재생산되고 있음을 보여주는 사례인 것입니다.
이 발화들은 부모의 출신국 언어와 문화가 일상 속에서 자연스럽게 활용되고 있음을 보여줍니다. 일본 드라마를 자막 없이 이해할 수 있다는 점은 단순한 취향의 문제가 아니라, 언어 능력이 곧 문화 접근성을 넓혀주는 자산으로 작동하는 사례로, 한국 내 일본 커뮤니티와의 교류 역시 초국적 네트워크의 한 형태로도 볼 수 있습니다.
즉, 여기서 부모의 모국어는 더 이상 ‘다름’의 표지가 아니라, 글로벌 시대에 유용하게 기능하는 문화적 자본으로 전환된 것입니다.
이 사례는 물리적으로는 한국에 거주하고 있지만, 어머니의 언어 능력을 매개로 필리핀과의 연결이 유지되고 있음을 보여줍니다. ‘필리핀 말을 할 수 있다’는 사실은 단순한 기술이 아니라, 가족 내부의 유대와 출신국과의 보이지 않는 연결 고리를 상징합니다.
이는 초국적 유대(Transnational Ties)가 거창한 이동이나 송금 같은 경제적 차원만이 아니라, 일상적 언어 사용과 정서적 안정감 속에서도 작동하고 있음을 입증하는 사례입니다.
분석의 경계: 모든 것이 '디아스포라'는 아니다
지금까지 4개의 디아스포라 개념을 적용하여 각각의 클러스터를 분류해보았는데요. 다만 여기서 한 가지 중요한 균형 잡기가 필요합니다. 17명 청소년의 모든 발화를 ‘디아스포라’라는 틀로만 해석하는 것은 또 다른 과잉 해석이 될 수 있기 때문입니다.
실제로 클러스터 분석 결과에는 다문화적 특성과 직접적으로 연결되지 않는 주제들도 다수 도출되었습니다. 교우관계에서의 갈등과 화해, 장래 희망에 대한 고민, 공부 스트레스, 좋아하는 음식이나 취미 이야기 등등 여느 10대와 다르지 않은 평범한 일상적 발화들도 상당 부분을 차지하고 있었는데요.
이는 이들이 ‘다문화 청소년’이기 이전에, 먼저 동시대를 살아가는 청소년이라는 사실을 상기시켜 줍니다.
1. 성적 스트레스와 진로에 대한 고민
분석 결과, 다문화 배경과 직접적인 연관 없이도 뚜렷하게 형성된 하나의 군집이 있었는데요. 바로 학업 스트레스와 장래 희망에 대한 현실적인 고민입니다. 이는 특정 문화적 배경의 문제가 아니라, 오늘날 대한민국을 살아가는 10대라면 누구나 한 번쯤 마주하게 되는 보편적 주제이기도 합니다. 성적에 대한 부담, 진로 선택의 압박, ‘잘해야 한다’는 기대 속에서의 불안 등은 다문화 여부와 관계없이 공유되는 청소년기의 공통된 정서인데요. 따라서 이들 군집은 이들이 ‘다문화 청소년’이기 이전에, 입시 경쟁과 미래 불확실성 속을 살아가는 한국 사회의 청소년이라는 점을 다시 한 번 보여주는 지점이라고 할 수 있겠습니다.
2. 또래 관계와 내향적인 성격 (교우관계) + 가족과의 일상
이와 더불어 또 하나 주목할 군집은, 국적이나 민족적 배경과는 무관하게 그저 ‘10대이기 때문에’ 겪는 감정의 굴곡을 담고 있는 발화들입니다. 친구 관계에서의 오해와 서운함, 관계가 멀어진 이유를 사회적 차별이 아니라 “내가 소심하고 잘 삐쳐서 그런 것 같다”고 설명하는 자기 성찰적 표현들은, 다문화라는 구조적 맥락 이전에 사춘기 특유의 예민한 감수성과 성격적 고민을 보여줍니다.
이는 심오한 정체성 갈등이라기보다, 또래 집단 안에서 누구나 한 번쯤 겪는 관계의 부침에 가깝습니다. 동시에 “엄마가 해준 한국 음식 중 최애는 김치찌개”라거나, 오늘 저녁 메뉴 이야기 같이 평온하고 일상적인 대화들도 적지 않게 등장합니다.
이러한 발화들은 이들이 거창한 정체성의 경계 위에만 서 있는 존재가 아니라, 웃고 떠들고 고민하고 삐지는 평범한 청소년이라는 사실을 다시 한 번 환기시켜 줍니다.
결론: 데이터 사이언스와 인문학의 융합이 남긴 것
이번 분석에서는 총 17명 중 14명의 데이터를 채택해 c-TF-IDF 키워드와 대표 문장을 중심으로 각 클러스터를 디아스포라 이론의 네 가지 개념(타자화, 동화/패싱, 혼종성, 초국적 유대), 그리고 문화적 특성과 직접적으로 연결되지 않는 보편적 청소년 주제로 나누어 살펴보았습니다.
흥미로웠던 점은 한 개인이 하나의 범주에만 머무르지 않았다는 건데요. 동일한 샘플 안에서도 동화 전략과 초국적 유대가 함께 나타나거나, 타자화 경험과 학업 고민이 동시에 등장하는 등 여러 분류가 교차하는 복합적인 모습이 확인되었습니다. 한편 모든 사례가 이렇게 깔끔하게 이론에 들어맞았던 건 아니었습니다. 채택되지 못한 Person 1, 2, 12의 경우에는 “아 그래… 네.”, “(잠시 침묵)”처럼 맥락이 드러나지 않는 단답형 응답이 대부분이었고, 세 스크립트 모두 발화의 70~80%를 면접관이 차지하는 ‘면접관 주도형 대화’ 구조를 보였는데요. 질문자가 상황을 설명하고 해석까지 제시한 뒤 학생은 짧게 호응하는 방식이 반복되면서, 청소년 본인의 자발적인 서사나 감정 표현을 충분히 추출하기 어려웠습니다.
이처럼 인터뷰 맥락과 발화 분위기까지는 수치화하기 어렵다는 점 역시 이번 분석의 한계로 남습니다.. 그럼에도 불구하고 기존의 전통적인 질적 방법과 달리 머신러닝 기반 토픽 모델링을 적용해 보니, 기대했던 것보다 질적 데이터에서도 주제 군집이 효과적으로 도출되었고, 방대한 인터뷰 내용을 일일이 설명하지 않고도 일부 문장 및 키워드 제시를 통해 전반적인 경향을 전달할 수 있었다는 점에서 나름 의미 있는 시도였던 것 같습니다 처음 해본 분석인 만큼 가볍게 읽어주시면 감사하겠습니다!
이상 KOSSDA 서포터즈 DataBee🐝였습니다.
📍 분석자료: 김기현. 국제결혼가정 청소년의 민족정체성에 관한 인터뷰 조사, 2012 [데이터 세트]. 한국사회과학자료원 (KOSSDA) [자료제공기관], 2021-08-09,https://doi.org/10.22687/KOSSDA-B3-2012-0004-V1.0
🔗 데이터로 읽는 국제결혼가정 청소년의 민족정체성, 1편
🔗 데이터로 읽는 국제결혼가정 청소년의 민족정체성,부록(Appendix) “그래서 이 지표들, 정말 괜찮은 걸까?”질문과 답