[Interview]자료를 알리고 쓰임을 기록하는 사람, 한아름 연구원

자료를 알리고 쓰임을 기록하는 사람, 자료이용 문헌 수집 및 구축과 DB 보급 업무를 담당하는 한아름 연구원을 인터뷰로 만나보세요. 

데이터 생애주기의 2막-공유 단계에서 데이터 활용의 흔적을 수집하고 다시 연구자들에게 전하는 자료이용 문헌 업무의 의미와 현황, 더 나은 데이터 공유를 위한 노력과 앞으로의 계획을 생생하게 담았습니다.  

d6c81ee52cc79.png



Q1. KOSSDA와 어떻게 처음 인연을 맺게 되셨는지, 또 현재 어떤 업무를 담당하고 계신지 소개 부탁 드립니다.


저는 사직동 한국사회과학자료원 시절부터 KOSSDA와 인연을 맺기 시작했습니다. 약 17년 전부터인데, 이렇게 오래되었네요.

현재 아카이빙사업부에서 자료이용문헌 수집 및 구축과 DB 보급 업무를 담당하고 있습니다. 데이터 생애 주기는 6단계의 순환 구조로 이루어져 있는데, 저는 주로 2막 공유 단계(보존, 공개 및 공유, 재활용)에 관련된 업무를 수행합니다.

KOSSDA는 데이터 공유를 활성화하기 위해 데이터를 재이용이 가능한 형태, 즉 데이터 세트로 제공하는데, 이 데이터 세트에는 메타데이터, 데이터 파일, 관련 파일, 자료이용문헌, 변수 DB까지 한 세트로 제공하고 있습니다. 

저는 이 중에서 자료이용문헌 파트를 주로 담당하고 있습니다.



Q2. 자료이용문헌을 수집할 때 가장 어려웠던 경험이나, 반대로 '아, 이렇게 활용되고 있구나!'라고 느꼈던 사례가 있으신가요?


저는 이용문헌 수집을 드넓은 갯벌에서 조개 찾기에 비유하는데, 실제로 이용문헌에 조사명이 잘못 쓰거나 정확한 영문 조사명이 확립되지 않아서 수집에 어려움이 있는 경우가 있습니다.  큰 자료들(예: 한국노동패널조사)은 이미 많이 알려져 있기 때문에 자료이용문헌을 수집하기가 상대적으로 수월합니다. 하지만 지역 연구원의 자료들은 이용문헌 수집 자체가 정말 어려워요. 그렇지만 오히려 더 의미가 있다고 생각합니다. 지역 연구원의 자료들은 그 지역에 밀착한 연구들이 많기 때문에 그 지역의 상황을 잘 드러내 줍니다. 그런 자료들의 이용문헌을 찾으면 정말 보람 있어요. 요즘에는 서울시여성가족재단의 이용문헌을 수집하고 있는데 아무래도 서울 시민의 삶과 맞닿은 자료들이 많기 때문에 이용문헌이 생각보다 잘 수집되고 있어서 나름 보람을 느끼고 있습니다.



Q3. 현재 자료이용문헌 수집 현황은 어떤가요?


자료이용문헌 수집은 연간 약 천 건을 목표로 하고 있는데, 크게 무리 없이 달성될 것으로 예상됩니다. 수집은 크게 3가지 경로로 이루어집니다. 첫 번째, KOSSDA 자료공유협약기관 주요자료의 이용문헌입니다. 한국종합사회조사, 통일의식조사, 한국노동패널조사 등의 약 50여 개 자료에서 정기적으로 이용문헌을 수집하고 있습니다.

두 번째, 자료공유협약기관의 주요 자료 외 자료들에 대한 이용문헌 수집입니다. 시리즈가 아닌 단년도 연구를 통해 수집되는 자료들이 많으며, 주로 이런 자료들의 이용문헌을 수집합니다. 마지막으로 지역연구원 및 국가인권위원회 자료의 이용문헌을 수집합니다.



Q4. 앞으로 이용문헌을 더 활성화하기 위해 어떤 노력을 하고 있거나 계획하고 계신가요? 


활성화를 위한 3가지 전략으로는 다음을 고려하고 있습니다. 

첫째, 자료이용 결과 보고 캠페인입니다. 이용자들의 자발적인 보고로도 이용문헌이 수집되도록 하고 있으며, 이 부분을 더 확대하려합니다. 자료이용 결과 보고 소개 및 안내를 위해 대량 메일 발송을 1년에 한 번씩 정기적으로 진행하고 있습니다.


b5d222c976b46.png

이미지1. '자료 이용 결과보고 안내(2024년)' 캠페인 이미지



둘째, KOSSDA 자료인용서식 홍보입니다. 메타데이터 중간 부분에 ‘자료인용서식'이 위치해 있는데, 많은 분들이 이 서식의 존재를 잘 모르고 계세요. 이 서식에 대한 홍보를 더 진행하려고 하고 있습니다. 

셋째, 이용문헌 수집처 다각화입니다. 현재 이용문헌의 주요 수집처는 KCI, RISS, SCOPUS 등인데 이를 더 확대하고 다각화하는 노력을 펼칠 계획입니다. 본래 조사자료를 제공하는 기관의 ‘자료이용활용목록’을 활용하여 부족한 부분을 보완하려 하고 있으며 현재까지 축적되어 있는 이용문헌 DB를 활용한 시각화 방안도 생각하고 있습니다. 

df37a8cfdeb1c.png

이미지2. 'KOSSDA 데이터 인용 안내'와 '자료 이용 결과보고 안내(2025년)' 캠페인 이미지



Q5. 생성형 AI의 등장이 연구원님의 주 업무인 '문헌 수집'과 'DB 보급' 영역에 어떤 변화를 가져올 것이라 예상하시나요? 


AI는 두렵기도 하지만 거스를 수 없는 대세인 것 같습니다. 잘만 쓰면 업무에 정말 많은 도움이 될 것 같습니다.

현재 저는 AI를 업무에 직접적으로 쓰고 있지는 않습니다. 대신 NetMiner Biblio Data Collector 같은 수집 도구를 이용해서 KCI에 있는 이용문헌들을 수집하고 있습니다. 지난 여름에는 업무에 도움이 될 것 같아서 KOSSDA 방법론 교육에서 '생성형 AI에 의한 코드 만들기로 텍스트 분석하기' 과목을 들었어요. 핵심은 코드를 몰라도 생성형 AI를 이용해서 코드를 만들 수 있다는 점입니다. 그 강의에서는 유튜브 API 키를 이용해서 댓글들을 수집하는 방식을 배웠는데, 직접 해보니까 한 번 들어서는 어렵더라고요. 익숙하지 않아서인지 어느 정도는 적용할 수 있을 것 같은데 아직은 업무에 적용하지는 못하고 있습니다.

이용문헌을 수집하는 것에 있어 가장 중요한 문제는 정확도입니다. 내가 원하는 대로 얼마나 정확하게 수집하는지가 관건이라고 생각합니다.

예를 들어, KOSSDA 이용문헌 수집은 기본적으로 데이터를 2차 분석한 연구 결과물을 대상으로 합니다. 학술 논문, 학위 논문, 보고서, 학술 발표 같은 것들이죠. 단순 자료 비교나 문항만 차용하는 것, 데이터의 단순 빈도 분석만 하는 경우는 이용문헌으로 수집하지 않아요. 수집처에 검색어를 던져서 이용문헌을 수집하면 이 기준을 충족하지 않는 많은 자료들도 함께 수집되어요. 그래서 제가 이용문헌을 일일이 보면서 수동으로 걸러내야 하는데, 이런 과정이 꼭 필요합니다.

결론적으로 사람의 손이 여전히 필요합니다. 아무리 AI로 정교하게 수집한다 해도 그런 검토 과정은 꼭 필요해요. 사람의 손길이 한 번은 거쳐야 한다고 생각합니다. 그래도 예전에는 더 노동 집약적으로 수집했는데, 이제는 수집기를 이용해 반자동적으로 수집을 하고 있습니다.

또 다른 과제는 API의 문제입니다. 이용문헌 수집 시 KCI, RISS, SCOPUS 같은 학술 DB로부터 API를 통해 서지정보를 끌어와야 합니다. 이 기관들이 공개한 API를 이용하는 것인데, KCI, RISS, SCOPUS의 API 키 값을 우리가 알고 있어야 해요. 이런 것들을 바탕으로 웹사이트 개발을 하는 일련의 복잡한 작업이 필요합니다. 그래서 이용문헌 수집처 하나 늘리는데도 어려움이 많습니다.

다만, AI가 새로운 역할로서 보조자 역할은 충분히 할 수 있고, 이를 활용하면 좀 더 넓게 이용문헌을 수집할 수 있을 것 같습니다. 계속 AI로 할 수 있는 것들을 탐색하면서, 관련 강의도 들으면서 이용문헌 수집에 어떻게 기여할 수 있을지 생각해보려고 합니다.



Q6. 이용자 반응과 개선 노력에 대해 질문 드리겠습니다. DB 구축 후 이용자의 반응은 어떻게 파악하고 계신가요? 


DB를 구축한 후에 자료 다운로드 현황, 관련 파일 다운로드 현황, 조회 수 등을 한 달에 한 번씩 살펴보고 있어요. 웹사이트 정기 점검 시 이런 통계 수치들을 시스템에서 추출해서 보고 있으며, Google Analytics를 통해 월별 방문자 추이 등도 모니터링하고 월별로 보고하고 있습니다.



Q7. 현장에서 가장 빈번하게 접하는 이용자들의 요구사항이나 컴플레인은 무엇인가요? 


2023년에 '연구 데이터 재이용 관행 인터뷰 조사'를 진행한 적이 있었는데, 그 결과가 저에게는 다소 충격적이었습니다.

첫 번째는 낮은 인지도입니다. KOSSDA는 주로 방법론 수업을 통해 알고 있었고, KOSSDA가 데이터 아카이브이며 데이터 검색 사이트라는 것을 인지하지 못하는 경우도 있었어요. 심지어 KOSSDA가 데이터 아카이브 기관이라는 것 자체를 모르시는 분들도 계셨습니다.

두 번째로는 기능의 존재를 모른다는 문제였습니다. KOSSDA를 알고 있더라도 변수 DB나 이용문헌 DB를 인지하지 못했고, 인지하고 있더라도 활용해본 경험이 거의 없었어요. 웹사이트에서 변수 DB나 이용문헌 DB를 찾지 못하는 분들이 대부분이었습니다.

세 번째는 사용 방법을 모른다는 문제입니다. KOSSDA가 이용문헌 DB도 있고 변수 DB도 있고 자료공유기관 DB가 있다고 하더라도, 활용해본 적이 없다는 분들이 거의 대부분이었어요.

전문가 자문회의에서도 비슷한 의견이 나왔습니다. KOSSDA 웹사이트 서비스의 불친절함에 대한 지적이 대부분이었어요. KOSSDA 웹사이트나 자료 설명이 초보 연구자나 대학생들에게 어렵고 불편하게 느껴진다는 점이 강조되었습니다. 특히 특정 자료가 아니라 막연하게 데이터를 찾는 입장에서는 KOSSDA의 웹사이트가 불친절하고 어렵다는 의견이 많았어요. 이런 점들을 개선하기 위해 노력하고 있습니다.

인지도가 너무 낮다는 걸 깨닫고 어떻게 해야 할까 고민하다가 밖으로 나가서 우리 기관이 어떤 곳인지 알려야겠다는 생각이 들었어요. 그래서 지난 8월, 연세대에서 열린 '전국대학도서관대회'에 KOSSDA DB 보급 및 이용 확산을 위해 전시 부스를 등록해 참가했습니다. KOSSDA DB의 우수성을 알리기 위해 DB 자체를 설명하는 자료를 만들어 우리 DB의 특징과 장점을 소개하는 자리를 가졌습니다.



Q8. 이런 노력의 결과는 어떻게 되었나요?


대학생들과 대학원생들이 그래도 여전히 많이 드나드는 곳이 대학 도서관이었고 그래서 대학 도서관에 DB를 보급하려면 어떻게 해야 할까 고민을 많이 했습니다. 여러 고민 끝에, 전국의 대학도서관에 공문을 발송해서 각 대학 도서관 DB 리스트에 KOSSDA DB를 신규 등록해 달라고 협조를 요청했어요.

놀라운 것은 결과입니다. 대학도서관 공문 발송과 홍보 전에는 약 30개 정도의 도서관이 KOSSDA DB를 구독했는데, 지금은 70개 이상으로 늘어났습니다! 이런 활동들을 하니 홍보도 되고 대학도서관들도 많은 관심을 보여주더라고요. 또한 KOSSDA DB가 무료라는 것을 모르는 대학도서관과 이용자들이 많았는데, 홍보를 통해 무료 DB라는 것을 강조하고 있습니다.



Q9. 앞으로의 계획은 어떻게 되시나요?


70개 이상의 대학도서관들과 KOSSDA 회원들을 대상으로 'DB 이용 방법' 특강을 할 계획이에요. KOSSDA DB에 대해 너무 모르시는 분들이 많기 때문에 정말 기초부터 설명하는 특강을 진행할 예정입니다. 변수 DB나 이용문헌 DB 이용 방법을 쉽게 설명하고, 변수 DB나 이용문헌 등이 어디에 위치하는지까지 설명하는 정말 기초부터 시작할 예정입니다.

장기적으로는 웹사이트 개편이 진행될 예정입니다. 현재 웹사이트는 검색이나 UX/UI 면에서 아쉬운 부분들이 많기 때문에, 전체적으로 개편하는 작업을 계획 중입니다.



Q10. KOSSDA DB를 보다 잘 활용하는 방법은 무엇일까요?


KOSSDA DB의 가장 큰 강점은 변수 DB, 이용문헌 DB, 자료공유기관 DB라고 생각해요. 우리 웹사이트에 이 기능들이 있기는 한데 잘 알려지지 않았습니다.

변수 DB는 조사자료를 변수 수준에서 검색해서 원하는 자료를 보다 쉽고 효율적으로 찾을 수 있게 해줍니다. 이용문헌 DB는 현재까지 어떤 연구가 진행되었는지 알 수 있도록 해주고, 해당 논문을 따라가면서 어떤 방법론이 사용되었는지도 알 수 있어요.

KOSSDA의 데이터를 정말 잘 활용했으면 좋겠습니다. 메타데이터를 읽어보고, 아래에 있는 탭에서 상세 메타와 관련 파일도 보고, 이용문헌도 보고, 변수가 있으면 클릭해서 보면서 200% 활용해주셨으면 좋겠습니다.

물론 자료만 다운로드받아서 나가시는 분들도 있을 텐데, 그런 분들은 KOSSDA에서 어떤 자료가 있는지, 자신이 어떤 데이터를 필요로 하는지 정확하게 아시는 분들일 것 같아요. 하지만 학부생 분들, 처음 KOSSDA를 이용하시는 분들은 우리가 제공하는 모든 자료를 꼼꼼하게 활용했으면 좋겠어요. 그러기 위해서는 저희가 어떻게 이 부분을 이용할 수 있는지를 더 잘 설명해드려야겠죠.



Q11. KOSSDA 자료를 이용하는 연구자들에게 한 가지 꼭 당부하고 싶으신 점이 있으신가요?


최근에 KOSSDA를 외부에 홍보하면서 많은 고민을 했는데, KOSSDA DB가 얼마나 좋은지, 이것을 어떻게 설명할지가 과제였어요. 이 부분이 생각보다 정말 어렵더라고요.

KOSSDA는 현재 국내에서 양적 자료와 질적 자료를 동시에 서비스하는 유일한 기관입니다. 그리고 무엇보다 무료로 DB를 제공하고 있다는 것이 정말 큰 강점입니다. 현재 3,600개 이상의 모든 자료를 자료 유형별로 전문 인력이 가공 처리하여 품질이 보장된 데이터를 제공하고 있습니다.

이런 DB를 무료로 품질도 보장되고, 질적 자료까지 이용할 수 있으니 자료들을 더 많이 이용해주셨으면 좋겠습니다. 더불어 KOSSDA 자료를 이용해서 논문이나 보고서, 단행본 같은 연구 결과물을 낼 때, KOSSDA '자료인용서식'을 이용해서 참고문헌에 데이터 인용을 꼭 해주시길 부탁드립니다.




3bdf7a1fc229d.pngdafb45cd3789e.png

eff984dcea741.png

198ca7e3a96a6.png