티스토리 뷰

올해부터는 해외금융계좌 신고에 가상자산을 포함해서 신고해야 했다. 대상은 해외의 모든 계좌 합이 2022년 연중 한순간이라도 5억이 넘은 개인/법인이었다. 그리고 오늘 그 수집자료에 대한 통계가 보도자료로 나왔다.

 

국세청 "해외 암호화폐 신고액 131조원" - 코인데스크코리아

올해 해외 금융계좌 신고 대상에 처음으로 포함된 암호화폐(가상자산) 신고액이 131조원에 달하는 것으로 확인됐다.20일 국세청이 발표한 ‘2023년 해외 금융계좌 신고 실적’에 따르면 올해 해외

www.coindeskkorea.com

기사를 봐서는 정확한 내용이 이해가 가지 않아, 국세청의 원본 자료도 함께 찾아봤다.

 

국세청

국세청

www.nts.go.kr

 

그런데 국세청의 자료를 보아도 쉽게 이해하기 어려웠다. 아마 다른 사람들도 대부분 이해하기가 어려웠을 것 같다. 보통 이런 자료는 글을 세세하게 읽기 보다 차트들을 휙휙 보면서 이해하는데 지금 보니 도표가 좀 엉망이었다. 아니 그냥 엉망이었다.

 

그래서 현재 도표들이 어떤 문제가 있는지 한번 짚어보고, 좀 더 의미전달을 잘 할 수 있는 차트를 만들어보기로 하겠다. (구글 시트를 이용해볼 예정)

 

결과 개요

[해외금융계좌 신고현황 (2011-2023)]

생각의 흐름

  • 이 차트에서는 막대와 점선 두 개의 의미를 지닌 것 같다. 막대의 숫자와 점선그래프의 숫자는 무엇을 의미하는 것일까? 자세히보니 사람모양과 돈모양 같은 것이 있는데… 단위를 찾아보니 [명],[조원]이다. 그러니까 2023년에는 5.4천명이 186조원을 신고했다는 이야기군. 물론 올해부터 해외에 예치한 가상자산을 의무적으로 신고해야 했어서 상승분은 그 영향이 컸겠네. 근데 전반적으로 그림이 조잡하다. 색깔도 많고. 막대 색깔도 그라데이션 파랑은 무슨 의미인거지?

 

개선안

  • 제목을 ~ 연간 추이로 변경. 연도는 내용에 있으므로 제목에서 제외하였다.
  • 색상은 엑셀 기본 색상이지만 올해를 강조하고 싶어하는 듯 보여서 2023년에 포인트를 주었다
  • 기존 차트처럼 각 년도별 숫자를 추가하였다. 막대의 숫자는 윗쪽에, 선의 숫자는 아랫쪽에 배치하여 숫자가 겹치지 않게 하였다.
  • 우측 눈금의 경우 기본 스케일을 사용하면 선 차트가 최소~최대값에 꽉 차서 조금 안이쁘다. 선 차트는 보조 개념이니 선을 좀 낮게 배치하도록 하였다.
  • 범례는 아랫쪽 또는 오른쪽이 적절해보인다. 이번엔 아랫쪽으로 배치. 또 시리즈와 단위를 구분하여 함께 표기한다.

 

내용을 바꿔도 된다면, 아래처럼 막대를 금액, 선을 인원으로 하는게 좋았을 것 같다. 이 내용에선 인원보다 금액이 중요한게 아닐까? 아울러 추이도 최근 5년정도면 충분할 것 같다.

 

[최근 5년간 개인신고자 / 법인신고자 추이]

생각의 흐름

  • 역시 마찬가지다. 저 애매한 3D는 눈금 보기에 혼란스러울 뿐 이득이 없어 보인다.

개선안

  • 위 4개는 아래 2개의 도표로 요약 가능

  • 내용상 이전 차트에서 개인신고자/법인신고자만 분리된 형태이다. 그러니 이전 형태와 비슷하게 단순화 시키는 것이 이해하기 쉽다. 전년도와 차이 수치(%)를 추가로 표시해서 강조하고 싶으나 현재 엑셀 기능으로는 안되니 생략.

 

신고자산별 분석

[’23년 신고자산별 신고현황] - (1)

생각의 흐름

  • 인원이 총 5,419명 있는데, 이들 중 가장 많은 42.6%는 예적금을 소유했고, 23%는 주식을 소유했다. 가상자산은 그보다 적은 20.7%이네. 해외에 가상자산을 보유한 인원은 5,419명*0.207 = 1,122명정도 되겠네.
  • 하지만 개인/법인이 여러 상품을 신고할 수 있지 않나? 예적금과 주식과 가상자산을 동시에 보유할 수 있다는 것이다.
  • 맞네… 인원별현황 이거는 완전히 틀렸다. 이 데이터의 소스는 다음과 같다.

  • 실제 5,419명 중 가상자산을 소유한 신고자는 개인/법인을 합쳐서 1,432명으로 가상자산을 소유한 비율은 1,432/5,419 = 29.3%이다. 왜 잘못된 계산식이 나왔을까? 아마 전체 모수를 각 자산 수의 합으로 두고 비율을 구했기 때문이다.

  • 신고자산을 중복 선택할 수 있으므로, 각각에 대해 전체인원대비비율을 구해야 올바르다. 이때 비율의 합계가 100%가 나오지 않는 것은 당연하다. 비율의 합계라는 자체가 의미가 없다.

 

개선안

  • 여기의 백분율은 총합이 100%이 아닌, 개별 자산에 대한 비율이기에 파이차트를 사용해서는 안된다. 다음과 같은 차트가 더 적절하다.

  • 각각의 자산별 비율이기에 하나의 막대는 100%를 의미하며, 자산별로 보유하는 비율이 다르다.
  • 예적금은 5,419명중 54.3%이 보유하고 있고, 가상자산은 5,419명중 26.4%가 보유하고 있다.
  • 보유비율이 높은 자산부터 배열하였고, 기타는 보유비율이 높지만 기타이기 때문에 맨 우측에 배치하였다. 또한 100%에 대한 비율임을 강조하기 위해서 회색 배경을 (가라로) 집어넣었다.

 

[’23년 신고자산별 신고현황] - (2)

생각의 흐름

  • 금액의 경우는 상관이 없다. 각각의 자산은 중복 선택이 가능하지만 자산별 금액은 통합을 할 수 있다. 즉, 전체 금액은 모든 개별 자산의 합이 될 수 있다. 그래서 파이차트가 가능하며, 비율을 표기하기에도 적절하다.

  • 다만 파이차트이므로 이전의 신고자산별 보유 비중(막대그래프)과 함께 표현하기엔 좋지 않아 보인다.
  • 근데 위 이미지에 비트코인 심볼을 거꾸로 표시해놓은 것은 나름 킹받는다. 타로카드도 뒤집으면 뜻이 반대가 된다구. 참고로 비트코인 공식 심볼은 아래와 같다. (B가 14도 각도로 기울어져 있어야 한다.)

 

[’23년 신고자산별 신고현황] - (3)

생각의 흐름

  • 이건 또 뭘까. 이해하려고 노력해보자. 두 개의 차트가 있는데 둘의 차이는 신고인원과 신고비중이다. 각각의 차트에는 두 개의 막대가 있는데 개인과 법인이다. 마찬가지로 비율(%)과 수량(명/금액)을 동시에 갖고있다.

 

개선안

  • 한번에 쉽게 이해하기도 어렵지만 어렵게 이해하고 나서도 굳이 바꾸고 싶지 않았다. 크게 중요하지 않아보이는 내용이기 때문이다. 걍 포기

 

국가별 분포 분석

(참고로 가상자산은 국가별 분포 분석에 포함되지 않는다.)

[신고자산 보유 상위 5개국 신고금액]

생각의 흐름

  • 여긴 차트의 종류를 살펴봐야 하지만, 다른 부분에서 신경쓰이는 부분이 있다.
  • 먼저 국기 아이콘. 원형 아이콘으로 국가를 한번에 시인하도록 의도했지만, 아이콘 자체가 너무 어색해보인다. 특히 저 일본과 홍콩 국기 비율이 홀쭉해진거… 너무 싫다.
  • 대강 구글에 검색해봐도 많이 나오는데, 어디서 저런걸 구했을까. 아니면 직접 압축한걸까? 일반적인 국기의 비율(3:2)을 1:1로 압축하면 저정도 모양이 나올 것 같다.
  • 라이센스는 둘째치고 좀 좋은거 구하면 안됐나... 그리고 홍콩은 중국된지 좀 된거 같은데??

  • 또 한가지는 비율이다. 개인신고자의 경우 61.1%가 미국으로 2위인 싱가포르보다 8배정도는 크게 차이나지만 그림상으로는 2~3배 밖에 차이가 나지 않는다. 그럴듯한 그림을 위해 정확한 정보를 포기하는 격. 그냥 엑셀에 있는 차트 쓰면 좋겠음

 

[신고자산별 보유 상위 5개국의 신고금액 비율]

생각의 흐름

  • 이것 역시 모호한 부분이 있다. 파이차트가 여러개면 다른 차트와 비교할 수가 없다. 또 순위별로 색깔이 맞아 나라별 색깔 또한 맞지 않는다. (파생상품은 1위가 영국)

 

개선안

  • 대강 이런 느낌? 이건 잘 모르겠다. (참고로 아래 여러 나라는 이미 [기타]로 변한 상황이라 데이터가 없음...)

 

연령대별 분석

[연령대별 해외금융계좌 보유 분포도]

생각의 흐름

  • 대상자 중 30대 전체의 29.9%는 해외금융계좌를 보유하고 있구나. 30대 전체의 해외금융계좌 자산 합은 7.3조정도 되는구나.
  • 하지만 실제로는…

  • 대상자 중 30대 전체(768명)는 전체인원(4,565명) 중 16.8%에 해당하며, 이들이 가진 자산은 7.3조로 모든 연령대의 전체 자산(24.2조) 중 29.9%를 차지하고 있다.

 

개선안

  • 혼동된 이유는 연령별 전체 비율의 합이 100%인것을 각각의 연령별로 막대그래프를 그렸기 때문이다. 또한 신고인원인지 신고자산인지 역시 불분명하다. 위 그래프는 차라리 다음의 파이차트가 나아 보인다.

  • 결과적으로 30대의 경우 신고인원은 적지만 신고금액은 많다. 사람들이 궁금해 하는 것은 이런 부분 아닐까? 차라리 다음과 같은 차트로 표현하면 어땠을까 싶다.

  • 각 연령단위를 막대차트로 표현했다. 이때는 비율보다 실제 신고인원이 좋다는 생각이다. 또한 인당 평균 신고금액을 함께 표혔했다. 즉 2030은 인원이 적음에도 인당 평균 신고금액은 40대 이상보다 2배 이상 높음을 한번에 파악할 수 있다.

 

그 외

아쉬운 부분 중 하나가 분포에 대한 차트가 빠져서다. 분포도가 고르지 않은 데이터를 평균으로 가늠하기는 힘들다.

  • 가상자산의 경우 개인/법인 신고자 총 1,432명이 130.8조원을 신고했다. 이는 전체 신고금액(186.4조원)의 70%를 차지한다.
    → 와… 신고자별로 평균 9,134억 신고했네
  • 그런데 1,432명중 73개는 법인이고 이들의 금액이 120.4조원이야. 개인은 1,359명이 10.4조원 신고했어
    → 와… 개인 신고자 1인당 평균 76억씩 신고했네
  • 1,359명 중 30대는 546명인데, 이들이 6.759조를 신고했어. 30대가 평균이 가장 높은데 30대 1인당 123.8억씩 신고했어
    → 와… 개인 평균 76억, 30대 평균 123억... 나는 짜쳐있어야 겠다.

 

흔히 말해서 평균의 함정에 빠지는 경우인데, 보유 자산같은 데이터는 편차가 크다. 그래서 다른 다양한 데이터를 함께 보는데, 이 보도자료에선 평균을 깰 좋은 데이터가 있음에도 차트로 표현하지 않았다.

 

다음의 10분위 도표이다.

개인 신고자 전체 인원을 10개의 집합으로 나누어 각 집합별 수치(여기선 모든 해외금융자산 금액의 합)를 구한 데이터이다. 분위수가 많으면 더 상세해지는데, 익명성을 위해 10분위정도로 나눈 것 같다. 여기서 예상할 수 있는 데이터는…

  • 최하집단인 10분위(90~100%)의 경우 최소값은 5억 (또는 드물게 5억 미만; 5억 이상 신고이지만 5억 미만 신고도 제재하지는 않았으므로), 최대값은 6.4억이다. (9분위가 정말 고르게 되어 있어 모든 값이 6.4억일때)
  • 절반(하위 50%)은 14억 미만의 금액을 신고했고
  • 하위 80%~하위 50%는 40억 미만~14억 이상의 금액을 신고했다
  • 이는 파레토 차트로 나타내면 더 보기가 쉽다 : 상위 20% 금액의 합이 81.6%이다. 상위 20%가 전체 수량의 80%을 차지한다는 파레토의 법칙이 거의 맞는다. 파레토는 미친놈이다.

 

결론

  • 보고서 차트가 엉망이었다. 아마 담당자가 바빴겠지
  • 평균 깎는거 아니니까 평균 안된다고 좌절하진 말자
  • 해외금융계좌 5억 이상 신고자들 가운데도 빈익빈부익부는 존재한다.
  • 하지만 해외금융신고자는 아마 국내 코인 자산의 80%를 소유한 20%일것 같은데...

 

 

댓글
최근에 올라온 글
Total
Today
Yesterday