파이썬/크롤링

[python-파이썬] 15 네이버에서 지역별 인구정보 크롤링 (crawling) - 2탄

모두의 실험실 2022. 5. 5. 09:34
728x90

안녕하세요. 모두의 파이썬입니다. 1탄에서는 연도별 서울시인구수를 크롤링하여 얻었습니다. 앞으로 크롤링 계속 하면서 '이제 정보를 얻는것은 쉽게 할수 있다. 그럼 이 정보를 어떻게 하면 더 가치있게 만들까?' 를 더 생각하고 고민하게 될 것입니다. 분명한것은 모든 정답은 본인에게 있고, 포기만 없다면 정답을 찾을 수 있다고 믿습니다. 2탄에서는 크롤링한 연도별 인구 정보로 앞으로 내년 후내년에 얼마나 증가하고 감소할지 리니어 리그레션(선형회기-linear regression) 방법을 활용하여 값을 얻어 보겠습니다. 그리고 국내 특별시-광역시에서 부터 시군도 까지 연도별인구수와 증가율, 그리고 증가수을 구하겠습니다

 

전체 글을 요약하면, 국내 전채 시군도 연도별 인구수를 활용하여 평균연도별 증가율(감소율)과 증가수(감소수)를 구한다

 

1탄에서 활용한 서울시 연도별 인구수는 오래된 순서대로 [1019.5, 1014.4, 1010.3, 1002.2, 993.1, 985.7, 976.6, 972.9, 966.8, 950.9인구의 변화율을 확인하는 방법은 여러가지가 있지만, 선형회기방식을 사용하겠습니다. 중학수학에서 접할 수 있는 1차함수그래프(1차 방정식)로 이해하면 쉽습니다. 모르는게 잘못이 아닙니다. 알면됩니다. 구글로 검색은 모든걸 알려줍니다. 포기말고 끝까지 해보겠습니다. 1차함수 그래프는 y = mx + b 입니다. 여기서 우리는 y값만 알고 있습니다. 그리고 x는 연도별이며, 편의상 y의 갯수에 맞추어 x값은 [0,1,23,4,5,6,7,8,9]로 하겠습니다. m과 b를 구해야 합니다. m은 최소제곱법을 사용하겠습니다. 분자는 (각x-x평균)*(각y-y평균)의 총합이며, 분모는 (각x-x평균)의제곱의 총합입니다. 그리고 b = y평균 - m*x평균입니다. 이로서 모든것을 구하였습니다. 다소 복잡할 수도 있습니다. 하지만 한번 이해하면, 주식 코인 부동산 및 다향한 분야에서도 활용이 가능하니 포기말고 꾸준히 실천하길 바랍니다. 

y = mx + b라는 식의 단위는 무엇일까요? '만명' 입니다. 위에 연도별 인구수에서 단위가 생략되었습니다. m은 평균 인구증가율입니다. 서울시의 최근10년간 인구수 기반 m값은 -7.4만명이며, 이는 연도별 -7.4만명 감소를 뜻합니다. 최근10년간 평균인구수는 989만명이며, 연도별 -7.4만명 감소하고 있으니 연도별 인구변화율은 100*(-7.4/989) = -7.5가 나오며 단위는 '%'입니다. 정리하면, 연간 7.4%감소하고 있습니다. 모두의 파이썬의 사견을 첨부하면, 완성형 도시 서울에서 인구가 빠져나가 경기도로 유입이 되고 있으니, 정책적 균형발전의 의미에서 긍정적이라 볼수 있으며, 그럼 경기도 인구가 증가로 예상되니, 어떤선택을 해야할지는 각자의 판단에 맡겨보겠습니다. 

ⓒ서울시 연도별 인구, 출처 네이버검색

print('모두의 파이썬') 입니다.

※좋아요/댓글은 서로를 응원합니다!

728x90
반응형