### 네이버에서 지역별 인구정보 크롤링
### 네이버에서 지역별 인구정보 크롤링
### 네이버에서 지역별 인구정보 크롤링

import requests
from bs4 import BeautifulSoup

def get_html(url):
    ## 브라우저 호환을 위해서 설정
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '+ \
        '(KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36'
                } 
    ##해당 url에 htlm(정보) 요청에사용 / url은 사용자가 원하는 url
    r = requests.get(url, headers=headers) 
    ## 해당 url의 html을 사용자가 활용하기 쉽게 변환
    html = BeautifulSoup(r.content, 'html.parser')
    ## 결과값 전달
    return html

def get_population_info(city_name):
    #try:
        url = 'https://search.naver.com/search.naver?where=nexearch&sm=top_hty&fbm=1&ie=utf8&query=' + city_name + '인구'
        html = get_html(url)
        ## 도시별 html출력 예외케이스를 방지하기위해 공백제거
        html = str(html).replace(' ','')
        
        print(html)
    

get_population_info('서울시')

### 네이버에서 지역별 인구정보 크롤링
### 네이버에서 지역별 인구정보 크롤링
### 네이버에서 지역별 인구정보 크롤링

import requests
from bs4 import BeautifulSoup

def get_html(url):
    ## 브라우저 호환을 위해서 설정
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '+ \
        '(KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36'
                } 
    ##해당 url에 htlm(정보) 요청에사용 / url은 사용자가 원하는 url
    r = requests.get(url, headers=headers) 
    ## 해당 url의 html을 사용자가 활용하기 쉽게 변환
    html = BeautifulSoup(r.content, 'html.parser')
    ## 결과값 전달
    return html

def get_population_info(city_name):
    #try:
        url = 'https://search.naver.com/search.naver?where=nexearch&sm=top_hty&fbm=1&ie=utf8&query=' + city_name + '인구'
        html = get_html(url)
        ## 도시별 html출력 예외케이스를 방지하기위해 공백제거
        html = str(html).replace(' ','')
        
        ## 인구정보 시작 point
        data_text = ',{"billboard":{"data":{"type":Chart.type.line(),columns:[["data1",'
        ## 인구정보 끝 point
        data_end_text = ']],"colors":{"data1":'

        ## 인구정보 시작 point 찾기
        p_data =str(html).find(data_text,0)
        ## 인구정보 끝 point 찾기
        p_data_end = str(html)[p_data:].find(data_end_text,0)
        ## 최종 인구정보 크롤링
        data = str(html)[p_data + len(data_text):p_data + p_data_end]
        ## text가공하여 list형태로 변형
        l_data = [float(i) for i in str(html)[p_data + len(data_text):p_data + p_data_end].split(',')]
        return l_data

print(get_population_info('서울시'))

[1019.5, 1014.4, 1010.3, 1002.2, 993.1, 985.7, 976.6, 972.9, 966.8, 950.9]

[python-파이썬] 20 한경컨센서스에서 증권사 애널리포트 크롤링 (crawling) (0)	2022.04.23
[python-파이썬] 9 네이버에서 블로그 정보 크롤링 (crawling) - 2탄 (0)	2022.04.23
[python-파이썬] 10 유튜브에서 동영상 정보 크롤링 (crawling) - 1탄 (0)	2022.04.21
[python-파이썬] 8 네이버에서 블로그 정보 크롤링 (crawling) - 1탄 (0)	2022.04.21
[python-파이썬] 7 네이버에서 종목뉴스 크롤링 (crawling) - 2탄 (1)	2022.04.21

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

모두의 실험실

[python-파이썬] 14 네이버에서 지역별 인구정보 크롤링 (crawling) - 1탄

'파이썬 > 크롤링' 카테고리의 다른 글

'파이썬/크롤링'의 다른글

티스토리툴바

[python-파이썬] 14 네이버에서 지역별 인구정보 크롤링 (crawling) - 1탄

'파이썬 > 크롤링' 카테고리의 다른 글

'파이썬/크롤링'의 다른글

관련글

티스토리툴바