#네이버에서 종목뉴스 크롤링 (crawling)
## datetime은 날짜 시간을 다루는 package
from datetime import datetime, timedelta
## strftime을 사용하여 string형태로 변환
now_time = datetime.now().strftime('%Y.%m.%d.%H.%M') 
##timedelta사용하여 해당 시간단위를 이동, 아래예제는 3일을 이동
start_time = (datetime.now()-timedelta(hours=3)).strftime('%Y.%m.%d.%H.%M') 
print(start_time)
print(now_time)

2022.04.22.04.20
2022.04.22.07.20

#네이버에서 종목뉴스 크롤링 (crawling)
from datetime import datetime, timedelta 
## datetime은 날짜 시간을 다루는 package
## strftime을 사용하여 string형태로 변환
now_time = datetime.now().strftime('%Y.%m.%d.%H.%M') 
##timedelta사용하여 해당 시간단위를 이동, 아래예제는 3일을 이동
start_time = (datetime.now()-timedelta(hours=3)).strftime('%Y.%m.%d.%H.%M') 
#print(start_time)
#print(now_time)
page_num = 1
stock_name = '삼성전자'
url = 'https://search.naver.com/search.naver?where=news&sm=tab_pge&query=' +  stock_name + \
'&sort=1&photo=0&field=0&pd=9&ds=' + start_time +'&de=' + now_time + \
    '&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:dd,p:all,a:all&start=' + \
        str((page_num-1)*10 + 1)
print(url)

https://search.naver.com/search.naver?where=news&sm=tab_pge&query=삼성전자&sort=1&photo=0&field=0&pd=9&ds=2022.04.22.04.25&de=2022.04.22.07.25&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:dd,p:all,a:all&start=1

#네이버에서 종목뉴스 크롤링 (crawling)
## datetime은 날짜 시간을 다루는 package
from datetime import datetime, timedelta
##HTTP를 호출하는 프로그램을 작성할 때 주로 사용한다
import requests
## html의 내용을 사용자가 활용하기 쉽게 하기위해 사용한다
from bs4 import BeautifulSoup 
## strftime을 사용하여 string형태로 변환
now_time = datetime.now().strftime('%Y.%m.%d.%H.%M') 
##timedelta사용하여 해당 시간단위를 이동, 아래예제는 3일을 이동
start_time = (datetime.now()-timedelta(hours=3)).strftime('%Y.%m.%d.%H.%M') 
page_num = 1
stock_name = '삼성전자'

url = 'https://search.naver.com/search.naver?where=news&sm=tab_pge&query=' +  stock_name + \
'&sort=1&photo=0&field=0&pd=9&ds=' + start_time +'&de=' + now_time + \
    '&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:dd,p:all,a:all&start=' + \
        str((page_num-1)*10 + 1)

## 브라우저 호환을 위해서 설정
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '+ \
    '(KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36'
            } 

##해당 url에 htlm(정보) 요청에사용 / url은 사용자가 원하는 url
r = requests.get(url, headers=headers) 
## 해당 url의 html을 사용자가 활용하기 쉽게 변환
html = BeautifulSoup(r.content, 'html.parser')
tmp = []
## try/except 구문을 사용하여 예외처리
try:
    ## page주소 정보를 가지고 있는 'tag'
    tmp = html.find('div',{'class', 'sc_page_inner'}).find_all('a') 
except:
    pass

##저장될 비어있는 주소리스트 선언
l_address = []
##전체 주소리스트를 l_address에 저장
for i in tmp:
    tmp_add = 'https://search.naver.com/search.naver'+i.get('href')
    l_address.append(tmp_add)
    print(tmp_add)

https://search.naver.com/search.naver?where=news&sm=tab_pge&query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&sort=1&photo=0&field=0&pd=9&ds=2022.04.22.17.31&de=2022.04.22.20.31&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:dd,p:all,a:all&start=1
https://search.naver.com/search.naver?where=news&sm=tab_pge&query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&sort=1&photo=0&field=0&pd=9&ds=2022.04.22.17.31&de=2022.04.22.20.31&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:dd,p:all,a:all&start=11
https://search.naver.com/search.naver?where=news&sm=tab_pge&query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&sort=1&photo=0&field=0&pd=9&ds=2022.04.22.17.31&de=2022.04.22.20.31&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:dd,p:all,a:all&start=21
https://search.naver.com/search.naver?where=news&sm=tab_pge&query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&sort=1&photo=0&field=0&pd=9&ds=2022.04.22.17.31&de=2022.04.22.20.31&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:dd,p:all,a:all&start=31
https://search.naver.com/search.naver?where=news&sm=tab_pge&query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&sort=1&photo=0&field=0&pd=9&ds=2022.04.22.17.31&de=2022.04.22.20.31&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:dd,p:all,a:all&start=41
https://search.naver.com/search.naver?where=news&sm=tab_pge&query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90&sort=1&photo=0&field=0&pd=9&ds=2022.04.22.17.31&de=2022.04.22.20.31&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:dd,p:all,a:all&start=51

[python-파이썬] 10 유튜브에서 동영상 정보 크롤링 (crawling) - 1탄 (0)	2022.04.21
[python-파이썬] 8 네이버에서 블로그 정보 크롤링 (crawling) - 1탄 (0)	2022.04.21
[python-파이썬] 7 네이버에서 종목뉴스 크롤링 (crawling) - 2탄 (1)	2022.04.21
[python-파이썬] 5 네이버 증권에서 주식정보 크롤링 (crawling) - 2탄 (0)	2022.04.19
[python-파이썬] 4 네이버 증권에서 주식정보 크롤링 (crawling) - 1탄 (0)	2022.04.18

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

모두의 실험실

[python-파이썬] 6 네이버에서 종목뉴스 크롤링 (crawling) - 1탄

'파이썬 > 크롤링' 카테고리의 다른 글

'파이썬/크롤링'의 다른글

티스토리툴바

[python-파이썬] 6 네이버에서 종목뉴스 크롤링 (crawling) - 1탄

'파이썬 > 크롤링' 카테고리의 다른 글

'파이썬/크롤링'의 다른글

관련글

티스토리툴바