파이썬/크롤링

[python-파이썬] 20 한경컨센서스에서 증권사 애널리포트 크롤링 (crawling)

모두의 실험실 2022. 4. 23. 11:21
728x90

안녕하세요. 모두의 파이썬입니다. 코인 부동산 주식 주식에서도 국내주식 해외주식(미국주식) 이렇게 투자할 종류가 정말 많습니다. 국내주식 관련 투자에대해 알아보겠습니다. '과연 얼마나 잘 기업을 알고 투자를 하고 있는가' 입니다. 국내에 정말 많은 투자자들이 있지만, 묻지마투자 뉴스투자 지인추천등 소중한 손을 쉽게 투자하고 있는 투자자를 보면, 안타까울 때가 있습니다. 그래서 좀더 기업을 알고 투자하는 방법중에 하나가 증권사의 전문 분석가, 'Analyst(애널리스트)' 입니다. 애널리스트는 증권사에 근무하면서, 담당하는 산업군과 기업들이 있습니다. 기업들의 재무재표 기반으로 기업을 분석하고 목표가 예상 매출 영업이익등을 기술해 놓은 것이 애널리포트라고 이해하시면 쉽습니다. 애널리포트가 정답은 아닙니다. 투자자 방향의 보조도구로 입니다. '투자의 모든 선택과 책임은 본인에게 있습니다' 명심하십시오.

 

전체 글을 요약하면, 한경컨센서스에서 증권사 애널리포트를 크롤링합니다

 

검색의 시작은 구글링입니다. 명심하세요. 구글에서 '한경컨센서스'를 검색합니다. 상단에 '한경닷컴 증권 | 주식시세에서 투자방법까지! - 시장지표 - 한국경제' 이렇게 나옵니다. 접속을 하면 '한경증권'으로 이동하고 페이지 중간에 '한경 컨센서스 실행' 이 보입니다. 클릭하면, '한경코리아마켓'으로 이동하고, 하단에 레포트 조회에서 '기업' 클릭하고 날짜등을 설정하면 원하는 리포트를 수동으로 확인 가능합니다. 바로가기 url은 'https://markets.hankyung.com/consensus' 입니다. 

 

크롤링의 시작은 개발자모드(F12 또는 우클릭> 검사)로 접속입니다. 접속완료후 'tag'속성을 확인합니다. 범위가 큰 영역에서 부터 작은영역(반복된 영역)으로 접근하면 속성을 찾기가 쉽습니다. 하지만, 문제에 봉착했습니다. 페이지가 날짜 및 기업 산업 시장 등에 사용자 선택에 의해 동적으로 결과를 보여줍니다. 사용자 선택이 url에 반영이 되어야 원하는 정보를 크롤링하기에 용이한데, 한경컨센서스는 그렇지 않게 반영이 되어있습니다. 하지만, 포기는 없습니다. 개발자모드를 분석해 보겠습니다. 모두의파이썬은 개발자모드에서 'Elements'를 먼저 확인하고, 해결이 원활하지 않으면, 'Network'를 확인합니다. Network에서는 빨간색 버튼이 보입니다 중요한 버튼입니다. 사용자가 페이지 사용하는것을 녹화합니다. 바로 옆에 있는것이 삭제하는 버튼입니다. 먼저 삭제를 하고, 웹페이지로 돌아가서 원하는것을 실행합니다. 모두의파이썬은 기업을 클릭하겠습니다. '개발자모드> Network> Name'를 각각 클릭하며 분석 해 보겠습니다. 클릭을 하면 우측에 'Header'가 활성화 됩니다. 'General'정보에서 'Request URL'을 발견했습니다. 정답으로 추정이 됩니다. url형식이 https://markets.hankyung.com/api/consensus/search/report?page=6&reportType=CO&fromDate=2022-05-06&toDate=2022-05-06&gradeCode=ALL&changePrices=ALL&searchType=ALL 인데 각 요소를 살펴보면, page reportType fromDate toDate가 있습니다. 

ⓒ 개발자모드>network , 출처 한경컨센서스

 

국내주식 애너리포트 정보 사이트 2가지 소개합니다. 'https://www.whynotsellreport.com/' 와 'http://data.krx.co.kr/contents/MDC/HARD/hardController/MDCHARD005.cmd

' 입니다. 

 

print('모두의 파이썬')

※좋아요/댓글은 서로를 응원합니다!

728x90
반응형