## 유튜브에서 동영상 정보 크롤링 (crawling) 
## 유튜브에서 동영상 정보 크롤링 (crawling) 
import requests
from bs4 import BeautifulSoup 
import json

def get_html(url):
    ## 브라우저 호환을 위해서 설정
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '+ \
        '(KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36'
                } 
    ##해당 url에 htlm(정보) 요청에사용 / url은 사용자가 원하는 url
    r = requests.get(url, headers=headers) 
    ## 해당 url의 html을 사용자가 활용하기 쉽게 변환
    html = BeautifulSoup(r.content, 'html.parser')
    ## 결과값 전달
    return html

    
def get_youtube_video_crawling():
    url = 'https://www.youtube.com/c/BLACKPINKOFFICIAL/videos'
    html = get_html(url)
    
    ##제목 시작 위치
    title_point1 = 0
    ##url 시작 위치
    url_point1 = 0
    ## html에서 제목위치 직전 text
    title_param1 = '"title":{"runs":[{"text":"'
    ## html에서 url위치 직전 text
    url_param = '"commandMetadata":{"webCommandMetadata":{"url":"'

    for i in range(0,10):
        ## 제목위치 직전 text 위치
        point1 = str(html)[title_point1:].find(title_param1, 0)        
        ## 제목위치     
        title_point1 = title_point1 + point1 + len(title_param1)
        ## url위치 직전 text 위치 
        point2 = str(html)[title_point1:].find(url_param, 0)
        ## url위치
        url_point1 = title_point1 + point2 + len(url_param)
        
        ## 제목출력
        print(str(html)[title_point1:title_point1+1000].split('"}],"')[0])
        ## url출력
        print('https://www.youtube.com'+ \
              str(html)[url_point1:url_point1+1000].split('","webPageType"')[0])

get_youtube_video_crawling()

BLACKPINK 2022 WELCOMING COLLECTION PREVIEW
https://www.youtube.com/watch?v=OZdK1czhuv8
CALLING ALL BLINKS: CLIMATE ACTION IN YOUR AREA! #COP26
https://www.youtube.com/watch?v=0pJ1oD-OXZo
LISA - 'SG' DANCE HIGHLIGHT CLIP
https://www.youtube.com/shorts/a74YfHF4TKY
LISA - 'MONEY' DANCE CHALLENGE
https://www.youtube.com/shorts/B8fapsO4P2g
BLACKPINK Performs Stay | Dear Earth
https://www.youtube.com/watch?v=rqVPhi0oTVU
BLACKPINK Talks Climate Change  | Dear Earth
https://www.youtube.com/watch?v=Aq27eTQMBJA
LISA - 'MONEY' DANCE PRACTICE VIDEO
https://www.youtube.com/watch?v=fr-eHz87XoM
LISA - 'LALISA' 0926 SBS Inkigayo
https://www.youtube.com/watch?v=aEiznLJCb9o
LISA - 'MONEY' EXCLUSIVE PERFORMANCE VIDEO
https://www.youtube.com/watch?v=dNCWe_6HAM8
LISA - FIRST SINGLE ALBUM LALISA ALBUM UNBOXING
https://www.youtube.com/watch?v=LuFyun11XNs

[python-파이썬] 15 네이버에서 지역별 인구정보 크롤링 (crawling) - 2탄 (2)	2022.05.05
[python-파이썬] 13 mk증권에서 시간외단일가 크롤링 (crawling) (0)	2022.04.30
[python-파이썬] 12 빗썸에서 호가정보 크롤링 (crawling) (0)	2022.04.26
[python-파이썬] 16 멜론에서 인기순위 크롤링 (crawling) (0)	2022.04.23
[python-파이썬] 17 네이버웹툰 순위정보 크롤링 (crawling) (0)	2022.04.23

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

모두의 실험실

[python-파이썬] 11 유튜브에서 동영상 정보 크롤링 (crawling) - 2탄

'파이썬 > 크롤링' 카테고리의 다른 글

'파이썬/크롤링'의 다른글

티스토리툴바

[python-파이썬] 11 유튜브에서 동영상 정보 크롤링 (crawling) - 2탄

'파이썬 > 크롤링' 카테고리의 다른 글

'파이썬/크롤링'의 다른글

관련글

티스토리툴바