공부하기싫어

저번에 계정에 접속하는것까지 했으니까

오늘은 로컬환경에서 그 계정의 최신 사진들을 크롤링 한 후 저장해보고

금방끝나면 반복문으로 4명 모두의 사진을 저장해보자

 

오늘의 안주는 편의점 편육과

두부팽이버섯계란 섞어서 소금 후추 쳐서 전같이 부친

두부버섯계란전?

 

 

  • 이미지 크롤링

저번에 했던 거에서 첫번째 사진 링크로 접근해서 사진을 받고, 두번째 , 세번째

이후에 다음 아이디

이런 순서로 접근하려고 했는데

 

계정의 첫번째 사진의 링크를 얻어오는게 쉽지 않았다

xpath 로 클릭하는것도 안됬고

find element 로 접근해서 클릭해보려고했는데 실패했다

 

그래서 링크의 href 를 찾아내서 driver.get(url) 이런식으로 접근해보려고 한다

 

...

 

저 위 글 쓴게 4시간전임

ㅋㅋ

 

크롤링은 고사하고

href 링크 따오는데 너무오래걸렸다

술 하나도 안취하네 2병 다마셧는데

머리나쁘면 몸이고생한다더니

ㅈ같다 ㅋㅋ

 

크롤링코드

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
div_class_name='_ac7v _aang'
link_arr=list()
 
def getimage(classname):
    pageString=driver.page_source
    bsObj=BeautifulSoup(pageString, 'lxml')
 
    for link1 in bsObj.find_all(name='div', attrs={'class':classname}) :
        SelData=link1.select('a')
        for i in range(len(SelData)) :
            title=SelData[i]
            real=title.attrs['href']
            link_arr.append(real)
    
    print(link_arr)
    #print("access to first image")
    time.sleep(2)
cs

 

실행영상

https://youtu.be/IHVHZ11_cbI

 

- YouTube

 

www.youtube.com

 

 

 

 

 

참고한 블로그

https://kjk92.tistory.com/65?category=689641 

 

Python 인스타그램 크롤링-크롤링관련 소스(1)

안녕하세요. 인스타그램 크롤링 프로젝트 중 크롤링과 관련된 소스에 대한 설명입니다. 전체 구조 중 CraCrawlingInstagramMng.py에 대해 설명하겠습니다. 인스타그램 크롤링 클래스는 크롤링 과정에

kjk92.tistory.com

https://0ver-grow.tistory.com/997

 

[beautifulsoup, selenium] 인스타그램 이미지 크롤링해보자!

1. 사전작업 크롬브라우저 버전 체크하기 크롬 브라우저 > 설정 > 좌측하단의 크롬 정보 클릭해서 확인 이제 버전에 맞는 크롬 드라이버를 하단의 사이트에서 다운로드받자. ChromeDriver - WebDriver fo

0ver-grow.tistory.com

 

https://www.youtube.com/watch?v=j_BW5vNrcxA&t=532s