개발에 대한 기본 지식/쿠쉬쿠쉬블로깅

4. Instagram Crawling(1) - Image

쿠쿠트레인 2020. 8. 18. 13:08

한동안 블로깅을 못했는데 바빳다면 그짓말이고 솔직히 게을러서 계속 미루다 이제 쓰게 되었다...

그래서 이제 마음먹고 지난 2주간 있었던 폭풍과 같은 삽질 결과를 보여주겠다!

 

우선 CUSHCUSH 웹 프로젝트에서 데이터를 수집하는 크롤링 부분을 맡게되었다.

해시태그를 접하기 전 Image Crawling을 접하게 되었고 구현해보았다.

 

모든 코드는 vscode에서 작성 했고, 코드는 위 사진과 같다.

 

소스코드가 작동되기 위해서 해야할 것!!

1. 자신의 chrome 버전에 맞는 chromedriver 를 설치해준다.

2. 필요한 환경변수를 pip install (selenium, beautifulsoup4 등) 설치해준다.

3. 크롤링 하고자 하는 부분을 찾는다 (F12 소스코드 화살표 보기로 찾으면 빠름!)

4. 검색한 해시태그 이미지를 크롤링

5. 미리 만들어 놓은 img 폴더에 저장 

 

검색한 해시태그로 이미지 크롤링 완성된 결과물~!

다음 블로깅은 해시태그 크롤링을 올려보겠다~^^

 

참고한 유튜브 영상 - https://www.youtube.com/watch?v=j_BW5vNrcxA

작성한 코드(깃헙) - https://github.com/kuminkyu/SoloStudy/blob/master/CushCush/ImageCrawling.py

참고한 사이트 - velog.io/@codeamor/TIL-no.14-Python-%EC%9D%B8%EC%8A%A4%ED%83%80%EA%B7%B8%EB%9E%A8-%EC%9D%B4%EB%AF%B8%EC%A7%80-%ED%81%AC%EB%A1%A4%EB%A7%81