Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 면접질문
- hash
- C++
- Java
- 동적계획법
- 코딩테스트준비
- BFS
- Lv.1
- 코테준비
- 고득점Kit
- 문제풀이
- 해시
- 그래프
- BruteForceSearch
- Lv.2
- 단지번호붙이기
- OS
- 2색칠하기
- LV.3
- 파이썬
- 이분그래프판별
- 알고리즘
- C
- 운영체제
- 코딩테스트
- 프로그래머스
- 쿠쉬쿠쉬
- Python
- Algorithm
Archives
- Today
- Total
쿠쿠의기록
4. Instagram Crawling(1) - Image 본문
한동안 블로깅을 못했는데 바빳다면 그짓말이고 솔직히 게을러서 계속 미루다 이제 쓰게 되었다...
그래서 이제 마음먹고 지난 2주간 있었던 폭풍과 같은 삽질 결과를 보여주겠다!
우선 CUSHCUSH 웹 프로젝트에서 데이터를 수집하는 크롤링 부분을 맡게되었다.
해시태그를 접하기 전 Image Crawling을 접하게 되었고 구현해보았다.
모든 코드는 vscode에서 작성 했고, 코드는 위 사진과 같다.
소스코드가 작동되기 위해서 해야할 것!!
1. 자신의 chrome 버전에 맞는 chromedriver 를 설치해준다.
2. 필요한 환경변수를 pip install (selenium, beautifulsoup4 등) 설치해준다.
3. 크롤링 하고자 하는 부분을 찾는다 (F12 소스코드 화살표 보기로 찾으면 빠름!)
4. 검색한 해시태그 이미지를 크롤링
5. 미리 만들어 놓은 img 폴더에 저장
검색한 해시태그로 이미지 크롤링 완성된 결과물~!
다음 블로깅은 해시태그 크롤링을 올려보겠다~^^
참고한 유튜브 영상 - https://www.youtube.com/watch?v=j_BW5vNrcxA
작성한 코드(깃헙) - https://github.com/kuminkyu/SoloStudy/blob/master/CushCush/ImageCrawling.py
'개발에 대한 기본 지식 > 쿠쉬쿠쉬블로깅' 카테고리의 다른 글
제네릭 클래스 (generic class)에 사용법(간결하게!) (0) | 2023.06.09 |
---|---|
5. Instagram Crawling(2) - Hashtags (0) | 2020.08.19 |
3. API 적용해서 사이트 만들기 (0) | 2020.07.30 |
2. Node.js 동기, 비동기 (0) | 2020.07.22 |
1. API(Application Programming Interface) (1) | 2020.07.17 |