www.youtube.com/watch?v=Yw3VzGCis48
파이썬을 이용해서 웹상에서 유럽축구 리그 경기 결과정보를 수집해서
각 리그별로 이번 시즌 결과를 한눈에 볼 수 있는 엑셀파일을 제작해보겠습니다.
4/19 기준 분데시리가, 라리가, 세리에, 프리미어 리그 2020-21 전체 경기결과 정리표
결과물 부터 보시죠.
참고로 서식지정은 수동으로 진행한 결과입니다. 추후 자동적용방안으로 업그레이드하겠습니다.
가로축은 현재 리그 순위별로 팀명을 정렬하였고
세로축은 홈/원정 경기로 분리하여 결과를 한표로 보여주는 결과입니다.
윈도우환경에서 Visual Stuio Code를 이용해서 작성한 예제입니다.
웹정보 수집을 위해 selenium, Beautiful Soup 라이브러를 활용했으며
데이터 수집 사이트는 스코어보드를 이용했습니다.
아래는 첨부한 예제 파일입니다.
해당 파일을 실행하기위해서는 파이썬 설치와 환경설정이 필요합니다.
제가 처음 보고 공부한 영상링크를 첨부해둘테니 그대로 따라하시면 될겁니다.
1)파이썬 설치 (나도코딩님 유튜브자료)
www.youtube.com/watch?v=kWiCuklohdY&t=24s
2) 라이브러리 설치
1. beautifulsoup4 라이브러리 설치
터미널창에서 다음 명령을 실행합니다.
pip install beautifulsoup4
2. lxml 라이브러리 설치
터미널창에서 다음 명령을 실행합니다.
pip install lxml
3. selenum 설치
터미널창에서 다음 명령을 실행합니다.
pip install selenium
4. 크롬 드라이버 설치
크롬 주소창에 chrome://version/ 입력 후 버젼확인
chromedriver.chromium.org/downloads
Downloads - ChromeDriver - WebDriver for Chrome
WebDriver for Chrome
chromedriver.chromium.org
위 링크에서 버젼에 맞는 파일을 다운로드합니다.
OS에 맞는 파일을 다운로드합니다. 전 윈도우를 사용하고 있으니 chromedriver_win32.zip 파일을 받아 압축을
풀어줍니다. 아래 파일을 첨부한 소스코드 위치에 옮겨줍니다.
그럼 위에서 엑셀파일을 만드는 과정은 영상제작을 완료 후 유튜브 영상으로 보여드리겠습니다.