본문 바로가기

Python

[Python] 네이버 영화 리뷰 데이터 수집 (2)

728x90

사용자를 기준으로 작성한 리뷰를 가져오는 코드입니다. 코드 확인

 

piaochung/naver_movie_scrap

네이버 영화 리뷰 데이터와 영화 데이터를 가져오는 프로그램입니다. Contribute to piaochung/naver_movie_scrap development by creating an account on GitHub.

github.com

 

추가된 파일은 다음과 같습니다.

 

  • user_sword_scrap.py: 사용자 고유 번호를 가져오는 코드입니다.
  • user_review_info_scrap.py: 고유 번호에 따른 리뷰 데이터를 가져오는 코드입니다.

우선 user_sword_scrap.py의 이용 방법과 인자에 대해 알아보겠습니다. 다음은 인자의 내용과 타입입니다.

 

인자 내용 타입
movie_id 영화 고유 아이디입니다. int
start_page 시작 페이지를 지정하는 변수입니다. int
end_page 끝나는 페이지를 지정하는 변수입니다. int

 

3가지 변수 모두 정상적으로 입력되어야 합니다.

 

from naver_movie import user_sword_scrap

movie_id = 93756
user_sword = user_sword_scrap.get_user_code(movie_id, start_page=1, end_page=1)

 

user_sword에 사용자 고유 번호가 저장되게 됩니다.

 

다음은 user_review_info_scrap.py에 대해서 알아보겠습니다. 다음은 인자의 내용과 타입입니다.

 

인자 내용 타입
sword 사용자 고유 아이디입니다. int
minimum_count 스크랩하기 위한 최소한의 리뷰 개수입니다. int
maximum_count 리뷰 개수의 최대값을 지정합니다. int

 

2가지 변수 모두 정상적으로 입력되어야 합니다.

 

from naver_movie import user_review_info_scrap

user_sword = user_review_info_scrap.get_user_review(17471693, 10, 50)

 

위의 코드는 17471693 유저가 10개 이상의 리뷰 데이터가 있다면 50개의 리뷰를 가져오는 코드입니다. 결괏값은 다음과 같습니다. 결괏값이 많아 2개만 보여주었습니다.

 

[{'movie_id': '93756',
  'movie_title': '명량',
  'score': '1',
  'sword': 17471693,
  'text': '민족 성웅 이순신과 그의 가장 극적인 전투 명량해전을 소재로 삼아놓고 이따위 수준 밖에 만들어내지 못한 감독은 한국 영화 업계 앞에 반성해라. 애국심을 팔아먹을거면 차라리 피규어를 만들든지. ',
  'user_name': 'voyo****',
  'user_number': '17471693'},
 {'movie_id': '172174',
  'movie_title': '어느 가족',
  'score': '9',
  'sword': 17471693,
  'text': '고를거라면 도둑이 아닌 아빠를 고르겠지만 결국 그를 아빠로 고른 것처럼... 가족을 고른 사람들 ',
  'user_name': 'voyo****',
  'user_number': '16944498'},
  .
  .
  .
728x90