본문 바로가기

Python

[python] wordcloud를 사용한 네이버 영화 리뷰 시각화

728x90

네이버 영화 리뷰 스크랩을 만든 후에 영화 데이터를 시각화해보고 싶다는 생각이 들어서 wordcloud를 사용한 네이버 영화 리뷰 데이터 시각화를 만들어보았습니다. (구글 코랩을 사용하여 개발하였습니다) 전체 코드

 

piaochung/movie_wordcloud

네이버 영화 리뷰를 사용하여 wordcloud를 만들어보는 프로그램입니다. Contribute to piaochung/movie_wordcloud development by creating an account on GitHub.

github.com

데이터 시각화를 위해서는 다음의 과정을 진행합니다.

  • 데이터 수집: 네이버 영화 스크랩을 통해서 리뷰 데이터를 수집합니다.
  • 데이터 가공: 데이터의 길이와 빈도수 그리고 불용어 사전을 만들어서 불필요한 데이터를 제거합니다.
  • 데이터 시각화: 가공한 데이터를 가지고 wordcloud 라이브러리를 사용하여 시각화를 진행합니다.

다음은 미니언즈 500개의 데이터를 수집한 후에 가공하여 시각화 진행한 이미지입니다.

데이터 시각화 결과 이미지

 

네이버 리뷰 데이터를 사용하여 데이터 시각화를 진행보았습니다. 주요 키워드들을 한눈에 볼 수 있어서 추후 영화 시청 여부를 결정할 때에도 도움이 될 수 있을 것 같습니다. 

728x90