본문 바로가기
Learn Coding/AI(인공지능)

텍스트마이닝(Text Mining)-영화 리뷰 데이터#1(스마트인재개발원)

by 북극성매니아 2021. 12. 8.
반응형

 

텍스트마이닝(Text Mining) 3번째 수업

 

https://www.rottentomatoes.com/

 

Rotten Tomatoes: Movies | TV Shows | Movie Trailers | Reviews

Rotten Tomatoes, home of the Tomatometer, is the most trusted measurement of quality for Movies & TV. The definitive site for Reviews, Trailers, Showtimes, and Tickets

www.rottentomatoes.com

 

영화리뷰 사이트에 들어가 영화별 평점을 보고 관심있는 영화 클릭해서 리뷰 내용 가져와 부정(0)인지 긍정(1)인지 예측을 해볼시 있습니다.

저는 영화 "Red Notice"를 저번주에 넷플릭스로 잼있게(킬링타임용) 봐서 리뷰내용이 부정과 긍정의 비율이 궁금해 리뷰내용을 가져와 예측을 해겠습니다.

 

토마토 모양은 긍정인 리뷰내용이고 초록색모양(썩은토마토)은 부정인 리뷰내용을 표시 해주고 있습니다.

직접만든 모델이 위의 부정과 긍정처럼 구분을 하는지 리뷰내용을 한개씩 가져와 테스트 해보겠습니다.

 

위의 리뷰 6개(첫번째만 긍정, 나머진 부정)를 한개씩 가져와 각각 review ~ review6에 할당을 해주고 예측을 해봤습니다. 예측결과는 6개 모두 정확하게 예측을 성공한걸 확인했습니다.

 

학습한 모델을 통해 단어별 가중치를 확인

 

 

 

 

아래 coef(가중치)를 보면 -1에 가까울수록 부정에 영향을 미치는 단어이고 1에 가까울수록 긍정에 영향을 미치는 단어를 확인할수 있습니다.

 

 


스마트인재개발원 : https://www.smhrd.or.kr/

 

스마트인재개발원

4차산업혁명시대를 선도하는 빅데이터, 인공지능, 사물인터넷 전문 '0원' 취업연계교육기관

www.smhrd.or.kr

 

반응형

댓글