반응형
텍스트마이닝(Text Mining) 3번째 수업
https://www.rottentomatoes.com/
영화리뷰 사이트에 들어가 영화별 평점을 보고 관심있는 영화 클릭해서 리뷰 내용 가져와 부정(0)인지 긍정(1)인지 예측을 해볼시 있습니다.
저는 영화 "Red Notice"를 저번주에 넷플릭스로 잼있게(킬링타임용) 봐서 리뷰내용이 부정과 긍정의 비율이 궁금해 리뷰내용을 가져와 예측을 해겠습니다.
토마토 모양은 긍정인 리뷰내용이고 초록색모양(썩은토마토)은 부정인 리뷰내용을 표시 해주고 있습니다.
직접만든 모델이 위의 부정과 긍정처럼 구분을 하는지 리뷰내용을 한개씩 가져와 테스트 해보겠습니다.
위의 리뷰 6개(첫번째만 긍정, 나머진 부정)를 한개씩 가져와 각각 review ~ review6에 할당을 해주고 예측을 해봤습니다. 예측결과는 6개 모두 정확하게 예측을 성공한걸 확인했습니다.
학습한 모델을 통해 단어별 가중치를 확인
아래 coef(가중치)를 보면 -1에 가까울수록 부정에 영향을 미치는 단어이고 1에 가까울수록 긍정에 영향을 미치는 단어를 확인할수 있습니다.
스마트인재개발원 : https://www.smhrd.or.kr/
반응형
'Learn Coding > AI(인공지능)' 카테고리의 다른 글
텍스트마이닝(Text Mining)-영화 리뷰 데이터(스마트인재개발원) (0) | 2021.12.07 |
---|---|
텍스트 마이닝(Text Mining) 개념정리(스마트인재개발원) (0) | 2021.12.06 |
스마트인재개발원 - 전자상거래 물품 배송예측 대회 (0) | 2021.12.06 |
댓글