본문 바로가기
반응형

Learn Coding21

텍스트마이닝(Text Mining)-영화 리뷰 데이터(스마트인재개발원) 텍스트마이닝(Text Mining) 2번째 수업 : 25,000건 영화 리뷰 데이터 텍스트마이닝 Large Movie Review Dataset Sentiment Analysis Publications Using the Dataset Andrew L. Maas, Raymond E. Daly, Peter T. Pham, Dan Huang, Andrew Y. Ng, and Christopher Potts. (2011). Learning Word Vectors for Sentiment Analysis. The 49th Annual Meeting of the Association for Computational Linguistics (A ai.stanford.edu 1) Large Movie Review Dat.. 2021. 12. 7.
텍스트 마이닝(Text Mining) 개념정리(스마트인재개발원) 스마트인재개발원 머신러닝수업을 들으면서 그동안 분류모델, 회귀모델 수업이 진행되었으며 이번주에는 텍스트 마이닝(Text Mining) 교육이 시작되었습니다. 첫날이라 텍스트 마이닝에 대한 기본개념, 텍스트 마이닝 활용사례, 텍스트 마이닝 기술영역, 텍스트 데이터 구조, 텍스트 마이닝 분석 프로세스 등 이론교육이 진행되었습니다. 텍스트마이닝 활용사례를 구글링 하다보니 다양한 분야에서 활용이 되고 있어서 교육을 잘 받고 활용해보고 싶어지네요 텍스트 마이닝(Text Mining) 개념 텍스트 마이닝은 정형 및 비정형 데이터를 자연어 처리방식(Natural Language Processing)과 문서처리 방법을 적용하여 유용한 정보를 추출하여 가공하는 것을 목적으로 하는 기술 텍스트 마이닝은 데이터로부터 유용한.. 2021. 12. 6.
스마트인재개발원 - 전자상거래 물품 배송예측 대회 스마트인재개발원 5개월 교육과정중 벌써 3개월이 지나고 파이썬을 활용한 머신러닝 수업의 중후반 정도 배우는 중인데 팀대항으로 "전자 상거래 물품 배송 예측(분류)" 대회가 시작되었습니다. 팀당 6명으로 구성되어 4개팀이 대회에 참여하고 있으며 대회기간은 10일간입니다. 대회규칙 1. 대회기간 : 10일간(11월 30일~12월 9일) 2. 예측데이터는 하루에 팀당 10건을 제출할수 있다. 3. 1일기준은 밤12시가 아니며 (오전9시 ~ 익일 9시)기준이다. 4. Submit Prediction을 10건 모두 소진하면 다음날 오전 9시에 10건이 다시 생긴다. 5. 예측데이터를 제출하면 전체데이터중 60%만 채점을하여 점수를 보여주고 대회가 종료되면 전체데이터를 채점한다. This is a page wher.. 2021. 12. 6.
파이썬 머신러닝 - Titanic 생존자 예측하기(Kaggle)#1 머신러닝(Machine Learing) 학습과정 순서 1. 문제정의 2. 데이터수집(크롤링, 공공데이터, IOT센서데이터, 설문조사) 3. 데이터전처리(결측치,특성공학) 4. 탐색적 데이터분석(시각화, EDA) 5. 모델선택(머신러닝(지도학습:분류,회귀), (비지도학습:군집,연관), 딥러닝, 강화학습) 6. 모델학습 7. 모델평가(오차,R2,F1,엔트로피) 8. 예측, 추론 1) 문제정의 실제 kaggle 데이터인 타이타닉 데이터를 이용해 머신러닝을 진행 타이타닉 데이터의 승객들 정보를 가지고 이 승객의 사망여부를 예측 이진분류 문제(생존/사망) 2) 데이터수집 Kaggel사이트에서 데이터파일 다운로드(Download All) Titanic - Machine Learning from Disaster | .. 2021. 11. 25.
반응형