본문 바로가기
반응형

머신러닝8

파이썬 머신러닝 - Titanic 생존자 예측하기(Kaggle)#1 머신러닝(Machine Learing) 학습과정 순서 1. 문제정의 2. 데이터수집(크롤링, 공공데이터, IOT센서데이터, 설문조사) 3. 데이터전처리(결측치,특성공학) 4. 탐색적 데이터분석(시각화, EDA) 5. 모델선택(머신러닝(지도학습:분류,회귀), (비지도학습:군집,연관), 딥러닝, 강화학습) 6. 모델학습 7. 모델평가(오차,R2,F1,엔트로피) 8. 예측, 추론 1) 문제정의 실제 kaggle 데이터인 타이타닉 데이터를 이용해 머신러닝을 진행 타이타닉 데이터의 승객들 정보를 가지고 이 승객의 사망여부를 예측 이진분류 문제(생존/사망) 2) 데이터수집 Kaggel사이트에서 데이터파일 다운로드(Download All) Titanic - Machine Learning from Disaster | .. 2021. 11. 25.
머신러닝 파이썬(python) 라이브러리 기계 학습 또는머신 러닝(machine learning)은 경험을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구이다.인공지능의 한 분야로 간주된다. 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야이다. 가령, 기계 학습을 통해서 수신한 이메일이 스팸메일인지 아닌지를 구분할 수 있도록 훈련할 수 있다. 기계학습 문제들을 학습 종류에 따라 지도학습(문제와 답이 둘다 존재), 비지도학습(문제는 존재하지만 답은 알아서 알아야함.) 그리고 강화학습(문제도 답도 알아서 찾아나가야 함.)3가지로 나눌 수 있다. 특히 지도학습과 비지도학습의 구분은 레이블(label)의 유무에 따라 이뤄진다. 여기서 레이블이란, 학습 데이터의 속성을 무엇을 분석할지에 따라 정의되는 데이터를 뜻한다. 파이썬(Python).. 2021. 11. 22.
머신러닝(Machine Learning) 기초 1. 인공지능의 역사 인공지능(AI, Artificial Intelligence)이라는 용어가 처음 등장한 때는 1956년에 미국 다트머스 대학교에서 마빈 민스키,클로드 섀넌 등 인공지능 및 정보 처리 이론에 지대한 공헌을 한 사람들이 개최한 학회에서 존 매카시가 이 용어를 사용하면서부터이다. 하지만 인공지능이라는 개념 자체는 훨씬 예전부터 있었다. 예를 들면, 앨런 튜링이 ‘생각하는 기계’의 구현 가능성과 튜링 테스트를 제안한 것은 1950년의 일이며, 최초의 신경망 모델은 1943년에 제안되었다. 20세기 중반에도 인공지능 연구는 자연어처리나 복잡한 수학 문제를 해결하는 등 정말로 인간만이 할 수 있는 영역에 있던 문제들도 컴퓨터로 착착 해결할 수 있었던 상당히 혁신적인 연구였으며, 많은 관심을 받고.. 2021. 11. 18.
머신러닝을 위한 기초통계 개념정리 1. 통계학이란? 사람들은 불확실한 미래를 예측하고 싶어한다. 사람이나 사물, 사건 등을 조사해 결과를 구체적인 숫자로 나타내고 사회적 현상과 자연 현상을 규명하기 위해 수집된 각종 데이터를 요약하여 적절한 방법을 통해 1차 가공되어 도출된 정보(숫자, 차트, 평균, 상관계수)를 분석하여 올바른 탑을 구하는 학문이다. 과거부터 현재까지 통계 적용분야 전쟁, 일식, 무역, 질병(흑사병), 기상, 농업(농작물작황, 쌀 생산량), 주식투자, 환경과학(쓰레기의 양), 생명과학, 산업연구, 품질보증, 시장조사 등 통계청 사이트 (https://kostat.go.kr/portal/korea/index.action) 통계청 자주찾는 서비스펼쳐보기+ kostat.go.kr 2. 통계관련 용어 모집단(Population.. 2021. 11. 18.
반응형