본문 바로가기
반응형

분류 전체보기27

파이썬 머신러닝 - Titanic 생존자 예측하기(Kaggle)#1 머신러닝(Machine Learing) 학습과정 순서 1. 문제정의 2. 데이터수집(크롤링, 공공데이터, IOT센서데이터, 설문조사) 3. 데이터전처리(결측치,특성공학) 4. 탐색적 데이터분석(시각화, EDA) 5. 모델선택(머신러닝(지도학습:분류,회귀), (비지도학습:군집,연관), 딥러닝, 강화학습) 6. 모델학습 7. 모델평가(오차,R2,F1,엔트로피) 8. 예측, 추론 1) 문제정의 실제 kaggle 데이터인 타이타닉 데이터를 이용해 머신러닝을 진행 타이타닉 데이터의 승객들 정보를 가지고 이 승객의 사망여부를 예측 이진분류 문제(생존/사망) 2) 데이터수집 Kaggel사이트에서 데이터파일 다운로드(Download All) Titanic - Machine Learning from Disaster | .. 2021. 11. 25.
isnan vs isna vs isnull 차이점(스마트인재개발원) 요즘 파이썬으로 머신러닝 수업을 받는데 데이터 전처리를 하면서 결측치를 처리하기 위해서 메서드(함수)를 사용하여 결측값을 찾는데 비슷한 메서드가 자주 등장하여 햇갈리는 부분이 있어서 개념정리도 할겸해서 포스팅을 해보니다. isnan vs isna vs isnull 차이점 우선 nan은 Not a Number의 뜻으로 결측치, 없는값이라는 의미로 isnan(값)은 값이 결측치이면 boolean 데이터타입인True, 아니면 False를 return하는 메서드 입니다. isnan과 isna 그리고 isnull은 모두 결측치를 찾아 True, False로 리턴해주는 기능을 하는 메서드입니다. 1. isnan isnan은 Numpy의 결측치를 찾아주는 메서드입니다. NumPy의 공식사이트의 API referenc.. 2021. 11. 24.
머신러닝 파이썬(python) 라이브러리 기계 학습 또는머신 러닝(machine learning)은 경험을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구이다.인공지능의 한 분야로 간주된다. 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야이다. 가령, 기계 학습을 통해서 수신한 이메일이 스팸메일인지 아닌지를 구분할 수 있도록 훈련할 수 있다. 기계학습 문제들을 학습 종류에 따라 지도학습(문제와 답이 둘다 존재), 비지도학습(문제는 존재하지만 답은 알아서 알아야함.) 그리고 강화학습(문제도 답도 알아서 찾아나가야 함.)3가지로 나눌 수 있다. 특히 지도학습과 비지도학습의 구분은 레이블(label)의 유무에 따라 이뤄진다. 여기서 레이블이란, 학습 데이터의 속성을 무엇을 분석할지에 따라 정의되는 데이터를 뜻한다. 파이썬(Python).. 2021. 11. 22.
머신러닝(Machine Learning) 기초 1. 인공지능의 역사 인공지능(AI, Artificial Intelligence)이라는 용어가 처음 등장한 때는 1956년에 미국 다트머스 대학교에서 마빈 민스키,클로드 섀넌 등 인공지능 및 정보 처리 이론에 지대한 공헌을 한 사람들이 개최한 학회에서 존 매카시가 이 용어를 사용하면서부터이다. 하지만 인공지능이라는 개념 자체는 훨씬 예전부터 있었다. 예를 들면, 앨런 튜링이 ‘생각하는 기계’의 구현 가능성과 튜링 테스트를 제안한 것은 1950년의 일이며, 최초의 신경망 모델은 1943년에 제안되었다. 20세기 중반에도 인공지능 연구는 자연어처리나 복잡한 수학 문제를 해결하는 등 정말로 인간만이 할 수 있는 영역에 있던 문제들도 컴퓨터로 착착 해결할 수 있었던 상당히 혁신적인 연구였으며, 많은 관심을 받고.. 2021. 11. 18.
반응형