TITANIC

Titanic - Predict survival on the Titanic and get familiar with ML basics (kaggle) 2부 (학습 진행)

2022.05.25

데이터셋 구성 학습과 검증 데이터의 비율을 80:20 으로 구성하였습니다. 그리고 1부에서 진행하였던 데이터 구성으로 학습 데이터와 검증데이터를 구성하였습니다. 그리고 test.csv를 이용하여 테스트 데이터셋을 구성하였습니다. def make_Tensor(array): return torch.from_numpy(array).float() data_percent = 0.8 train_data_len = int(len(x_data) * data_percent) train_x = np.array(x_data[:train_data_len]) val_x = np.array(x_data[train_data_len:]) train_y = np.array(y_data[:train_data_len]) val_y = n..

toy project

Titanic - Predict survival on the Titanic and get familiar with ML basics (kaggle) 1부 (데이터 전처리)

2022.05.25

Titanic data 카테고리 Passenger : 승객 ID Survived : 생존하였는지 (0 = No, 1 = Yes) Pclass : Ticket Class (1 = 1st, 2 = 2nd, 3 = 3rd) Name : 사람 이름 Sex : 성별 Age : 나이 SibSp : 타이타닉 호에 탑승한 형제와 배우자 수 Parch : 타이타닉 호에 탑승한 자녀와 부모의 수 Ticket : 티켓 번호 Fare : 여객 운임 Cabin : 객실 번호 Embarked : 승선항 (C = Cherbourg, Q = Queenstown, S = Southapmton) Data 전처리 1. 누락된 데이터 처리 (결측 데이터) 2. 데이터 평활 위의 데이터에서 티켓번호와 사람이름, 객실번호는 데이터 전처리가 어..

Titanic - Predict survival on the Titanic and get familiar with ML basics (kaggle) 2부 (학습 진행)

Titanic - Predict survival on the Titanic and get familiar with ML basics (kaggle) 1부 (데이터 전처리)

티스토리툴바