반응형

분류 전체보기 78

Tabular Data - 당뇨병에 걸릴 확률 회귀

목적 - 당뇨병에 걸릴 확률을 예측해보자 (회귀) 1. 데이터 불러오기import pandas as pdtrain = pd.read_csv('./data_folder_reg/diabetes_reg_train.csv')test30 = pd.read_csv('./data_folder_reg/diabetes_reg_test30.csv')  2. 데이터 분할x = train.drop(columns=['target']) # 특징(Feature) 변수들y = train['target'] # 예측할 대상(Target) 변수from sklearn.model_selection import train_test_splittrain_x, test_x, train_y, test_y = train_test_split(x, y..

인공지능 2025.02.09

Tabular Data - 당뇨병에 걸릴지 안걸릴지 분류

활용파일 목적- 여러 파라미터를 통해 당뇨병에 걸릴 확률을 예측해보자 1. 라이브러리 임포트 및 데이터 불러오기from sklearn.model_selection import train_test_split #데이터를 학습/데이터용으로 분리from sklearn.metrics import accuracy_score #모델의 예측 정확도 평가import pandas as pd #데이터 관리import pickle #모델을 파일로 저장하거나 불러옴import joblib folder_path='./data_folder'train = pd.read_csv(folder_path + '/diabetes_train.csv')test30 = pd.read_csv(folder_path + '/diabetes_testse..

인공지능 2025.02.03

Tabular Data - 타이타닉 생존자 분류

활용데이터  목적 - 머신러닝을 통해 타이타닉 생존자 예측을 해보자. 1. 데이터 불러오기 및 전처리#pandas : 데이터프레임 형태로 데이터를 다루기 위해 사용#numpy : 수치 연산을 지원#pickle, joblib : 모델 저장 및 불러오기를 위해 사용import pandas as pdimport numpy as npimport pickleimport joblibtrain = pd.read_excel('./data_folder/titanic_train.xls')test30 = pd.read_excel('./data_folder/titanic_test30.xls')#필요없는 변수 제거train_copy = train.drop(columns=['name','home.dest','boat','cabi..

인공지능 2025.02.02
반응형