인공지능🤖

유데미 강의 ANN(인공신경망) 모델 평가 전까지 수강

https://www.udemy.com/course/best-artificial-neural-networks/?couponCode=KEEPLEARNING

인공신경망 예제 작성

인공신경망을 활용하여 은행 고객들의 데이터로 은행 탈퇴 확률 예측 AI를 만들어본다.

import numpy as np
import tensorflow as tf
import pandas as pd

먼저 코드에 필요한 라이브러리들을 임포트해준다.

1. 데이터 전처리

사용하려는 데이터는 처음상태로는 사용될 수 없다. 독립변수의 값이 숫자가 아니거나, 비어있거나, 너무 크면 처리하는 데에 문제가 생길 수도 있기 때문에 이전에 전처리를 해주어야한다.

dataset = pd.read_csv('Churn_Modelling.csv')
X = dataset.iloc[:, 3:-1].values
y = dataset.iloc[:, -1].values

우선 사용하려는 데이터셋을 임포트한 후에(고객의 이름, 고객번호, 아이디 등은 독립변수로써 사용될 수 없기에 슬라이싱해준다.)

from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
X[:, 2] = le.fit_transform(X[:, 2])

성별은 male female 둘 중 하나이기 때문에 0과 1로 인코딩해준다(순서는 상관없다.)

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [1])], remainder='passthrough')
X = np.array(ct.fit_transform(X))

다음으로 지역을 인코딩한다. 인공신경망의 학습에서 글자는 사용이 불가하기 때문에 숫자로 바꾸어주는데, 현재 고객의 지역이 프랑스, 스페인, 독일이므로 3개의 더미변수를 생성하여 각각 1 0 0, 0 1 0, 0 0 1같은 식으로 인코딩하여 나타낼 수 있다.

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)

모델을 훈련하고 테스트할 때에 데이터셋은 각각 달라야한다. 따라서 임포트한 데이터셋을 훈련 세트와 테스트 세트로 분리한다.

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)