머신러닝/Tensorflow 기초

실습환경

dlwltn98 2021. 1. 13. 23:16

머신러닝 야학 정리

  • jupyter notebook
  • Colab notebook (이거 사용)

Colab notebook

  1. 구글 드라이브로 이동

      파일 → 새노트 
    1. 셀에 코드 작성

커서가 있는 곳 = 셀

 

+ 셀은 여러개 추가 가능

ctrl + enter ⇒ 실행 후 셀 안에 머물러 있음 //연속적으로 반복 실행 가능

Shift + enter ⇒ 셀 실행 후 다음 셀로 넘어감

- Variable (변수)

  표에선 칼럼을 '변수'라고 한다.

          즉, 온도의 값들이 변수

   온도와 판매량은 밀접한 관계가 있다.

원인 - 온도, 결과 - 판매량

  • 온도 → 원인 → '독립변수'
  • 판매량 → 결과 → '종속변수'

지도학습은 독립변수와, 종속변수를 구분하는것에서 시작.

 

Pandas - 표를 다루는 도구

import pandas as pd  
# 데이터 불러오기
파일경로 = 'lemonade.csv'
데이터 = pd.read_csv(파일경로)

#독립변수와 종속변수의 분리
독립 = 데이터[['온도']]
종속 = 데이터[['판매량']]

#데이터 모양 확인
print(독립.shape, 종속.shape)

데이터 준비하기

#파일 일어오기
    pd.read_csv('/경로/파일명.csv')

#모양 확인하기
    print(데이터.shape)

#칼럼 선택하기
    데이터[['칼럼명1','칼럼명2','칼럼명3']]

# 칼럼 이름 출력하기
    print(데이터.columns)

#상위 5개 관측치 출력하기
    데이터.head()

Colaboratory_실습

# 파일들로부터 데이터 읽어오기
file_path = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/lemonade.csv'
lemonade = pd.read_csv(file_path)

file_path = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/boston.csv'
boston = pd.read_csv(file_path)

file_path = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/iris.csv'
iris = pd.read_csv(file_path)

# 칼럼 이름 출력
print(lemonade.columns)
print(boston.columns)
print(iris.columns)

Index(['온도', '판매량'], dtype='object')
Index(['crim', 'zn', 'indus', 'chas', 'nox', 'rm', 'age', 'dis', 'rad', 'tax',
'ptratio', 'b', 'lstat', 'medv'],
dtype='object')
Index(['꽃잎길이', '꽃잎폭', '꽃받침길이', '꽃받침폭', '품종'], dtype='object')

독립 = lemonade[['온도']]
종속 = lemonade[['판매량']]
print(독립.shape, 종속.shape)

독립 = boston[['crim', 'zn', 'indus', 'chas', 'nox', 'rm', 'age', 'dis', 'rad', 'tax',
       'ptratio', 'b', 'lstat']]
종속 = boston[['medv']]
print(독립.shape, 종속.shape)

독립 = iris[['꽃잎길이', '꽃잎폭', '꽃받침길이', '꽃받침폭']]
종속 = iris[['품종']]
print(독립.shape, 종속.shape)

(6, 1) (6, 1)
(506, 13) (506, 1)
(150, 4) (150, 1)


실습 데이터 출처 : https://github.com/blackdew/tensorflow1/tree/master/csv

출처 : https://opentutorials.org/course/4570/28969

출처 : https://opentutorials.org/course/4570/28969

'머신러닝 > Tensorflow 기초' 카테고리의 다른 글

3. 아이리스 품종 분류  (0) 2021.01.19
+ 딥러닝 학습의 원리  (0) 2021.01.15
2. 보스턴 집값 예측  (0) 2021.01.14
1. 레모네이드 판매 예측  (1) 2021.01.13
Tensorflow 기초 (python)  (0) 2021.01.13