전체 글 80

3. 아이리스 품종 분류

머신러닝 야학 정리 ⇒ 독립 변수 : 꽃잎길이, 꽃잎폭, 꽃받침길이, 꽃받침폭 ⇒ 종속 변수 : 품종 =⇒ '범주형 데이터' =⇒ "분류(classification)" 회귀와 분류를 나누는 기준 : 종속변수의 데이터 타입. # 1. 과거의 데이터를 준비 아이리스 = pd.read_csv('iris.csv') # 판다스가 범주형 데이터들만 골라서 **원핫인코딩** 해준다. 아이리스 = pd.get_dummies(아이리스) 독립 = 아이리스[['꽃잎길이', '꽃잎폭', '꽃받침길이','꽃받침폭']] 종속 = 아이리스[['품종']] print(독립.shape, 종속.shape) ⇒ 원핫인코딩이 되면서 **종속변수의 개수가 3개**가 되었음 ⇒ 이 수식의 결과는 -무한대 ~ +무한대까지 모든 숫자를 대상으로 한..

+ 딥러닝 학습의 원리

머신러닝 야학 정리 딥러닝 워크북 초기값 생성기를 통해 나오는 값을 복사하여 W와 B값을 넣어준다. 2. 결과인 W, B 그리고 자동으로 생성되는 Loss 값을 복사하여 history에 넣는다. 3. prevLoss 에 Loss 값을 복사하여 넣어준다. 4. W값을 0.0001을 더한 값으로 고쳐주고 dLoss / dt의 값 변화를 관찰한다. ⇒ 그 다음 W와 그 다음 B를 찾기위한 과정 미분이라는 것을 통해서 W가 어떤 방향으로 가야 loss값을 찾게 만들 수 있는지 **방향**을 찾아야함 ⇒ W를 아주 조금 키웠는데 loss값이 커지면 W를 낮춰야한다는 결론이 나온다. (loss값을 낮추는게 목적이기 때문에) W를 0.0001을 키웠는데 Loss값이 작아 졌으므로 W값을 키워야함 1. **결과값 dL..

2. 보스턴 집값 예측

머신러닝 야학 정리 1978년도 미국 보스턴 주 506개 타운들의 집값을 알려주는 표 각각의 행 하나는 타운 하나를 의미, 열은 각 타운의 특성들을 의미 제일 중요한 열은 14번째 'MEDV' → 해당 타운에 있는 주택들 가격의 중앙값을 나타낸다. 중앙값 → 다섯채의 집이 있다고 가정했을때 주택들을 가격을 기준으로 순서대로 정렬한 다음에 그중에서 가장 가운데에 있는 값이 중앙값이다. 중앙값과 비슷하게 사용되는 것 → 평균값 중앙값, 평균값 ⇒ 집단을 대표하기 위해 사용되는 값 평균의 대표성을 무너뜨리는 값 → 이상치 EX) 평균 연봉 - 높은 연봉을 받는 사람들의 연봉이 평균에 영향을 미쳐 괴리가 커지게됨 → 평균값이 대표성을 띄지 못해 대안으로 사용되는 것이 '중앙값' MEDV - 해당 지역 주택값 사..

1. 레모네이드 판매 예측

머신러닝 야학 정리 1. 레모네이드 판매 예측 1. 과거의 데이터를 준비합니다. 레모네이드 = pd.read_csv('lemonade.csv') 독립 = 레모네이드[['온도']] 종속 = 레모네이드[['판매량']] print(독립.shape, 종속.shape) # 독립변수와 종속변수를 분리하여 준비 2. 모델의 구조를 만듭니다.출처 X = tf.keras.layers.Input(shape=[1]) # 여기서 독립변수의 개수는 '온도' 하나라서 1이 들어간다. Y = tf.keras.layers.Dense(1)(X) # 종속변수의 개수는 '판매량' 하나라서 1이 들어간다. model = tf.keras.models.Model(X,Y) model.compile(loss='mes') 3. 데이터로 모델을 학습..

실습환경

머신러닝 야학 정리 jupyter notebook Colab notebook (이거 사용) Colab notebook 구글 드라이브로 이동 파일 → 새노트 셀에 코드 작성 + 셀은 여러개 추가 가능 ctrl + enter ⇒ 실행 후 셀 안에 머물러 있음 //연속적으로 반복 실행 가능 Shift + enter ⇒ 셀 실행 후 다음 셀로 넘어감 - Variable (변수) 표에선 칼럼을 '변수'라고 한다. 즉, 온도의 값들이 변수 온도와 판매량은 밀접한 관계가 있다. 원인 - 온도, 결과 - 판매량 온도 → 원인 → '독립변수' 판매량 → 결과 → '종속변수' 지도학습은 독립변수와, 종속변수를 구분하는것에서 시작. Pandas - 표를 다루는 도구 import pandas as pd # 데이터 불러오기 파..

Tensorflow 기초 (python)

머신러닝 야학 정리 Machine Learning 기계를 학습시켜서 인간의 판단 능력을 기계에게 위임하는 기술 Tansorflow 를 이용해 해결하려는 문제 → 지도학습 영역 머신러닝의 종류 지도학습 비지도 학습 강화학습 지도학습 (문제) 회귀 - 숫자로된 결과를 예측 분류 - 범주형, 카테고리 형태의 결과를 예측 지도학습을 하기 위해서 과거의 데이터 필요 →과거의 데이터 속에서 원인과 결과를 인식 원인 = 독립변수 결과 = 종속변수 모델의 구조를 만들기 데이터로 모델을 학습(Fit) 분류와 회귀 문제를 풀기위해 사용하는 방법 ⇒ 머신런닝 알고리즘 머신러닝 알고리즘 Decision Tree Random Forest KNN SVN Neural Network Neural Network 사람의 두뇌가 동작하는..

github에 프로젝트 올리기

1. github에서 repositories 생성하기 2. cmd 창 켜기 - cd 명령어를 이용하여 올릴 프로젝트가 있는 경로로 이동 + cmd 창 C드라이브에서 D드라이브로 이동하는 방법 : cd없이 D:라고 치면 된다. - 프로젝트가 있는 경로로 이동하여 git init을 치면 .git 파일이 생성됨 - git add . 를 사용하여 github에 파일 추가 - git status 를 사용하여 add가 잘되었는지 확인 - git commit -m "설명" 3. github에 내가 생성한 repositories에 들어가 드레그한 부분 복사하여 cmd 창에 붙여 넣기 4. git push origin master 사용하여 올리기 + 처음에만 사용 + 나중에는 git push 만 사용 - 끝 -

기타/git & github 2020.10.31

내가 자주 사용한 리눅스 명령어 정리

우분투 - 리눅스 사용 pwd - 현재 작업중인 dir 정보 출력 cp - 파일 or 디렉토리 복사 mv - 파일 or 디렉토리이동/ 이름 변경 cd - 경로 이동 ls - 디렉토리 목록 확인 more - 파일 내용 확인 + cat은 파일을 이어붙여 출력 vi 명령어 i - 현재 커서에 입력 a - 현재 커서 다음에 입력 - esc를 누른 후 사용 - x - 현재 커서가 위치한 한 글자 삭제 dd - 한줄 삭제 - esc를 누른 후 : 를 쓴 후 사용 - wq - 파일 저장후 종료 q - 저장하지 않고 종료

기타/Linux 2020.10.31

Python 공부2 (코드업 기초 100제)

1097번부터 1099번까지 1097 : [기초-2차원배열] 바둑알 십자 뒤집기 시간 제한: 1 Sec 메모리 제한: 128 MB https://www.codeup.kr/problem.php?id=1097 내가 쓴 답 arr = [[0]*19]*19 for i in range(0,19): arr[i] = list(map(int,input().split())) n = int(input()) for i in range(0,n): x,y = map(int,input().split()) for j in range(0,19): if arr[x-1][j] == 0: arr[x-1][j] = 1 else: arr[x-1][j] = 0 for z in range(0,19): if arr[z][y-1] == 0: arr..

Python 공부(코드업 기초 100제)

codeup.kr 기초 100제 1001번부터 1096번 특수 문자 출력 print('"!@#$%^&*()"') print('"C:\Download\hello.cpp"') 유니코드 출력 함수 print('\u250C\u252C\u2510\n') // \u뒤에 유니코드 작성 정수를 입력 받아 출력 n = int(input()) print(n) 문자 입력 받아 출력 char = input() print(char) 실수 입력 받아 소수점 6자리까지 표시 a = float(input()) print("%f" %a) 정수 2개 입력 받아서 그대로 출력 map() - 여러 데이터를 한번에 다른 형태로 변환 a, b = map(int, input().split()) print(a,b) 문자 2개 입력 받아서 순서 바..