통계 & 데이터분석(8)
-
[NIPA] 데이터 분석 믹스앤 매치 아카데미 - 활용오프라인 - 웹/앱 서비스 트랙
NIPA 활용과정 앱 데이터 분석을 통한 평점 예측 실습 Kaggle에서 제공하는 구글 앱 데이터를 바탕으로 앱 평점을 예측해보는 머신러닝 실습을 수행해 보겠습니다. 데이터 출처: https://www.kaggle.com/gauthamp10/google-playstore-apps 이번 실습은 다음과 같은 과정으로 진행합니다. 데이터 읽기: 구글 앱 데이터를 불러오고 Dataframe 구조를 확인 데이터 정제: 비어 있는 데이터 또는 쓸모 없는 데이터를 삭제 데이터 시각화: 변수 시각화를 통하여 분포 파악 데이터 전처리: 머신러닝 모델에 필요한 입력값 형식으로 데이터 처리 머신러닝 모델 수행: 회귀 모델을 사용하여 학습 수행, 평가 및 예측 수행 이번 실습에서의 최소한의 학습 목표는 데이터를 바탕으로 머신..
2020.12.02 -
[NIPA] 데이터 분석 믹스앤 매치 아카데미 - Python - 활용선택 - 데이터 분석과 머신러닝
01. 머신러닝과 데이터 과학 이해하기 02. 데이터 과학자 이해하기 03. 머신러닝을 위한 데이터 이해하기 04. 머신 러닝 실무 체험 05. 파이썬 Lib 를 활용한 기초 행렬 # Trans A = numpy.array([[1, 2, 3], [4, 5, 6]]) print(A.transpose()) # Inv A = numpy.array([[1, 2], [3, 4]]) print(numpy.linalg.inv(A)) #lin alg 이라는 Package 사용 # Dot C = numpy.dot(A, B) Transpose , Inverse , Dot product 06. 회귀분석 1. Linear Regression X = statsmodels.api.add_constant(X) # 3 results..
2020.12.02 -
[NIPA] 데이터 분석 믹스앤 매치 아카데미 - Python - 활용선택 - 파이썬으로 시작하는 데이터 분석(Pandas, Matplotlib)
1. NumPy Numpy의 배열은 파이썬의 list()보다도 빠른 연산과 효율적인 메모리 사용이 가능 import numpy as np #0부터 5사이 랜덤한 값이 담긴 3x5 array를 만들어 봅시다! import math array=np.random.randint(0,5,(3,5)) Numpy library에서 자주 사용되는 함수 np.array - 배열생성 np.zeros - 0이 들어있는 배열 생성 np.ones - 1이 들어있는 배열 생성 np.empty - 초기화가 없는 값으로 배열을 반환 np.arange(n) - 배열 버전의 range 함수 np.random.randint - 다양한 난수가 들어있는 배열 생성 import numpy as np print("1차원 array") array..
2020.11.28 -
[NIPA] 데이터 분석 믹스앤 매치 아카데미 - Python - 활용필수 - 주가 예측 체험
과목구성 & 일정 이 과정을 하면 정보통신산업진흥원(NIPA) 명의의 인증서를 발급해줍니다 ! 이 블로깅은 Python Pandas 사용법을 까먹지 않기 위해 작성되었습니다. 1. [활용필수] 인공지능 주가 예측 체험 > 1-1-1. Pandas Column 추출 import pandas as pd # 코로나 엑셀 데이터 파일(.xlsx)이 저장된 경로입니다. data_path = './data/corona_data.xlsx' # pandas를 활용해 엑셀 파일을 불러오고, corona_data(변수)에 저장합니다. corona_data = pd.read_excel(data_path) # corona_data셋에서 '확진자' 데이터만 추출하여 출력해보세요 confirmed = corona_data['확진..
2020.11.28 -
[스터디파이] 데이터분석 4주차
더보기0. 4주차 커리큘럼 1. WEEK 4 / DAY 1더보기0. Intro금주부터는 '어떻게 하면 분석일을 잘할수 있는가?' 에 대한 주제들을 다루려 합니다. 첫번째로는 어제 온라인 세션에서도 말씀드렸던 '논리적 사고'와 관련된 주제입니다.이쪽의 가장 클래식한 책은 바바라민토의 '논리의 기술' http://www.yes24.com/Product/Goods/77671422 이지만, 책이 두껍고, 솔직히 좀 지루합니다. 그래서 주변에는 이것의 좀 더 경량화된 버전인 '로지컬 씽킹' 책을 추천하곤 합니다. http://www.yes24.com/Product/Goods/76899643?Acode=101 (그나저나 저는 두책 모두 거의 8~10년전에 구판으로 보았었는데, 벌써 이렇게 예쁘게 리뉴얼되었군요)하지..
2020.07.05 -
[스터디파이] 데이터분석 3주차
0. 3주차 커리큘럼 1. WEEK 3 / DAY 1 카카오 AI 리포트 머신러닝의 적용 실제 [카카오AI리포트]머신러닝 적용의 실제 하용호 카카오 Machine Intelligence 파트장 | 누가 뭐라고 해도 역시 지금의 슈퍼스타는 머신러닝(machine learning)이다. 마법같은 결과를 담은 논문이 나날이 쏟아져나오고, 또 며칠만 있으면 코드로 구� brunch.co.kr 더보기 0. 인트로 안녕하세요. 책만 보면 심심하니까 오늘은 가벼운 아티클을 하나 공유드립니다. '머신러닝 적용의 실제'라는 글이고, 제가 카카오에서 머신 인텔리전스 파트를 맡았을 때 작성했던 글입니다. 머신러닝이 굉장히 멋져 보이지만, 실제로 적용하려다보면 여러 문제와 마주하게 됩니다. 이 글은 현업에 머신러닝을 적용하게..
2020.07.05