분류 전체보기 90

Python 머신러닝, 딥러닝 파이토치

파이토치(Pytorch) - Tensorflow와 함께 머신러닝, 딥러닝에서 가장 널리 사용되는 프레임워크이다.- 초기에는 Torch라는 이름으로 Lua언어 기반으로 만들어졌으나, 파이썬 기반으로 변경한 것이 Pytorch이다.- 뉴욕대학교와 페이스북(메타)이 공동으로 개발하였고, 현재 가장 대중적인 머신러닝, 딥러닝 프레임워크이다.# importimport torch# version 확인print(torch.__version__) 스칼라(Scalar)- 하나의 상수를 의미한다.더보기var1 = torch.tensor([1])var1 # type 확인type(var1) # Float형var2 = torch.tensor([10.5])var2  # 두 스칼라의 사칙 연산print(var1 + var2)pri..

Python 머신러닝 다양한 모델 적용하기

AirQualityUCI Dataset더보기 # 필요한 모듈 설치import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltair_df = pd.read_csv("파일경로")air_df  # 데이터프레임 정보 확인air_df.info()  # NaN으로 채워져있는 column 제외air_df.drop(["Unnamed: 15", "Unnamed: 16"], axis=1, inplace=True)# 결측값(null값) 제거air_df.dropna(inplace=True)# Date 컬럼을 타입을 datetime으로 변경air_df["Date"] = pd.to_datetime(air_df["Date"], fo..

Python 머신러닝 LightGBM

Credit Dataset더보기# 필요한 모듈import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt# credit 데이터셋 데이터프레임으로 읽어오기credit_df = pd.read_csv("파일경로")credit_df  # 데이터프레임 정보확인credit_df.info()  # 사용하지 않을 column 제외credit_df.drop(["ID", "Customer_ID", "SSN", "Name"], axis=1, inplace=True)# 다시 정보확인credit_df.info()  # Credit_Score의 값들 확인credit_df["Credit_Score"].value_counts()  #..

Python 러닝머신 랜덤 포레스트

Hotel Dataset더보기# 필요한 모듈 import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt# hotel 데이터셋 데이터프레임으로 읽어오기hotel_df = pd.read_csv("파일경로")hotel_df   # 데이터프레임 정보확인hotel_df.info()  # 사용하지 않을 column 제거하기hotel_df.drop(["name", "email", "phone-number", "credit_card", "reservation_status_date"], axis=1, inplace=True)hotel_df.head()  # 데이터프레임 통계정보 확인hotel_df.describe()  ..

Python 머신러닝 서포트 벡터 머신

손글씨 데이터셋더보기from sklearn.datasets import load_digitsdigits = load_digits()digits.keys()  data = digits["data"]data.shape  target = digits["target"]target.shape  target  import matplotlib.pyplot as plt# subplot(nrow, ncol, index)# subplot은 2개의 값을 반환한다. 첫번째 figure객체, 두번째는 axes 객체들 배열_, axes = plt.subplots(2, 5, figsize=(14, 8))print(_) # figure 객체print(axes) # axes 객체 배열들for i, ax in enumerate(axes..

Python 머신러닝 로지스틱 회귀

Hr Dataset더보기# hr 데이터셋 데이터프레임으로 읽어오기import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as plthr_df = pd.read_csv("/content/drive/MyDrive/KDT/7. 머신러닝과 딥러닝/데이터/hr.csv")hr_df.head()  # 데이터프레임 정보확인hr_df.info()  # 통계정보 확인hr_df.describe()  # previous_year_rating(고가점수)가 높을수록 is_promoted(승진여부) 높다는 것을 알 수 있다.sns.barplot(x="previous_year_rating", y="is_promot..

Python 머신러닝 의사 결정 나무

Bike DataSet더보기# 데이터셋 데이터프레임으로 읽기import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltbike_df = pd.read_csv("/content/drive/MyDrive/KDT/7. 머신러닝과 딥러닝/데이터/bike.csv")bike_df  # 데이터프레임 정보확인bike_df.info()  # 통계정보bike_df.describe()  # 막대 그래프sns.displot(bike_df["count"])  sns.boxplot(y=bike_df["count"])  sns.scatterplot(x="feels_like", y="count", data=..

Python 머신러닝 선형회귀

Rent DataSet더보기# 데이터셋 데이터프레임으로 읽기import numpy as npimport pandas as pdimport seaborn as snsrent_df = pd.read_csv("파일경로")rent_df  # 데이터프레임 정보확인rent_df.info()  # 통계정보 describe()rent_df.describe()  # 소수점 둘째자리까지만 보이기round(rent_df.describe(),2)  # BHK 정보확인rent_df["BHK"]  # 막대그래프로 나타내기sns.displot(rent_df["BHK"])  # 한쪽에 몰려있지만 다 다른 값# 0.0쪽으로 몰려있지만 ~3.5까지 사이에 값들이 다 있어서 그래프에 표시가 된다.sns.displot(rent_df["Re..

Python 머신러닝 DataSet - iris, titanic DataSet

DataSet - 특정 작업을 위해 데이터를 관련성 있게 모아 놓은 것이다.- 데이터셋은 다양한 형태로 존재할 수 있으며, 데이터 항목들은 구조화된 방식(행과 열로 구성)으로 배열된다.- 데이터셋의 사용    분석: 데이터를 분석하여 패턴을 찾고 결론을 도출한다.    시각화: 데이터를 시각적으로 표현하여 이해하기 쉽게 만든다.    모델링: 머신러닝 모델을 훈련시키기 위해 사용된다.    보고서 작성: 데이터를 기반으로 보고서나 인사이트를 생성한다. 인공지능 분야 데이터셋 제공 사이트 Scikit-learn- https://scikit-learn.org/stable/index.html scikit-learn: machine learning in Python — scikit-learn 1.5.0 docu..

Python 머신러닝 Scikit-learn

사이킷런(Scikit-learn) - 대표적인 파이썬 머신러닝 모듈이다.- 다양한 머신러닝 알고리즘을 제공한다.- 다양한 샘플 데이터를 제공한다.- 머신러닝 결과를 검증하는 기능을 제공한다.- BSD 라이선스이기 때문에 무료로 사용 및 배포가 가능하다.- 사이킷런 공식 홈페이지: https://scikit-learn.org scikit-learn: machine learning in Python — scikit-learn 0.16.1 documentation scikit-learn.org LinearSVC (Linear Support Vector Classifier) - 클래스를 구분으로 분류 문제에서 각 클래스를 잘 구분하는 선을 그려주는 방식을 사용하는 알고리즘이다.- 지도학습 알고리즘을 사용하는 학..