일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- dfs
- BFS
- 인접행렬
- 엔터티
- resnet
- Inductive Bias
- outer join
- SQLD 후기
- 연산량 감소
- CROSS JOIN
- mobilenet
- depthwise convolution
- skip connection
- 그래프
- 식별자
- bottleneck
- Two Pointer
- 인접리스트
- 데이터모델링
- feature map
- SQLD
- pytorch
- Depthwise Separable Convolution
- numpy
- 백준
- 정규화
- dp
- 1x1 Convolution
- get_dummies()
- SQL
- Today
- Total
목록분류 전체보기 (89)
SJ_Koding

csv파일로 이루어진 fasion mnist 셋을 Pytorch를 이용하여 분류하는 방법을 알아보겠습니다. https://dacon.io/competitions/open/235594/overview/description [이미지] Fashion MNIST : 의류 클래스 예측 - DACON 좋아요는 1분 내에 한 번만 클릭 할 수 있습니다. dacon.io 데이터 셋은 이 dacon 대회 사이트를 통해 다운로드 가능합니다. 먼저 필요한 모듈을 import합니다. import pandas as pd import numpy as np from torch.utils.data import Dataset, DataLoader from torch import nn from torchvision import tran..

Matplotlib을 사용하다보면 그래프를 세로로 나열하지 않고 아래의 그림과 같이 n by m 형태로 출력하고 싶은 경우가 대부분입니다. 이번 게시글은 Matplotlib의 subplot에 대해 알아봅니다. subplot은 plt.subplot(n, m, idx) 형태로 존재합니다. 여기서 n은 행의 개수, m은 열의 개수를 의미하며 subplot(4, 4, idx)는 4 x 4 의 형태로 그래프들을 나누어 출력하겠다! 라는 뜻이됩니다. 여기서 idx는 4x4의 바둑판이 있을때 몇 번째에 그래프를 출력할건지의 값입니다. idx가 6이라면 2행의 2번째에 올것입니다. * 주의사항: subplot의 idx는 0이 아닌 1부터 시작입니다. 즉 1행의 1번째는 0이아닌 1입니다!. 코드로 설명합니다. impo..

pandas 패키지는 자동으로 범주형 데이터에 대해 One-Hot인코딩을 진행하는 메소드가 존재합니다. pd.get_dummies() 결과를 미리 보여드립니다. df_train = pd.get_dummies(df_train) 컬럼의 수가 10개에서 15개로 증가하였고, string형에 대한 데이터들에 대해 모두 One-Hot인코딩이 진행된 모습입니다. 사용 방법은 위에 제시되었지만 자세히 알려드립니다. 먼저 예시로 제시된 데이터는 데이콘에서 진행되는 '펭귄 몸무게 예측 경진대회'에서 제공된 데이터 셋입니다. https://dacon.io/competitions/official/235862/data 펭귄 몸무게 예측 경진대회 - DACON 좋아요는 1분 내에 한 번만 클릭 할 수 있습니다. dacon.io..

저는 오늘 처음으로 Dacon AI경진대회를 참가해보았습니다. 주제는 펭귄 몸무게 예측으로, 머신러닝 입문자를 위한 Basic 대회입니다. (작성일 기준, 저한테 맞는 수준입니다 ㅎ) https://dacon.io/competitions/official/235862/overview/description 펭귄 몸무게 예측 경진대회 - DACON 좋아요는 1분 내에 한 번만 클릭 할 수 있습니다. dacon.io 구글 코랩에서 CPU환경으로 진행을 하였으며 skleran 모듈을 이용하여 모델을 구성했습니다. 또한 평가 지표로 RMSE를 사용합니다. Mean Squared Error에 Root를 씌운 값으로 평가를 진행합니다. 데이터는 3개의 csv파일로 주어집니다. 1. train.csv : 학습 데이터 i..

안녕하세요, 성지코딩입니다! 이번 게시글은 Numpy 인덱싱에 대해 알아봅니다. Index는 행렬, 배열, 리스트 등에서 특정 요소를 빠르게 참조할 수 있습니다. Numpy Array Indexing 리스트 혹은 다른 언어에서의 배열같은 경우 일반적으로 정수 값을 사용하고 정수는 특정 요소의 위치(순서)를 의미합니다. 파이썬에서 시퀀스 자료형에서 사용한 것과 동일하게 대괄호([])를 사용하여 특정 요소에 접근이 가능합니다. 기존 파이썬의 시퀀스 자료형에는 차원에 따라 대괄호를 여러번 사용 했지만 Numpy 에서 대괄호는 한 번만 사용됩니다. 단 차원의 구분자로 ,를 사용합니다. 예) 2차원 리스트에서 데이터 접근: list[0][1] 예) 2차원 Numpy Array에서 데이터 접근 : array[0, ..

안녕하세요, 성지코딩입니다! 이번 게시글은 Numpy의 연산에 대해 알아봅니다. 여기서 Broadcast의 개념은 Pandas에서도 이어지니 꼭 알아두셔야합니다. 어쩌면 Numpy의 꽃이라고 볼 수 있겠네요. Numpy Array의 연산은 Broadcast(Element Wise)연산으로 이루어집니다. Array간의 연산은 각 요소별 연산이 이뤄지며 연산 함수 또는 연산자를 이용합니다. Array와 Scalar간의 연산은 Scalar 값이 Array 각 요소별로 계산합니다. 그림으로 설명합니다. 2 by 2 Array간의 연산입니다. 여기서 리스트로 연산을 진행할 때의 단점이 부각됩니다. 리스트간의 + 연산은 값을 더하는 것이 아니라 그저 이어 붙일 뿐입니다. 리스트로 진행 할 경우에는 반복문을 사용해서..

안녕하세요! 성지코딩입니다. 이번 게시글은 Numpy의 배열 형태 변경과 데이터 유형 변경에 대해 알아봅니다. Numpy 배열 형태 변경 Numpy Array의 가장 큰 장점은 형태(shape)를 자유자재로 변경이 가능합니다. - 단, 변경 전 데이터 개수와 변경 후 데이터의 개수(size)는 같아야 합니다. Numpy Array의 형태를 바꾸기 위해서는 reshape 함수를 이용합니다. reshape에서 (-1, x)의 형태를 사용할 수 있습니다. -1은 딱 한 번만 사용할 수 있으며 자동으로 적절한 형태를 계산합니다. 단, (-1자리의 들어올 값) * x 가 원소의 개수와 동일해야만 사용이 가능합니다. 예를 들어 (18, ) 사이즈의 numpy변수 num이 있다고 할 때 ex) num.reshape(..

안녕하세요! 성지코딩입니다. 이번 게시글은 Numpy의 속성에 대해 알아봅니다. *참고사항: 코드 및 회색글씨는 출력 결과를 의미합니다. Numpy Array 속성 Numpy 배열에서 사용할 수 있는 속성은 다음과 같습니다. ndim : ndarray의 차원을 나타냄 shape : 각 차원의 ndarray 크기를 튜플 형태로 나타냄 (가장 중요) shape의 경우, 정말 많은 곳에서 사용됩니다. 특히, 나중에 게시글로 다루어질 딥러닝 분야에서 자주 쓰이는 DataFrame형, Tensor형에서도 자주 쓰이게됩니다. 꼭 알아두셔야 합니다. size : ndarray에 있는 요소의 총 수 dtype : ndarray의 데이터 유형 unit8 ~ unit64, int8 ~ int64, float16 ~ flo..