반응형

 

 

 

 

1. 데이터 결측치 처리

2. 라벨링된 데이터 처리

3. 데이터의 scale의 차이가 매우 클 경우 

 

 

 

 

데이터 결측치 처리

1) 데이터가 없으면 sample을 드롭

2) 데이터가 없는 최소 개수를 정해서 sample을 드롭

3) 데이터가 거의 없는 feature는 feature

4) 최빈값, 평균값으로 비어있는 데이터를 채우기

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

반응형

'AI > Numpy & Pandas' 카테고리의 다른 글

판다스 기본  (0) 2021.01.20
선형대수 파이썬으로 구현해보기 !  (0) 2021.01.14
선형대수 기초  (0) 2021.01.12
반응형

 

 

 

Group by

: SQL의 group by 명령과 같다.

 

split -> apply -> combine

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

반응형

'AI > Numpy & Pandas' 카테고리의 다른 글

Data preprocessing  (0) 2021.01.22
선형대수 파이썬으로 구현해보기 !  (0) 2021.01.14
선형대수 기초  (0) 2021.01.12
반응형

 

 

 

1. Zip을 이용하여 Vector 계산하기

u = [2,2]
v = [2,3]
z = [3,5]

print("vector의 덧셈")
result = [sum(t) for t in zip(u,v,z)]
print(result)

print("vector의 뺄셈")
result = [x-y-z for x,y,z in zip(u,v,z)]
print(result)
vector의 덧셈
[7, 10]
vector의 뺄셈
[-3, -6]

 

 

 

 

2. Scalar-Vector product

상수(Scalar)와 리스트(Vector)를 한번에 곱하는 방법

print("scalar-vector product")
u = [1,2,3]
v = [4,4,4]
alpha = 2

result = [alpha * sum(z) for z in zip(u, v)]
print(result)
scalar-vector product
[10, 12, 14]

 

 

 

3. Matrix addition

** zip으로 matrix를 풀면 ([3,6]) 이런 식으로 튜플로 묶이기 때문에, asterisk(*)로 풀어줘야 한다.

matrix_a  = [[3, 6], [4, 5]]
matrix_a  = [[5, 8], [3, 7]]

result = [[sum(row) for row in zip(*t)] for t in zip(matrix_a, matrix_b)]

print(result)
Matrix addition
[[8, 14], [7, 12]]

 

 

 

4. Scalar-Matrix Product

matrix_a = [[3, 6], [4, 5]]
alpha = 4
result = [[alpha * element for element in t] for t in matrix_a]

print(result)
Scalar-Matrix Product
[[12, 24], [16, 20]]

 

 

 

5. Matrix Transpose

print("Matrix Transpose")
matrix_a = [[1, 2, 3], [4, 5, 6]]
result = [[element for element in t] for t in zip(*matrix_a)]

print(result)
Matrix Transpose
[[1, 4], [2, 5], [3, 6]]

 

 

 

6. Matrix Product

print("Matrix Product")
matrix_a = [[1, 1, 2], [2, 1, 1]]
matrix_b = [[1, 1], [2, 1], [1, 3]]
result = [[sum(a * b for a, b in zip(row_a, column_b))
          for column_b in zip(*matrix_b)] for row_a in matrix_a]
print(result)
Matrix Product
[[5, 8], [5, 6]]

 

** asterisk를 하고 zip 을 하면 컬럼을 가져올 수 있다 !!

 

 

 

 

 

 

반응형

'AI > Numpy & Pandas' 카테고리의 다른 글

Data preprocessing  (0) 2021.01.22
판다스 기본  (0) 2021.01.20
선형대수 기초  (0) 2021.01.12
반응형

 

 

 

Scala : 하나의 숫자

Vector : 순서가 정해져있는 배열  => 순서가 없는 배열은 Set이라고 한다.

Matrix : 행렬(row, column), two dimensional array

 

 

1. Vector 

Row Vector와 Column Vector 가 있는데, Column Vector를 기본으로 생각한다. Row Vector는 Column Vector를 Transpose하여 나타낸다. 

Column Vector를 매트릭스로 나타내면, R(nx1)

Row Vector를 매트릭스로 나타내면 R(1xn)

 

 

 

 

2. Matrix

1) Square Matrix  (rows = columns)

ex) B = [1 5] [2 3]

 

2) Rectangular Matrix  (rows != columns)

ex) A = [1 6] [3 4][5 2]

 

3) Transpose Matrix

ex) AT = [1 3 5] [6 4 2]

 

4) Ai,j

ex) A2,1 =3

 

5) Ai, : i행의 모든 값

ex) A1, = [1 6]

 

6) A,j : j열의 모든 값

ex) A,2 = [6 4 2]

 

 

 

 

 

 

 

 

 

3. Matrix의 계산

1) 더하기 빼기

행과 열의 개수가 모두 같은 상태에서 그대로 더하고, 그대로 빼주면 된다.

 

2) 곱하기

A3,2 X B2,5 이렇게 두 행렬을 곱할 때,

가운데 2가 동일해야 곱할 수 있다.

 

 

4. Matrix 계산의 성질

1) (AB)^T = B^T x A^T

 

2) AB != BA

같지 않다!

 

 

 

 

반응형

'AI > Numpy & Pandas' 카테고리의 다른 글

Data preprocessing  (0) 2021.01.22
판다스 기본  (0) 2021.01.20
선형대수 파이썬으로 구현해보기 !  (0) 2021.01.14

+ Recent posts