일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- pytorch
- Self-loop attention
- XOR
- Attention
- GNN
- abstraction
- overfitting
- word2vec
- Transformer
- Python
- Classificaion
- elif
- machine learning
- sigmoid
- sentence embedding
- neural net
- deep learning
- NLP
- python practice
- Set Transformer
- Today
- Total
목록R (2)
Research Notes

1. 데이터마이닝과 분류 ▶ 분류 (Classification) : 다수의 속성을 갖는 객체를 그룹 또는 범주로 분류하는 것 학습 표본으로부터 효율적인 분류규칙을 생성(=오분류율 최소화) ▶ 분류규칙 예시 1) 임의로 분류규칙 선정 2) 오분류율 제시 3) 두번째 분류규칙 제시(더 자세하게) 2. 과적합(overfitting) : 모델이 너무 데이터화된 경우. - 분류모형에서 훈련데이터에 대한 과적합을 시킬 경우, 실제 데이터를 적용했을 때 더 높은 오분류율 발생. - 실제 데이터가 들어갔을 때 정확도가 낮아지는 문제 발생. - 이를 해결하기 위해 학습데이터와 검증 데이터를 나눠서 모델의 성능을 학습시키며 평가 ▶ 교차검증 : 분류모형의 유효성 검증 방법 ▶ K-fold cross validation ..

1. 데이터 마이닝 기법 ▶ 지도학습(정답이 있음) - 예측 : 종속변수가 continuous(연속형)인 값. 방법으로는 회귀분석, 선형모형, 비선형모형 등이 존재. (이번 글에서는 지도학습-예측-회귀분석- 다중회귀분석을 공부.) (ex. 자동차의 연비, 야구선수의 연봉, 주식변동, 수질오염 등) - 분류 : 종속변수가 categorical(범주형)인 것들 방법으로는 의사결정나무, 서포트벡터머신, 판별분석, 로지스틱회귀모형 등이 존재. (ex. 대출심사, 신용등급, 고객분류, 품종분류 등) ▶ 비지도학습(정답이 없음) - 군집 : 주어진 속성으로 군집화 - 연관규칙 : 변수들간의 연관관계를 도출. 2. 다중회귀분석(Multiple Linear Regression) - 종속변수 Y를 설명하는 독립변수가..