본문 바로가기
728x90

분류 전체보기228

다차원척도법 1. 서론 2. 거리행렬과 내적행렬3. dij^2 = bii + bjj -2bij 도출과정 4. 거리 행렬을 통해 내적행렬 B = XX' 도출하기 dij^2 = bii + bjj - 2bij 에서 좌변은 이렇게 정리가 됨우변은 다음의 우측인데 이제 우변을 정리해보자 5. B를 구했으니 X를 구해보자6. 차원축소 # 1. 패키지 로드library(readxl)# 2. 거리행렬 D 불러오기D D rownames(D) # 3. 거리제곱행렬 D^2 계산D2 # 4. 중심화 행렬 J 계산n J # 5. 내적행렬 B 계산B print("✅ 내적행렬 B:")print(round(B, 4))# 6. 고유값 분해 (spectral decomposition)eigen_B eigen_Bvalues valuesvec.. 2025. 6. 18.
군집분석 3. 모형기반 군집 방법 1. 서론 2. 우도를 이용하여 판단 ---------------------------------- library(readxl)library(mclust)library(factoextra)library(ggplot2)# 2. 데이터 불러오기data # 3. 필요한 변수만 선택vars # 4. 표준화vars_scaled # 5. 모형기반 군집 분석 수행 (군집 수 자동 선택)model # 6. 결과 요약summary(model)# 7. 군집 결과를 원 데이터에 추가data$cluster # 8. 군집 시각화 (첫 두 주성분 기준)fviz_mclust(model, what = "classification", ellipse.type = "convex", geom =.. 2025. 6. 17.
군집분석 2. K-mean 방법 library(readxl)library(factoextra)library(ggplot2)# 2. 데이터 불러오기data # 3. 필요한 변수만 선택vars # 4. 표준화vars_scaled # 5. 적절한 군집 수 결정 (Elbow + Silhouette)fviz_nbclust(vars_scaled, kmeans, method = "wss") + ggtitle("Elbow Method")fviz_nbclust(vars_scaled, kmeans, method = "silhouette") + ggtitle("Silhouette Method")# 6. K-means 클러스터링 수행 (K = 3으로 설정)set.seed(123)k_result # 7. 결과 출력print(k_result)# 8. 원.. 2025. 6. 17.
군집분석1. Ward의 계층적 군집방법 1. 설명즉 최초의 군집은 개별표본들 중 2개를 선택해 결정하게 되고, 둘 사이의 편차 즉 ESSab가 가장 작은 개체 두개를 선택하게 된다. (최초의 개별표본의 ESSa, ESSb는 0이 되므로)--------------------------------2. Iab 도출과정왜 Iab는 저런 형태의 식을 가지게 되는가? 우선 ESS의 정의에 대해서 살펴보자 Xbar a^t의 1행의 예시는 [x1bar,x2bar,.......xpbar]로 각열에 p번째 변수의 평균이 들어간다. 그리고 ESSab는 이런 형태를 가지게 되는데 여기서 Iab = ESSab - (ESSa + ESSb) 이므로 Iab는 위측 우변의 오른쪽 두 항으로 정리 된다.왜 이렇게 되는 지 살펴보면 이게 ESSab의 도출과정이며 따라.. 2025. 6. 16.
판별분석 8. 판별함수에 들어갈 변수의 선택 1. 기본개념과 R코드 #------------------library(readxl)library(MASS)# 1. 데이터 불러오기data # 2. 후보 변수 (수치형만, WRC/그룹 제외)numeric_vars candidate_vars # 3. 그룹 생성 (WRC 기준 3개 분위수)data$Group breaks = quantile(data$WRC, probs = c(0, 1/3, 2/3, 1), na.rm = TRUE), labels = c("Low", "Mid", "High"), include.lowest = TRUE)data$Group # 4. 단계적 변수 선택selected remaining lambd.. 2025. 6. 15.
판별분석 7. 윌크스람다 검정을 통한 적절 집단 수 설정 1. 판별계수의 유의성 검정 ------------2. 첫번째 고유값 제외 나머지 고유값과 고유벡터에 대한 검정(몇 번째 고유벡터까지 유의미하냐에 따라 몇개까지 그룹을 나누는 게 의미가 있냐를 의미) #-------------------------------------------library(readxl)library(MASS)# 데이터 불러오기data # 분석 변수X_vars WRC # 결과 저장results for (k in 2:6) { # WRC 분위수 기준 그룹 생성 data$Group breaks = quantile(WRC, probs = seq(0, 1, length.out = k + 1), na.rm = TRUE), .. 2025. 6. 15.
728x90