강의 요약: EE542 Lecture 19 - Machine Learning 2
이번 강의는 머신러닝의 응용을 확장하여 데이터 수집 및 처리, 센서 기반 학습 모델, 파워 모니터링, 그리고 머신러닝 알고리즘의 실질적 한계와 개선 방향을 다루었다. 특히 클라우드 컴퓨팅 환경에서 에너지 및 열 관리 문제와 같은 실질적인 문제 해결 방안을 제시하였다.
주요 내용
1. 도메인 지식과 머신러닝
• 머신러닝 접근법은 도메인 지식과 결합해야 더 나은 성능을 발휘함.
• 기존 데이터 분석 방법:
• 물리적 모델에 의존하였으나, 복잡성과 상관관계 부족으로 한계 존재.
• 현재 머신러닝 접근법:
• 데이터 수집 및 전처리를 통해 모델을 학습.
• 비지도 학습과 지도 학습 모두 활용 가능.
2. 자동차 데이터 수집 및 처리
• 자동차의 OBD2 포트를 통해 데이터를 수집.
• 데이터를 Bluetooth로 전송하여 CSV 형식으로 변환 후 머신러닝에 활용.
• 데이터 처리 파이프라인:
• 데이터 수집 → 전송 → 클라우드 저장 → 전처리 → 학습 및 분석.
3. 파워 모니터링 및 관리
• 온라인 파워 모니터링 기술:
• 디지털 센서를 통해 실시간 전력 소모 측정.
• 데이터는 빅데이터 분석 및 머신러닝 모델에 사용.
• 소프트웨어 기반 모니터링:
• 하드웨어 없이 소프트웨어로 전력 소모를 추정.
• 2-5%의 소프트웨어 오버헤드 발생.
• 결과 활용:
• 전력 및 열 관리 최적화.
• 칩의 동적 전력 및 누설 전력 예측 가능.
4. FPGA를 활용한 데이터 분석
• FPGA 측정 실험:
• Xilinx Spartan 3E 및 Spartan 6 사용.
• 칩의 전력 변동 3-9% 관찰.
• 온보드 파워 측정:
• 실시간 전력 관리 가능.
• 설계의 유연성과 효율성 제공.
5. 머신러닝의 교훈
• 데이터 품질:
• 잘못된 데이터는 성능을 저하시킬 수 있으므로 철저한 필터링 필요.
• 소규모 고품질 데이터가 대규모 저품질 데이터보다 효과적.
• 도메인 지식과 통합:
• 특정 응용 사례에 맞는 맞춤형 분류기(Classifier) 필요.
• 클라우드 컴퓨팅 문제:
• 전력 및 열 문제, 보안 문제에 대한 해결책 요구.
• 정밀한 모니터링 및 지능형 관리 필요.
6. 응용 사례
• 암 예측:
• 생체 지표(Biomarkers)를 기반으로 암을 조기 예측.
• 연구 과제:
• 복잡한 데이터 처리: 파라미터 분리 및 단순화.
• 데이터 품질과 양: 건강한 데이터와 질병 데이터의 비교.
• 플랫폼 관련 연구: 열/전력 문제 및 보안 문제 해결.
요약
이 강의는 머신러닝의 도메인 지식 통합, 데이터 품질 개선, 하드웨어 및 소프트웨어 기반 전력 모니터링 기술을 강조하며, 클라우드 컴퓨팅과 머신러닝의 실질적 문제 해결 방법을 탐구한다.
'Learn > '24_Fall_(EE542) Internet&Cloud Computin' 카테고리의 다른 글
(LAB 01) Network with VyOS, and simple Socket Program (0) | 2025.01.09 |
---|---|
(Lecture 20) Embeddings and Vectorizations (0) | 2025.01.09 |
(Lecture 18) Machine Learning (1) | 2025.01.09 |
(Lecture 17) Big Data Processing (0) | 2025.01.09 |
(Lecture 16) Database in the Cloud (0) | 2025.01.09 |