Learn/'24_Fall_(EE542) Internet&Cloud Computin

(Lecture 19) Machine Learning 2

QBBong 2025. 1. 9. 03:52
728x90

강의 요약: EE542 Lecture 19 - Machine Learning 2

 

이번 강의는 머신러닝의 응용을 확장하여 데이터 수집 및 처리, 센서 기반 학습 모델, 파워 모니터링, 그리고 머신러닝 알고리즘의 실질적 한계와 개선 방향을 다루었다. 특히 클라우드 컴퓨팅 환경에서 에너지 및 열 관리 문제와 같은 실질적인 문제 해결 방안을 제시하였다.


주요 내용

 

1. 도메인 지식과 머신러닝

  • 머신러닝 접근법은 도메인 지식과 결합해야 더 나은 성능을 발휘함.

   기존 데이터 분석 방법:

   물리적 모델에 의존하였으나, 복잡성과 상관관계 부족으로 한계 존재.

   현재 머신러닝 접근법:

     데이터 수집 및 전처리를 통해 모델을 학습.

     비지도 학습과 지도 학습 모두 활용 가능.

 

2. 자동차 데이터 수집 및 처리

   자동차의 OBD2 포트를 통해 데이터를 수집.

   데이터를 Bluetooth로 전송하여 CSV 형식으로 변환 후 머신러닝에 활용.

   데이터 처리 파이프라인:

     데이터 수집 → 전송 → 클라우드 저장 → 전처리 → 학습 및 분석.

3. 파워 모니터링 및 관리

   온라인 파워 모니터링 기술:

     디지털 센서를 통해 실시간 전력 소모 측정.

     데이터는 빅데이터 분석 및 머신러닝 모델에 사용.

   소프트웨어 기반 모니터링:

     하드웨어 없이 소프트웨어로 전력 소모를 추정.

     2-5%의 소프트웨어 오버헤드 발생.

   결과 활용:

     전력 및 열 관리 최적화.

     칩의 동적 전력 및 누설 전력 예측 가능.

 

4. FPGA를 활용한 데이터 분석

   FPGA 측정 실험:

     Xilinx Spartan 3E 및 Spartan 6 사용.

     칩의 전력 변동 3-9% 관찰.

   온보드 파워 측정:

     실시간 전력 관리 가능.

     설계의 유연성과 효율성 제공.

 

5. 머신러닝의 교훈

   데이터 품질:

     잘못된 데이터는 성능을 저하시킬 수 있으므로 철저한 필터링 필요.

     소규모 고품질 데이터가 대규모 저품질 데이터보다 효과적.

   도메인 지식과 통합:

     특정 응용 사례에 맞는 맞춤형 분류기(Classifier) 필요.

   클라우드 컴퓨팅 문제:

     전력 및 열 문제, 보안 문제에 대한 해결책 요구.

     정밀한 모니터링 및 지능형 관리 필요.

 

6. 응용 사례

   암 예측:

     생체 지표(Biomarkers)를 기반으로 암을 조기 예측.

   연구 과제:

     복잡한 데이터 처리: 파라미터 분리 및 단순화.

     데이터 품질과 양: 건강한 데이터와 질병 데이터의 비교.

     플랫폼 관련 연구: 열/전력 문제 및 보안 문제 해결.


요약

 

이 강의는 머신러닝의 도메인 지식 통합, 데이터 품질 개선, 하드웨어 및 소프트웨어 기반 전력 모니터링 기술을 강조하며, 클라우드 컴퓨팅과 머신러닝의 실질적 문제 해결 방법을 탐구한다.

728x90
반응형