강의 요약: EE542 Lecture 20 - Embeddings and Vectorizations 이번 강의는 **임베딩(Embeddings)**과 **벡터화(Vectorizations)**를 중심으로, 자연어 처리(NLP)와 데이터 표현의 주요 개념과 기술을 다루었다. Word2Vec과 같은 기법을 통해 단어와 문서의 의미를 수치적 벡터로 표현하고, 이를 다양한 NLP 작업에 활용하는 방법이 강조되었다.주요 내용 1. 임베딩의 필요성 • 텍스트를 수치 데이터로 변환해야 머신러닝 모델에 활용 가능. • One-Hot Encoding: • 단어를 길이 $N$의 벡터로 표현하며, 단 하나의 값만 1이고 나머지는 0. • 공간 비효율적이며 단어 간 관계를 표현하지 못함. • Bag o..