7강 임베딩과 유사도 표현

🏢 과학기술 🏷️ 90% 할인
👁️ 1 ⬇️ 0 💬 0 🔥 0

📋 상품 구성

📖 내용 정리 (학습/PDF)
요약 53개
4,000P
400P
📝 예상 문제 (학습/PDF)
문제 0개
준비 중

📄 본문 미리보기

컴퓨터는 사람의 언어를 직접 이해할 수 없다. 따라서 컴퓨터가 사람의 언어를 이해할 수 있도록 표현해 주어야 한다. 컴퓨터가 사람의 언어를 이해할 수 있도록 표현하는 방법에는 여러 가지가 있을 수 있는데, 그중 원-핫 인코딩은 표현하고 싶은 단어의 색인 값에 1을 부여하고 나머지에는 0을 부여하는 방법이다. 원-핫 인코딩을 수행하기 위해서는 먼저 대상이 되는 텍스트의 단어 집합을 만든다. 예를 들어 '오늘 날씨 정말 좋다.'라는 한 문장으로 이루어진 텍스트를 대상으로 한다고 가정하면, 단어 집합은 {오늘, 날씨, 정말, 좋다}가 되고 집합의 원소가 되는 단어의 개수가 4개이므로 단어 집합의 크기는 4가 된다. 단어 집합의 크기에 따라 각각의 단어에 [1, 0, 0, 0], [0, 1, 0, 0], [0, 0, 1, 0], [0, 0, 0, 1]과 같이 4차원의 고유한 숫자를 부여하는 것이 원-핫 인코딩이다. 원-핫 인코딩은 직관적이고 단순하지만 단어들이 개별적, 독립적으로 표현되기 ...

📑 PDF 미리보기

📄
PDF를 불러오는 중...

💬 댓글 (0)

로그인 후 댓글을 작성할 수 있습니다.
아직 댓글이 없습니다. 첫 댓글을 남겨보세요!

💰 구매하기

로그인이 필요합니다

로그인
📖 내용 정리만
4,000P
400P
📝 예상 문제만
준비 중