06 토픽 모델링(Topic Modeling) - 20 뉴스그룹 토픽 모델링(Topic Modeling): 문서 집합에 숨어 있는 주제를 찾아내는 것, 핵심 주제를 찾는 것은 많은 시간이 소모되므로, 머신러닝의 토픽 모델링 적용하여 숨어있는 중요 주제 찾아냄 사람: 더 함축적인 의미로 문장 요약 머신러닝 기반: 숨겨진 주제를 효과적으로 표현하기 위해 중심단어를 함축적으로 추출 대표적으로 사용되는 토픽 모델링 기법LSA(Latent Semantic Analysis)LDA(Latent Dirichlet Allocation) #fetch_20newgroups() API는 카테고리 파라미터를 통해 필요한 주제만 필터링 후 추출, 추출된 텍스트를 count 기반으로 벡터화 변환from sklearn.datas..