Analyze Text Data with Yellowbrick
81개의 평가

4,796명이 이미 등록했습니다.
Use visual diagnostic tools from Yellowbrick to steer your machine learning workflow
Vectorize text data using TF-IDF
Cluster documents using embedding techniques and appropriate metrics
81개의 평가
4,796명이 이미 등록했습니다.
Use visual diagnostic tools from Yellowbrick to steer your machine learning workflow
Vectorize text data using TF-IDF
Cluster documents using embedding techniques and appropriate metrics
Welcome to this project-based course on Analyzing Text Data with Yellowbrick. Tasks such as assessing document similarity, topic modelling and other text mining endeavors are predicated on the notion of "closeness" or "similarity" between documents. In this course, we define various distance metrics (e.g. Euclidean, Hamming, Cosine, Manhattan, etc) and understand their merits and shortcomings as they relate to document similarity. We will apply these metrics on documents within a specific corpus and visualize our results. By the end of this course, you will be able to confidently use visual diagnostic tools from Yellowbrick to steer your machine learning workflow, vectorize text data using TF-IDF, and cluster documents using embedding techniques and appropriate metrics. This course runs on Coursera's hands-on project platform called Rhyme. On Rhyme, you do projects in a hands-on manner in your browser. You will get instant access to pre-configured cloud desktops containing all of the software and data you need for the project. Everything is already set up directly in your internet browser so you can just focus on learning. For this project, you’ll get instant access to a cloud desktop with Python, Jupyter, Yellowbrick, and scikit-learn pre-installed. Notes: - You will be able to access the cloud desktop 5 times. However, you will be able to access instructions videos as many times as you want. - This course works best for learners who are based in the North America region. We’re currently working on providing the same experience in other regions.
Data Science
Natural Language Processing
Machine Learning
Python Programming
Data Visualization (DataViz)
작업 영역이 있는 분할 화면으로 재생되는 동영상에서 강사는 다음을 단계별로 안내합니다.
Introduction and Loading the Corpus
Vectorizing the Documents
Clustering Similar Documents with Squared Euclidean Distance And Euclidean Distance
Manhattan (aka “Taxicab” or “City Block”) Distance
Bray Curtis Dissimilarity and Canberra Distance
Cosine Distance
What Metrics Not to Use
Omitting Class Labels - Using KMeans Clustering
작업 영역은 브라우저에 바로 로드되는 클라우드 데스크톱으로, 다운로드할 필요가 없습니다.
분할 화면 동영상에서 강사가 프로젝트를 단계별로 안내해 줍니다.
AH 제공
2020년 4월 13일It was an amazing test and this lecture i like same with my area teaching.
KL 제공
2021년 4월 1일Could have run through the theory behind the library functions a bit more as a refresher but for brevity's sake it is alright the instructor did not.
안내 프로젝트를 구매하면, 시작에 필요한 파일과 소프트웨어가 포함된 클라우드 데스크톱 작업 영역에 웹 브라우저를 통해 접근할 수 있으며, 주제 전문가의 단계별 동영상 지침 등 프로젝트 완료에 필요한 모든 것이 제공됩니다.
귀하의 작업 영역에는 노트북이나 데스크톱 컴퓨터에 맞게 용량이 지정된 클라우드 데스크톱이 포함되어 있으므로 모바일 기기에서는 안내 프로젝트를 이용할 수 없습니다.
안내 프로젝트 강사는 해당 주제의 전문가로서, 해당 프로젝트 영역이나 도구, 기술에 대한 경험이 풍부하며 전 세계 수백만 명의 학습자와 지식을 적극적으로 공유합니다.
안내 프로젝트에서 생성된 파일은 모두 다운로드하고 보관할 수 있습니다. 클라우드 데스크톱에 접속한 상태에서 '파일 브라우저'를 사용하여 파일을 다운로드할 수 있습니다.
안내 프로젝트는 환불이 불가능합니다. 전체 환불 정책 보기
안내 프로젝트에는 재정 지원이 제공되지 않습니다.
안내 프로젝트의 청강은 할 수 없습니다.
페이지 상단에서 이 안내 프로젝트에 대한 경험 수준을 누르면 우선적으로 알아야 하는 지식을 확인할 수 있습니다. 안내 프로젝트의 단계마다 강사가 차례대로 안내해 드립니다.
네, 브라우저를 통해 이용할 수 있는 클라우드 데스크톱에서 안내 프로젝트 완료에 필요한 모든 것을 이용할 수 있습니다.
브라우저의 분할 화면 환경에서 바로 작업을 완료하여 학습할 수 있습니다. 화면 왼쪽에 있는 작업 영역에서 작업을 완료할 수 있습니다. 화면 오른쪽에서는 강사의 단계별 프로젝트 안내를 볼 수 있습니다.
궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.